sábado, 4 de abril de 2009

An Essay towards a Real Character, and a Universal Translator


He estado revisando unas traducciones para la presentación de la plataforma de traducción Zirano, desarrollada por Miguel Santolaria, antiguo maestro mío y a real character. Es un proyecto con el que colaboro ocasionalmente aunque menos de lo que debería, dado su interés. Es que uno no llega a todo, y a veces ni a lo básico.

Zirano es algo así como un diccionario conceptual multilingüe pensado para ser expandido y desarrollado por los propios usuarios, a partir de una base conceptual y una herramienta accesible en red. De este modo podría accederese a las acepciones de cada palabra en todas las lenguas, a partir de cualquiera de las lenguas que hayan introducido sus usuarios.

Este es el fragmento que he estado revisando hoy, que explica un concepto central para posibilitarlo: el símbolo conceptual que permite mediar entre los distintos idiomas. En versión multilingüe, como corresponde a este artefacto multilingüe que es Zirano.

La doble representación del concepto

NORMALMENTE, decimos que ‘caballo’ es SINÓNIMO de ‘corcel’. Digo ‘normalmente’ porque lo normal hasta ahora es hablar de sinónimos DENTRO DE UNA SOLA LENGUA. Hasta ahora la semántica ha sido básicamente monolingüe, plana.

Otra terminología utilizada con el mismo enfoque monolingüe:
ANTÓNIMO (subir / bajar).
HIPERÓNIMO. 'Mueble' es un HIPERÓNIMO que contiene varios HIPÓNIMOS (silla, mesa, armario, etc.).

NUEVA SITUACIÓN.
El hecho de construir el Árbol Conceptual (potencialmente) Universal, en el que los elementos de cada idioma se extienden superficialmente en capas paralelas y en contacto en múltiples puntos hace que TENGAMOS QUE pasar a hablar de SEMÁNTICA ¿pluridimensional? ¿multifacética? ¿en relieve? ¿estéreo? ¿nuevo término?

¿Qué es ‘mesa’ [cas] con respecto a ‘table’ [ing] y con respecto a ‘taula’ [cat]?. Si perteneciesen a la misma lengua serían sinónimos.
¿Qué es ‘monter’ [fra] con respecto a ‘descendre’ [fra], ‘baxar’ [ara], ‘baixar’ [cat], ‘come down’ [ing]?. Si TODOS perteneciesen a la misma lengua serían antónimos.

Para enfocar adecuadamente el tema tenemos que introducir un elemento que en la ¿semántica plana? (al menos para la cuestión que nos ocupa) no suele ser tenido en cuenta. Me refiero al ‘concepto’. Por supuesto que sí que se tiene en cuenta, pero aparece como algo dado, el juego de relaciones se establece entre significados, no entre significante(s) y significado(s).

El concepto es lo que se dibuja o aparece en la mente de una persona cuando / oye / lee / ve / le es sugerida // el nombre / la imagen de un // ‘caballo’ [cas], ‘cheval’ [fra], ‘caball’ [cat], horse [ing], etc.

En todos los casos, [cas], [fra], [cat], [ing], etc. el concepto (imagen mental) ES UNO y EL MISMO (aunque pueda diferir accesoriamente, no esencialmente, (por causas ¿culturales?, ¿de experiencia personal?) de unas personas a otras).

NUEVA METODOLOGÍA.
Representamos cada CONCEPTO con un SÍMBOLO que tiene ciertas propiedades y características.
Un SÍMBOLO es la PRIMERA REPRESENTACIÓN de un CONCEPTO. Sustituye, en el esquema tradicional de Saussure, a lo que él llama ‘significante’.

El SÍMBOLO es bipolar, por la izquierda enlaza con el concepto al que representa (significado, Saussure), por la derecha enlaza con tantas formas o SEGUNDAS REPRESENTACIONES como idiomas en los que sus hablantes posean ese concepto.
Cada símbolo actúa como una VARIABLE SEMÁNTICA.

Por una parte REPRESENTA (primera representación) al concepto.
Por otra, (segundas representaciones) a todas y cada una de las palabras o expresiones con que el CONCEPTO se representa en todos los idiomas del mundo donde exista ese concepto.

Con la ‘doble representación’ cada CONCEPTO tiene una PRIMERA representación que es su SÍMBOLO y múltiples SEGUNDAS representaciones.

Cada SÍMBOLO es ÚNICO y representa a un solo CONCEPTO.

Cada SÍMBOLO está incluido en otro (excepto los símbolos primigenios, aquellos constituidos por un solo elemento discreto) formando una estructura inclusiva en árbol.

/DEA/ es el SÍMBOLO (primera representación) del CONCEPTO que en [cas] se expresa así: “Cualquiera de los objetos transportables ... que hay en una casa, ...” y cuyas segundas representaciones son ‘supellex’ [lat], ‘meuble’ [fra], ‘furniture’ [ing], ‘moble’ [cat], ‘mueble’ [cas].

/DEAD/ es el SÍMBOLO (primera representación) del CONCEPTO que en [cas] se expresa así: “Mueble constituido por una superficie horizontal ...” y cuyas segundas representaciones son ‘mensa’ [lat], ‘table’ [fra], ‘table’ [ing], ‘taula’ [cat], ‘mesa’ [cas].

Situada en esta nueva dimensión, la pregunta ¿Qué es ‘mesa [cas]’ con respecto a ‘table’ [ing] y con respecto ‘taula’ [cat]?, adquiere sentido.
Aparece un nuevo tipo de relación (relación interlingüística por oposición a relación intralingüística) que antes no existía: ¿Cómo llamamos a la relación que existe entre ‘mesa’ [cas], ‘table’ [ing] y ‘taula’ [cat]? No son sinónimos porque no pertenecen al mismo idioma.

¿Qué es ‘monter’ [fra] con respecto a ‘bajar’ [cas], ‘baixar’ [cat], ‘come down’ [ing]? No son antónimos porque no pertenecen a la misma lengua.

Siendo consecuentes con el planteamiento de la SEMÁNTICA ¿estéreo?, hay un tercer elemento que les da unidad a pesar de pertenecer a idiomas diferentes: el CONCEPTO (imagen mental) y su primera representación (forma física), su SÍMBOLO.

Nos encontramos con que en SEMÁNTICA ¿PLANA? ‘mueble’ es HIPERónimo de ‘mesa’, ‘silla’, ‘armario’.
En semántica esterea?

Semántica Plana— Semántica Estéreo—
sinónimos: caballo corcel sinonotios: caballo horse cheval
antónimos: subir bajar antinotios: subir descendre
hiperónimo: mueble hipernotio: mueble
hipónimos: silla mesa armario hiponotios: mesa chair table cupboard

¿Qué aplicaciones tiene este desarrollo teórico?

Recuperación de la información en múltiples idiomas por medio de un solo símbolo (ciencias de la información, bibliotecas, buscadores de internet).

Localización de ocurrencias de campos conceptuales COMPLETOS en lingüística de corpus. Una busca /DEA%/ nos permitiría recuperar ‘mensa’ [lat], ‘table’ [fra], ‘table’ [ing], ‘taula’ [cat], ‘mesa’ [cas] y silla, taburete, armario, cama, etc. en múltiples idiomas.

La realización y computación automática de encuestas con cuestionarios abiertos, cerrados o con preguntas abiertas en todos los idiomas de la plataforma multilingüística partiendo de un idioma, sin necesidad de conocer los otros idiomas ni de traducir los resultados. Los resultados son accesibles desde todos los idiomas, cada consultante en su idioma, sin necesidad de traducción. Este tipo de encuesta permitiría agrupar todos los hiponotios (hipónimos) en su hipernotio (hiperónimo). Por ejemplo, una respuesta abierta del tipo ‘devorar’ [cas] podría ser agrupada con otras como ‘engullir’, ‘tragar(se)’, ‘zampar(se)’, ‘to gulp’, ‘to swallow’, ‘to cram down’, ‘engloutir’, ‘avaler’, ‘boufrer’, ‘abalar’, ‘trusquir’ y todas ellas asimiladas a su hipernotio (hiperónimo) ‘comer con voracidad’ / ‘to eat voraciously’ / ‘manger avec voracité’ / ‘minchar con angluzia’ y éste con el superhipernotio (superhiperónimo) ‘comer’ / ‘to eat’ / ‘manger’ / ‘minchar’ … simultáneamente en todos los idiomas de la plataforma lingüística.



The double representation of the concept

USUALLY you say that ‘horse’ is SYNONYMOUS of ‘steed’. I said ‘usually’ because until now the usual thing is to speak of synonyms WITHIN A SINGLE LANGUAGE. Until now semantics has been basically monolingual, flat.

Further terminology used with the same monolingual approach: ANTONYM (to raise/to lower). HYPERONYM: 'Furniture' is a HYPERONYM that contains several HYPONYMS (chair, table, wardrobe, cabinet, etc.).

NEW SITUATION.
The construction of the Conceptual (Potentially) Universal Tree, in which the elements of each language extend superficially in parallel layers in contact at multiple points entails that WE NEED to speak of a SEMANTICS which is —multi-dimensional? multifacetic? in relief? stereo? new term?

What is ‘table’ [cas] with respect to ‘table’ [ing] and ‘taula’ [cat]? If they belonged to the same language they would be synonyms.
What is ‘monter’ [fra] with respect to ‘descendre’ [fra], ‘baxar’ [ara], ‘baixar’ [cat], ‘to come down’ [ing]?. If ALL them belonged to the same language they would be antonyms.

In order to focus this subject adequately we must introduce an element that in —flat? semantics (at least for the question that occupies us) usually is not considered. I mean the ‘concept’. Of course it is considered but it appears as something given, the relations are established between meanings, not between significant(s) and meaning(s).

The concept is what draws itself or appears in the mind of a person when he or she hears/reads/sees/ a horse or the name ‘caballo’ [cas], ‘cheval’ [fr], ‘caball’ [cat], ‘horse’ [eng], or the image of a horse is suggested to him or her.

In all cases, [cas], [fr], [cat], [eng], etc. the concept (mental image) IS ONE and THE SAME —although it can differ accessorily, not essentially (due to cultural causes or personal experience— from one to another person).

NEW METHODOLOGY.
We represent each CONCEPT with a SYMBOL that has certain properties and characteristics. A SYMBOL is the FIRST REPRESENTATION of a CONCEPT. It replaces, in the traditional scheme of Saussure, what he calls the ‘signifier’.

The SYMBOL is bipolar, on the left it connects with the concept which it represents (signifier, Saussure), on the right it connects with as many forms or SECOND REPRESENTATIONS as languages in which speakers know or ‘use’ that concept. Each symbol acts as a SEMANTIC VARIABLE.

On the one hand IT REPRESENTS (first representation) the given concept.

On the other, (second representations) each and every one of the words or expressions whereby the CONCEPT is represented in all the languages of the world where that concept exists.

With the ‘double representation’ each CONCEPT has one FIRST representation that is its SYMBOL and multiple SECOND representations (or at least one).

Each SYMBOL is UNIQUE and represents a single CONCEPT.

Each SYMBOL is included in another one (except the original symbols, those consituted by only one discreet element) forming an inclusive treelike structure.

Located in this new dimension, the question "What is ‘mesa’ [cas] with respect to ‘table’ [ing] and with respect to ‘taula’ [cat]?" makes now sense.
A new type of relation appears (interlinguistic relation by opposition to intralinguistic relation) that before did not exist: How do we call the relation that exists between ‘mesa’ [cas], ‘table’ [eng] and ‘taula’ [cat]?. They are not synonyms because they do not belong to the same language. What are ‘monter’ [fr], ‘baxar’ [ara], ‘baixar’ [cat], ‘to come down’ [eng]. They are not antonyms because they do not belong to the same language.

In consequence with the assumptions of —stereo? SEMANTICS, there is a third element that unifies them in spite of belonging to different languages: the CONCEPT (mental image) and its first representation (its physical form), its SYMBOL.

/DEA/ is the SYMBOL (first representation) of the CONCEPT that in [ing] is expressed thus: “Anyone of the movable articles of a house …” and whose second representations are ‘supellex’ [lat], ‘meuble’ [fra], ‘furniture’ [ing], ‘moble’ [cat], ‘mueble’ [cas].

/DEAD/ is the SYMBOL (first representation) of the CONCEPT that in [eng] is expressed thus: “A piece of furniture consisting of a flat smooth top …” and whose second representations are ‘mensa’ [lat], ‘table [fr], ‘table’ [ing], ‘taula’ [cat], ‘mesa’ [cas].

In FLAT? SEMANTICS ‘furniture’ is a HYPERonym of ‘table’, ‘chair’, ‘sofa’, ‘cupboard’.
In STEREO SEMANTICS?

Flat Semantics— Stereo Semantics—
synonyms: horse steed synonotios: horse caballo cheval
antonym: go up come down antinotios: go up descendre
hyperonym: furniture hypernotio: Furniture
hyponyms: chair table cabinet hyponotios table chair mesa cupboard

Which applications does this theoretical development have?
Information retrieval in multiple languages by means of a single symbol (information sciences, libraries, Internet search).

Location of occurrences of COMPLETE conceptual fields in corpus linguistics. One search for /DEA%/ would allow us to recover ‘mensa’ [lat], ‘table’ [fra], ‘table’ [ing], ‘taula’ [cat], ‘mesa’ [cas] and 'chair', 'stool', 'closet', 'bed', etc. in multiple languages.

The accomplishment and automatic computation of surveys with /open / closed questions or open /closed questionnaires in all the languages of the multilinguistic platform starting off from any language, without needing to know the other languages nor to translate the results. The results are accessible from all the languages, each user in his or her own language, with no translation being required.

This type of survey would allow to group all the hyponotios (hyponyms) in their hypernotio (hyperonym). For example, an open answer of the type ‘to devour’ [ing] would be grouped with others like ‘to gulp’, ‘to swallow’, ‘to cram down’, ‘engloutir’, ‘avaler’, ‘boufrer’, ‘engullir’, ‘tragar(se)’, ‘zampar(se)’, ‘abalar’, ‘trusquir’ and all of them assimilated to their hypernotio (hyperonym) ‘to eat voraciously’ / ‘comer con voracidad’ / ‘manger avec voracité’ / ‘minchar con angluzia’ and this one with its superhypernotio (superhyperonym) ‘to eat’ / ‘comer’ / ‘manger’ / ‘minchar’ … simultaneously in all the languages of the linguistic platform.



La double représentation du concept

NORMALEMENT, nous disons que ‘cheval’ est SYNONYME de ‘coursier’. Je dis ‘normalement’ parce que ce qui est normal jusqu'à présent est de parler de synonymes DANS une SEULE LANGUE. Jusqu'à présent la sémantique a été principalement monolingue, plate.


D'autres termes utilisés avec la même analyse monolingue : ANTONYME (monter/baisser). HYPERONYME: Meuble est un HYPERONYME qui contient plusieurs HYPONYMES (chaise, table, armoire, etc.).

NOUVELLE SITUATION. Le fait de construire l'Arbre Conceptuel (potentiellement) Universel, dans lequel les éléments de chaque langue sont superficiellement étendus dans des couches parallèles et en contact dans de multiples points fait qu'IL NOUS FAUT parler d'une SÉMANTIQUE —pluridimensionnele? multifacétique? en relief? Stéréo? nouveau terme?

Qu'est-ce que c'est ‘mesa’ [cas] à l'égard de ‘table’ [ing] et à l'égard de ‘taula’ [cat]?. S'ils appartenaient la même langue ils seraient des synonymes. Qu'est-ce que c'est ‘monter’ [fra] à l'égard de ‘descendre’ [fra], ‘baxar’ [ara], ‘baixar’ [cat], ‘to come down’ [ing]?. Si TOUS appartenaient la même langue ils seraient des antonymes.

Pour focaliser adéquatement le sujet nous devons introduire un élément qui dans le sémantique —plate? (au moins pour la question qui nous occupe) n'est pas généralement pris en considération. Il s'agit du ‘concept’. Évidemment qu'en effet il est pris en considération, mais comme quelque chose de donné: le jeu de relations est établi entre des significations, pas entre significant(s) et signification(s).

Le concept est ce qui est dessiné ou apparaît dans l'esprit d'une personne quand elle entend/lit/voit/lui un de // ‘caballo’ [cas], ‘cheval’ [fr], ‘caball’ [cat], ‘horse’ [ang], etc.// ou l'on lui suggère l'image d'un cheval.

Dans tous les cas, [cas], [fra], [cat], [ing], etc. le concept (image mentale) EST UN et LE MêME (même s'il peut différer accessoirement /pour des causes culturelles?, d'expérience personnelle?— d'une personne à une autre).

NOUVELLE MÉTHODOLOGIE.
Nous représentons chaque CONCEPT avec un SYMBOLE qui a des propriétés et caractéristiques données. Un SYMBOLE est la PREMIÈRE REPRÉSENTATION d'un CONCEPT. Il remplace, dans le schéma traditionnel de Saussure, ce qu'il appelle le signifiant.


Le SYMBOLE est bipolaire, à gauche il est relié au concept qu'il représente (signification, Saussure), à droite il est relié à tant de formes ou REPRÉSENTATIONS SECONDES comme il y a des langues dans lesquelles les personnes parlant cette langue possèdent ce concept. Chaque symbole agit comme une VARIABLE SÉMANTIQUE.

D'une part il REPRÉSENTE (première représentation) le concept. D'autre part, (secondes représentations) chacune des mots ou expressions avec lesquelles le CONCEPT est représenté dans toutes les langues du monde où ce concept existe. Avec la ‘double representation’ chaque CONCEPT a une PREMIÈRE représentation qui est son SYMBOLE et de multiples représentations SECONDES. Chaque SYMBOLE est UNIQUE et représente un seul CONCEPT.

Chaque SYMBOLE est inclus dans un autre (sauf les symboles primitifs, ceux qui sont constitués par un seul élément discret) en formant une structure inclusive en arbre.

Située dans cette nouvelle dimension, la question "Qu'est-ce qu'est ‘mesa’ [cas] à l'égard de ‘table’ [ing] et à l'égard de ‘taula’ [cat]?" acquiert un sens. Il apparaît un nouveau type de relation qui n'existait avant pas (une relation interlinguistique par opposition à une relation intralinguistique): Comment appelons-nous la relation qui existe entre ‘mesa’ [cas], ‘table’ [ang] et ‘taula’ [cat]?. Ils ne sont pas synonymes parce qu'ils n'appartiennent pas à la même langue. Qu'est-ce c'est ‘monter’ [fra] à l'égard de ‘bajar’ [cas], ‘baixar’ [cat], ‘to come down’ [ang]? Ils ne sont pas antonymes parce qu'ils n'appartiennent pas la même langue.

En étant conséquents avec l'approche de la SÉMANTIQUE —stéréo?, il y a un troisième élément qui leur donne unité bien qu'appartenant à des langues différentes : le CONCEPT (image mentale) et sa première représentation (forme physique), son SYMBOLE.

/DEA/ est le SYMBOLE (première représentation) du CONCEPT qui en [fra] est ainsi exprimé : « Chacun des objets transportables… qui ont dans une maison,… » et dont les secondes représentations sont ‘supellex’ [lat], ‘meuble’ [fra], ‘furniture’ [ing], ‘moble’ [cat], ‘mueble’ [cas].

/DEAD/ est le SYMBOLE (première représentation) du CONCEPT qui en [cas] est ainsi exprimé : « Meuble constitué par une surface horizontale… » et dont les représentations secondes sont ‘mensa’ [lat], ‘table’ [fra], ‘table’ [ing], ‘taula’ [cat], ‘mesa’ [cas].

En SÉMANTIQUE PLATE ? nous trouvons que ‘mueble’ est un HYPERonyme de table, chaise, armoire.
En sémantique stéreo?

Semantique Plate Semantique Stéreo
sinonymes: cheval coursier synonotios: caballo horse cheval
antonymes: monter baisser antinotios: subir descendre
hyperonyme: meuble hypernotio: meuble
hyponymes: chaise, table, armoire hyponotios: mesa chair table cupboard


Quelles applications a ce développement théorique ?
Récupération d'information dans de multiples langues au moyen d'un seul symbole (sciences l'information, bibliothèques, chercheurs d'internet).


Localisation de présences de domaines conceptuels COMPLETS en linguistique de corpus. Une cherche /DEA%/ nous permettrait de récupérer ‘mensa’ [lat], ‘table’ [fra], ‘table’ [ing], ‘taula’ [cat], ‘mesa’ [cas] et 'chaise', 'tabouret', 'armoire', 'lit', etc. dans de multiples langues.

La réalisation et le calcul automatique d'enquêtes avec des questionnaires ouverts, fermés ou avec des questions ouvertes dans toutes les langues de la plate-forme multilinguistique en partant d'une langue, sans avoir besoin de connaître les autres langues ni de traduire les résultats. Les résultats sont accessibles depuis toutes les langues, chaque consultant dans sa langue, sans avoir besoin de traduction. Ce type d'enquête permettrait de grouper toutes les hyponotios (hyponymes) dans leur hypernotio (hyperonyme). Par exemple, une réponse ouverte du type ‘dévorer’ [fra] pourrait être groupée avec d'autres comme ‘engloutir’, ‘avaler’, ‘boufer’, ‘engullir’, ‘tragar(se)’, ‘zampar(se)’, ‘to gulp’, ‘to swallow’ ‘to cram down’, ‘abalar’, ‘trusquir’ et toutes autres assimilées à son hypernotio (hyperonyme) ‘manger avec voracité’ / ‘comer con voracidad’ / ‘to eat voraciously’ / ‘minchar con angluzia’ et celui-ci avec le superhypernotio (superhyperonyme) ‘manger’ / ‘to eat’ / ‘comer’ / ‘minchar’ … simultanément dans toutes les langues de la plate-forme linguistique.


Se verá que esta propuesta tiene algo en común con los proyectos de lenguaje universal de los siglos XVII y XVIII, en especial con el idioma analítico de John Wilkins, expuesto en su obra An Essay towards a Real Character and a Philosophical Language (1668). Por cierto que Wilkins, como Cyrano de Bergerac, también es un precursor de la idea de viajes espaciales; fue quizá el primero que propuso seriamente viajar a la luna (ahora que la NASA dice que lo va a intentar otra vez imitándose a sí misma), y predijo (y ayudó en parte a efectuar) la invasión tecnológica de cacharros móviles y voladores y automáticos que ahora nos rodean.

Bien, se recordará el idioma analítico de Wilkins fue ridiculizado por algunos, visto que era totalmente imposible aprenderlo. Hasta el artículo de Borges sobre Wilkins, en Otras Inquisiciones, "El idioma analítico de John Wilkins", se mueve entre la admiración y la ironía. De hecho, muchos seguramente creen que John Wilkins es producto de la imaginación de Borges.

Pero Zirano tiene varias ventajas con respecto al idioma de Wilkins, aparte de que Miguel Santolaria sí existe: primero, no hace falta aprender los símbolos universales en que se basa, pues su estructura está informatizada, y se consulta en el propio idioma de cada cual. Aparte, tiene una utilidad práctica factible: no pretende sustituir a las demás lenguas ni sistemas de escritura, sino que es sólo una herramienta que permita compararlas y ayudar así a la elaboración de diccionarios y a la traducción.

¿El inconveniente? Bueno, pues que requeriría el trabajo de muchas personas, en muchas lenguas diferentes. No puede ser desarrollado, excepto en forma muy limitada, por una persona ni por un equipo pequeño: está pensado para que crezca por la participación espontánea de los usuarios—un fenómeno en torbellino al estilo wikipedia le vendría bien y sería su medio natural. Pero no está todavía en fase de arrancar así exponencialmente. Y cómo se pone en marcha un torbellino viral de ese estilo, es una ciencia que de momento nos supera. Si lo supiésemos, nos dedicaríamos al márketing, o seríamos personajes de alguna novela de William Gibson.


No hay comentarios:

Publicar un comentario

Se aceptan opiniones alternativas, e incluso coincidentes:

Mi fotoblog

Mi fotoblog
se puede ver haciendo clic en la foto ésta de Termineitor. Y hay más enlaces a cosas mías al pie de esta página.