No quiero comenzar este pequeño artículo sin mencionar que el Ugarítico es una lengua, hoy extinta, que fue hablada en Ugarit a partir del año 2000 aC. en la antigua Persia. Ahora bien, ¿qué tiene que ver esa lengua con el software de traducción en línea? Que un par de investigadores del MIT crearon un software para descifrar por vez primera en la historia buena parte de esa lengua, y que sus hallazgos servirán para que el significado de otras lenguas ---antiguas o no--- también sea develado y esto podría resultar sumamente útil para herramientas como Google Translate.

El software para traducir el Ugarítico nació a partir de un reto lanzado involuntariamente por Andrew Robinson en su libro _Lost Languages_, en el que decía:

> resulta que el descifrado arqueológico exitoso requiere una síntesis de lógica e intuición [...] eso que los ordenadores no poseen (y probablemente no puedan tener)

Regina Barzilay y su equipo se negaron a aceptar esas palabras. Así que luego de años de investigación llegaron a la implementación de un software con el que asumen lo siguiente:

1. Cualquier lenguaje por descifrar debe estar relacionado íntimamente con otro. Para el caso de Ugarítico, el lenguaje elegido fue el Hebreo.

2. Existe una forma sistemática para hacer corresponder el alfabeto de una lengua con el alfabeto de la otra. Los símbolos (carácteres) correlacionados ocurrirán con frecuencias similares en las dos lenguas. A nivel palabra, también habrá palabras correlacionadas en su raíz; éstas son las que conocemos como cognados, como "_homme_" y "_hombre_" en Francés y Español, respectivamente.

3. Finalmente, el software asume que existe una correlación estructural (número de partes) en las palabras compuestas de los idiomas comparados.

Con esos supuestos, el software genera mapeos alfabéticos (por carácter) y traducciones de palabras en sus correspondientes cognados utilizando técnicas clásicas de inteligencia artificial. Aplicado al Ugarítico, el software mapea correctamente 29 de 30 letras a sus contrapartes hebreas, y deduce el 60% de los cognados ugaríticos para el hebreo. Estos resultados parecen contradecir lo dicho por Robinson.

Aunque no podemos pensar que el software creado en el MIT descifre con éxito cada lengua que le sea entregada, los creadores ya le ven ayudando a expander la versatilidad del software de traducción de textos. Y es que de forma similar, muchos de los traductores que encontramos en línea hacen análisis estadísticos para determinar correspondencias entre palabras provenientes de lenguas distintas.

Google Translate hace traducciones para cerca de 60 lenguas. Unos de los creadores del software menciona que las técnicas usadas en su trabajo pueden ayudar a construir diccionarios para miles de lenguas más.

Vía: MITnews

Recibe cada mañana nuestra newsletter. Una guía para entender lo que importa en relación con la tecnología, la ciencia y la cultura digital.

Procesando...
¡Listo! Ya estás suscrito

También en Hipertextual: