El empuje de Meta por la IA no se detiene. Esta vez, la compañía de Mark Zuckerberg ha presentado SeamlessM4T, un nuevo modelo de inteligencia artificial multilingüe y multimodal capaz de reconocer, transcribir y traducir hasta 100 idiomas. De acuerdo con los de Menlo Park, se trata de la primera inteligencia artificial "todo en uno" dedicada a labores de este tipo.

Según el blog oficial de Meta, esta nueva IA forma parte de una estrategia que aspira a desarrollar un traductor universal. Una labor por demás compleja, pero a través de la cual la compañía se propone terminar con las barreras idiomáticas entre las personas de cualquier parte del mundo.

A través de su canal de difusión en Instagram, Mark Zuckerberg brindó una breve descripción de SeamlessM4T. El CEO de Meta explicó que la IA en cuestión puede reconocer y traducir hasta 100 idiomas en una variedad de combinaciones: voz a texto, texto a voz, voz a voz y texto a texto. Y dejó en claro que su plan es incorporar la tecnología en los principales servicios de la compañía. "Con el tiempo, integraremos estos avances de traducción y transcripción a través de inteligencia artificial en Facebook, Instagram, WhatsApp, Messenger y Threads", aseveró.

Además, el empresario compartió un breve vídeo con una demostración de cómo funciona SeamlessM4T, y los resultados mostrados son más que interesantes.

SeamlessM4T, la nueva IA multilingüe de Meta

Para crear su nueva IA, Meta tuvo que desarrollar un set de datos de gran calibre. El mismo, bautizado como SeamlessAlign, está basado en miles de millones de oraciones de texto y 4 millones de horas de registros de voz extraídos de la web. Como suele suceder en este tipo de lanzamientos, la compañía afirma que la información en cuestión proviene de fuentes disponibles públicamente.

Con los datos obtenidos, los de Zuckerberg afirman haber podido "alinear automáticamente más de 443.000 horas de voz con textos", así como crear unas 29.000 horas de alineaciones de voz a voz.

Si bien SeamlessM4T se presenta como un avance muy interesante, no todas sus tareas ofrecen soporte para un centenar de idiomas. En su blog dedicado a los avances en IA, Meta explica que el nuevo modelo es capaz de reconocer automáticamente hasta 100 idiomas a partir de un registro de voz. También soporta esa cantidad de idiomas como método de entrada y salida para traducir de voz a texto y de texto a texto.

No obstante, otras tareas están un poco más limitadas. En el caso de las traducciones de texto a voz y de voz a voz, la inteligencia artificial reconoce hasta 100 idiomas como método de entrada, pero puede entregar resultados en hasta 36 lenguajes, incluyendo el inglés.

SeamlessM4T, la nueva IA multilingüe de Meta

En busca de crear un traductor universal

Esta no es la primera vez que Meta experimenta con una IA multilingüe. A mediados del año pasado, la compañía lanzó NLLB-200, un modelo de código abierto capaz de traducir hasta 200 idiomas en tiempo real. Uno de los avances importantes de dicha propuesta era que podía traducir entre dos idiomas de forma directa —de birmano a español, por ejemplo—. Esto implicaba no tener que pasar por el inglés como un punto intermedio.

Será interesante ver no solo cómo Meta incorpora SeamlessM4T en sus principales servicios, sino también cómo se aprovecha esta tecnología en labores de investigación. La IA y el set de datos SeamlessAlign se lanzarán bajo licencia Creative Commons (CC BY-NC 4.0).