Nuance Communications, empresa responsable de uno de los sistemas de reconocimiento de voz más potentes del mercado (creadores de Dragon Dictation para iOS, ya fue el pasado noviembre víctima de una serie de rumores (generados por un comentario desafortunado del gran Steve Wozniak, de los que luego se retractó) que hablaban de su posible compra por parte de Apple. Ahora, vuelven los rumores, pero esta vez en forma de acuerdo de colaboración para cerrar una de las estrellas del próximo iOS 5: el reconocimiento de voz y la inteligencia artificial.

Miremos atrás y recordemos a Siri, una compañía que fue comprada por Apple hace 1 año. Desde entonces no hemos vuelto a saber nada de ella, pero Siri tenía una aplicación para iPhone que era realmente interesante: un asistente personal con uso de la inteligencia artificial unida a las búsquedas y al reconocimiento de voz.

Imaginad que queremos ir a cenar a un restaurante italiano en el centro de la ciudad, y le decimos al teléfono: "quiero ir a cenar a un restaurante italiano en el centro de la ciudad". La aplicación te geolocaliza para saber en qué ciudad estás, y entra en el catálogo de restaurantes de la misma, busca en esa zona y nos propone opciones. Cuando hemos visto qué nos puede interesar, le decimos: "quiero una reserva para dos personas en el restaurante X sobre las 10 de la noche". La aplicación buscará en los servicios online de reserva de restaurantes y nos propondrá, para ese restaurante, la reserva más cercana en hora a lo que hemos sugerido.

Ahora ya tenemos hecho el plan, pero luego queremos ir al cine y le preguntamos: "quiero ir esta noche a ver la película Y en un cine en 3D". La aplicación sabe contextualmente que esta noche hemos reservado la cena, y que tenemos dicha resserva a las 22:15 horas. Por lo tanto, nos ofrece sesiones que correspondan a una hora prudencial posterior a la cena, y en la misma zona donde estamos cenando. Vemos los cines, pulsamos en uno y decimos. "Cómpra dos entradas para la sesión de las doce y cuarto que estén centradas". La aplicación usará nuestro dato de tarjeta, entrará en el sistema, reservará dos entradas lo más centradas posibles y nos pedirá la confirmación del dato de nuestra tarjeta para hacer el pago. Pero imaginad que no nos gustan los cines que hay alrededor y queremos otros. Decimos: "quiero verla en los cines Z"*. La aplicación sabe la película que estamos buscando y busca en los cines Z que están fuera de la zona donde estamos cenando. Entonces busca y propone horarios que tengan añadido el tiempo de desplazamiento en coche que supone desde la zona donde estamos hasta dónde vamos a ir. Ese es el concepto que aporta Siri con su inteligencia artificial.

Si os habéis fijado en el vídeo, la tecnología de reconocimiento de voz que usaba Siri es la de Nuance Commucations. Por este motivo, parece que ahora ya ha salido a la luz que habría un posible acuerdo de colaboración de dicha compañía con Apple, según comentan desde techcrunch, para que estos pudieran usar su tecnología de reconocimiento de voz, preparada para múltiples idiomas, en la nueva versión del sistema operativo de Apple. De esta forma, Apple no tendría que hacer el enorme desarrollo que supone unas librerías de estas características, más con lo que supone el soporte multi-idioma.

Si habéis probado algunas de las soluciones de Nuance, como Dragon for Mac o la menciona aplicación de iPhone, habréis visto que la tecnología de esta compañía es especialmente asombrosa y tiene un funcionamiento impecable en un 98% de las veces. Es capaz de reconocer el habla en un lenguaje natural sin ningún tipo de dificultades, y sin tener que hablar despacio o marcando los espacios, como sucedía en los inicios del reconocimiento de voz.

Imaginad entonces la increíble funcionalidad extra que se aportaría a nuestro dispositivo, si además incluimos esta tecnología dentro del contexto del propio sistema operativo, pudiendo permitirnos, como ya hace Google Voice Actions para Android, dictar correos electrónicos o lanzar aplicaciones. Las posibilidades de integración de un motor de reconocimiento de voz con compresión semántica, contextual y algoritmos de inteligencia artificial, podrían suponer que nuestros dispositivos iOS casi parecieran dispositivos de ciencia ficción.

En poco menos de un mes saldremos de dudas, en el WWDC de este año, cuando se presente al mundo la nueva versión de iOS, que probablemente se lanzará en septiembre en versión universal para todos los dispositivos que usan este sistema.

Recibe cada mañana nuestra newsletter. Una guía para entender lo que importa en relación con la tecnología, la ciencia y la cultura digital.

Procesando...
¡Listo! Ya estás suscrito

También en Hipertextual: