Llega el momento para centrarnos en probablemente la mayor novedad del día de ayer, más allá de la modesta actualización del iPhone 4S que supone renovar la potencia, la cámara y poco más. Pero Siri es algo diferente, una nueva función que solo está disponible en el iPhone 4S dotándolo por tanto de una características diferenciadora que podría convertirse en la forma de comunicarnos con las máquinas de Apple a partir de ahora.
Por todo ello conviene comprender de qué se trate exactamente así como entender su funcionamiento para que después cada uno de nosotros saquemos nuestras propias conclusiones.
Qué es Siri
En la definición que ayer se dio de esta nueva característica, Phil Schiller lo llamó el "asistente inteligente que nos ayuda a hacer las cosas solo con preguntar". Quizás esta sea la mejor forma de describirlo, se trata de un ayudante, una especie de máquina inteligente que nos ayuda a averiguar cosas o simplemente a interactuar con el dispositivo. Por supuesto esta idea no es nueva. Por ejemplo, la misma Apple ya soñó con esta posibilidad en 1987 en lo que se dio en llamar Knowledge Navigator (el navegador del conocimiento), pero claro, en aquel tiempo solo eran conceptos de lo que podría ocurrir algún día.
No fue sino hasta mediados de los 90 que empezamos a ver el sistema Naturally Speaking que muchos de vosotros recordaréis bajo el nombre comercial Dragon de la empresa Nuance. Personalmente tuve este programa aunque su funcionamiento era bastante tosco, había que dedicar bastante tiempo a enseñar a nuestro ordenador y para ello se nos pedía que leyésemos un fragmento del Quijote (creo recordar). Este concepto evolucionó a procesos algo más complejos pero que seguían basándose en la misma idea: una computadora o similar siguiendo al pie de la letra lo que se le decía como si formara parte de un dictado. Apple poseía hasta ahora el Control por voz que aún podemos utilizar si mantenemos el botón de inicio de nuestro iPhone pulsado unos segundos. Este Control responde a frases predefinidas muy concretas. Un sistema similar usa Google por ejemplo en los Android mediante Google Voice Actions, mensajes fijados dan lugar a acciones predefinidas.
Pero esto no era lo que imaginaba Apple en 1987, ellos imaginaban una máquina con las que se pudiera conversar, que adoptara una forma de pensar casi humana mediante la Inteligencia Artificial. Esta idea era precisamente la que tenía también el ejército de los Estados Unidos en 2003, quien comenzó a experimentar con la ayuda de empresas comerciales el desarrollo de un ayudante para los soldados controlado por voz. Un proyecto que tras su terminación dio a luz a Siri, una compañía que investigaba complejos sistemas para interpretar el lenguaje y que hasta llegó a implantar una aplicación para iPhone que seguramente ya habréis visto en vídeo o habréis probado vosotros mismos.
Y aquí llegamos a la actualidad. En abril del año pasado Apple compró Siri con la clara idea de integrar tarde o temprano esta tecnología en sus dispositivos. Fijaos que no compró Nuance, la empresa de reconocimiento de voz que utilizaba la app Siri porque esa era solo una parte del sistema, la base digamos. Lo que Apple quería era el algoritmo de Siri, cómo era capaz esa aplicación de entender el lenguaje aunque fuesen expresiones complejas sin orden aparente. Y por fin, eso es Siri en el iPhone 4S. Siguiendo el listado que hizo Schiller, Siri puede ser descrita en los siguientes aspectos:
- Lenguaje natural: Podemos hablarle como si se tratase de una persona cualquiera, con la misma naturalidad y espontaneidad, sin aprender métodos o expresiones, no hay que mantener un orden al hablar ni obedecer a ciertos requerimientos como "Reproducir música" ni nada por el estilo, basta con decir "Quiero escuchar X" y Siri lo hará. No será necesario expresarnos con los términos "Meteorología para el 5 de octubre en mi zona", bastará con decir "¿Necesitaré paraguas hoy?". No habrá que pedir "Llama a Ana", bastará con decir "Llama a mi mujer".
- Conversacional: Siri no es unidireccional, no es un humano hablándole a una máquina sino que se produce una comunicación bidireccional, el sistema también nos habla, nos pregunta, propone, nos muestra posibilidades, nos dice en qué estado se encuentra en la acción que le hemos ordenado y hasta responde ante preguntas sobre su propio propósito. En la demostración que llevó a cabo Scott Forstall este preguntó "qué eres" y ella respondió "Un humilde asistente personal".
- Contextual: Como parte de la inteligencia artificial a la que nos hemos referido antes, Siri hace uso del contexto para continuar buscando. Por ejemplo, llegó un momento en que Scott quería saber si tenía hueco en la agenda para comer con Schiller tras proponerle la cita este último. Siri mostró que había posibilidades y después volvió al mensaje de Schiller esperando que un dato estuviera relacionado con el otro.
- Funciona con las apps nativas: Recordatorios, Mapas, Safari, son algunas de las apps propias de Apple que son utilizadas por Siri para ayudar al propietario del teléfono.
- Dictado: Por supuesto, como parte del sistema, podemos dictar a Siri para que escriba por nosotros, solo hay que pulsar en el icono de micrófono que aparecerá en el teclado virtual de los iPhone 4S para completar correos, mensajes, etc.
Gracias a lo anterior habrá múltiples acciones que podremos solicitar a Siri para que las haga por nosotros. Consulta del tiempo, fijar alarmas, añadir recordatorios, comenzar contadores de tiempo. Y con la integración de WolframAlpha y Wikipedia las posibilidades son aún más grandes. Ya os hablamos de WolframAlpha y me parece todo un acierto, pues posee capacidades de búsqueda que no tiene Google, al ofrecer información estructurada como respuesta a las búsquedas en lugar de una lista de enlaces. Por cierto, en este apartado es interesante que Google haya quedado a un lado, no creo que sea pura casualidad.
Cómo funciona
Su funcionamiento es muy sencillo, para utilizarlo necesitaremos tener un iPhone 4S en primer lugar. La razón para esta exigencia es la propia capacidad del sistema, parece que Siri consume elevados recursos al sistema pero el nuevo smartphone con procesador de doble núcleo y seguramente más RAM solventa estas necesidades sin problema. Apuesto a que en breve veremos a algunos hackers intentando portar Siri al iPhone 4, y sabremos si es cierto este razonamiento o si simplemente Apple ha restringido esta función al 4S para vender más, como sostienen algunos.
Para activar Siri solo debemos mantener el botón de inicio pulsado algunos segundos de manera similar a como hacemos hoy día con el Control por voz. Entonces veremos desplegarse abajo el nuevo icono a la espera de órdenes. Por último, para utilizar Siri a partir del día 14 en que el iPhone 4S se pone a la venta tendremos que hablarle en inglés, francés y alemán. Sí, es una auténtica lástima que no podamos hacerlo en el idioma de Cervantes ni ninguna otra de las lenguas que se hablan en nuestros territorios. Recordemos que Schiller mencionó que el desarrollo aún estaba en fase beta pero que se le añadirían nuevos idiomas tan pronto como fuese posible. Aún así, recordemos que nuestros acentos y formas de hablar son diferentes dependiendo de región o país y esto es un impedimento. Si os fijáis en la captura de más abajo, en la lista de lenguajes se diferenciaba entre el inglés norteamericano del británico y del australiano, dando a entender que portar el sistema a cada uso de la lengua requirió desarrollo separados.
Conclusión
Siri no es tanto lo que hace como lo que puede llegar a ser, en esta presentación Apple abre la puerta a un nuevo mundo de posibilidades como ya lo hizo con el sistema multitáctil, dando un nuevo aire más elegante y eficaz a procesos ya inventados. El futuro podría consistir en portar el sistema al iPad (seguro al iPad 3) y al Mac, dos máquina electrónicas que podrán acoger sin problemas un asistente como este y donde pueden desempeñar un rol significativo.
Aún así, a mi parecer, quedan muchas dudas en el aire cuya respuesta demostrará si Siri es tan bueno como dicen. Por ejemplo, ¿cómo se comporta en ambientes con poco ruido? ¿qué tal funciona en la etapa de aprendizaje, si es que la tiene? ¿Aburrirá a los usuarios una vez produzca los primeros fallos de entendimiento o sea algo más lento que nuestros dedos en reaccionar? Lo sabremos cuando podamos tenerlo en nuestras manos.