El supercómputo es un área fascinante con varios momentos clave en la historia de la computación. Uno de ellos nos ocupa hoy porque Watson, la supercomputadora creada por IBM, participará en Jeopardy! los días 14, 15 y 16 de febrero. Después de una impresionante etapa previa de entrenamiento --ver vídeo más adelante-- Watson medirá su "inteligencia" en vivo y en cadena nacional frente los dos campeones más importantes del concurso: un hecho mediático sin precedentes.

¿Cómo funciona Watson? ¿Por qué es capaz de enfrentar a un par de seres humanos en un concurso de preguntas abiertas sobre conocimiento general? ¿Qué sistema operativo le hace funcionar? Vamos a ver.

Algoritmos

Watson es una supercomputadora especializada en el procesamiento de lenguaje natural, el nuestro. En particular, es una implementación de DeepQA, un sistema de inteligencia artificial creado por IBM para responder preguntas abiertas acerca de cualquier dominio del conocimiento humano. Esto es complicado al extremo. La computadora debería ser capaz de entregar respuestas precisas e inteligibles, sintetizadas de una forma rápida y natural para un ser humano. Estamos hablando de un sistema eficiente en términos humanos, más que computacionales. No por nada los algoritmos implementados en Watson están enfocados en

  • Análisis y procesamiento de preguntas.
  • Análisis semántico para mejorar el desempeño del sistema.
  • Aprendizaje Maquinal para evaluar qué tan confiables son las respuestas.
  • Reconocimiento, relación y aprendizaje de las respuestas a lo largo del tiempo.
  • Reconocimiento del sentido y el contexto de las preguntas.

Para participar en Jeopardy!, IBM ha reunido un equipo de especialistas para crear otros algoritmos que ayuden a Watson a aplastar ganar a sus rivales. Algoritmos de

  • Estrategia para encontrar y evaluar posibles respuestas.
  • Valorar y estimar la certeza de las posibles respuestas con técnicas de Aprendizaje Maquinal.
  • Análisis y categorización de preguntas típicas de los juegos de palabras.
  • Estrategia para competir específicamente en las instancias finales de Jeopardy!, creados por Gerry Tesauro, experto mundial en juegos de computadora contratado por IBM.

Además, IBM ha creado un equipo para la síntesis de voz y reconocimiento del habla para que participe de forma natural en el concurso.

Ahora bien, vistos de manera muy general, estos son los pasos que van desde la pregunta a la respuesta:

  1. Pregunta
  2. Análisis de la pregunta.
  3. Descomposición de la pregunta en una consulta a la bases de datos.
  4. Generación de hipótesis
    • Búsqueda en las fuentes
    • Generación de respuestas candidatas
  5. Filtrado suave para las mejores respuestas (unas 100 en promedio)
  6. Calificación de las hipótesis en función de la evidencia.
  7. Síntesis de la posible respuesta.
  8. Respuesta.

Infraestructura

Esto es lo que sostiene a Watson:

  • 10 racks con 90 servidores IBM POWER 750 con 32 cores cada uno, es decir 2.880 unidades de procesamiento a 3.55 GHz cada una, lo que equivale a unos 80 teraflops.
  • Sistema operativo Novell SUSE Linux Enterprise Sever 11 (SLES).
  • Almacena más de 200 millones de páginas de información en un disco de 4 Terabytes.
  • 16 Terabytes de memoria RAM.

Así es, Watson está operado por Linux. Y si corriera sobre un sólo CPU, le llevaría unas dos horas contestar una pregunta, por eso necesita un cluster de esas dimensiones para responder rápida y correctamente. La gente de IBM, menciona que

estamos en un momento muy especial [...] Estamos en un momento en el que las computadoras y su tecnología han alcanzado a los humanos. Hemos creado un sistema computacional con la habilidad para entender el lenguaje natural, lo cual es algo muy difícil de conseguir para las computadoras.

Watson será probado en Jeopardy! para que el mundo entero la admiré --con la boca abierta-- como un magnífico monumento dedicado como pocos a las ciencias de la computación y en especial a la inteligencia artificial. Su futuro no estará en Jeopardy!, sino en la administración y análisis de datos para diferentes áreas de la industria y el gobierno: salud, finanzas, servicio a clientes, ciencia. IBM verá subir sus bonos y quizá venda más máquinas.