AlphaGo Zero, primera inteligencia artificial autodidacta

DeepMind, la compañía que Google adquirió en 2014, ha presentado la última versión disponible de su inteligencia artificial, AlphaGo. El software, al que han denominado AlphaGo Zero, es capaz de aprender por sí solo sin ayuda humana y sin conocimientos previos de Go, el tradicional juego chino al que las máquinas batieron por primera vez el año pasado. La última versión de la inteligencia artificial de Google, AlphaGo Zero, ha batido a su predecesora por cien juegos a cero. El anterior AlphaGo logró vencer a Lee Se-dol, campeón mundial de Go, en marzo de 2016, por lo que el nuevo software podría considerarse como prácticamente imbatible.

Según explica en el trabajo publicado en Nature el equipo de Demis Hassabis, CEO de DeepMind, la última versión de la inteligencia artificial de Google utiliza una única red neuronal y cuatro chips especializados para el entrenamiento de redes neuronales. Por el contrario, el software anterior empleaba múltiples máquinas y 48 chips especializados (TPU, por sus siglas en inglés). El programa está diseñado para aprender desde cero de forma autodidacta con el objetivo de predecir la selección de movimientos y el ganador de sus partidas, mejorando con cada repetición del juego.

Tras unos días de entrenamiento, AlphaGo Zero consiguió completar más de cinco millones de partidas consigo mismo y batir la capacidad humana y de las anteriores versiones conocidas. El autoaprendizaje de la inteligencia artificial permitió que el programa de DeepMind descubriera por sí mismo los principios del mismo juego que tardaron en conocer los seres humanos miles de años, además de conceptualizar y desarrollar estrategias novedosas para resultar imbatible en este pasatiempo ancestral de origen asiático.

"Es increíble ver lo lejos que ha llegado AlphaGo en solo dos años. AlphaGo Zero es ahora la versión más sólida de nuestro programa y demuestra el progreso que podemos alcanzar incluso con una menor potencia de computación y evitando el uso de datos humanos", destaca Demis Hassabis, cofundador y CEO de la compañía.

El investigador, que llegó a ser descrito por The Guardian como "el superhéroe de la inteligencia artificial", destaca que avances como los conseguidos por su algoritmo podrían ayudar a resolver "todo tipo de problemas apremiantes del mundo real", como resolver el plegamiento de las proteínas o ayudar en el diseño de nuevos materiales.

Satinder Singh, especialista en Computación de la Universidad de Michigan, valora el trabajo como "un gran avance". El científico señala en una tribuna publicada en Nature News & Views que el método de aprendizaje del software es "novedoso", aunque combina "aspectos básicos y familiares" del aprendizaje por refuerzo autónomo. Las conclusiones de DeepMind, a juicio del investigador, que no ha participado en el estudio, muestran que probablemente los resultados de la inteligencia artificial sean mejores si emplean esta técnica que si se apoyan en la experiencia humana.

No obstante, Singh alerta de la "obsesión de los medios de comunicación" por el enfrentamiento entre la inteligencia artificial y los humanos. "Sí, otro bello y popular juego ha caído en poder de las máquinas, y sí, el método de aprendizaje por refuerzo autónomo puede ser aplicado en otras tareas. Sin embargo, este no es el principio del fin porque AlphaGo Zero, como otros programas exitosos, es extremadamente limitada en lo que sabe y respecto a lo que puede hacer en comparación con los humanos e incluso con otros animales", advierte el experto. Por su parte, el CEO de DeepMind también destaca el lado positivo de sus investigaciones, al resaltar que "si podemos hacer los mismos progresos con los problemas actuales que los avances conseguidos con AlphaGo, tendremos el potencial de impulsar la comprensión humana y tener un impacto positivo en nuestras vidas".