Cepheus es una máquina diseñada para ser prácticamente invencible en el póker. Gracias a un ingenioso algoritmo y varios meses de entrenamiento, los investigadores han creado al jugador perfecto en este juego.

Esta afirmación parece demasiado categórica, pero sus autores no dudan en que es así. La estrategia diseñada por los investigadores para Cepheus es tan cercana a la perfección que reduce las posibilidades para un ser humano de ganar a cifras completamente despreciables. Aunque no es la primera máquina capaz de auténticos prodigios a la hora de jugar, la comunidad científica se sorprende de la rapidez con la que se ha llegado a resolver este algoritmo. Aunque otros juegos fueron "resueltos" anteriormente, como las damas, el póker estaba lejos de hallar una estrategia adecuada por su dificultad. Hasta ahora.

Resolviendo el póker

El póker, como juego, tiene una dificultad que no presentan otros similares. Resolver desafíos como las damas es relativamente sencillo, matemáticamente hablando. El ajedrez presenta todavía bastante dificultad aunque se han obtenido grandes resultados, como todos sabemos. Sin embargo, el póker es un juego de información imperfecta, según la teoría de juegos. Esto quiere decir que la información con la que actúa cada jugador no es completa e incluso puede ser falsa. Si tenemos en cuenta que esta información es esencial para desarrollar una estrategia, nos encontramos ante un problema bastante grave de resolver.

Cepheus jugó durante 2 meses en 4.000 ordenadores analizando más de 6.000 millones de partidas por segundo y ordenadorAsí que el truco está en empezar desde cero. No en crear un algoritmo para resolver el juego sino uno para diseñar una estrategia efectiva desde la nada. Esto hizo Cepheus durante dos meses jugando en 4.000 ordenadores simultáneamente. Si tenemos en cuenta que puede analizar más de 6.000 millones de manos en un segundo, podemos afirmar que Cepheus ha jugado al póker más que toda la humanidad junta en su historia. Esto dio como resultado una estrategia perfecta en su juego, lo que convierte a Cepheus en un jugador sencillamente imbatible.

El algoritmo en el que se basa Cepheus es un conjunto de ecuaciones que centran su atención en aprender de la experiencia y que se denomina conditional random fields o CFR. A partir de una acción, Cepheus analiza cualquier posible situación, entre millones, valorando y eligiendo la mejor estrategia. Para ello, utiliza la información obtenida de un resultado erróneo, lo que los investigadores califican como "arrepentimiento" de Cepheus, de manera que el programa trata de reducirlo a 0 obteniendo siempre los mejores resultados aprendiendo de los errores pasados.

Para qué queremos a Cepheus

¿Qué tiene Cepheus, aparte de ser imbatible al póker, que sea tan impresionante? En primer lugar, como explicábamos, la velocidad con la que se ha resuelto el problema para esta variante de póker (llamada heads-up limit hold’em). Los investigadores llevan tiempo trabajando en un algoritmo para "romper" la estrategia de este juego y por fin pueden afirmar con rotundidad haberlo hecho. Pero el hallazgo no se queda ahí. Tal vez el apartado más importante sea el espectro de aplicaciones que podemos encontrar en la estrategia de Cepheus.
Desde la seguridad al desarrollo de sistemas de vida artificial, Cepheus presenta un increíble potencial de aplicación
En primer lugar, en cuestiones de seguridad. La seguridad informática es, sin duda, un campo de información imperfecta. Con algoritmos como este nuevas opciones se abren ante los investigadores, tanto para superar barreras como para entender la manera de fortalecer las reglas. Una aplicación directa sería la mejora sustancial de nuestros sistemas informáticos. Por otro lado, por supuesto, los jugadores podrán mejorar practicando contra Cepheus.

Puesto que el mundo del póker es muy lucrativo, nadie duda de la aplicación comercial que esto puede tener. Pero aún hay más. La biología es también uno de esos aspectos cuya información, por su complejidad, es también imperfecta. La aplicación en sistemas de vida artificial o desarrollo de IAs más avanzadas son los primeros puntos que se nos ocurren. Pero incluso un algoritmo capaz de aprender de los errores podría evaluar una situación y la mejor decisión según las simulaciones realizadas previamente, algo increíblemente útil en eventos críticos. Aunque esto ya existe, con Cepheus se lleva esta estrategia un paso adelante. Y, además, si te atreves, puedes echarte una partida de póker con él.

👇 Más en Hipertextual