Los videojuegos han tomado un papel importante en el entrenamiento de agentes de inteligencia artificial. OpenAI, quien ya trabajó con DoTA 2 hace algunos meses, ahora se vale del género multijugador masivo en línea para crear un nuevo sistema llamado Neural MMO.

Neural MMO es una plataforma para aprendizaje de refuerzo profundo que utiliza las mecánicas básicas de un juego como World of Warcraft. Los agentes (o jugadores) pueden unirse a un servidor que ofrece un mapa creado de manera aleatoria. En este escenario existen casillas (tiles) con diversos valores, como agua, pasto, bosque y montañas.

Neural MMO

Los agentes deberán moverse a lo largo del mapa con la intención de sobrevivir. Para lograrlo, deberán usar casillas que ofrecen comida (bosque) y agua. De igual modo podrán enfrentarse con otros agentes que se encuentran explorando el escenario en el mismo servidor. Algunas casillas permiten circular libremente, mientras que otras bloquean por completo el paso del personaje.

Lo interesante es que, en el caso de la comida, las casillas con valor "bosque" no tienen duración infinita, lo que obligará al agente a moverse a otros lugares a lo largo del escenario. Esto creará una situación de conflicto con otros agentes, con quienes podrán pelear usando tres tipos de estilos: cuerpo a cuerpo, a distancia y usando hechizos.

Los investigadores han podido agrupar a los agentes por tipo de población e incluso fusionar agentes de otros servidores. Al igual que ocurre en los juegos en línea, es posible crear "torneos" con distintas poblaciones.

De acuerdo con OpenAI, su plataforma Neural MMO se desempeña mejor cuando existe una mayor cantidad de agentes en el servidor. El sistema ha sido entrenado con población que va de los 16 a los 128 agentes por mapa y encontraron que a medida que aumenta la población, los agentes comienzan a explorar partes del mapa más lejanas con el fin de evitar confrontamientos.

A diferencia de otros sistemas de entrenamiento, Neural MMO es más complejo en términos de entorno y escala. Aquellos interesados en conocer más de él podrán descargarlo desde GitHub. La versión soporta hasta 128 agentes que podrán conectarse a un máximo de 100 servidores.

Dínamo

Dínamo es el nuevo podcast de Hipertextual donde hablamos, discutimos, analizamos y nos obsesionamos con Apple.