La fiebre por la inteligencia artificial y los modelos de lenguaje extenso — como GPT-3 — se ha disparado a tal grado que las grandes tecnológicas están compitiendo por el liderazgo en este sector. Si bien la atención se centra en ChatGPT, Midjourney y otras IA generativas, existen proyectos dignos de mención. Tal es el caso de MarioGPT, una IA capaz de generar cientos de niveles de jugables de Super Mario Bros.
Un equipo de investigadores de la Universidad de Copenhague liderados por Shyam Sudhakaran, publicaron MarioGPT: generación abierta de niveles basados en texto a través de modelos de lenguaje extenso. El estudio detalla un método de crear escenarios para el popular juego de Nintendo utilizando inteligencia artificial. MarioGPT se basa en un modelo GPT-2 entrenado con un subconjunto de niveles de Super Mario Bros y Super Mario Bros: The Lost Levels y es capaz de crear nuevo contenido a través de una entrada de texto simple.
En pocas palabras, basta con introducir frases como "muchos enemigos, algunos bloques y poca elevación" o "muchas tuberías y muchos enemigos" para que la IA haga su trabajo. De acuerdo con el estudio, el 88% de los 250 niveles generados por MarioGPT son jugables. Cada escenario es acompañado de una trayectoria óptima que confirma que puede recorrerse de principio a fin.
MarioGPT se basa en niveles de Super Mario Bros y su secuela, The Lost Levels, convertidos a texto por The Video Game Level Corpus. Cada elemento del escenario tiene un caracter asignado, similar a lo que vemos en juegos clásicos como Rogue o el ultra famoso Dwarf Fortress. De este modo el modelo se entrena y reconoce los patrones para después reproducirlos en escenarios completamente nuevos por medio de una entrada (o prompt).
MarioGPT: el primer paso para diseñar niveles de videojuegos usando IA
Como es de esperarse, los primeros resultados no son perfectos. MarioGPT tiene algunas limitantes, comenzando por el subconjunto de datos con el que se entrena al modelo. Los niveles en texto de The Video Game Level Corpus requieren mayor trabajo de codificación para identificar todos los elementos que conforman un escenario. Un ejemplo de ello son los enemigos, que simplemente se definen por la letra "E" y que impiden que haya variación en los niveles generados por la IA.
Shyam Sudhakaran, uno de los autores del estudio, dijo a TechCrunch que decidieron usar GPT-2, ya que es más sencillo entrenarlo y se desempeña mejor que GPT-3 con un conjunto más pequeño de datos. No obstante, el investigador reveló que en el futuro podrían migrar a un modelo más sofisticado si cuentan con una base más extensa. Según Sudhakaran, MarioGPT sería el primer paso para una generación de niveles de videojuegos más controlable y diversa.
Sumado a las limitaciones técnicas, los investigadores tendrían un problema más con qué lidiar: Nintendo. La compañía japonesa se especializa en cancelar proyectos que involucren a sus propiedades intelectuales. Los abogados de la gran N ya estarían redactando una carta de cese y desista para enviarla a la Universidad de Copenhague lo antes posible, sin importar que este proyecto sea de carácter científico.
Super Mario Bros no es el único juego con niveles generados por GPT-2
Casi al mismo tiempo de la publicación de MarioGPT, la Universidad de Nueva York anunció un proyecto similar. En el estudio titulado Generación de niveles a través de modelos de lenguaje extenso, investigadores utilizan GPT-2 y GPT-3 para crear escenarios del juego Sokoban. Julian Togelius, uno de los autores, menciona que su modelo genera niveles novedosos y jugables con una alta tasa de éxito.
A diferencia de MarioGPT, el académico menciona que GPT-3 funciona mejor con un conjunto de datos pequeños, reduciendo la base de niveles requerida. No obstante, Togelius menciona que el trabajo de la Universidad de Copenhague es más sofisticado en su forma de entrenar a la IA. En ambos casos, los expertos coinciden en que es el primer paso de un futuro prometedor en el campo de la generación de niveles de videojuegos usando IA.