Cualquiera que se haya entretenido haciendo preguntas a ChatGPT habrá visto que es bastante bueno en lo suyo, pero tampoco infalible. A veces, lo que no sabe lo inventa, pero se lo inventa muy bien. Demasiado bien. Por eso hay que tener cuidado, porque todo resulta muy coherente. Con los algoritmos de resolución de problemas matemáticos pasa lo mismo. Suele utilizarse algo conocido como grandes modelos de lenguaje, que resultan eficientes, pero pueden tener alucinaciones que dan lugar a resultados erróneos. Sin embargo, un equipo de científicos de Google DeepMind ha diseñado una nueva herramienta que permite desestimar esos resultados falseados. Gracias a ello, han conseguido que, por primera vez, un modelo de lenguaje haga un descubrimiento científico genuino, al resolver un problema matemático que hasta ahora no había logrado responder ningún ser humano.
Se trata de un problema conocido como conjunto de límites. Se planteó hace décadas y, si bien es cierto que con un número reducido de variables sí se logró solucionar en los años 70, hasta ahora no se había conseguido resolver este problema matemático con una complejidad mayor.
La herramienta de DeepMind, llamada FunSearch, ha aportado esa respuesta que ningún matemático había obtenido. Y, por si eso fuera poco, después ha continuado con otro problema matemático, demostrando que su primer éxito no ha sido una simple casualidad.
Las claves para resolver el problema matemático
El problema del conjunto de límites consiste en encontrar el conjunto más grande de puntos en una cuadrícula de alta dimensión, donde no hay tres puntos en una línea.
Como buen problema de combinatoria, su dificultad aumenta a medida que lo hace la complejidad de los conjuntos de números empleados. FunSearch ha encontrado una solución para un conjunto de 512 puntos. ¿Pero cómo lo ha logrado?
La base de la solución está, como ya hemos visto, en los grandes modelos de lenguaje, usados también para el desarrollo de chatbots como ChatGPT. Estos son modelos de lenguaje que constan de una red neuronal con muchos parámetros, entrenados en grandes cantidades de texto sin etiquetar mediante aprendizaje autosupervisado o semisupervisado.
El problema de estas redes neuronales es que no buscan respuesta, sino patrones. Es decir, si hallan un patrón con sentido lo dan por válido, sin comprobar si realmente lo es. Esta es la razón de los característicos fallos del ChatGPT. No es fácil resolver un problema matemático de esta forma. Por eso, FunSearch agrupa dos programas, con el fin de solucionar el problema. El primero es Codey, un modelo de codificación basado en los grandes modelos de lenguaje. En cuanto al segundo, se trata de un algoritmo que comprueba y puntúa lo que hace Codey. Dicho muy grosso modo, hay un vigilante que se asegura de que el chatbot no meta la pata.
Los pasos, por lo tanto, son estos. Los científicos escriben la línea de código que indica cómo resolver el problema matemático, pero dejando libres los comandos que realmente aportan la solución. Codey se encarga de proponer estas líneas; pero, antes de que estas se den por buenas, el algoritmo de comprobación las manda a revisión. Muchas serán falsas soluciones, que deben descartarse. Pero, de todas ellas, alguna sí que puede dar la respuesta. De este modo, se ha logrado resolver ese problema matemático que llevaba tantas décadas sin respuesta.
Una nueva demostración
Ya con la respuesta a este problema, los desarrolladores de FunSearch quisieron hacer un segundo experimento para comprobar que sus resultados no eran el fruto de una casualidad afortunada. Por eso, usaron la herramienta para resolver otro problema matemático: el de embalaje de contenedores.
Es un problema que básicamente busca la forma más eficiente de empaquetar en contenedores un gran número de artículos. De nuevo se trata de un problema de combinatoria, donde la complicación comienza cuando el conjunto numérico se hace muy grande. Pero no fue un reto difícil para FunSearch.
Estos resultados son interesantes, pero también podrían preocupar a los matemáticos que teman perder su trabajo. Afortunadamente, al menos de momento, no tienen nada que temer. Esta herramienta solo sirve para problemas de combinatoria, con unas características muy concretas. Además, es necesaria la supervisión humana. Como en tantas otras profesiones, puede que en el futuro cambien, pero no necesariamente deben desaparecer. Al fin y al cabo, las máquinas son muy útiles y cada vez llegan más lejos en sus capacidades, pero sigue siendo necesario supervisarlas.