La inteligencia artificial sigue creciendo a pasos agigantados. Ya no solo es capaz de producir textos con asombrosa precisión, derrotar a jugadores de ajedrez y enfrentarse a equipos profesionales de videojuegos, por mencionar algunos ejemplos. Ahora es capaz de crear imágenes realistas a partir de descripciones escritas en lenguaje natural.
OpenAI, una compañía de investigación de inteligencia artificial cofundada por Elon Musk y respaldada por Microsoft, ha desarrollado un sistema llamado DALL-E. Se trata de una red neuronal que sienta sus bases en GPT-3 para interpretar textos, asociarlos a diferentes conceptos visuales y crear imágenes. En algunos casos los resultados son tan buenos que parecen fotografías reales.
DALL-E cobra vida gracias a 12 mil millones de parámetros de GPT-3, el modelo de lenguaje autorregresivo de tercera generación basado en el aprendizaje profundo presentado en mayo de 2020. Este programa de inteligencia artificial combina una amplia gama de conceptos relacionados a expresiones comunes. Uno de de sus atributos más sorprendentes es que puede crear objetos que ni siquiera existen.
La inteligencia artificial de DALL-E crea lo que se le pide
No deberías esforzarte demasiado en pensar algo racional. El sistema tiene la capacidad de combinar conceptos para crear otros totalmente nuevos. Por ejemplo, si deseas ver un rábano en tutú paseando un perro, tus deseos serán órdenes. La inteligencia artificial de DALL-E te presentará este vegetal paseando a su mascota. Por si fuera poco, dispondrás de una serie de imágenes para que escojas la más pintoresca.
En cambio, si le pides una sala de estar con sillones y un cuadro de El Coliseo de Roma, el sistema de inteligencia artificial te presentará una serie de imágenes basadas en sus interpretaciones. Según el equipo de OpenAI, a diferencia de lo que ocurre con los motores de renderizado 3D, DALL-E es capaz de sustituir los detalles que no se indican explícitamente antes de presentar los resultados.
OpenAI es una de las compañías que más avances ha realizado en el campo de la inteligencia artificial. Uno de sus objetivos a largo plazo es construir redes neuronales "multimodales". Desde la compañía aseguran que DALL-E podría comprender mejor el mundo gracias a su capacidad de aprender diferentes conceptos visuales y textuales.