OpenAI anunció que DALL-E 3 ya está disponible para los usuarios de ChatGPT Plus. Tal como se reveló hace unas semanas, la inteligencia artificial para generar imágenes a partir de texto se integró de forma nativa en el popular chatbot. Los usuarios que tengan una suscripción de pago o empresarial podrán acceder a la nueva versión a partir de hoy.

En una entrada publicada en el blog de la empresa, OpenAI declaró que han desarrollado medidas de seguridad suficientes para abrir su nuevo modelo a más usuarios. DALL-E 3 permite crear imágenes a partir de instrucciones con lenguaje natural (prompt) dentro de ChatGPT. Comparada con la versión anterior, la inteligencia ha avanzado considerablemente, sobre todo en la interpretación de las partes del cuerpo humano.

De acuerdo con OpenAI, DALL-E 3 puede responder a indicaciones extensas y representa de manera confiable detalles intrincados, incluidos texto, manos y rostro. Esto fue posible al perfeccionar su tecnología de subtitulado, que se encarga de traducir una imagen de entrada en una descripción textual. Posteriormente, la empresa la utilizó para entrenar a DALL-E 3, de este modo, el modelo presta más atención a las instrucciones que proporciona el usuario.

Un detalle importante es que DALL-E 3 ya permite cambiar la proporción de aspecto en sus imágenes. Esta era una de las críticas constantes de los usuarios, ya que la versión anterior estaba limitada a crear contenido 1:1 (cuadrado). Ahora será posible indicar la proporción horizontal o vertical en el prompt de ChatGPT.

Para celebrar el lanzamiento de DALL-E 3, OpenAI mostró ejemplos de las imágenes que puede generar su inteligencia artificial. En uno de ellos, el usuario le pide a ChatGPT que produzca imágenes fotorrealistas de nubes que se usarán para una tarea escolar. Otro sugiere una interfaz de diseño web y logotipos.

DALL-E 3 añadirá más barreras de seguridad

Las IA generativas como DALL-E, Midjourney o Stable Diffusion han estado en el ojo del huracán desde sus primeras versiones. Sumado a las demandas por derechos de autor que enfrentan algunas de ellas, también existe la preocupación sobre el contenido que producen. Pese a que muchas incluyen barandillas de seguridad, algunos se las ingenian para crear imágenes ofensivas.

Con la llegada de DALL-E 3 a Bing, un número considerable de usuarios encontró la forma de traer de vuelta el 11-S. Un reporte de 404 incluye ilustraciones de Bob Esponja y otros personajes pilotando un avión sobre Nueva York con miras a estrellarse en las Torres Gemelas. Esto obligó a que Microsoft ajustara las directrices para evitar este contenido dentro de su buscador.

Bob Esponja vuela hacia las Torres Gemelas, gracias a la IA de DALL-E 3

Para el lanzamiento de DALL-E 3 en ChatGPT Plus, OpenAI reveló que implementaron un sistema de seguridad de varios niveles para limitar la creación de imágenes potencialmente dañinas. Eso significa que no podremos generar contenido violento, sexual o que incluya a figuras públicas a partir de su nombre. Esto último ha sido reforzado para evitar la proliferación de noticias falsas, como el arresto de Donald Trump o el Papa Francisco vistiendo Balenciaga.

La nueva versión de la inteligencia artificial tampoco puede generar contenido al estilo de artistas vivos, una característica que apunta a reducir las críticas y problemas legales. OpenAI ha sido criticada por la comunidad artística por entrenar a su modelo con imágenes protegidas por derechos de autor sin pedir consentimiento a los autores originales.