Amazon es la última compañía en subirse al tren de la inteligencia artificial capaz de generar imágenes a partir de una descripción de texto. En el marco de la conferencia re:Invent, de AWS, la compañía presentó Titan Image Generator. Se trata de una herramienta que promete crear imágenes "realistas" y con calidad "de estudio".
Eso sí, no te ilusiones que probar ya mismo esta utilidad. A diferencia de soluciones como DALL-E, de OpenAI, o Midjourney, Titan Image Generator no se ha desarrollado como una aplicación disponible para que cualquiera acceda a través de la web. Se trata de una plataforma para desarrolladores que estará disponible a través de Amazon Bedrock.
"Amazon Titan Image Generator ayuda a los clientes de industrias como la publicidad, el comercio electrónico y los medios y el entretenimiento a producir imágenes realistas con calidad de estudio o mejorar imágenes existentes utilizando indicaciones de lenguaje natural, para una rápida ideación e iteración en grandes volúmenes de imágenes y a bajo costo", indica la compañía en su blog.
Un elemento interesante de esta nueva inteligencia artificial es que permite generar una imagen a través de un comando de texto. Pero no se limita a ello. Una vez creado el objeto principal, es posible continuar editando el material sin modificar la creación original.
Durante la conferencia de AWS se mostró el ejemplo de una iguana generada artificialmente sobre un fondo de color plano. Posteriormente, se le pidió a la inteligencia artificial que eliminara el fondo y lo reemplazara por un bosque. Además, es posible cargar una fotografía y pedirle a Titan Image Generator que genere un determinado número de variantes, que la escale a otro tamaño, o que quite o añada detalles en partes aisladas.
Titan Image Generator, la nueva inteligencia artificial generativa de Amazon
En la web de AWS se menciona que Titan Image Generator aún se encuentra en una versión preliminar y que, al menos por ahora, los comandos de texto para generar imágenes deben ser en inglés. Por lo pronto, se desconoce si Amazon planea dotar a su inteligencia artificial con la habilidad de comprender prompts en otros idiomas.
Lo interesante de esta nueva propuesta es que, al no ser una app o un sitio web de acceso libre, sino un modelo de inteligencia artificial, lo que Amazon busca es que los desarrolladores lo utilicen para crear sus propios generadores de imágenes a partir de texto. De hecho, la compañía indica que, más allá de la información utilizada para entrenar a la IA, los programadores podrán usar sus propios sets de datos personalizados.
Además, Amazon ha decidido que todas las imágenes que se generen con Titan Image Generator incorporen una marca de agua invisible de forma predeterminada. La empresa ha optado por brindar demasiados detalles al respecto. Solo ha mencionado que la información no estará integrada a los metadatos del archivo y que será imposible de borrar o modificar.
Los de Andy Jassy pretenden evitar que esta herramienta se utilice para desinformar con imágenes falsas o alteradas. Por lo pronto, el sistema de detección de la marca de agua estará conectado a una API de Amazon, pero se desconoce si se podrán utilizar herramientas de terceros para saber si un archivo ha sido creado con inteligencia artificial.
Así mismo, la compañía afirma que Titan Image Generator incluye salvaguardas para impedir su uso con fines tóxicos o sesgados. De todos modos, su efectividad seguramente se pondrá a prueba una vez que los desarrolladores puedan jugar con este nueva plataforma de IA generativa.
Suscríbete a la newsletter diaria de Hipertextual. Recibe todos los días en tu correo lo más importante y lo más relevante de la tecnología, la ciencia y la cultura digital.