Stability AI, los creadores del famoso generador de imágenes Stable Diffusion, acaba de presentar su herramienta impulsada por inteligencia artificial para videos. Stable Video Diffusion ya está disponible en una versión limitada para investigadores. La empresa la promociona como un sistema de última generación, capaz de generar videos de alta resolución.

«Este modelo de video de inteligencia artificial generativa de última generación representa un paso importante en nuestro viaje hacia la creación de modelos para todos de cada tipo», dijo la Stability AI en un comunicado. Stable Video Diffusion se lanza en forma de dos modelos de imagen a video: cada uno de ellos es capaz de generar 14 y 25 cuadros, a velocidades de cuadro personalizables entre 3 y 30 cuadros por segundo.

Está basado en el modelo de imagen Stable Diffusion, que le ganó popularidad y algunas demandas por usar datos protegidos por derechos de autor para su entrenamiento. Stability AI explicó que el entrenamiento del nuevo sistema de video pasó por tres fases: pre entrenamiento de texto a imagen, pre entrenamiento de video y ajuste fino de video de alta calidad.

La empresa asegura que su herramienta fue superior a los competidores comerciales RunwayML y Pika Labs en los estudios de preferencias de los usuarios. Stability AI explicó que está disponible como un modelo de código abierto en GitHub y aclaró que todavía no está pensada como una solución comercial o de uso público. La versión limitada para investigadores les permitirá perfeccionar aspectos sobre calidad y seguridad antes de su lanzamiento general.

YouTube video

Stability AI lanzará una plataforma web para generar videos

Stability AI destaca que su modelo de video se puede adaptar fácilmente a diversas tareas posteriores. Por ejemplo, la síntesis de múltiples vistas a partir de una sola imagen con ajuste fino en conjuntos de datos de múltiples vistas. «Estamos planeando una variedad de modelos que se basan y amplían esta base, similar al ecosistema que se ha construido alrededor de Stable Diffusion», dijo en el comunicado.

La empresa también puso a disposición una lista de espera de una nueva plataforma web, que incluirá una interfaz de texto a video. «Esta herramienta mostrará las aplicaciones prácticas de Stable Video Diffusion en numerosos sectores, incluidos la publicidad, la educación, el entretenimiento y más», agregó.

Ejemplos de Stable Video Diffusion, la herramienta de inteligencia artificial de Stability AI para generar videos.

Stability AI lanzó a principio de mes Stable 3D. Es una aplicación impulsada por inteligencia artificial que genera objetos 3D texturizados para plataformas de modelado y desarrollo de juegos. Esta herramienta está disponible en vista previa privada para clientes. La compañía resaltó en su blog que está diseñada para permitir a los no expertos generar modelos 3D con calidad de borrador «en minutos».

La polémica por los derechos de autor de Stable Diffusion sigue pasando factura. Uno de sus vicepresidentes, Ed Newton-Rex, renunció este mes como director de audio en Stability AI. No estaba de acuerdo con la posición de la compañía de considerar como «uso legítimo» el entrenamiento con obras protegidas por derechos de autor. Esta postura le ganó una pelea en tribunales con Getty Images, una de las agencias de fotografía más importantes del mundo.