Microsoft acaba de lanzar una versión más eficiente de una de sus mejores IA para generar imágenes. El gigante tecnológico presentó MAI-Image-2-Efficient, una versión optimizada del modelo MAI-Image-2 que lanzó hace unas semanas. Esta IA promete velocidades superiores a un coste mucho menor y ya supera a Gemini hasta en un 40%.
De acuerdo con una publicación en su blog, MAI-Image-2-Efficient está pensado para tres escenarios: producción de alto volumen, conversaciones en tiempo real y prototipado. La primera podría aplicarse a campañas publicitarias o catálogos electrónicos que requieren cientos (o miles) de imágenes. En el caso de las conversaciones, las imágenes se generan más rápido para mantener la fluidez, mientras que en el prototipado se priorizan los tiempos en lugar del nivel de detalle.
En términos de rendimiento, MAI-Image-2-Efficient supera en velocidad a sus principales competidores. Cuando se mide contra Gemini 3.1 Flash, Gemini 3.1 Flash Image y Gemini 3 Pro Image, el modelo de Microsoft obtiene una ventaja de hasta 40% en la velocidad. Por otro lado, frente a MAI-Image-2 consigue una ganancia del 22% en el tiempo de generación de imágenes y es hasta cuatro veces más eficiente al normalizar el rendimiento por latencia y consumo de GPU usando una NVIDIA H100.

MAI-Image-2-Efficient es 40% más rápida que Gemini para generar imágenes
Microsoft ha mencionado que la variante Efficient no reemplaza a MAI-Image-2. El modelo estándar conserva ventajas cuando la imagen necesita texto legible integrado en la composición, o cuando la prioridad es el fotorrealismo. Aunque Efficient no consigue esa riqueza en contraste y profundidad tonal, puede producir imágenes con mayor nitidez y líneas más definidas, lo que lo hace apto para ilustraciones.
"MAI-Image-2-Efficient permite a su equipo probar de forma rápida y económica nuevos flujos de trabajo, experimentar con ideas creativas o perfeccionar las indicaciones", mencionó Microsoft en su blog. "Su eficiencia superior se traduce en lotes más grandes con un menor coste de GPU, para que tu equipo pueda pensar e iterar tan rápido como desee y llegar al producto final con mayor rapidez".

Esa mayor eficiencia se traduce en un recorte de precio significativo con respecto al modelo estándar. El coste de salida de imagen baja de 33 dólares a 19,50 dólares por millón de tokens, mientras que el precio del texto de entrada se mantiene en 5 dólares por millón de tokens.
La presentación de MAI-Image-2-Efficient llega a pocos días de que Microsoft lanzara MAI-Image-2, MAI-Voice-1 y MAI-Transcribe-1, sus primeros modelos desarrollados por el equipo de superinteligencia. Pese a la competencia, la variante estándar consiguió ubicarse en el Top 5 de modelos de texto a imagen en arena.ai, solo por detrás de Gemini 3.1 Pro, GPT-Image 1.5 y Gemini 3.1 Flash.
Microsoft confirmó que MAI-Image-2-Efficient estará disponible a partir de hoy como vista previa pública en Microsoft Foundry y MAI Playground. La compañía prometió que habrá más anuncios relacionados con esta familia de modelos en su conferencia Build 2026.
