Kimi K2.6: el modelo de código abierto que supera a GPT y Claude

A unas semanas de irrumpir en escena y desplazar a ChatGPT y Gemini, Kimi está de regreso. La IA china desarrollada por Moonshot lanzó una nueva versión que supera a los modelos de lenguaje más potentes de OpenAI y Anthropic. Kimi K2.6 iguala o va más allá de GPT-5.4 y Claude Opus 4.6 en múltiples benchmarks, aunque con la ventaja de ser una IA de código abierto más accesible.

De acuerdo con una publicación en su blog, la característica principal de Kimi K2.6 es la ejecución autónoma sostenida. La IA puede mantener procesos largos y complejos sin necesidad de intervención humana.

En una de las demostraciones, Kimi optimizó la inferencia local del modelo Qwen3.5-0.8B en un Mac durante 12 horas seguidas y encadenando más de 4.000 llamadas a herramientas. En otra prueba, la IA refactorizó de forma autónoma un motor financiero de código abierto, durante 13 horas y 12 pases de optimización. La empresa menciona que esta prueba se tradujo en una mejora del 185% en el rendimiento medio y del 133% en el rendimiento pico.

En términos de benchmarks, Kimi K2.6 lidera en SWE-Bench Pro con 58,6 puntos, frente a los 57,7 de GPT-5.4 y los 53,4 de Claude Opus 4.6. En Humanity's Last Exam con herramientas obtiene 54,0 puntos, por delante de Claude (53,0) y de GPT-5.4 (52,1). Por último, en Toolathlon, un benchmark centrado en el uso agéntico de herramientas, K2.6 puntúa 50,0, superando a Claude (47,2) y a Gemini 3.1 Pro (48,8).

Eso sí, Kimi se queda por detrás de sus competidores en las pruebas de razonamiento puro y en visión.

Kimi K2.6 programa sin ayuda humana por 12 horas

Una de las características más llamativas de Kimi es Agent Swarm, que permite ejecutar hasta 300 subagentes de forma simultánea. El sistema divide las tareas automáticamente y las distribuye entre agentes especializados. Moonshot menciona que esta función la usa su equipo de marketing, en donde Kimi gestiona agentes expertos en demos, benchmarks, redes sociales y vídeo.

La IA también puede convertir prompts simples en interfaces completas. La compañía señala que Kimi K2.6 produce diseños estructurados con "decisiones de diseño deliberadas". El modelo es capaz de generar secciones distribuidas por jerarquía, así como elementos interactivos, animaciones y efectos de desplazamiento.

"Con una gran destreza en el aprovechamiento de herramientas de generación de imágenes y vídeo, Kimi K2.6 permite la generación de activos visualmente coherentes y contribuye a secciones de héroes de mayor calidad y más destacadas", dijo Moonshot. La compañía china mostró ejemplos de diseño web con imágenes y animaciones profesionales.

A diferencia de Gemini o Claude, Kimi es de código abierto. La versión K2.6 se distribuye bajo una licencia MIT modificada que permite un uso ampliamente libre. Solo los productos comerciales con más de 100 millones de usuarios activos mensuales o más de 20 millones de dólares en ingresos mensuales deberán especificar que se construyó con Kimi K2.6 en la interfaz.

El modelo está disponible a partir de hoy en kimi.com en modo chat y agente, como herramienta de programación a través de Kimi Code, vía API y como descarga de código abierto en Hugging Face.