Gemini 2.5 Pro estrena un nuevo modo de razonamiento avanzado

El Google I/O 2025 ha llegado con un sinfín de novedades en el campo de la inteligencia artificial, tal y como se esperaba. En lo que respecta a sus modelos de vanguardia, los de Mountain View han anunciado importantes mejoras tanto para la versión estándar de Gemini 2.5, como para las variantes Flash y Pro.

Esta última es la más interesante, ya que, como bien lo indica su nombre, es su IA más inteligente hasta la fecha. La gran novedad de Gemini 2.5 Pro es que introduce un nuevo modo de razonamiento avanzado que se llama Deep Think. Este le permite competir de tú a tú contra tecnologías similares de OpenAI, como o3 y o4-mini, que debutaron oficialmente el mes pasado.

Google presume que, gracias a Deep Think, Gemini 2.5 Pro ahora lidera en benchmarks claves contra sus principales rivales. En tal sentido, los californianos mencionan que esta modalidad ha obtenido un puntaje del 49,4 % en USAMO 2025, una de las pruebas de matemáticas más difíciles de la actualidad. Esto la ubica bien por encima de la versión regular de Gemini 2.5 Pro (34,5 %), como también de o3 high y o4-mini high (21,7 % y 19,1 %, respectivamente).

En los benchmarks de LiveCodeBench v6 y MMMU, que se enfocan en programación y razonamiento multimodal, respectivamente, Gemini 2.5 Pro Deep Think también se ha ubicado por encima del resto con puntajes superiores al 80 %. En este caso las brechas con sus rivales han sido menores, pero lo suficientemente notorias como para subirse a lo más alto de las comparativas.

El modo Deep Think de Gemini 2.5 Pro todavía no está disponible para todos. Google indica que, como se trata de un modelo de frontera, quiere realizar más evaluaciones de seguridad. En un principio habilitará el acceso a algunos testers de confianza mediante la API de Gemini, y más adelante la expandirá a un número de usuarios mayor.

No todo es para la versión Pro: Gemini 2.5 Flash también recibe mejoras

Si bien Gemini 2.5 Pro con Deep Think es de lo más destacado de la apertura del Google I/O 2025, también hay mejoras importantes para la variante Flash. Según los de Mountain View, dicho modelo de IA ahora es todavía más eficiente, y lo ha logrado sin sacrificar su rendimiento.

Google afirma que ha mejorado sus resultados en benchmarks de razonamiento, multimodalidad, programación, y más, usando entre un 20 y 30 % menos de tokens para conseguirlo. Y los usuarios podrán sacar provecho de inmediato de todo esto, ya que la versión renovada de Gemini 2.5 Flash está disponible desde hoy a modo de prueba tanto en la app de Gemini como en Vertex AI y Google AI Studio.

Otras características que llegan a Gemini 2.5 Flash y Pro son los resúmenes de pensamiento, que estructuran mejor el razonamiento en crudo de los modelos. Esto va a permitir mayor control y comprensión sobre el proceso y las herramientas que use la IA al generar una respuesta. Esta característica se va a poder usar desde la API y a través de Vertex AI.

Google también anunció la expansión de la función de "presupuesto de pensamiento". Esta se había habilitado inicialmente en Gemini 2.5 Flash, permitiendo estipular cuántos tokens se pueden gastar en ciertas respuestas o directamente desactivar algunas capacidades. En adelante, también se podrá aprovechar en Gemini 2.5 Pro.

Asimismo, Gemini 2.5 Flash y Pro introducen una salida de audio nativa como parte de sus renovadas capacidades de texto a voz. De esta forma, la IA puede responder con tonos de voz más naturales y con más matices. También pueden cambiar su forma de expresarse; por ejemplo, pasar de una voz en un volumen normal o a un susurro. Aunque lo más impresionante es que las voces pueden cambiar de idioma sin alterar su tono. Lo último estará disponible desde hoy en la API de Gemini y será compatible con 24 idiomas, incluyendo el español.