Google está pisando el acelerador con Gemini, su inteligencia artificial de última generación. Si bien esta tecnología fue anunciada apenas la semana anterior, la compañía no quiere perder el tiempo y su intención es que cada vez más usuarios la usen. Para impulsar su expansión, se están apoyando en uno de sus productos más usados: Android.

Google acaba de anunciar que, a partir de hoy, los desarrolladores ya pueden integrar Gemini en sus aplicaciones. Las empresas, por su parte, igualmente pueden aprovecharla en sus flujos de trabajo. Para ello, han liberado la Gemini API, un conjunto de herramientas que ya están disponibles a través de Google AI Studio y Google Cloud Vertex AI.

Es importante señalar que la API, de momento, solo ofrece acceso a las soluciones de Gemini Pro. Es decir, la propuesta cuyo procesamiento ocurre en los servidores de Google, no en el dispositivo del usuario.

De esta manera, entonces, los desarrollares pueden crear aplicaciones que ofrezcan, por ejemplo, funciones generativas de texto. Debemos recordar que Gemini es un modelo de lenguaje multimodal. Es decir, puede generar contenido basado en la petición del usuario, pero también interpretar el ya existente —tanto texto como imágenes—.

Google Gemini | Inteligena artificial

Evidentemente, como el procesamiento ocurre en los centros de datos de Google, integrar Gemini Pro no siempre es gratis. Para evitar pasar por caja, la API no debe sobrepasar las 60 queries por minuto.

Si la aplicación necesita más, los desarrolladores tendrán que pagar en función de las peticiones realizadas. Los precios, a continuación:

Entrada de datos:

$0,00025 dólares por cada 1.000 caracteres ingresados.
$0,0025 dólares por cada imagen ingresada.

Salida de datos:

$0,0005 dólares por cada 1.000 caracteres de salida.

"En la versión disponible hoy, Gemini Pro acepta texto como entrada y genera texto como salida. También hemos puesto a disposición la terminal multimodal Gemini Pro Vision, la cual acepta texto e imágenes como entrada, y texto como salida."

Google.

Un punto importante es que, por ahora, no es posible usar la propuesta de pago. Por lo tanto, los desarrolladores están limitados a aprovechar el plan gratuito. Seguramente es una medida temporal mientras la comunidad aprende a usar la API y realiza sus primeras pruebas. 60 queries por minuto son más que suficiente para experimentar.

Al momento de escribir esta publicación, Gemini Pro tiene soporte para 38 lenguajes. En consecuencia, puede cubrir las necesidades de desarrolladores —y usuarios— de más de 180 países.

Google lo apuesta todo por Gemini

No queda duda de que Gemini se ha convertido en una prioridad para Google. Los avances de sus competidores, especialmente OpenIA —que trabaja codo a coco con Microsoft—, provocó que los de Mountain View redoblaran esfuerzos en el terreno de la inteligencia artificial.

Con el lanzamiento de la API para integrar Gemini Pro en las aplicaciones de terceros, se abre un mundo de posibilidades cuyo límite será la creatividad de los propios desarrolladores. Y ojo, porque es tan solo el primer paso de Google. Tras Android, Google Chrome y Firebase serán los siguientes en abrazar Gemini.

El próximo año, además, Google planea lanzar Gemini Ultra, un modelo más grande y capaz de realizar tareas aún más complejas. Eso sí, antes deben cerciorarse que las propuestas existentes, tanto Gemini Nano como Gemini Pro, cumplen con las exigencias de usuarios, empresas y desarrolladores. De hecho, mencionan que los comentarios de la comunidad serán clave para seguir mejorando su tecnología.