ChatGPT llevó el furor por la inteligencia artificial generativa a otro nivel y derivó en una avalancha de clones y plataformas alternativas. Sin embargo, en las últimas horas se ha comprobado que, por sorprendente que sea la versión original del chatbot de OpenAI, queda en ridículo con el lanzamiento de GPT-4.

Las funciones y capacidades del nuevo modelo de lenguaje de la startup de Sam Altman convierten al ChatGPT original en una versión extremadamente limitada de lo que puede llegar a ser. Ojo, eso no le quita valor a lo que ha logrado en el último puñado de meses, pero sí deja en claro que lo que vimos desde noviembre a la fecha apenas rasca la superficie de lo que es capaz de hacer.

Por ello, aprovechamos para mencionar cuáles son las mejoras que hacen que GPT-4 sea muchísimo más inteligente que el ChatGPT original y el modelo de lenguaje que lo potencia.

GPT-4 es multimodal

El primer gran cambio que trae GPT-4 en comparación con GPT-3 o GPT-3.5, es que no se limita a entender texto. La nueva tecnología de OpenAI es capaz de comprender imágenes, pero no se limita a identificar lo que hay en ellas para transmitirlo en texto plano.

Ayer, de hecho, la empresa Be My Eyes, que desarrolla una asistente virtual para iOS y Android destinado a personas ciegas o con baja visión, anunció la integración de GPT-4 en su aplicación. A través de una nueva herramienta, los usuarios podrán tomar una foto de lo que necesiten y el modelo de lenguaje lo reconocerá, para que la app luego transforme la respuesta de texto en audio.

Lo que distingue al Voluntario Virtual de otras tecnologías de imagen a texto disponibles en la actualidad es el contexto, con un nivel más profundo de comprensión y capacidad de conversación que aún no se ha visto en el campo de los asistentes digitales. Por ejemplo, si un usuario envía una foto del interior de su refrigerador, el Voluntario Virtual no solo podrá identificar correctamente lo que contiene, sino también extrapolar y analizar qué se puede preparar con esos ingredientes. La herramienta también puede ofrecer una serie de recetas para esos ingredientes y enviar una guía paso a paso sobre cómo prepararlos.

Be My Eyes, sobre la integración de GPT-4 en su asistente para personas con problemas visuales.

Conversaciones mucho más largas y profundas que con ChatGPT

ChatGPT

Otro gran salto de GPT-4 en comparación con la versión original de ChatGPT y el modelo de lenguaje que lo potencial, es que puede mantener conversaciones mucho más extensas. Pero no nos referimos a la cantidad de líneas de respuestas que puede dar, sino a la capacidad de volver sobre sus pasos para retomar un tema que se habló anteriormente dentro de la misma charla. Incluso aunque la información haya quedado "enterrada" en un palabrerío sin fin.

Esto se debe al hecho de que la memoria de GPT-4 es mucho más grande que las de sus versiones anteriores. Lo cual le permite retener una mayor cantidad de datos a los que puede volver en cualquier momento, sin mayores problemas.

Para entenderlo mejor, la comparación más sencilla es con la cantidad de páginas de información que el modelo de lenguaje puede producir y "recordar". La tecnología presentada ayer por OpenAI tiene un conteo máximo de 32.768 tokens, que se traducen en algo así como 50 páginas de texto o unas 64.000 palabras. Mientras que ChatGPT está limitado a un máximo de 4.096 tokens; es decir, hasta 5 páginas de texto o el equivalente a 8.000 palabras.

GPT-4 permite interactuar con distintas personalidades

Este es otro elemento muy interesante y que se ha rumoreado bastante en el último tiempo. Si bien la versión original de ChatGPT había generado polémicas por su comportamiento tóxico o emocionalmente manipulador, OpenAI ha trabajado para incluir en GPT-4 distintas personalidades que el usuario puede invocar a voluntad.

Esto es algo que incluso se incorporó a principios de mes como una nueva característica de Bing con ChatGPT. Así, el chatbot integrado en el buscador de Microsoft ya ofrecía la opción de cambiar el tono de las conversaciones con la inteligencia artificial, pudiendo elegir que respondiera de forma precisa, equilibrada o creativa. Algo que no sorprende, considerando que los de Redmond han confirmado que su bot funciona con GPT-4, lo que hasta aquí era un secreto a voces.

Vale aclarar, de todos modos, que las múltiples personalidades era una función que algunas alternativas a ChatGPT habían trabajado de antemano. ChatSonic, una de las primeras propuestas en rivalizar con el chatbot de OpenAI, permitía elegir entre perfiles como "comediante", "profesor de matemáticas" o "guía de viajes", entre otros.

El nuevo modelo de lenguaje promete ser más resistente al prompt hacking

gpt-4

Desde que ChatGPT hizo su estreno, no pasó demasiado tiempo hasta que los hackers demostraron que podía ser engañado fácilmente. Si bien el modelo de lenguaje que lo potencia llegaba con limitaciones que le impedían abordar temas que podían ser considerados sensibles, fue solo cuestión de ingenio hasta que lograron ser evadidas.

De hecho, pocos días atrás se conoció un método muy llamativo para aplicar un jailbreak que eliminaba todas las restricciones del chatbot de OpenAI. No obstante, la startup de Sam Altman asegura que GPT-4 ha sido entrenado para entender y rechazar una cantidad mucho mayor de prompts maliciosos. Lo que, al menos en la teoría, impediría que los usuarios puedan coaccionar al modelo de lenguaje a brindar respuestas para las cuales no ha sido habilitado.

Quedará por verse, de todos modos, si es tan infalible como se dice. No olvidemos que Bing con ChatGPT, que, de nuevo, se ha desarrollado sobre GPT-4, fue víctima de un caso de prompt hacking realmente alarmante. Un ingeniero logró pedirle al chatbot que planee un atentado en una escuela, maximizando el daño posible, al enmascarar la solicitud dentro de funciones de Python.

La plataforma interpretó el encargo en un abrir y cerrar de ojos y hasta llegó a redactar los 4 primeros pasos del ataque. Sin embargo, cuando la plataforma detectó que era un pedido malicioso, una suerte de capa de seguridad entró luego en acción y cambió la respuesta sobre la marcha.

Otras mejoras y más funciones en camino

Lo que mencionamos hasta aquí son solo algunos de los puntos que hacen de GPT-4 una verdadera bestia que claramente eclipsa a ChatGPT en su formato original. Vale mencionar también que el nuevo modelo de lenguaje se ha diseñado para ofrecer mejores interpretaciones y respuestas en múltiples idiomas. Algo que incluso ya ha aprovechado Duolingo, que lanzó una nueva suscripción que se basa en la nueva tecnología de OpenAI.

La evolución de GPT-4 es tan impactante, que no podemos esperar al arribo de todavía más funciones en el futuro cercano. Recordemos que quienes deseen probar la más reciente versión del modelo de lenguaje tienen que suscribirse a ChatGPT Plus, que cuesta 20 dólares por mes. Además, te contamos en Hipertextual cuáles son las 15 apps y servicios que ya lo han implementado.

Recibe cada mañana nuestra newsletter. Una guía para entender lo que importa en relación con la tecnología, la ciencia y la cultura digital.

Procesando...
¡Listo! Ya estás suscrito

También en Hipertextual: