ChatGPT está en boca de todos por sus increíbles capacidades, y ahora que GPT-4 ya se ha presentado, todo el mundo está entusiasmado con esta nueva tecnología. Pero, ¿alguna vez te has preguntado qué es lo que significan las siglas que componen los nombres de estos modelos? Una pregunta bastante elemental, pero que resulta esencial para saber de qué estamos hablando cuando tocamos temas sobre esta inteligencia artificial.

Los comienzos del modelo GPT pueden rastrearse hasta el año 2018. Fue en aquella época que OpenAI, empresa fundada por Elon Musk y Sam Altman, lanzó la primera versión de su modelo. Su nombre significa Generative Pre-Trained Transformer —Transformador generativo preentrenado—, y como ya habrás probado por ti mismo con Bing Chat o ChatGPT, ha sido entrenado con la tarea básica de hablar como un ser humano.

¿Y qué significan los términos de Generative Pre-Trained Transformer? Este tipo de modelos de inteligencia artificial, por lo general, son entrenados en grandes cantidades de texto, lo que le gana el apellido de preentrenada. Se construyen utilizando bloques de la arquitectura Transformer, un tipo de red neuronal que aprende contexto, por lo que puede ofrecer datos secuenciales basados en relaciones.

La arquitectura Transformer es esencial para tecnologías como GPT o ChatGPT debido a su capacidad de prestar atención a sí misma. Este tipo de modelos se emplean en la traducción, predicción de texto, sumarización e incluso en campos como el trading o forecasting.

¿Qué significa el número junto a las siglas GPT? Pues bien, este hará referencia a la versión del modelo de la que estemos hablando. Mientras más alto el número, más nueva será. Así, tenemos que GPT-2 es inferior en capacidades a GPT-3, y este último lo será con respecto al nuevo GPT-4.

Qué significa el término chat en ChatGPT

ChatGPT, OpenAI

Ahora que hemos desglosado el apellido de ChatGPT, es momento de comprender qué significa el término chat que lleva como nombre la plataforma más popular del momento. OpenAI lo ha escogido deliberadamente, y revela la función más célebre del conocido chatbot: hablar.

A lo explicado anteriormente se le suma la capacidad de mantener conversaciones. ChatGPT significa que el modelo puede responder a las preguntas de los usuarios utilizando un lenguaje natural y conversacional. Todo esto, claro, a través del modelo transformador generativo preentrenado. El resultado es casi como si estuvieses teniendo una conversación vía texto con otra persona en el mundo.

Por supuesto, a diferencia de una persona, ChatGPT no es consciente de lo que dice y tampoco entiende el contexto del texto. Simplemente utiliza un sistema de probabilidades, patrones y relaciones recogidas durante su preentrenamiento para armar una frase de la manera más natural posible.