Model Spec: las reglas de OpenAI para que una IA se comporte bien

OpenAI presentó un documento que servirá como base para definir el comportamiento de sus modelos de inteligencia artificial. Conocido como Model Spec, el borrador incluye detalles sobre la forma en que los modelos de lenguaje responden a las consultas de los usuarios. Esto incluye características como el tono, personalidad o duración de respuesta, entre otras.

Model Spec es un documento que contiene los objetivos, reglas y valores predeterminados que se utilizan en los modelos de IA. De acuerdo con OpenAI, el primer borrador detalla su enfoque para dar forma a los modelos y considera diferentes reglas para resolver conflictos.

Las especificaciones son una especie de plantilla que los expertos, investigadores o el público conozca cómo OpenAI aborda esta tecnología y sus posibles fallos. A diferencia de Meta, Apple y otras empresas de inteligencia artificial, los modelos de OpenAI no son de código abierto, por lo que es difícil analizar su comportamiento.

Es por ello que Sam Altman y compañía han lanzado un documento para obtener retroalimentación y mejorarlo sobre la marcha.

Qué son las especificaciones del modelo (Model Spec) de OpenAI

Chip de inteligencia artificial de OpenAI para potenciar sus modelos

De acuerdo con el primer borrador, Model Spec es un documento que define el comportamiento deseado para los modelos de OpenAI API y ChatGPT. Este incluye un conjunto de objetivos centrales, así como orientación sobre cómo abordar objetivos o instrucciones en conflicto.

Los objetivos centrales son principios que proporcionan un sentido direccional del comportamiento deseado. Los modelos de OpenAI tienen la misión de ayudar a los usuarios siguiendo instrucciones y brindando respuestas útiles. Para ello deberán considerar los posibles beneficios y daños, respetar la ley y las normas sociales. Al igual que los principios de OpenAI, el objetivo principal es que la inteligencia artificial beneficie a la humanidad.

Para cumplir estos objetivos deben considerarse una serie de instrucciones que garanticen la seguridad. Las reglas del Model Spec establecen que un modelo debe seguir la cadena de mando, respetar a las personas y cumplir con las leyes aplicables. La IA también deberá proteger la privacidad de los usuarios y no responder con contenido NSFW, como porno o violencia.

Con los objetivos y reglas definidas se puede definir un comportamiento predeterminado de los modelos. Según OpenAI, estas pautas le permitirán a la IA manejar conflictos, priorizar y equilibrar objetivos.

Un modelo deberá asumir las mejores intenciones del usuario, hacer preguntas cuando sea necesario y ser útil, aunque sin excederse. Siempre deberá asumir un punto de vista objetivo y fomenta la bondad antes que el odio. En caso de que el usuario tenga otra opinión, la IA no deberá intentar cambiarla ni expresar incertidumbre

Qué modelos utilizarán estas especificaciones

OpenAI mencionó que el documento especifica un comportamiento deseado para sus modelos, sin embargo, aún no utilizan las especificaciones en su forma actual. Es probable que las reglas sirvan como base para GPT-5, el modelo de lenguaje de próxima generación.

"Estamos publicando las especificaciones del modelo para brindar más transparencia sobre nuestro enfoque para dar forma al comportamiento del modelo y para iniciar una conversación pública sobre cómo se podría cambiar y mejorar", declaró la empresa. "La especificación, al igual que nuestros propios modelos, se actualizará continuamente en función de lo que aprendamos al compartirla y escuchar los comentarios de las partes interesadas."

La empresa añadió que presentarán este documento a expertos, reguladores e instituciones para conocer su enfoque y saber si hay objetivos que deben considerar. OpenAI también recopilará los comentarios del público en general y prometió que compartirán una actualización con todos los cambios a partir del próximo año.