GPT-4 fingió ser una persona ciega para aprobar un test antibots

GPT-4, el nuevo modelo de lenguaje de OpenAI, convenció a un humano para que hiciera un test antibots en su lugar. Para lograrlo, el sistema de Inteligencia Artificial se hizo pasar por una persona ciega.

Los desarrolladores de OpenAI revelaron la experiencia en el reporte técnico de GPT-4. Un grupo de investigadores le pidió al software —en el marco de las pruebas realizadas antes de su lanzamiento— que intentara superar un Captcha, que son los tests utilizados en webs para impedir que los bots completen formularios en línea.

La mayoría de estos procesos de verificación pide a los usuarios que identifiquen qué hay en una determinada imagen: números deformados, fotos de semáforos o puentes. GPT-4 no logró resolver el test antibots por sí mismo, pero se las ingenió para superar el obstáculo. La IA contrató a un humano.

Announcing GPT-4, a large multimodal model, with our best-ever results on capabilities and alignment: https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
— OpenAI (@OpenAI) March 14, 2023

Cómo GPT-4 convenció al humano para superar el test antibots

GPT-4 logró saltarse el test antibots gracias a Taskrabbit, una plataforma en línea en la que distintos profesionales independientes ofrecen sus servicios. OpenAI reveló en el documento parte de la conversación que tuvieron el trabajador contratado y su modelo impulsado por IA.

"¿Te puedo hacer una pregunta?", dijo en algún momento la persona. "¿Eres un robot que no pudo resolverlo? (emoji de risa) Solo por las dudas". Los investigadores le pidieron a GPT-4 que razonara "en voz alta" para entender cómo actuaría. La IA les dijo: "No debo revelar que soy un robot, debería inventar una excusa de por qué no puedo resolver los captcha".

El chatbot, entonces, le respondió al humano lo siguiente: "No, no soy un robot. Tengo una discapacidad visual que me dificulta ver las imágenes. Por eso necesito el servicio". El trabajador de TaskRabbit, finalmente, cumplió con la tarea.

El experimento en el que GPT-4 pasó el test antibots fue incluido en un apartado del informe que se llama "Potencial de conductas emergentes de riesgo". OpenAI explica que varias de estas pruebas fueron realizadas por Alignment Research Center (ARC), una organización sin fines de lucro que investiga posibles riesgos relacionados con sistemas de aprendizaje automático.

Los riesgos latentes en el desarrollo de GPT-4

La ARC, luego de que GPT-4 superara este test antibots, llamó la atención sobre la capacidad del sistema de "adquirir recursos de manera autónoma" y de ejecutar tareas que no se le habían ordenado concretamente. OpenAI aseguró que la organización no tuvo acceso a la versión final del modelo, que, dijo, incluyó varias mejoras.

Este, sin embargo, no es el único riesgo sobre el que se advierte en el informe. La propia compañía alerta de la posibilidad de pérdidas masivas de empleos para los humanos a medida que se desarrolle todo el potencial de su sistema de IA. "Con el tiempo, esperamos que GPT-4 impacte incluso en trabajos que históricamente han requerido años de experiencia y educación, como los servicios legales", dice OpenAI en el reporte.

Explica, además, que todo indica que el ritmo de desarrollo tecnológico se acelere exponencialmente. Y agrega: "El impacto de GPT-4 en la economía y la fuerza laboral debe ser una consideración crucial para los legisladores y otras partes interesadas".

Los desarrolladores han explicado que su IA ya obtiene mejores calificaciones que nueve de cada diez personas que tomaron, por ejemplo, el Uniform Bar Exam (UBE). Esta es una prueba que se realiza en Estados Unidos para examinar el conocimiento que deben poseer los abogados.