OpenAI ya se enfrenta a la primera gran polémica tras el anuncio de GPT-4o. El avanzado modelo de lenguaje, que tiene como principal atractivo el uso del habla y la conversación fluida, acaba de eliminar su voz más popular tras ser acusada de copiar a la de Scarlett Johansson. La actriz no se ha pronunciado, pero ya hay quien afirma que el movimiento de la compañía viene precedido de una posible denuncia por parte de la hollywoodense.

La polémica gira en torno a Sky, la voz que según muchos se parece increíblemente al tono de la actriz. Por el momento son especulaciones y afirmaciones vertidas por los usuarios, pero OpenAI ya ha confirmado en sus redes sociales que están eliminando esta opción de voz del modelo de lenguaje.

De hecho, la compañía ha querido lavarse las manos revelando cómo ha seleccionado las voces de GPT-4o y ha dejado claro que Sky no imita la voz de la actriz. Es más, según OpenAI las voces pertenecen a personas reales.

Creemos que las voces de IA no deben imitar deliberadamente la voz distintiva de una celebridad: la voz de Sky no es una imitación de Scarlett Johansson, sino que pertenece a una actriz profesional diferente que usa su propia voz natural.

Blog de OpenAI

Las voces de ChatGPT son reales

Tras confirmar que no se trata de una copia, OpenAI ha revelado cómo fue el proceso de selección de las voces. Y lo más importante, que en ningún momento han sido creadas con un programa de inteligencia artificial. Querían dotar a ChatGPT y GPT-4o de naturalidad y para ello reclutaron directores de casting y productores galardonados con el fin de obtener un criterio de calidad a la hora de elegir las voces del modelo.

Cabe destacar, que este equipo lanzó una convocatoria de casting en mayo de 2023 y estudiaron más de 400 voces de actores profesionales del doblaje y el cine. La selección final fue de 5 voces que en estos momentos dan vida al sistema de habla de GPT-4o. Entre estas opciones se encontraba Sky, la polémica copia.

Unos meses después de dicha selección, estas personas volaron a San Francisco para realizar las sesiones de grabación y estudiar con el equipo las posibilidades del modelo de lenguaje. OpenAI ha confirmado que el proceso duró unos 5 meses y que los profesionales cobraron tarifas muy por encima de lo establecido en el sector del doblaje.

Por lo tanto, todo apunta a que Sky, la supuesta copia de la voz de Scarlett Johansson, pertenece a una persona real y no hay un sistema basado en IA que haya seleccionado los tonos adecuados para establecer una relación directa. Ahora bien, no es posible saber si OpenAI la eligió por su parecido con la actriz.

La compañía no ha querido revelar la identidad de la persona que pone voz a Sky para preservar su intimidad, por lo que la polémica queda en el aire y las palabras de OpenAI, aunque muy interesantes, no se pueden contrastar.

OpenAI GPT4o siendo probado por dos personas en un estudio

OpenAI mata a Sky y se queda con 4 voces

Toda esta historia no parece haberle servido a OpenAI, que ha eliminado la voz Sky hasta nuevo aviso y sin dar demasiadas explicaciones. Pero claro, la duda sigue ahí: ¿por qué eliminar una voz que te ha llevado meses pulir y grabar si pertenece a una persona real que nada tiene que ver con Scarlett Johansson?

Cuando OpenAI lance su servicio de voz a los usuarios de ChatGPT Plus lo hará con cuatro y no con cinco opciones. A saber: Breeze, Cove, Ember y Juniper. En estos momentos no es posible utilizar la nueva función, por lo que toca esperar para saber si la comunidad sacará parecidos en los tonos del resto de opciones disponibles.

Recibe cada mañana nuestra newsletter. Una guía para entender lo que importa en relación con la tecnología, la ciencia y la cultura digital.

Procesando...
¡Listo! Ya estás suscrito

También en Hipertextual: