La irrupción de la Inteligencia Artificial en nuestras vidas tiene una cara positiva y otra negativa. Entre los beneficios de estas tecnologías tenemos, por ejemplo, su aplicación en medicina. En general, puede hacernos la vida más fácil en muchos sentidos. Pero también ha abierto un terrorífico abanico de posibilidades para los estafadores. Por ejemplo, la suplantación de voz por IA está a la orden del día. Cada vez son más las personas que caen en el timo de enviar dinero a sus familiares en problemas después de una llamada telefónica en la que, en realidad, no hablaba su ser querido, sino una máquina. Es vital encontrar formas de diferenciar la voz real de la falsa y para ello también es importante entender cómo las diferenciamos los propios humanos.

Este fue el objetivo inicial de dos psicólogos de la Universidad de Oslo en un estudio cuyos resultados son realmente sorprendentes. Querían comprobar hasta qué punto somos los humanos capaces de diferenciar una voz por IA de una emitida por un ser humano. Como cabía esperar, descubrieron que se nos da bastante mal. Pero también que, mientras nosotros fallamos, nuestro cerebro sí que tiene la respuesta correcta.

Puede resultar paradójico, pero es un claro ejemplo de que nuestros sesgos muchas veces van más allá de lo que dicta nuestro propio cerebro. La investigación acaba de publicarse en el Foro 2024 de la Federación de Sociedades Europeas de Neurociencias. 

¿Puedes diferenciar la voz por IA?

Los actores de doblaje se encuentran entre los profesionales que ya están empezando a perder sus trabajos a causa de la inteligencia artificial. Esta no solo es capaz de poner voz a personajes animados o reales. También puede emular la voz de los actores y simplemente cambiar de idioma.

Por supuesto, esto es todo un problema para los trabajadores que se han visto en la calle. Pero no es el único inconveniente al que nos enfrentamos por culpa de la imitación de voz por IA.

En este vídeo de The Guardian se puede ver lo muchísimo que se parece la voz humana a la imitación artificial. Si cerramos los ojos, es prácticamente indistinguible.

YouTube video

Los científicos de la Universidad de Oslo realizaron un experimento similar a ese con las 43 personas que se ofrecieron voluntarias para el estudio. Les pusieron varios audios de personas hablando sin decir si se trataba de una voz por IA o humana. Estas podían ser masculinas o femeninas y mostrar cinco emociones distintas: ira, neutralidad, felicidad, miedo o placer.

Mientras respondían a las preguntas, se sometieron a un análisis de su cerebro por resonancia magnética funcional. Esta prueba permite estudiar los cambios en el flujo de sangre en distintas áreas cerebrales, con el fin de comprobar cuáles están más activas en cada momento. Así fue como dieron con un resultado sorprendente.

Tu cerebro sabe más que tú

De media, los participantes acertaron un 50,5% de los casos de voz por IA y un 56% de la de las voces humanas. Prácticamente fifty-fifty. No obstante, hubo diferencias de género y con respecto a las emociones. Por ejemplo, distinguieron mucho mejor  las voces de IA cuando mostraban neutralidad y las humanas cuando eran felices. En ambos casos el acierto fue de más de un 70%. Además, en el caso de las voces por IA las reconocían mejor si se trataba de mujeres.

En cuanto a los resultados de la resonancia magnética funcional, se vio que cuando escuchaban voces humanas se activaban en su cerebro algunas zonas asociadas con la memoria (hipocampo derecho) y la empatía (giro frontal inferior derecho). Sin embargo, la voz por IA activaba mayormente las áreas relacionadas con la detección de errores (corteza cingulada media anterior derecha) y la regulación de la atención (corteza prefrontal dorsolateral derecha). Esto ocurrió con una tasa de acierto muchísimo mejor que la de las encuestas.

espectrograma
Crédito: FENS Forum / Christine Skjegstad

La conclusión de los autores del estudio es que, posiblemente, los humanos nos dejamos llevar por sesgos. Tendemos a pensar que la IA, por ser algo sintético, será siempre neutra. En cambio, la felicidad la asociamos con la humanidad. También detectamos más fácilmente la voz por IA cuando es femenina porque tenemos precedentes como Siri o Alexa con los que podemos comparar. Mientras tanto, nuestro cerebro no se rige por sesgos. Analiza la información tal cual le llega, de la forma más visceral posible.

Quizás no esté todo perdido. Si nuestro cerebro es capaz de diferenciar la voz por IA, nosotros también deberíamos poder. Solo nos queda entrenar un poquito. Así, los estafadores lo tendrían mucho más difícil en un futuro. 

Recibe cada mañana nuestra newsletter. Una guía para entender lo que importa en relación con la tecnología, la ciencia y la cultura digital.

Procesando...
¡Listo! Ya estás suscrito

También en Hipertextual: