Amazon emplea a miles de personas para transcribir parte de las peticiones de los usuarios a Alexa y mejorar la capacidad de reconocimiento y entendimiento. Un nuevo reporte de Bloomberg cuenta como estos trabajadores transcriben y anotan estos fragmentos para realimentar los sistemas detrás del motor de los distintos Amazon Echo disponibles.

No se trata, por tanto, de un proceso completamente automatizado podríamos imaginar. Estos trabajadores – localizados en países como Estados Unidos pero también Costa Rica, India o Rumanía– realizan jornadas completas revisando un total de hasta 1.000 clips de audio diarios, con una parte nada despreciable de los mismos correspondiendo a fragmentos de voz sin que el usuario haya activado voluntariamente el asistente.

La trazabilidad, en cuestión

En cierto sentido, es esperable que estas empresas analicen la interacción con estos dispositivos para mejorar el producto. De hecho, es algo relativamente común si atendemos al resto de grandes jugadores en la industria. Tanto Apple como Google procesan esta información también de forma manual, con una diferencia fundamental: no son trazables, que se sepa. En el caso de Apple se almacenan durante seis meses con un identificador aleatorio (y hasta dos años sin él), mientras que en Google además dicen distorsionar el audio.

En el caso de Amazon, estos audios están asociados a un número de cuenta, además de al nombre de pila del usuario y al número de serie del dispositivo que está siendo utilizado. Amazon afirma que los empleados "no tienen acceso directo a la información que pueda identificar a la persona o cuenta", y da la opción de deshabilitar estas grabaciones para el desarrollo de nuevas funciones.

Amazon Echo Dot
Amazon

Los empleados contactados por Bloomberg afirman que en ocasiones escuchan contenido más bien privado, como una mujer cantando en la ducha o un niño pidiendo ayuda a gritos, y utilizan los chats internos para compartir estos archivos cuando necesitan ayuda para reconocer ciertas palabras. Pero también cuando hay grabaciones divertidas o cuando necesitan desahogarse de algún caso concreto.

El sistema de reconocimiento de Amazon recoge fragmentos aleatorios, una pequeña muestra de las peticiones de los usuarios. Estas, en ocasiones, no son siquiera voluntarias. Si has utilizado alguna vez asistentes de voz durante algún tiempo, probablemente hayas visto cómo en ocasiones se activan sin necesariamente haber dicho el comando de activación, que puede ser 'Alexa', 'Oye, Siri' o 'OK, Google'. Estos falsos positivos son también transcritos y analizados, y en ocasiones contienen información que han de catalogar como "crítica", como datos bancarios o nombres concretos. Según las fuentes pueden representar hasta unas 100 de las 1000 transcripciones diarias que realizan.

Amazon se ha puesto en contacto con Hipertextual para dejar clara su postura al respecto del artículo publicado por Bloomberg, y la reproducimos íntegramente a continuación:

"Nos tomamos muy en serio la seguridad y privacidad de la información personal de nuestros clientes. Sólo anotamos un número extremadamente pequeño de interacciones de un conjunto aleatorio de clientes para mejorar la experiencia del cliente, siempre después de haber utilizado la palabra de activación de un dispositivo. Por ejemplo, esta información nos ayuda a entrenar nuestros sistemas de reconocimiento de voz y comprensión del lenguaje natural, para que Alexa pueda entender mejor sus peticiones y garantizar que el servicio funcione bien para todos. Tenemos estrictas salvaguardas técnicas y operativas, y tenemos una política de tolerancia cero en cuanto al abuso de nuestro sistema. Los empleados no tienen acceso directo a la información que puede identificar a la persona o cuenta del cliente como parte de este flujo de trabajo. Aunque toda la información es tratada con alta confidencialidad y utilizamos la autenticación multifactorial para restringir el acceso, además del encriptado del servicio y las auditorías de nuestro entorno de control para proteger dicha confidencialidad, los clientes siempre pueden eliminar sus interacciones de voz con Alexa en cualquier momento."

Actualización (11/04 – 16:00h): el artículo ha sido actualizado con el comunicado oficial de Amazon.