Un equipo conformado por investigadores de diversas universidades estadounidenses ha creado las primeras técnicas automatizadas para identificar anuncios potencialmente vinculados a círculos de tráfico humano y asociarlos a información pública sobre el Bitcoin, el principal método de pago que utilizan los anuncios sexuales en línea.

Este es el primer paso hacia el desarrollo de una serie de herramientas de libre acceso para ayudar a las instituciones policiales y sin fines de lucro a identificar a las víctimas de la explotación sexual, explicaron los expertos de la Universidad de Nueva York Tandon School of Engineering; Universidad de California, Berkeley; Y la Universidad de California, San Diego.

La trata de personas es un problema social generalizado, con un estimado de 4,5 millones de personas obligadas a la explotación sexual, según la Organización Internacional del Trabajo. En 2016, el Centro Nacional para Niños Desaparecidos y Explotadosestadounidense estimó que 1 de cada 6 fugitivos en peligro reportados al grupo eran probablemente víctimas de trata sexual.

Internet ha permitido y envalentonado a los traficantes de personas para que anuncien sus servicios sexuales. Los esfuerzos por aplicar la ley para localizar y disolver los círculos de tráfico humano son a menudo confundidos por la naturaleza seudónima de los anuncios para adultos y la tendencia de los líderes de los círculos para emplear múltiples números de teléfono y direcciones de correo electrónico para evadir ser detectados. Además, cómo identificar cuáles anuncios son de personas dispuestas a participar en el comercio sexual y los de las víctimas forzadas a la prostitución.

¿Cómo funciona este nuevo método de rastreo?

El enfoque del equipo de investigación está basado en dos nuevos algoritmos de aprendizaje automático. El primero es la estilometría, la cual analiza el estilo de escritura de un individuo para identificar al autor. Con esto se puede confirmar la autoría con mucha confiabilidad, y en el caso de los anuncios de tráfico en línea, permite a los investigadores y a la policía determinar los casos de anuncios independientes de diferentes individuos que comparten a un mismo autor: un signo revelador de un círculo de tráfico.

Al automatizar el análisis estilométrico, los investigadores descubrieron que podían rápidamente identificar grupos de anuncios con un autor común en Backpage, uno de los sitios más populares para anuncios sexuales en línea. De hecho, tras esta investigación, la sección de publicidad para adultos de Backpage fue suspendida, sin embargo, los investigadores observaron que los anuncios para adultos siguen siendo frecuentes y que ahora aparecen en múltiples secciones del sitio.

Luego de identificar los grupos de anuncios que pertenecen a un solo autor, los investigadores probaron un sistema automatizado que utiliza información pública disponible en la mempool y cadena articulada de Bitcoin -el nodo donde se registran todas las transacciones pendientes y finalizadas.

Debido a que Backpage publica los anuncios en cuanto recibe el pago, los investigadores compararon la marca de tiempo que indica el registro del pago a la marca de tiempo de la aparición de los anuncios en el sitio. Todos los usuarios de Bitcoin tienen cuentas, o "carteras", y hacer el seguimiento del pago de los anuncios que tienen el mismo autor en una cartera única es un método potencial para identificar al propietario de los anuncios y, por lo tanto, a las personas o grupos involucrados en el tráfico humano.

Damon McCoy, profesor adjunto de ingeniería y ciencias de la computación de la NYU Tandon y uno de los autores de la investigación, explicó que la combinación de estas técnicas para identificar anuncios sexuales tanto por el autor como por Bitcoin representa un avance considerable para ayudar a la aplicación de la ley y a las organizaciones no gubernamentales y sin fines de lucro.

"La tecnología que hemos construido encuentra conexiones entre los anuncios", indicó Rebecca Portnoff, la candidata a doctorado en ciencias de la computación por parte de la Universidad de Berkeley que desarrolló el algoritmo como parte de la disertación. "¿Es el chulo que está detrás de ese post para Backpage el que también está detrás de este post en Craigslist? Es él el mismo hombre que sigue recibiendo Bitcoin por niñas traficadas? Preguntas como éstas pueden ser respondidas sólo a través de herramientas tecnológicas más sofisticadas -exactamente lo que hemos construido en este trabajo- que vincula a los anuncios utilizando los mecanismos de pago y el idioma de los mismos anuncios".

Los investigadores aplicaron sus técnicas automatizadas de identificación de autor a un muestreo de 10.000 anuncios reales en Backpage, un estrato de todos los anuncios para adultos que aparecieron en Backpage durante un periodo de cuatro semanas, así como en varias docenas de anuncios que ellos mismos colocaron para comparar. Reportaron una tasa del 89% para agrupar a los anuncios por autor -significativamente más precisa que que los actuales algoritmos estilométricos de aprendizaje automático.

El equipo también observó una alta tasa de éxito en la vinculación de los anuncios que colocaron ellos mismos a las marcas de tiempo en la cadena articulada de Bitcoin. Sin embargo, reconocen que no pudieron verificar si las vinculaciones que hicieron utilizando anuncios reales y la información pública de Bitcoin correspondían verdaderamente a individuos vinculados a la trata de personas (cuestión que en última instancia debe ser perseguida por la policía).

Los investigadores pretenden refinar sus estrategias en colaboración con aplicadores de la ley y organizaciones sin fines de lucro.

La investigación titulada Backpage and Bitcoin: Uncovering Human Traffickers (Backpage y Bitcoin: Descubriendo el Tráfico Humano) fue presentada en la 23ª edición de la SIGKDD Conferencia sobre Descubrimiento del Conocimiento y Minería de Datos de la Asociación para la Maquinaria Informática, una de las conferencias líderes en minería de datos del mundo, que publicará el documento en sus actas.