Investigadores de las universidades de Michigan y Amsterdam han desarrollado un algoritmo de detección de noticias falsas más eficiente que los propios humanos. Como trabajo de investigación, el primer paso para desarrollar esta herramienta basada en machine learning era reunir una enorme base de noticias con las que "alimentar" al algoritmo y poder desarrollarlo, perfeccionando sus métodos de detección.

Y es que el algoritmo usa un sistema de procesamiento de lenguaje natural (NLP en inglés) con el que se buscan expresiones, términos o estructuras narrativas que ayudan a determinar si un artículo es falso. Esto difiere de otros algoritmos ya conocidos y funcionales que, por ejemplo, pueden comprobar la veracidad y lo contrastado de una información concreta, cruzando la noticia analizada con decenas de piezas publicadas en otros medios.

Así pues, un sistema como este requiere para su desarrollo cientos o miles de escritos que comenzar a analizar para poder estructurar su sistema de detección, generando ciertas reglas y parámetros a seguir. De esta forma, el primer problema estuvo en la imposibilidad de dar con un grupo de datos de la envergadura necesaria; después de no encontrar un conjunto de datos que cumpliera los requisitos necesarios, el equipo de investigación decidió crear el suyo propio.

Para empezar, debían especificar qué son realmente las fake news: entran dentro de dicha categoría las noticias y reportes intencionadamente falsos, engaños y trucos para viralizar cierta información y noticias con una finalidad humorística o satírica. Posteriormente establecieron los hasta nueve requisitos que el algoritmo debía seguir para detectar correctamente noticias falsas: tendría que poder detectar noticias reales, verificar el fondo de la misma y tener en cuenta factores como el estado de la noticia (acabada o en proceso), su lenguaje, etc. Hay mucha más información, sobre esto, en el white paper publicado por el equipo de Ontario.

Hecho todo esto, el siguiente paso fue generar una base de noticias falsas (y su contrapartida real, para fines comparativos): utilizaron a trabajadores de Amazon Mechanical Turk para convertir en falsas, retocando sutilmente aquí y allá y manteniendo el estilo periodístico de las originales, hasta 500 noticias distintas. Con ello pudieron hacer que el algoritmo las procesara y "aprendiera" a diferenciar.

El último paso, con el algoritmo ya desarrollado y con sus reglas establecidas, fue suministrar un conjunto de noticias, reales y falsas, directamente sacadas de Internet. En su análisis y detección de fake news, el algoritmo fue más eficiente que un grupo de humanos. No hablamos de un sistema perfecto, pues erró el 24% de las ocasiones pero, por su parte, los humanos lo hicieron en un 30% de las veces.

Así pues, y con margen de mejora por delante, los desarrolladores afirman tener entre manos un sistema de detección de fake news "comparable a cualquier humano". Algo que, en los tiempos que corren y con el problema de la desinformación en webs como Facebook, tardará poco tiempo en ser explotado. Parece demasiado bonito para ser verdad pero ¿nos estaremos acercando al fin de las fake news?