En los tiempos que corren, son muchas las personas que se informan de lo que ocurre en el mundo a través de internet, ya sea mediante vídeos de plataformas como Youtube o en blogs o prensa digital. La cantidad de información a la que se puede acceder de este modo es inmensa, por lo que muchas veces quienes la escriben optan por recurrir a ciertos truquitos para que el público escoja su noticia por encima de otra. Y para eso, sin duda, una de las mejores estrategias es escoger un buen título. Este debe ser una frase realista, que introduzca lo que hay en el interior del artículo, pero con gancho. El problema es que muchas personas optan por recurrir a información engañosa, a través de los títulos conocidos como clickbait.

Esta suele ser una de las principales entradas hacia las fake news, aunque en ciertas ocasiones sí que dan acceso a información verídica. Sin embargo, se trata de una estratagema poco honesta, ya que finalmente no se está dando lo que se ofrece. Algunos de estos titulares pueden reconocerse fácilmente. Basta con buscar muletillas como “y no imaginas lo que ocurrió” o “te sorprenderá” para saber que algo turbio está pasando. Sin embargo, otras veces son más difíciles de detectar y pueden terminar atrayéndonos hacia la trampa. Por eso, gracias al crecimiento de las técnicas basadas en inteligencia artificial se están empezando a desarrollar algoritmos capaces de detectar estos titulares, con el fin de filtrarlos o incluso eliminarlos de ciertas plataformas, que buscan ofrecer a sus usuarios solo información de calidad. Existen muchas opciones, pero la mejor hasta el momento parece ser la que ha desarrollado un equipo de científicos de las Universidades de Penn State y Arizona.

A la caza del clickbait

Para la realización de este estudio, cuyos resultados se han presentado hoy en la Conferencia Internacional IEEE / ACM 2019 sobre Avances en el Análisis de Redes Sociales (ASONAM), en Vancouver, pidieron a una serie de voluntarios que escribieran un titular engañoso para una noticia de 500 palabras que tuvieron que leer previamente. Además, programaron máquinas para generar clickbaits artificiales, con el fin de comprobar si el algoritmo era capaz de detectar también títulos realizados por bots.

Después de la fase de capacitación, su programa de inteligencia artifical fue capaz de detectar el clickbait en ambos casos, con una eficacia un 14’5% superior a la de otros algoritmos, como la herramienta en línea Clickbait Challenge 2017.

Los resultados en este aspecto son muy buenos, pero los autores del estudio no quieren centrarse solo en ellos, según ha explicado en un comunicado de prensa el investigador principal, Dongwon Lee: “Más allá de su uso en la detección de clickbait, el enfoque del equipo puede ayudar a mejorar el rendimiento del aprendizaje automático en general”.

A pesar de todo, tuvieron que lidiar con un problema básico al intentar detectar este tipo de datos, ya que existen muchas variaciones con respecto a las “fórmulas” consideradas como habituales. Los hay en forma de lista o de pregunta y en muchos formatos más. Por eso, es importante detectarlos y etiquetarlos, para poder entrenar mejor los algoritmos empleados.

Tras las pruebas se observó también que la IA era capaz de encontrar diferencias entre cómo creaban este tipo de titulares las máquinas y los seres humanos, e incluso en estos últimos podían diferenciar si se trataba de un escritor experimentado. Uno de los rasgos que ayudaban a distinguir a las personas es que, por lo general, solían incluir más determinantes. En cuanto a la experiencia, los periodistas, en contraposición a personas con menos formación, solían usar palabras más largas y una mayor cantidad de pronombres.