Documentar los crímenes de odio en Estados Unidos han representado desde hace mucho tiempo un gran reto para los investigadores, periodistas y científicos sociales. Así que con el fin de construir una imagen más amplia sobre estos delitos en los 50 estados del país, en colaboración con ProPublica, Google News Lab creó una base de datos basada en inteligencia artificial para registrarlos y analizar los artículos de prensa al respecto.

"Trabajamos con Google News Lab y el estudio de visualización de datos llamado Pitch Interactive para construir una app que facilita la búsqueda de noticias sobre crímenes de odio e incidentes de sesgo y a encontrar y rastrear a sujetos específicos", explicó ProPublica en una nota.

Pitch Interactive ayudó a crear el índice Documenting Hate News Index, que recoge los resultados de Google News y los filtra a través del análisis del lenguaje natural de Google (Cloud Natural Language API) para extraer información geográfica y contextual.

"Es una de las primeras visualizaciones que utilizan el aprendizaje automático para generar contenido usando la API de Google Natural Language, que analiza texto y extrae información sobre personas, lugares y eventos", explicó Simon Rogers, editor de Google News Lab Data.

En este caso, ayuda a los reporteros a encontrar localidades, nombres y otros datos útiles de los más de 3.000 informes de noticias -el feed se actualiza todos los días y se remonta a febrero de 2017.

La iniciativa Documenting Hate recoge y verifica los incidentes de odio que son reportados tanto por contribuyentes individuales como por organizaciones de noticias y los añade a un calendario dentro de la interfaz.

Los usuarios también podrán realizar una búsqueda por palabra clave o explorar sugerencias algorítmicas. Google monitoreará la base en caso de que encuentre un falso positivo, como cuando se utilice la palabra "odio" en otro contexto. Además, los datos estarán disponible a través de la plataforma GitHub.

Aunque el FBI está legalmente obligado a documentar los crímenes de odio a nivel federal, las autoridades estatales y locales a menudo no reportan sus propios incidentes, por lo que los registros son irregulares en el mejor de los casos, con datos incompletos o inexistentes, y no están catalogados en ninguna base de datos nacional formal. Por eso, Google llamó al proyecto un "punto de partida" para la documentación y el estudio de los crímenes de odio.