Cuando utilizamos Twitter, podemos activar un servicio extra de geolocalización, en el que se envía información sobre el lugar desde donde escribimos nuestros mensajes en esta popular red social. Si no lo tenemos activado, sin embargo, también se puede inferir nuestra localización a través del contenido de nuestros tuits, según un nuevo algoritmo desarrollado por científicos de IBM Research.
Y es que tus conversaciones en Twitter y el comportamiento que sigas en esta red social sirve para que este algoritmo detecte con un 70% de eficacia desde qué ciudad y provincia escribes. La herramienta, que podríamos pensar que interfiere con nuestra privacidad, ayuda a los investigadores a analizar la distribución geográfica de los mensajes de Twitter desde diferentes perspectivas.
Su trabajo ha sido publicado en arXiv, y se basó en la recopilación de tuits de julio a agosto de 2011 de usuarios de las 100 ciudades más grandes de Estados Unidos en términos de población. A partir de ahí, captaron los 200 últimos mensajes de los usuarios, de forma que su investigación analizó finalmente más de 1 millón y medio de mensajes en Twitter enviados por casi 10.000 usuarios.
Del total de tuits, el 6,6% eran fáciles de geolocalizar, pues procedían directamente de la red Foursquare. El 19% de los mensajes, por otro lado, contenían referencias directas a las ciudades donde estaban situados los usuarios. A partir de ahí, los investigadores desarrollaron un algoritmo en el que usaban diversos términos para geolocalizar los mensajes, tales como hashtags, nombres de ciudades u otras palabras clave.
Finalmente, para validar la relación entre la geolocalización inferida por el algoritmo y la localización real, los investigadores compararon datos como la hora de los envíos de los mensajes en Twitter y la franja horaria de las ciudades donde estarían los usuarios. Sin duda, el poder del big data generado en redes sociales como esta puede ayudarnos a recopilar numerosa información, solo hace falta saber cómo almacenar y gestionar todos estos datos.