big-data

El Big Data se ha convertido en una herramienta muy potente para explotar grandes volúmenes de datos y exprimirlos al máximo para extraer información y conocimiento que nos permita mejorar procesos, establecer modelos predictivos o plantearnos preguntas complejas a la hora de tomar decisiones empresariales. Hoy en día generamos gran cantidad de datos al usar nuestro smartphone o al hacer clic en un "me gusta" de Facebok, información que se puede procesar para ir mucho más allá del dato y obtener con bastante precisión datos sobre usuarios, sus hábitos o sus costumbres que, a simple vista, nos eran imperceptibles. La potencia del Big Data se ha revelado como un instrumento clave en las empresas pero, también, pueden influir en otros muchos ámbitos y contribuir a un desarrollo sostenible, una mejor planificación urbana o, incluso, hacer mucho más efectiva la lucha contra la propagación de una epidemia.

El famoso caso de los "me gusta" de Facebook, que comentamos hace unas semanas, es un buen ejemplo que muestra la capacidad de extraer información que tiene el Big Data. Si aplicamos esta tecnología al procesamiento de información cotidiana que generamos sin darnos cuenta y que, normalmente, no se suele explotar, el grado de conocimiento que podemos llegar a alcanzar puede ser muy grande y si procesáramos la información que generamos con nuestros dispositivos móviles, más de uno se asustaría con los proyectos que se están desarrollando y que, quizás, algún día podrían tener una aplicación real. ¿Qué supone aplicar el Big Data en la telefonía móvil?

Datos que predicen comportamientos

Quizás pueda sonar paranoide pero un teléfono móvil encendido está, de manera periódica, contactando con la red del operador para que éste tenga "ubicada" la estación base a la que el terminal está conectado y, de hecho, algunos terminales registran estos cambios de ubicación para hacer más rápida la conexión con las redes (y bien famoso que fue el caso del iPhone en el año 2011). Por tanto, constantemente estamos generando información que no se suele procesar y que, sin embargo, tiene un increíble potencial más allá de ofrecer información de llamadas cursadas o ubicaciones por las que nos hemos movido.

Universidad de Birmingham

Hace unos meses comentamos que la Universidad de Birmingham había desarrollado un algoritmo que era capaz de procesar este tipo de información y predecir el crimen, simplemente, monitorizando la actividad de los smartphones en un determinado sector de interés. Reduciendo el estudio a un grupo de sospechosos, que estuviesen sieno vigilados por la policía, el responsable de la investigación, Mirco Musolesi, comentaba que su algoritmo era capaz de alertar que había riesgo de producirse una actividad delictiva procesando los datos de uso del smartphone.

De hecho, según este mismo investigador, procesando este tipo de datos uno podría ser capaz de predecir comportamientos y, en un futuro, poder plantear preguntas del tipo ¿dónde estará mi amigo dentro de una hora? para obtener una posible ubicación y, quizás, darle una sorpresa bastante inquietante.

Planificación urbana

No siempre el uso que se hace del Big Data, afortunadamente, tiene que ver con la monitorización de las personas o la vigilancia y el seguimiento; la información que generamos con nuestros dispositivos móviles puede procesarse para que ayude a realizar una buena planificación urbana y optimizar, por ejemplo, las redes de transporte público.

Un buen ejemplo de este tipo de usos se ha conocido esta semana gracias a un concurso llamado "Data for Development" que ha organizado por el operador Orange y en el que, entre otros, ha participado IBM (que es uno de los referentes en el ámbito del Big Data).

YouTube video

Procesando unos registros de alrededor de 2.500 millones de llamadas telefónicas de la ciudad de Abidjan (la ciudad más grande de Costa de Marfil), importante tener en cuenta que los datos no identificaban personas, el equipo de IBM fue capaz de obtener una distribución fiable de la población y estudiar los movimientos que hacían a lo largo de la ciudad. ¿Y cuál era el objetivo de este estudio? En base a la información obtenida por IBM se ha llegado a la conclusión que la ciudad requiere 2 nuevas líneas de autobús y ampliar el trazado de una de las líneas existentes.

Lo interesante de este estudio es que se realizó con feauture phones, es decir, terminales sin GPS y toda la información geográfica utilizada correspondía a las estaciones base a las que se conectaban los usuarios de la ciudad y el proyecto se llevó a cabo en un mes.

Para realizar este proyecto, IBM utilizó únicamente la información de las líneas de transporte público de la ciudad y los datasets de las llamadas pero, si además, se combinase información sobre el tráfico, los horarios de los autobuses, trazados de carriles-bus existentes y cualquier información que se nos pueda ocurrir, el Big Data y los datos que generamos con nuestros dispositivos móviles podrían producir unos modelos de gestión del transporte urbano increíblemente eficaces y abrirían la puerta a una nueva forma de gestionar los entornos urbanos.

YouTube video

Otro proyecto interesante se está desarrollando en el Laboratorio de Transporte Inteligente de la Universidad de Berkeley y que también tiene como objetivo conjugar el Big Data con la información de nuestros smartphones y aplicarlos al ámbito del transporte urbano para predecir los atascos y replanificar el tráfico de manera dinámica, consiguiendo así un tráfico fluido y mejor distribuido en las grandes ciudades.

Luchar contra enfermedades

La investigación médica y el Big Data hace tiempo que caminan juntas y, por ejemplo, el MIT desarrolló hace tiempo un modelo con el que estudiar la propagación de la gripe A durante 2009 y 2010, una pandemia que se extendió por México, Estados Unidos y Europa causando alrededor de 18.000 muertes según la OMS.

YouTube video

El modelo del MIT casaba los datos aeroportuarios (vuelos, tiempos de espera en aeropuertos, conexiones entre vuelos, etc) con la información de los casos registrados de la enfermedad, un estudio interesante que ponía sobre la mesa cómo había cambiado la propagación de las enfermedades en el siglo XXI. Si bien el modelo del MIT sobre la gripe A nada tiene que ver con la telefonía móvil, existen proyectos que caminan por esta senda y que sí que utilizan este tipo de datos para predecir si hay una epidemia y cómo ésta se podría propagar.

La Universidad de Harvard lleva tiempo trabajando en el procesamiento de datos generados por los terminales móviles de los habitantes de Kenia. ¿El objetivo? Establecer un modelo predictivo que permita controlar la propagación de enfermedades como la malaria y predecir los movimientos de las personas que han contraído la enfermedad o que son portadoras de ésta y pueden propagarla.

Los investigadores analizaron los datos generados por 14.816.521 usuarios de telefonía móvil en las 11.920 estaciones base del país que están distribuidas en 692 núcleos de población para casar la información con los casos de malaria registrados y establecer mapas que ubicasen focos de la enfermedad y casos que pudieran estar vinculados a propagaciones de ésta debido a personas que hubiesen viajado por el país. Con todos estos datos, los investigadores esperan trazar modelos de comportamiento de la población y acotar la propagación de la enfermedad con mayor eficacia.

Big Data y privacidad

Como hemos podido comprobar, son múltiples los proyectos de Big Data que se están desarrollando con información generada con nuestros dispositivos móviles, un tema apasionante que puede tener aplicación en muchos ámbitos y que también nos hace pensar en lo que puede suponer para el usuario en términos de privacidad. Desde Nokia Research ya se ha comentado este asunto en forma de artículo científico con la idea de sentar las bases del modelo de datos a usar en este tipo de investigaciones pero, con el tiempo, las investigaciones se convertirán en productos o proyectos reales que también requerirán de un protocolo para el tratamiento de los datos.

Ya hay operadores que se plantean, dentro de su negocio estratégico, explotar la información estadística de sus redes y ofrecer esta información a terceros, por ejemplo, en forma de mapas de uso de servicios en movilidad por parte de los usuarios; un asunto del que comienzan a alertar algunas voces que comentan que es posible obtener modelos predictivos de los movimientos que hacen los usuarios y, por tanto, supone un riesgo para la privacidad si los datos no se tratan adecuadamente.

Movimiento de los usuarios - ¿Qué supone aplicar el Big Data en la telefonía móvil?
Nature

Siempre que los datos que se usen no incluyan información personal o susceptible de identificar al abonado de una línea, procesar este tipo de datos puede producir unos beneficios tangibles a los usuarios como hemos podido ver en el caso de Costa de Marfil o en el de la investigación de la Universidad de Harvard pero, sin duda, se abre un debate sobre privacidad que requiere del establecimiento de unas reglas de uso para preservar, con garantías, los derechos de los usuarios de los servicios en movilidad.