Un estudiante recopila 35 millones de perfiles de Google para alertar sobre la facilidad de acceso

Matthijs R. Koot, estudiante de la Universidad de Amsterdam, ha llevado a cabo un curioso experimento con el fin de demostrar los peligros a los que está expuesto el usuario con la información que queda indexada en las páginas de Google. Ha recopilado en un mes y con una sola IP, una base masiva de los perfiles de Google, 35 millones alojados en 35GB, entre los que se encuentran nombres, direcciones de correo, conversaciones en Twitter o información biográfica y laboral de los usuarios en la red. Koot ha guardado toda la información en una base de datos privada.

Recordamos el caso que se dio en Facebook el año pasado, momento en el que un investigador demostró la facilidad para obtener 100 millones de perfiles de los usuarios con sus URLs. Ese fue el detonante para que Facebook cambiara e hiciera lo posible por modificar la indexación de sus páginas. Actualmente, este tipo de acciones o investigaciones en la red social están prohibidas.

No es el caso de Google, quién, aunque permite elegir entre la privacidad o no de sus perfiles, hasta ahora da vía libre al acceso de los archivos de las URLs de los perfiles sin prohibición contra la indexación de las listas. Los ingenieros de la compañía no han puesto filtros ni límites al acceso de datos. Para Koot, la facilidad con la que ha recopilado esta información es un peligro, ya que cualquier persona o entidad podría llevar a cabo una acción similar con otro tipo de fines.

He escrito un bash script para descargar todo el mapa del sitio de los archivos mencionados. Traté de descargar 10K, luego 100K, 1M… Me quedé sorprendido de que mi conexión no se bloqueara, ni siquiera un CAPTCHA (sistema de reconocimiento para saber si el usuario que está accediendo a una aplicación es un humano o es una máquina). Tengo curiosidad por saber si se trata de un hecho aislado o si Google tiene pensado tomar medidas de protección contra la descarga masiva de datos de perfil

Para evitar males mayores como una posible violación en los términos de servicio de la compañía, la investigación se la ha trasladado a Google. La respuesta de la compañía es clara, aunque finalmente no responde realmente a la pregunta que plantea Koot. Google se apoya en que cada uno de los datos son públicos y autorizados y en que los perfiles se encuentran así para que los usuarios los utilicen en su motor de búsqueda.

La investigación que llevó a cabo no tiene otro fin que alertar sobre la facilidad de acceso de cualquier persona a información que probablemente debería de tener algún filtro. El eterno debate en la red sobre la privacidad que debe existir para con el usuario. Ayer mismo The Guardian planteaba un filtro que amparace a los usuarios en Twitter y Facebook sobre los datos que se vierten sobre ellos. En este caso el punto de mira ha sido Google y el mismo Koot plantea la necesidad de que, aunque exista la posibilidad de elegir entre un perfil público o privado y en último caso es el propio usuario el que debería tenerlo en cuenta, debiera ser la propia compañía la que aumentara las medidas de protección ante posibles casos fraudulentos. Vosotros, ¿cómo lo véis?

También en Hipertextual: