Miles de millones de personas y millones de negocios en todo el mundo han quedado parcialmente incomunicados este lunes debido a la caída de Facebook y todos sus servicios, entre los que se encuentra WhatsApp, Instagram y Facebook Messenger.

A las 17:40, hora peninsular, Facebook desapareció de internet. Los mensajes dejaron de enviarse y recibirse a través de WhatsApp, y las aplicaciones de Facebook e Instagram mostraban errores al entrar. Lo sorprendente de esta caída, que ha sido total, es su duración. ¿Cómo los servicios de una de las compañías más grandes y poderosas del mundo pueden quedar inaccesibles durante seis horas? Ésta es la pregunta que se ha estado haciendo todo el mundo. En la cabeza de los usuarios que no entienden los entresijos técnicos, internet no puede —o debería— ser tan frágil como lo es en realidad.

Photo by Greg Bulla on Unsplash

La clave de la caída de Facebook

En cuanto las aplicaciones y servicios de la compañía quedaron inaccesibles, Cloudflare detectó que su sistema de nombres de dominio (DNS) dejó de funcionar junto a su infraestructura de direcciones IP. «Es como si alguien hubiese tirado del cable de sus servidores», dice la compañía en su blog.

El DNS es una especie de listín telefónico de internet por el cual los nombres de las páginas web se traducen a su dirección real, la dirección IP. Se utiliza para que el usuario no memorice una serie de números en lugar de un simple nombre como facebook.com. Cuando un usuario quiere acceder a una web, los DNS se encargan de localizar el destino. Son los encargados de traducir una dirección comprensible para el humano a una comprensible para las máquinas: (cliente-internet-servidor).

El problema estaba en una capa superior, pues el servicio era ilocalizable aun mediante las direcciones IP.

Sin embargo, el problema estaba en una capa superior, pues el servicio era ilocalizable aun mediante las direcciones IP. Éste residía en el protocolo de puerta de enlace de frontera (BGP). El BGP es la clave tras los sistemas autónomos que conectan las redes de internet. Su cometido es listar constantemente la ruta que se puede tomar. Es decir, el DNS dice dónde quieres ir, el BGP dice por dónde. Los grandes routers de internet que hacen que todo funcione cuentan con listas actualizadas constantemente de las posibles rutas que seguir. El BGP hace posible la red de redes, y permite que la red de Facebook tenga presencia en internet y que por lo tanto sea accesible desde cualquier lugar del mundo.

Facebook, por un error en su configuración, anunció nuevas rutas. Éstas eran inaccesibles y, a efectos prácticos, la compañía se desconectó a sí misma de internet. El problema podría haberse solventado rápidamente revertiendo la nueva configuración, algo que no pudo hacerse debido a que toda la red de Facebook quedó inoperativa. Había que acceder a los servidores físicamente. Pero, según han reportado varios periodistas, incluso los accesos de entrada y salida dentro de sus oficinas dependían de la red.

¿La solución? Entrar a la fuerza

La oficina de una de las compañías más grandes del mundo estuvo horas sin poder usar su red de comunicación interna y sin poder acceder a los ordenadores en los que se pueden revertir los cambios. Hasta que lograron acceder físicamente a su centro de datos.

Las primeras informaciones indicaban que los encargados de resolver el incidente tuvieron que emplear una rotaflex o amoladora angular para acceder a la sala. Esta información ya ha sido desmentida por el periodista Mike Isaac del New York Times, que ha emitido una rectificación, aunque es el testimonio de empleados hablando de forma anónima frente al discurso público que puede querer Facebook. No es conveniente reconocer una situación desastrosa y cómica en medio del escrutinio al que está sometida la compañía durante los últimos días. Oficialmente, se ha reconocido que hubo dificultades debido a la «seguridad física».

La compañía ha emitido el siguiente comunicado horas después de solventar el problema explicando las causas:

«La causa que subyace a esta interrupción también afectó a muchas de las herramientas y sistemas internos que utilizamos en nuestras operaciones diarias, lo que complicó nuestros intentos de diagnosticar y resolver rápidamente el problema.

Nuestros ingenieros han averiguado que los cambios de configuración en los routers que coordinan el tráfico de red entre nuestros centros de datos provocaron problemas que interrumpieron esta comunicación. Esta interrupción del tráfico de red tuvo un efecto en cascada en la forma en que se comunican nuestros centros de datos, lo que provocó la interrupción de nuestros servicios. Éstos vuelven a estar en línea y estamos trabajando activamente para que vuelvan a funcionar con normalidad.

Queremos dejar claro en este momento que creemos que la causa principal de esta interrupción fue un cambio de configuración defectuoso. Tampoco tenemos pruebas de que los datos de los usuarios se hayan visto comprometidos como resultado de esta interrupción».

Foto por Brett Jordan

Cuando el mundo depende de una compañía

Sea verídico o no que miles de personas hayan podido volver a comunicarse o seguir operando sus negocios gracias a una rotaflex, la situación reabre un importante debate: ¿es conveniente que casi todo internet y, por ende la sociedad, gire en torno a una única compañía?

No sólo son los patentes problemas de polarización que promueven y los efectos nocivos en la salud mental de sus usuarios —según múltiples estudios que están saliendo a la luz— sino el hecho de que, paulatinamente, Facebook se ha hecho dueña de lo que ven y consumen los ciudadanos en internet y del mayor canal de comunicación del mundo, que es WhatsApp.

A su vez, cada vez más negocios dependen de ésta. Los medios digitales que usan sus servicios como puerta de entrada a sus contenidos, las tiendas que lo usan como escaparate o el dueño de un restaurante que gestiona las órdenes a través de Messenger. La conveniencia y beneficios inmediatos que ofrecieron en el pasado se convierten ahora, aunque sea durante un lapso de seis horas, en millones de dólares perdidos y la sensación de que gran parte de nuestras vidas pueden depender de unas cuantas líneas de código mal puestas.