El apagón de Internet en Italia, una tormenta perfecta
El domingo 5 de febrero, el mayor proveedor de servicios de Internet (ISP) de Italia, TIM (antes Telecom Italia), sufrió una importante interrupción de la red que afectó a más de uno de cada tres internautas italianos durante casi cinco horas.
Ahora que la polvareda se ha asentado, echemos un vistazo a lo que ocurrió exactamente y, de paso, analicemos la importancia de que los países cuenten con la redundancia y los pares adecuados con los socios locales para que no se produzcan cortes de suministro a tan gran escala.
¿Por qué uno de cada tres internautas italianos se ha quedado sin conexión a Internet?
Como muestra la lista de dependencia de la red del IIJ (figura 1), tres de las ocho redes más importantes de Italia (según su base de usuarios) están gestionadas por el grupo Telecom Italia: AS6762 SEABONE-NET (Sparkle), AS3269 ASM-IBSNAZ (la red nacional de telefonía fija) y AS16232 ASN-TIM (la red móvil de TIM).
Sparkle es un operador internacional que sirve como proveedor de tránsito para muchas redes en Italia, pero no presta servicio directamente a ningún usuario final. Funciona como una entidad independiente, pero es propiedad al 100% de Telecom Italia. La red de telefonía fija de TIM (AS3269) da servicio directamente al 20,8% de la población. Y como se utiliza como red de tránsito, da servicio indirectamente a un 8,5% estimado de la población del país. Si incluimos el 8,4% de la población a la que da servicio a través de su red móvil (AS16232), llegamos a cerca del 38% de los habitantes de Italia. Esto significa que el apagón del domingo afectó a más de un tercio del país.
El Grupo de Operadores de Red Italianos(ITNOG) gestiona un grupo de Telegram que estuvo muy activo durante la interrupción, con muchos participantes tratando de entender lo que estaba ocurriendo, y representantes de Sparkle proporcionando actualizaciones sobre cómo estaban resolviendo el problema.
En el momento de escribir estas líneas, no tenemos una descripción detallada de lo sucedido, sólo que:
- El problema se localizó en torno a la conectividad internacional, que TIM compra a Sparkle.
- El problema también afectó a los resolutores DNS de la red de TIM y, al parecer, a algunos de sus servidores PPPoE.
- La conectividad entre algunas localidades del país también se vio interrumpida alrededor de la misma hora.
- Aunque este apagón afectó a diferentes redes y fue notificado por un puñado de personas, sigue siendo importante tenerlo en cuenta, ya que algunos cables defectuosos podrían haber desencadenado problemas en los routers u otros equipos de red.
Mientras esperamos una autopsia tanto de TIM como de Sparkle, podemos especular con que estos problemas podrían haberse evitado si TIM hubiera tenido una mayor redundancia y más interconexión.
La importancia de la redundancia
Si usted es un operador de red, la gestión de fallos debe ser una prioridad, así como diseñar su red de forma que no tenga un único punto de fallo. TIM no debe tomarse como un buen ejemplo de ninguna de las dos cosas, ya que sólo depende de Sparkle para la conectividad internacional, como puede verse en el Hurricane Electric BGP Toolkit (Figura 2).
Es una práctica común que los operadores sean multihomed, lo que significa tener más de un operador como proveedor ascendente, suministrando el llamado "tránsito" al resto de Internet.
Por ejemplo, la figura 3 muestra cómo Vodafone (AS30722), competidor de TIM en Italia, tiene cinco proveedores ascendentes: AS3356 (Lumen, antes Centurilink y Level3), AS1299 (Arelion), AS1273 (Vodafone Global Network), AS5396 (IRIDEOS Spa), AS6939 (Hurricane Electric) y AS1299 (Twelve99). Esta configuración proporciona mucha redundancia "cuando" uno de estos flujos ascendentes tiene una interrupción.
Un argumento a favor de la importancia del peering con otras redes locales
Antes de 2013, TIM, al ser la teleco incumbente en Italia, estaba obligada por ley a hacer peering con todos los operadores italianos. Esto significaba que su matriz de peering era realmente compleja pero muy diversificada. Sin embargo, desde 2013 las leyes han cambiado, y casi todas las relaciones de peering de TIM fueron interrumpidas. Puede obtener más información al respecto en la presentación de Marco d'Itri en Salottino MIX 2014 y en esta presentación de Luca Cicchelli (TOP-IX) y Mauro Magrassi (MIX) en el Foro Europeo de Peering de 2013.
Lo que esto significa es que, en muchos casos, si los usuarios locales de Internet quieren llegar a los usuarios de una de las redes de TIM, el tráfico tiene que transitar por Fráncfort, Alemania, donde entra en la red Sparkle (el único proveedor ascendente de TIM), y luego se entrega de nuevo a TIM en Milán. Esto aumenta la latencia y el coste de la conexión con las redes de TIM y podría evitarse si TIM se conectara localmente a través de uno de los muchos puntos de intercambio de Internet (IXP) existentes en Italia.
Obtenga más información sobre cómo los IXP hacen que Internet sea más rápido y asequible.
Se trata de una situación que TIM ha elegido: no tiene ninguna base técnica. Se trata más bien de una postura política. Establecer peering con la mayoría de las redes en los dos puntos de peering en los que tiene un puerto activo - NAMEX en Roma y MIX en Milán - requeriría un esfuerzo mínimo.En 2020 y 2021, TIM estableció temporalmente sesiones de peering con cualquier red que lo solicitara para "absorber" el tráfico de quienes trabajaban desde casa durante los cierres patronales. TIM también había establecido un acuerdo de interconexión con TOP-IX, pero todo ello se interrumpió a finales de 2021.
Esta interrupción no podría haber sido una mejor manera de demostrar lo importantes que son los IXP y los contenidos locales. Se trata de un área de trabajo en la que se ha centrado la Internet Society. Trabajamos para promover los IXP y la interconexión, y nos estamos centrando en ayudar a los países a mantener el tráfico local con nuestra visión 50/50, un ambicioso plan para mantener local al menos la mitad de todo el tráfico de Internet en las economías emergentes para 2025.
