El corte de Internet en Italia es una tormenta perfecta

Picture of Massimiliano Stucchi
Regional Technical Advisor - Europe, Internet Society
Categorias:
Twitter logo
LinkedIn logo
Facebook logo
February 8, 2023

El domingo 5 de febrero, el mayor proveedor de servicios de Internet (ISP) de Italia, TIM (antes Telecom Italia), sufrió una importante interrupción de la red que afectó a más de uno de cada tres internautas italianos durante casi cinco horas.

Ahora que ya se ha calmado el ambiente, veamos qué ocurrió exactamente y, de paso, analicemos la importancia de que los países cuenten con la redundancia adecuada y se pongan de acuerdo con los socios locales para que no se produzcan cortes de suministro a tan gran escala.

¿Por qué uno de cada tres internautas italianos se ha quedado sin conexión a Internet?

Como muestra la lista de dependencia de redes del IIJ (Figura 1), tres de las ocho redes más importantes de Italia (en función de la base de usuarios) están gestionadas por el grupo Telecom Italia: AS6762 SEABONE-NET (Sparkle), AS3269 ASM-IBSNAZ (la red nacional de telefonía fija) y AS16232 ASN-TIM (la red móvil de TIM).

Figura 1 – Lista de dependencia de la red del IIJ que muestra el porcentaje de población italiana cubierta por sus mayores ISP.

Sparkle es un operador internacional que sirve de proveedor de tránsito para muchas redes en Italia, pero no atiende directamente a ningún usuario final. Funciona como una entidad independiente, pero es propiedad al 100% de Telecom Italia. La red de telefonía fija de TIM (AS3269) da servicio directo al 20,8% de la población. Y como se utiliza como red de tránsito, se calcula que sirve indirectamente a un 8,5% de la población del país. Si incluimos el 8,4% de la población a la que da servicio a través de su red móvil (AS16232), llegamos a cerca del 38% de los habitantes de Italia. Esto significa que el apagón del domingo afectó a más de un tercio del país.

El Grupo de Operadores de Red Italianos(ITNOG) gestiona un grupo de Telegram que estuvo muy activo durante la interrupción, con muchos participantes tratando de entender lo que estaba ocurriendo, y representantes de Sparkle proporcionando actualizaciones sobre cómo estaban resolviendo el problema.

En el momento de escribir estas líneas, no tenemos una descripción detallada de lo ocurrido, sólo que:

  • El problema se localizaba en torno a la conectividad internacional, que TIM compra a Sparkle.
  • El problema también afectaba a los resolutores DNS de la red de TIM y, al parecer, a algunos de sus servidores PPPoE.
  • La conectividad entre algunas localidades del país también se vio interrumpida hacia la misma hora.
  • Aunque esta interrupción afectó a diferentes redes y fue notificada por un puñado de personas, sigue siendo importante tenerla en cuenta, ya que algunos cables defectuosos podrían haber provocado problemas en routers u otros equipos de red.

Mientras esperamos la autopsia de TIM y Sparkle, podemos especular con que estos problemas podrían haberse evitado si TIM hubiera tenido más redundancia y más interconexión.

La importancia de la redundancia

Si es usted operador de redes, la gestión de fallos debe ser una prioridad, así como diseñar su red de modo que no tenga un único punto de fallo. TIM no debe tomarse como un buen ejemplo de ninguno de los dos, ya que sólo depende de Sparkle para la conectividad internacional, como puede verse en el Hurricane Electric BGP Toolkit (Figura 2).

Figura 2 – Diagrama de enrutamiento que muestra que todo el tráfico de AS3269 dentro y fuera de Italia pasa por AS6762.

Es práctica común que los operadores sean multihomed, lo que significa tener más de un operador como proveedor ascendente, suministrando el llamado “tránsito” al resto de Internet.

Por ejemplo, la figura 3 muestra cómo Vodafone (AS30722), competidor de TIM en Italia, tiene cinco proveedores ascendentes: AS3356 (Lumen, antes Centurilink y Level3), AS1299 (Arelion), AS1273 (Vodafone Global Network), AS5396 (IRIDEOS Spa), AS6939 (Hurricane Electric) y AS1299 (Twelve99). Esta configuración proporciona redundancia suficiente “cuando” uno de estos flujos ascendentes tiene una interrupción.

Figura 3 – Diagrama de enrutamiento que muestra que todo el tráfico de AS30722 dentro y fuera de Italia pasa por cinco sistemas autónomos (AS) distintos.

Por qué es importante el peering con otras redes locales

Antes de 2013, TIM, al ser la empresa de telecomunicaciones incumbente en Italia, estaba obligada por ley a equipararse con todos los operadores italianos. Esto significaba que su matriz de interconexión era realmente compleja pero muy diversificada. Sin embargo, desde 2013 las leyes han cambiado, y casi todas las relaciones de interconexión de TIM se interrumpieron. Puede obtener más información al respecto en la presentación de Marco d’Itri en Salottino MIX 2014 y en esta presentación de Luca Cicchelli (TOP-IX) y Mauro Magrassi (MIX) en el European Peering Forum 2013.

Esto significa que, en muchos casos, si los usuarios locales de Internet quieren llegar a usuarios de una de las redes de TIM, el tráfico tiene que pasar por Fráncfort (Alemania), donde entra en la red Sparkle (el único proveedor ascendente de TIM), y luego vuelve a TIM en Milán. Esto aumenta la latencia y el coste de la conexión con las redes de TIM y podría evitarse si TIM se conectara localmente a través de uno de los muchos Puntos de Intercambio de Internet (IXP) existentes en Italia.

Más información sobre cómo los IXP hacen que Internet sea más rápido y asequible.

Se trata de una situación elegida por TIM: no tiene ninguna base técnica. Se trata más bien de una postura política. El peering con la mayoría de las redes en los dos puntos de peering donde tiene un puerto activo – NAMEX en Roma y MIX en Milán – requeriría un esfuerzo mínimo.

En 2020 y 2021, TIM estableció temporalmente sesiones de peering con cualquier red que lo solicitara para “absorber” el tráfico de quienes trabajaban desde casa durante los cierres patronales. TIM también había establecido un acuerdo de interconexión con TOP-IX, pero todo esto se interrumpió a finales de 2021.

Esta interrupción no podía demostrar mejor la importancia de los IXP y los contenidos locales. Este es un ámbito de trabajo en el que se ha centrado la Internet Society. Trabajamos para promover los IXP y la interconexión, y nos centramos en ayudar a los países a mantener el tráfico local con nuestra visión 50/50: un ambicioso plan para mantener local al menos la mitad de todo el tráfico de Internet en las economías emergentes para 2025..