Apagones y Byteouts: ¿Qué les ocurre a los nodos de Internet cuando la red se tambalea?
En resumen:
- Comprender qué parte de nuestras operaciones en Internet es susceptible de sufrir fallos en la red de distribución eléctrica es fundamental para medir la resistencia de Internet.
- Un estudio reciente muestra que muchos IXP, y las redes a las que dan servicio, están ubicados en los mismos edificios físicos. Esto significa que un fallo que acabe con un pequeño número de nodos de alimentación críticos puede tumbar varios IXP a la vez.
- Comprender qué instalaciones están en peligro es sólo la mitad del cuadro. La otra mitad es qué ocurre con el tráfico cuando se caen.
El año pasado, un apagón generalizado afectó a partes de España, duró varias horas y se extendió en cascada a Portugal y el sur de Francia. En las zonas afectadas, e incluso en algunas vecinas, la gente informó de la pérdida tanto de conectividad como de servicios básicos: sin servicio de telefonía móvil durante horas, sin Internet e incluso con dificultades para retirar dinero en efectivo. El apagón también coincidió con una fuerte caída del tráfico de Internet, latencias más altas y sobrecarga en las aplicaciones de comunicación.
Otro tipo de recordatorio llegó unos días después, cuando un fallo en la Bolsa de Internet de Milán (MiX) interrumpió la accesibilidad de múltiples servicios, con efectos que se propagaron mucho más allá de un único edificio. Fue una demostración muy pública de lo que los ingenieros de redes ya saben: algunas instalaciones importan desproporcionadamente más para la conectividad
Estos incidentes no son raros. A medida que avanzamos hacia un mundo digitalizado, la cuestión ya no es si la electricidad y la infraestructura de Internet están acopladas. La cuestión es si comprendemos dónde el acoplamiento es más estrecho, y qué podemos hacer al respecto.
Dónde se produce físicamente "Internet
La mayoría de la gente se imagina Internet como cables bajo las calles y señales inalámbricas en el aire. Eso es cierto, pero está incompleto. Una gran parte de la vida cotidiana en línea depende de instalaciones físicas:
- Los centros de datos son los edificios donde viven la computación y el almacenamiento (sus aplicaciones, sus servicios empresariales, sus cargas de trabajo en la nube).
- Los puntos de intercambio de Internet (IXP) son ubicaciones en las que las redes se interconectan e intercambian tráfico localmente, en lugar de transportarlo a través de las fronteras o a través de un pequeño conjunto de proveedores de tránsito.
No se trata de instalaciones abstractas. Son emplazamientos físicos con alimentación eléctrica, sistemas de refrigeración, generadores de reserva y (a menudo) una dependencia de los activos de la red eléctrica cercana.
Como parte de mi beca de investigación Pulse 2025, mis colegas y yo nos propusimos comprender las dependencias de las infraestructuras críticas de Internet, como los centros de datos y los IXP, de las subestaciones eléctricas cercanas, con vistas a entender hasta qué punto nuestras operaciones en Internet son susceptibles de sufrir fallos en la red de distribución eléctrica, tanto a nivel de país/zona como de ciudad/local. Incluso la ubicación de las centrales eléctricas está fragmentada entre países, formatos y niveles de detalle.
Asignación de instalaciones de infraestructuras críticas a la red
No hay ningún conjunto de datos estandarizado y disponible públicamente que diga "esta instalación recibe energía de esa subestación específica". Incluso la ubicación de las centrales eléctricas está fragmentada entre países, formatos y niveles de detalle. Existen fuentes de datos públicas, pero son ruidosas.
Mapeamos las ubicaciones de las instalaciones de los IXP y los centros de datos hasta sus subestaciones de alta tensión más cercanas utilizando una asignación basada en la proximidad. En lugar de pretender conocer con exactitud los contratos de suministro (que no son públicos), utilizamos una óptica de riesgo: si falla una subestación, ¿qué instalaciones cercanas corren un riesgo plausible?
El gráfico de dispersión (Figura 1) muestra la distancia relativa al impacto (denotada por el número de IXP alojados en una instalación).
Las instalaciones más grandes tendrán un mayor impacto (en los IXP, los AS y el tráfico afectados) si falla la central eléctrica que las abastece. El gráfico también muestra las 5 principales instalaciones críticas por IXP y distancia, lo que pone de relieve que las instalaciones de alto impacto no se colocan necesariamente teniendo en cuenta la infraestructura de la red eléctrica, y que esto debe tenerse en cuenta a la hora de añadir nuevas instalaciones. Si un suceso eléctrico afecta a la zona de Ámsterdam (donde se agrupan muchas instalaciones), podrían fallar simultáneamente varios IXP de alto impacto, ya que el riesgo geográfico y por distancia se agrava.
El riesgo de fallo en cascada es real y se amplifica con la coubicación
Para modelar la capacidad de recuperación, construimos un grafo bipartito que conecta cada instalación IXP con sus k subestaciones más cercanas (con k = 3). En este modelo, una instalación se considera fallida sólo si se pierden todas sus subestaciones conectadas, lo que refleja la idea de que las instalaciones con acceso a múltiples subestaciones cercanas tienen cierta redundancia.
Incluso con esta generosa suposición, los resultados son aleccionadores. Muchos IXP, y las redes a las que dan servicio, están ubicados en los mismos edificios físicos. Esto significa que un fallo que acabe con un pequeño número de nodos de alimentación críticos puede tumbar varios IXP a la vez.
Al ejecutar una simulación de fallo de subestación utilizando el marco anterior, descubrimos que ~70% de los IXP pueden fallar por una tasa de fallo de subestación de ~20% (Figura 2). Esto se debe principalmente a la coubicación de estas instalaciones digitales.
Así, mientras que una ciudad puede parecer "bien conectada" sobre el papel (¡muchas instalaciones!), puede no ser resistente, ya que esas instalaciones pueden compartir la misma dependencia energética subyacente y ser vulnerables a riesgos similares (como un apagón o una catástrofe natural, como una inundación).
Realizamos estas simulaciones utilizando tres estrategias de fallo: fallos aleatorios en las subestaciones (modelados como averías en los equipos o fenómenos meteorológicos), fallos basados en la centralidad de grado (dirigidos primero a las subestaciones más conectadas) y fallos basados en la centralidad de interrelación (dirigidos a las subestaciones que se encuentran en el mayor número de rutas a través de la red). Las estrategias dirigidas, que se aproximan a ataques deliberados o fallos correlacionados en segmentos críticos de la red, son significativamente más dañinas que los fallos aleatorios a la misma escala.
Cuando falla un eje principal, ¿adónde va el tráfico?
Comprender qué instalaciones están en peligro es sólo la mitad del cuadro. La otra mitad es: ¿qué ocurre con el tráfico cuando se caen?
Es importante responder a esta pregunta para comprender mejor la capacidad de recuperación del sistema. Para responderla, utilizamos el banco de pruebas PEERING para emular escenarios de fallo y evaluar el impacto de un fallo de las infraestructuras de Ámsterdam inducido por un apagón (Figura 3).
Nuestra intuición es que "la geografía importa": si Amsterdam falla y hay enlaces PEERING disponibles tanto en Fráncfort (Alemania) como en Seattle (EE.UU.), es probable que el tráfico se desvíe por Fráncfort en lugar de por SIX (Seattle). Nuestros experimentos comprobaron si esta intuición se mantiene en la práctica.
También realizamos experimentos de fallos para pares y triples de emplazamientos con el fin de conocer las rutas de reencaminamiento preferidas primarias, secundarias y terciarias. Estos resultados revelan no sólo adónde puede ir el tráfico, sino adónde va cuando el sistema de encaminamiento se adapta a un fallo. Y en función de esos resultados de reencaminamiento, podemos empezar a captar las interdependencias que traspasan las fronteras nacionales
Los resultados obtenidos hasta ahora dibujan un panorama claro: la concentración geográfica de la infraestructura de Internet crea una fragilidad oculta a través de las dependencias de poder compartidas, y los patrones de coubicación habituales en los principales centros de Internet amplifican el riesgo considerablemente.
Vea mi presentación en el Foro Pulse de Medición de Internet, España, o póngase en contacto con [email protected] para obtener más información sobre nuestra metodología y resultados.
Tanya Shreedhar fue becaria de investigación de 2025 Pulse e investigadora postdoctoral en TU Delft (Países Bajos). Su investigación abarca los protocolos de transporte, las mediciones de Internet y la resistencia de las infraestructuras.
Las opiniones expresadas por los autores de este blog son suyas y no reflejan necesariamente los puntos de vista de la Internet Society.
