Foto de dos manos sobre un volante

¿Quién dirige el tráfico de Internet? Comprender la opacidad en la selección de réplicas CDN

Photo of Rashna Kumar
Categorías:

En resumen:

  • Las decisiones de direccionamiento del tráfico que eligen las redes de distribución de contenidos (CDN) afectan a la latencia, la resiliencia y la soberanía...
  • Un estudio reciente muestra que el direccionamiento basado en DNS es la estrategia más utilizada por las redes de distribución de contenidos, pero los proveedores no siempre confían en un único mecanismo de direccionamiento y pueden utilizar una combinación de enfoques.
  • Los resultados y la metodología de código abierto proporcionan una base para clasificar las estrategias de las RCD y permitir debates más informados sobre la responsabilidad en la infraestructura de Internet.

Detrás de muchas solicitudes de sitios web, especialmente los alojados en redes de distribución de contenidos (CDN), hay una decisión en gran medida invisible sobre qué servidor responderá. Esa decisión influye en la rapidez con que se carga una página, en que los datos permanezcan dentro de las fronteras nacionales o viajen al extranjero, y en la capacidad de recuperación de los servicios en línea durante las interrupciones de la red.

En nuestro estudio publicado en NINeS'26, introducimos una metodología para inferir el mecanismo que se esconde tras esa decisión, conocida como selección de réplicas, que se ha convertido en uno de los puntos de control silenciosos de Internet.

Por qué es importante entender las decisiones sobre el tráfico CDN

Las CDN gestionan grandes sistemas distribuidos que colocan copias del contenido en servidores de todo el mundo. Cuando usted abre un sitio, la CDN tiene que decidir qué servidor réplica debe responder a su solicitud. Puede parecer una elección rutinaria de ingeniería, pero conlleva consecuencias reales.

La selección de réplicas afecta a la latencia, la capacidad de recuperación e incluso la soberanía, especialmente cuando las solicitudes de los usuarios locales se dirigen a través de infraestructuras de otros países. El problema es que estas decisiones de direccionamiento suelen ser invisibles fuera de la propia CDN, incluso para los usuarios, los reguladores e incluso muchos operadores de red.

Esa opacidad importa aún más porque el ecosistema del Sistema de Nombres de Dominio (DNS) está cada vez más concentrado. Para las CDN que dependen de la dirección basada en DNS, la ubicación del resolver sirve como un proxy para los usuarios. Pero los resolvedores públicos centralizados pueden servir a usuarios de amplias regiones, lo que los convierte en un sustituto imperfecto de dónde se encuentran realmente los usuarios. Como resultado, la posición geográfica y las elecciones políticas de los resolvedores DNS de terceros pueden influir en el destino del tráfico.

En otras palabras, la entidad que da forma a la experiencia de un usuario puede no ser el usuario o incluso la red del usuario, sino una combinación opaca de lógica CDN e infraestructura DNS centralizada.

¿Podemos inferir cómo dirigen el tráfico las CDN?

Para responder a esta pregunta, utilizamos sondas RIPE Atlas como puntos de observación del cliente y resolvimos el mismo contenido alojado en una CDN a través de resolvedores DNS en diferentes ámbitos geográficos, desde cercanos a lejanos. Después medimos cómo cambiaba la latencia hasta el servidor asignado.

Tres gráficos de dispersión que muestran la diferencia en los resultados de rendimiento entre los tres appraoches
Figura 1 - Los diferentes enfoques de dirección dejan huellas de latencia distintas.

  • Dirección basada en DNS: las distribuciones de latencia se separan más fuertemente a medida que cambia el ámbito del resolver, porque diferentes ubicaciones del resolver pueden conducir a diferentes réplicas.
  • IP anycast: la distribución permanece prácticamente inalterada porque la misma IP anycast se enruta a una instancia cercana independientemente de la elección del resolver.
  • El anycast regional se sitúa en un punto intermedio: tiende a parecerse al anycast IP dentro de una región, pero se parece más al direccionamiento basado en DNS entre regiones.

Primero validamos este método en proveedores bien conocidos. Recuperó correctamente Akamai como basado en DNS, Cloudflare como basado en anycast y Edgio como anycast regional.

12 de 17 Las CDN utilizan la redirección basada en DNS

Aunque los enfoques de selección de réplicas de unos pocos proveedores importantes ya se conocen bastante bien, se sabe mucho menos sobre las numerosas CDN de importancia regional.

Aplicamos nuestra metodología a 17 CDN únicas que prestan servicio a los 1.000 sitios web más importantes de 19 países, un conjunto que cubre aproximadamente el 66% de los usuarios de Internet del mundo. Estas CDN incluyen tanto hiperescaladores como proveedores de importancia regional como Azion, Medianova y NGENIX.

El hallazgo central es: El redireccionamiento basado en DNS sigue dominando. En nuestro conjunto de datos, 12 de las 17 CDN utilizaron el redireccionamiento basado en DNS y, por bytes entregados, los sistemas basados en DNS dominaron en la mayoría de las regiones. Esto es importante porque, en la práctica, significa que la consolidación entre los resolvers puede dar forma a dónde va el tráfico, cómo se propagan los fallos y cuánto control conservan las redes locales.

Table 1 — Per country and region, the percentage of total bytes of web content delivered via each steering approach or a combination of approaches (mixed).
Location Users (%) DNS-based (%) Anycast (%) Regional Anycast ( Mixed (%)
Europe 60 27.6 41.4 2.6 28.4
France 1.1 27.5 38.5 3.9 30.2
Germany 1.5 30.8 42.2 1.6 25.4
Russia 2.3 9.9 63.1 0.6 26.4
Spain 0.8 44.5 27.4 3.1 25
Turkey 1.3 26.7 46 3.3 24
United Kingdom 1.2 28 33.8 3 35.3
North America 89.3 34.7 32.3 3.8 29.1
US 5.5 34.7 32.3 3.8 29.1
South America 60 35.5 33.1 1.4 30
Argentina 0.8 34.2 33.7 1.1 31
Brazil 3.3 35.7 33.1 1.8 29.5
Asia 70.1 26.3 43.8 1.8 28.1
China 18.8 48.1 30 1.3 20.6
India 15.5 28.1 40.1 0.8 31.1
Indonesia 3.9 13.6 53.5 2.7 30.2
United Arab Emirates 0.2 20.5 40 1.8 37.7
Oceania 75 40.1 27.1 1.8 30.6
Australia 0.4 40.1 27.1 1.8 30.6
Africa 50.1 56.7 26.1 0.9 16.4
Algeria 0.7 22.1 51 1.7 25.1
Egypt 1 16.9 55.4 0.3 27.4
Ghana 0.3 82 9.6 0.4 8
Nigeria 2.9 36.5 37.3 2.5 23.7
South Africa 0.6 14.3 52.9 0.9 31.9
World Total 66 40.9 33.6 1.7 23.9

Por bytes entregados, la dirección DNS domina globalmente, lo que sugiere que el tráfico más pesado recurre más a menudo a la selección basada en DNS.

También descubrimos que los proveedores no siempre se basan en una única estrategia de dirección. Google, por ejemplo, mostró una división más o menos uniforme entre el comportamiento basado en DNS y el basado en anycast en los recursos que estudiamos. Los servicios de origen, como Google y YouTube, tendían a parecer dirigidos por DNS, mientras que algunos contenidos de terceros alojados en la infraestructura de Google parecían más dirigidos por anycast.

Esto demuestra que, incluso dentro de un mismo proveedor, los distintos servicios pueden ser dirigidos de diferentes maneras, diferencias que nuestra metodología puede distinguir sin acceso privilegiado.

¿Por qué importa qué enfoque de dirección domina?

Porque la selección de réplicas da forma a algo más que el mero rendimiento. Plantea cuestiones sobre

  • Resiliencia: ¿Debería recaer tanto poder de redireccionamiento en un pequeño número de resolvers y políticas CDN opacas, y qué significa esto para la tolerancia a fallos durante los fallos de la red?
  • Soberanía: Cuando el tráfico regional o gubernamental se dirige al extranjero, ¿qué significa eso para la jurisdicción y la autonomía?
  • El control: ¿El anycast global, aunque sencillo desde el punto de vista operativo, cede demasiado control a BGP, y los sistemas híbridos que mezclan DNS y anycast agravan esa opacidad?

Al convertir la selección de réplicas en algo medible desde el exterior, nuestra metodología proporciona una base para clasificar las estrategias de las RCD y permitir debates más informados sobre la responsabilidad en la infraestructura de Internet. Si queremos debates significativos sobre la rendición de cuentas, la soberanía digital y la concentración en la infraestructura de Internet, primero necesitamos visibilidad sobre cómo funciona realmente la dirección.

Para más detalles sobre la metodología y los resultados, lea nuestro documento.

Rashna Kumar es candidata a doctorado de último año en el grupo de investigación AquaLab del Prof. Bustamante en el Departamento de Informática de la Universidad Northwestern.

Colaboradores: Fabián E. Bustamante (Universidad Northwestern), Marcel Flores (Netflix)

Las opiniones expresadas por los autores de este blog son suyas y no reflejan necesariamente los puntos de vista de la Internet Society.


Foto de Eric Vía Wikimedia Commons