- La coubicación de servidores raíz es frecuente, pero mayoritariamente baja, ya que ∼70% de los puntos de observación observan la coubicación de al menos dos servidores.
- Aunque la mayor parte del tráfico se mantiene local, muchas peticiones se encaminan a réplicas remotas. Los proveedores ascendentes y las políticas de enrutamiento individuales desempeñan un papel importante en esto.
- Diversificar la infraestructura de último salto en determinados sitios puede mejorar la redundancia.
El Sistema de Nombres de Dominio (DNS) es una base de datos enorme, jerárquica y distribuida. En la parte superior de esta jerarquía, la zona raíz, servida por los servidores raíz, proporciona el punto de partida (lógico) para todas las resoluciones de nombres. Como la mayoría de las aplicaciones de Internet dependen del DNS, la resistencia de estos servidores raíz es fundamental para el funcionamiento de Internet.
Lee: El sistema de nombres de dominio de Internet explicado para no expertos
Por suerte, el sistema de servidor raíz (RSS) es un ejemplo excelente de sistema resistente. Esta resistencia se consigue mediante medidas de diversidad y redundancia, como:
- 13 servidores raíz (identificados con las letras “a” a “m”) operados por 12 organizaciones independientes.
- Cada servidor raíz tiene réplicas distribuidas geográficamente. En total, el RSS contiene más de 1.900 instancias de servidor.
- Estas instancias ejecutan pilas de software diferentes.
Antes de examinar la resistencia del RSS con más detalle, es crucial comprender cómo medir un sistema distribuido de este tipo.
Configuración de la medición
Los servidores raíz utilizan IP Anycast para dirigir a los clientes a las instancias del servidor. Por ejemplo, un cliente de Japón puede ser dirigido a una instancia de servidor en Tokio, mientras que un cliente de Europa puede acabar en Ámsterdam, aunque ambos clientes hayan contactado con la misma dirección IP.
Esto también significa que el comportamiento observado puede cambiar en función de la ubicación geográfica o topológica de un cliente. Necesitamos clientes (o puntos de observación) en redes de todo el mundo para captar esas diferencias.
Como parte de un estudio reciente, mis colegas y yo del Instituto Max Planck de Informática, Deutsche Commercial Internet Exchange (DE-CIX) y BENOCS GmbH utilizamos 675 puntos de observación de NLNOG RING en 523 redes y 62 países (Figura 1).
Con más de 1.900 instancias de servidor, encontrar nuevas ubicaciones de despliegue puede resultar complicado. Por lo general, resulta atractivo desplegarse en lugares con buena conectividad (local), como centros de datos o Puntos de Intercambio de Internet (IXP). Sin embargo, reutilizar la misma infraestructura de último salto puede reducir la redundancia de una configuración anycast.
Recopilando traceroutes desde nuestros puntos de observación hasta los 13 servidores raíz diferentes, podemos cuantificar la reutilización de la infraestructura de último salto. Si dos rutas desde un punto de observación comparten el penúltimo salto (siendo el último salto el propio servidor raíz), es probable que estos servidores raíz estén ubicados en el mismo lugar. Definimos entonces la “redundancia reducida” como el número total de penúltimos saltos menos el número único.
Nuestro estudio reveló que prevalece cierta coubicación, y en el 70% de los puntos de observación se observó la coubicación de al menos dos servidores. En algunos puntos de observación, por ejemplo, en Oceanía (Figura 2), observamos una Redundancia Reducida significativa (n=6) para IPv6.
Sin embargo, una pequeña “redundancia reducida” no es necesariamente mejor. Por ejemplo, en África, descubrimos que el tráfico se enruta fuera del continente (aumentando el número de rutas únicas), aunque se disponga de réplicas locales, como l.root. Esto subraya el papel y la importancia de los proveedores ascendentes cuando se considera la capacidad de recuperación del RSS.
Mantener el tráfico local
Como hemos visto, el tráfico africano de “redundancia reducida” a veces se encamina fuera del continente.
Sin embargo, mantener el tráfico local puede mejorar la resistencia y es un objetivo explícito de la Internet Society.
En particular, el rendimiento bruto (en términos de RTT) no es una preocupación primordial para los servidores raíz, ya que sus respuestas suelen almacenarse en caché en los resolvers locales.
Utilizando consultas especiales y un mapa público de los emplazamientos de los servidores, podemos hacer que un servidor nos proporcione un identificador de instancia real y calcular la distancia entre el punto de observación que realiza la consulta y la réplica del servidor que responde.
La Figura 3 muestra la diferencia de distancia entre la instancia global geográficamente más cercana y aquella a la que se encaminó cada solicitud a la b.raíz. El 78% de las solicitudes se dirigen a la réplica global más cercana y aterrizan en la diagonal.
También observamos un grupo de solicitudes que recorren entre 5.000 y 10.000 kilómetros adicionales. Estas solicitudes proceden de puntos situados en Europa y se encaminan a Norteamérica. Una vez más, observamos que estos efectos suelen deberse a las decisiones de encaminamiento de los proveedores anteriores.
Saber más
Si te ha parecido interesante, consulta nuestro artículo, en el que hacemos un análisis más profundo, examinamos un cambio de dirección IP en el RSS y evaluamos el mecanismo de transferencia de zonas en el contexto del nuevo registro ZONEMD.
Florian Steurer es estudiante de doctorado en el Instituto Max Planck de Informática. Su investigación se centra en la medición del DNS y la resiliencia.
Foto de Bas van Schaik VIA Wikimedia Commons