Sobre la constancia de la latencia en el borde de Internet
En resumen
- Un estudio reciente ha caracterizado la estabilidad de la latencia entre los usuarios finales y los servidores de borde de las redes de distribución de contenidos (CDN), que son infraestructuras críticas para la entrega de contenidos a la mayoría de los usuarios finales.
- Los resultados indican que nuestra infraestructura de red suele estar bien optimizada para ofrecer conexiones de red sin apenas variaciones.
- Determinar las causas exactas de los picos y variaciones de latencia sigue siendo un objetivo clave de nuestro trabajo futuro.
La latencia o tiempo de ida y vuelta (RTT) entre dos hosts finales (por ejemplo, el portátil o la tableta de un usuario y un servidor web) es un factor determinante de la experiencia del usuario. Establecer una conexión de baja latencia entre dos puntos finales cualesquiera que se comuniquen es, por tanto, crucial para maximizar el rendimiento de las aplicaciones.
Las redes de distribución de contenidos (CDN) se han convertido en un elemento crítico para reducir la latencia sirviendo contenidos desde servidores "periféricos" que se encuentran "muy cerca" de los usuarios finales. Esta tarea ha obligado a las CDN a desplegar cientos de miles de servidores en diversas redes y ubicaciones geográficas, y pueden determinar dinámicamente desde qué servidor se puede servir la solicitud de un usuario final determinado en función de las métricas de rendimiento (latencia) y otros factores (carga). Por ello, la mayor parte de los contenidos que consumen los usuarios finales en Internet son servidos actualmente por las CDN, lo que las convierte en una valiosa referencia para comprender el rendimiento global de Internet desde la perspectiva del usuario final.
En un estudio reciente, mis colegas y yo de BITS Pilani, Goa, y la Vrije Universiteit de Ámsterdam tratamos de caracterizar las latencias de los trayectos entre los usuarios finales y los servidores de borde de las CDN.
Nuestro interés residía en comprender la "estabilidad" de la latencia, ya que tiene implicaciones sustanciales en el rendimiento de diversas aplicaciones.
Incluso los mejores sistemas sufren variaciones
Nuestro trabajo se centró en la "constancia" de las latencias, es decir, hasta qué punto las latencias observadas están libres de variaciones "sustanciales".
Para medir la constancia, utilizamos 69 anclas del Atlas RIPE como nuestros puntos de observación y cien servidores de borde (véase la figura 2) pertenecientes a cinco CDN ampliamente utilizadas como objetivos. (Consulte nuestro documento para obtener más detalles sobre la selección de nuestros puntos de observación y objetivos). Medimos las latencias entre nuestros puntos de observación y los objetivos cada dos horas durante 10 días consecutivos. A continuación, cotejamos las latencias entre cada par punto de observación-objetivo en una "línea de tiempo". Caracterizamos la constancia de las observaciones de latencia utilizando tres enfoques bien conocidos:
- Constancia matemática -Usando tres algoritmos estadísticos, medimos dónde las latencias observadas muestran una desviación "sustancial" respecto a los valores pasados en una línea temporal. Esencialmente, ignoramos las desviaciones menores en la señal de latencia y sólo consideramos los cambios sustanciales, a menudo llamados "cambios de nivel". Los casos en los que observamos tales cambios de nivel se denominan "puntos de cambio" (véase la figura 3), y la región entre dos puntos de cambio cualesquiera es la "región libre de cambios (CFR)", en la que la latencia (señal) se considera constante. Cuanto mayor sea la duración de las CFR, más estable (o constante) será la línea temporal de latencia.
- Constancia operativa - Definimos una secuencia de observaciones de latencia como constante si estas latencias se encuentran dentro de ciertos umbrales predefinidos (digamos, 25-50 ms).
- Constancia predic tiva - Si, basándonos en datos históricos, podemos predecir con exactitud la siguiente observación de latencia, entonces se considera que las variaciones de latencia no son sustanciales: la línea temporal de latencia es (según la noción predictiva) constante.
Los resultados indican que nuestra infraestructura de red suele estar bien optimizada para ofrecer conexiones de red con pocas o ninguna variación (o jitter).
Observamos que las regiones CFR máximas -el periodo máximo durante el cual las latencias en una línea temporal permanecieron matemáticamente constantes- son al menos tres veces mayores que las registradas en trabajos anteriores recientes.
También observamos que, incluso desde una perspectiva operativa, la mayoría de las líneas de tiempo eran constantes: el 95% tienen un CFR máximo de cien horas o más, un factor de cuatro más que el mostrado en trabajos anteriores. Incluso con un umbral de constancia más estricto de 25 ms, observamos que la mediana del CFR máximo de todas las líneas de tiempo era superior a 230 horas (el 96% de la duración de nuestro estudio).
Observamos, no obstante, que alrededor del 4% de todas nuestras observaciones manifiestan "picos" de latencia, lo que supone al menos dos órdenes de magnitud más que lo registrado en trabajos anteriores recientes. Aunque no es típico, los trayectos de red proporcionados por nuestra actual infraestructura de Internet experimentan degradaciones no triviales de la latencia, que a su vez pueden dar lugar a un rendimiento deficiente de las aplicaciones de los usuarios finales.
Determinar las causas profundas exactas de los picos y variaciones de latencia sigue siendo un objetivo clave de nuestro trabajo futuro. Nuestro trabajo actual también se centró únicamente en las mediciones de latencia entre hosts finales con capacidad IPv4, por lo que tenemos previsto investigar a continuación las latencias entre hosts con capacidad IPv6. También queremos comprobar la correlación entre las mediciones de latencia IPv4 e IPv6 entre un par determinado de hosts finales (apilados doblemente). Estas exploraciones ofrecerán probablemente una rica perspectiva de las capacidades de nuestra infraestructura de red.
Colaboradores: Aniket Shaha, Vaibhav Ganatra, Balakrishnan Chandrasekaran y Vinayak Naik
Aditya Bhat es un estudiante de Informática en BITS Pilani, Goa, interesado en las mediciones de red, los análisis de big data y el aprendizaje profundo.
Las opiniones expresadas por los autores de este blog son suyas y no reflejan necesariamente los puntos de vista de la Internet Society.
Imagen de wal_172619 de Pixabay
