Ilustración de ordenadores portátiles haciendo yoga

Visualizar cómo respira Internet

Photo of Stephen Jasina
Categorías:

En resumen:

  • La necesidad de visualizar los datos de rendimiento de la red es especialmente relevante en los actuales conjuntos de datos telemétricos de red, cada vez más grandes.
  • Los investigadores han elaborado una representación de tipo geográfico de los datos de medición del retardo de la red que es a la vez visualmente convincente y operativamente informativa.
  • La nueva visualización puede servir de inspiración a otros investigadores y operadores.

Los humanos somos criaturas intrínsecamente visuales. Como resultado, las visualizaciones de datos se encuentran entre las herramientas más poderosas que tienen los investigadores y operadores de redes para transmitir información de forma clara y memorable. La importancia de las buenas visualizaciones es especialmente relevante con los conjuntos de datos telemétricos de red actuales, cada vez más grandes.

Un estudio de los artículos sobre redes revela una fuerte presencia de visualizaciones tradicionales, como gráficos de líneas, histogramas, diagramas de barras y diagramas de dispersión. En este post, presentamos un argumento a favor de enfoques creativos y no estándar para la visualización de datos, especialmente para los datos espaciotemporales y otros tipos de datos de redes multidimensionales. En particular, trataremos un problema que las visualizaciones tradicionales no pueden abordar: cómo mostrar que una red "respira" con el tiempo.

Medidas de latencia de la red como series temporales

Un conjunto de magnitudes que suelen recopilar los operadores de redes son los tiempos de ida y vuelta (RTT) por pares entre enrutadores, medidos normalmente a intervalos regulares y representados como series temporales individuales, una por cada par de enrutadores. Las anomalías en estas series temporales pueden revelar un enrutamiento ineficaz, condiciones extremas de tráfico, cortes de enlaces, etc. Nos referimos a esto como la representación en series temporales de los datos de medición del retardo de la red.

Un gráfico solitario de series temporales de datos de medición del retardo de la red.
Figura 1 - Ejemplo de la representación en series temporales de los datos de medición del retardo de la red. En el eje y figuran los RTT (en milisegundos) y en el eje x las marcas de tiempo de las mediciones. Para mayor claridad visual, sólo se muestra una selección de 100 series temporales.

Esta representación de series temporales (figura 1), compuesta por un conjunto de gráficos lineales estándar, presenta una serie de inconvenientes:

  • Incluso para redes de tamaño modesto, hay demasiadas mediciones como para identificar fácilmente qué línea corresponde a qué par de routers.
  • Aunque algunas anomalías pueden resultar obvias en el gráfico, es difícil saber el contexto geográfico de los sucesos. Por ejemplo, ¿el suceso del principio de la figura 1 está localizado o afecta a toda la red a la vez?
  • Es muy difícil determinar la gravedad de una anomalía determinada. En la figura 1, se aprecian numerosos cambios en los RTT; sin embargo, es difícil determinar cuáles son lo suficientemente graves como para justificar la intervención del operador.

Nuestro objetivo es producir una representación de estos datos de medición del retardo de la red que sea a la vez visualmente más atractiva y operativamente más informativa.

Una alternativa creativa

Nuestra solución consiste en representar una instantánea de los datos de medición del retardo de la red en el tiempo t como una superficie(colector), muy parecida a un mapa topográfico. Llamamos a esta superficie el espacio de retardo de la red en el tiempo t.

Intuitivamente, el RTT medido en el tiempo t entre dos enrutadores corresponde a la distancia(geodésica) más corta entre ellos en la superficie. En efecto, caminar sobre la superficie a lo largo de dicha geodésica como si fuera la Tierra define un camino cuya longitud se aproxima a la latencia medida.

Ilustración en 3D de un gráfico del espacio de retardo de una red. Los círculos representan los encaminadores. Las líneas de colores representan los caminos más cortos (geodésicos).
Figura 2 - Una instantánea del espacio de retardo de una red. Los círculos representan los encaminadores. Las líneas de color representan los caminos más cortos (geodésicos).

A medida que generamos y consideramos diferentes instantáneas a lo largo del tiempo, podemos interpolar suavemente entre superficies en cada instantánea para crear una animación cohesiva que muestre cómo evoluciona el espacio de retardo de la red; es decir, una visualización de cómo respira la red.

Nuestro enfoque para transformar una representación de series temporales de datos de medición del retardo de la red en un espacio de retardo de red que respire aprovecha las herramientas y técnicas de la geometría riemanniana y se describe con más detalle en nuestro documento HotNets.

Un ejemplo de respiración

Para demostrar la utilidad de nuestro método de visualización, lo aplicamos a los datos disponibles públicamente proporcionados por ESnet, una red no clasificada de alto rendimiento financiada por el DoE y construida para apoyar la investigación científica. Utilizamos 56 routers y más de 100.000 mediciones para crear la animación. La animación final se muestra a continuación:

Figure 3 — A breathing network.

Para llamar la atención del observador, los grandes cambios en el colector se resaltan en rojo. Además, se dibujan los caminos más cortos (geodésicos) entre varios puntos finales.

Hay varios acontecimientos notables en la animación. En el tiempo 0:12, se produce un gran desplazamiento en la zona de Utah/Colorado. Como resultado, las geodésicas que pasan por esa zona son empujadas hacia el sur. Esto corresponde al primer pico de la serie temporal de la figura 1. Con la animación, ahora tenemos el contexto geográfico de que los aumentos de latencia se debieron a una anomalía cerca de la región de Four Corners, no a una interrupción a gran escala.

Por el contrario, a la hora 1:15, se produce un cambio menor en Arizona, que da lugar al pico final de la serie temporal que se muestra en la Fig. 1. Concluimos que este último acontecimiento es más local y menos significativo de lo que sugiere la serie temporal.

Por último, observamos que la red no "hiperventila", sino que se mantiene estable durante gran parte del periodo medido. Esto sugiere que la red ESnet proporciona un rendimiento consistente, y que las desviaciones de esa consistencia son relativamente menores.

Utilizando el poder de la animación no estándar, hemos creado una visualización que ofrece una comprensión más profunda del espacio de retardo de una red que la que podría lograrse con métodos más tradicionales. Creemos que los conjuntos de datos recientes, cada vez más grandes, requieren la adopción de técnicas de visualización creativas, y esperamos que este trabajo sirva de inspiración a otros investigadores y operadores.

Stephen Jasina es estudiante de doctorado en la Universidad de Wisconsin-Madison bajo la supervisión del profesor Paul Barford. Sus principales intereses son la medición de Internet y la visualización de datos, aunque tiene debilidad por las matemáticas abstractas.


Las opiniones expresadas por los autores de este blog son suyas y no reflejan necesariamente los puntos de vista de la Internet Society.