Illustration d'ordinateurs portables faisant du yoga

Visualiser la respiration de l'internet

Photo of Stephen Jasina
Catégories:

En bref :

  • La nécessité de visualiser les données relatives à la performance des réseaux est particulièrement pertinente dans les ensembles de données de télémétrie de réseau de plus en plus volumineux d'aujourd'hui.
  • Les chercheurs ont produit une représentation géographique des données de mesure des retards des réseaux qui est à la fois visuellement attrayante et informative sur le plan opérationnel.
  • Les nouvelles visualisations peuvent servir d'inspiration à d'autres chercheurs et opérateurs.

Les êtres humains sont par nature des créatures visuelles. Par conséquent, la visualisation des données est l'un des outils les plus puissants dont disposent les chercheurs et les opérateurs de réseaux pour transmettre des informations de manière claire et mémorable. L'importance d'une bonne visualisation est d'autant plus grande que les ensembles de données de télémétrie des réseaux sont aujourd'hui de plus en plus volumineux.

Une étude des articles sur les réseaux révèle une forte présence de visualisations traditionnelles, telles que les graphiques linéaires, les histogrammes, les diagrammes à barres et les diagrammes de dispersion. Dans ce billet, nous présentons un argument en faveur d'approches créatives et non standard de la visualisation des données, en particulier pour les données spatiotemporelles et d'autres types de données de réseau multidimensionnelles. En particulier, nous discuterons d'un problème que les visualisations traditionnelles ne peuvent pas résoudre : comment montrer qu'un réseau "respire" au fil du temps.

Mesures de latence du réseau sous forme de séries temporelles

L'un des ensembles de données couramment recueillies par les opérateurs de réseaux est le temps de transit aller-retour (RTT) entre les routeurs, généralement mesuré à intervalles réguliers et représenté sous forme de séries temporelles individuelles, une par paire de routeurs. Les anomalies dans ces séries temporelles peuvent révéler un routage inefficace, des conditions de trafic extrêmes, des pannes de liaison, etc. C'est ce que nous appelons la représentation en séries temporelles des données de mesure des retards du réseau.

Un graphique de séries temporelles de données de mesure des retards du réseau.
Figure 1 - Exemple de représentation d'une série temporelle de données de mesure de retard de réseau. L'axe des y représente les RTT (en millisecondes) et l'axe des x représente les horodatages des mesures. Pour des raisons de clarté visuelle, seule une sélection de 100 séries temporelles est présentée.

Cette représentation des séries chronologiques (figure 1), composée d'un ensemble de tracés linéaires standard, présente un certain nombre d'inconvénients :

  • Même pour les réseaux de taille modeste, il y a trop de mesures pour identifier facilement quelle ligne correspond à quelle paire de routeurs.
  • Bien que certaines anomalies soient évidentes dans le graphique, il est difficile de déterminer le contexte géographique des événements. Par exemple, l'événement au début de la figure 1 est-il localisé ou affecte-t-il l'ensemble du réseau en une seule fois ?
  • Il est très difficile de déterminer la gravité d'une anomalie donnée. Dans la figure 1, de nombreux changements dans les RTT sont évidents ; cependant, il est difficile de déterminer lesquels sont suffisamment graves pour justifier l'intervention de l'opérateur.

Notre objectif est de produire une représentation des données de mesure des retards du réseau qui soit à la fois plus attrayante sur le plan visuel et plus informative sur le plan opérationnel.

Une alternative créative

Notre solution consiste à représenter un instantané des données de mesure du retard du réseau à l'instant t sous la forme d'une surface(manifold), à l'instar d'une carte topographique. Nous appelons cette surface l'espace des retards du réseau à l'instant t.

Intuitivement, le RTT mesuré à l'instant t entre deux routeurs correspond à la distance(géodésique) la plus courte entre eux sur la surface. En effet, marcher à la surface le long d'une telle géodésique comme s'il s'agissait de la Terre définit un chemin dont la longueur est proche de la latence mesurée.

Illustration en 3D d'un graphique de l'espace de retard d'un réseau. Les cercles représentent les routeurs. Les lignes colorées représentent les chemins les plus courts (géodésiques).
Figure 2 - Instantané de l'espace de retard d'un réseau. Les cercles représentent les routeurs. Les lignes colorées représentent les chemins les plus courts (géodésiques).

Au fur et à mesure que nous générons et examinons différents instantanés au fil du temps, nous pouvons interpoler en douceur entre les surfaces de chaque instantané pour créer une animation cohérente qui montre l'évolution de l'espace de retard du réseau, c'est-à-dire une visualisation de la façon dont le réseau respire.

Notre approche de la transformation d'une représentation temporelle des données de mesure des retards du réseau en un espace respiratoire des retards du réseau s'appuie sur des outils et des techniques de la géométrie riemannienne et est décrite plus en détail dans notre article sur les réseaux chauds (HotNets).

Un exemple de respiration

Pour démontrer l'utilité de notre méthode de visualisation, nous l'appliquons aux données publiques fournies par ESnet, un réseau non classifié à haute performance financé par le DoE et construit pour soutenir la recherche scientifique. Nous utilisons 56 routeurs et plus de 100 000 mesures pour créer l'animation. L'animation finale est présentée ci-dessous :

Figure 3 — A breathing network.

Pour attirer l'attention de l'observateur, les changements importants apportés au collecteur sont mis en évidence en rouge. En outre, les chemins les plus courts (géodésiques) sont tracés entre plusieurs points d'extrémité.

L'animation comporte plusieurs événements notables. À 0:12, un important déplacement se produit dans la région de l'Utah et du Colorado. En conséquence, les géodésiques passant par cette zone sont poussées vers le sud. Cela correspond au premier pic de la série temporelle de la figure 1. Grâce à l'animation, nous disposons désormais d'un contexte géographique indiquant que les augmentations de latence étaient dues à une anomalie près de la région de Four Corners, et non à une panne à grande échelle.

En revanche, à 1:15, un changement mineur se produit en Arizona, conduisant au pic final dans la série temporelle montrée dans la figure 1. Nous en concluons que ce dernier événement est plus local et moins important que ne le suggère la série chronologique.

Enfin, nous observons que le réseau n'est pas "hyperventilé", mais qu'il reste stable pendant la majeure partie de la période mesurée. Cela suggère que l'ESnet fournit des performances constantes et que les écarts par rapport à cette constance sont relativement mineurs.

En utilisant la puissance de l'animation non standard, nous avons créé une visualisation qui offre une compréhension plus profonde de l'espace de retard d'un réseau que ce que l'on pourrait obtenir avec des méthodes plus traditionnelles. Nous pensons que les ensembles de données récents et de plus en plus volumineux nécessitent l'adoption de techniques de visualisation créatives, et nous espérons que ce travail servira d'inspiration à d'autres chercheurs et opérateurs.

Stephen Jasina est doctorant à l'université du Wisconsin-Madison sous la direction du professeur Paul Barford. Il s'intéresse principalement à la mesure de l'Internet et à la visualisation des données, mais il a un faible pour les mathématiques abstraites.


Les opinions exprimées par les auteurs de ce blog sont les leurs et ne reflètent pas nécessairement celles de l'Internet Society.