Photo of several mountain ranges of varying heights

Développer une approche holistique pour mesurer les pannes d’Internet

Picture of Mike Vandersanden
Guest Author | Hasselt University and Pulse Research Fellow
Catégories:
Twitter logo
LinkedIn logo
Facebook logo
December 5, 2024
En bref
  • Un chercheur boursier de Pulse a mis au point un nouveau système de suivi de l’arrêt de l’internet qui récupère des données API en source ouverte provenant de plusieurs sources afin d’obtenir une meilleure résolution des mesures du trafic internet, y compris lors d’anomalies.
  • Les essais montrent que chaque système de mesure fournit des résultats variables, mais collectivement, ils peuvent aider à interpréter la cause des anomalies.
  • D’autres sources de données et une interface intuitive pour automatiser le processus d’analyse sont en cours d’élaboration.

Il est difficile de mesurer l’internet. Chaque mesure est hautement subjective, en fonction des données auxquelles vous avez accès et de la manière dont vous les interprétez. Une façon de surmonter ces difficultés consiste à rassembler des données provenant de sources multiples afin d’obtenir une compréhension globale de la connectivité de l’internet lorsqu’il y a ou non un événement important.

En tant que boursier de 2024 Pulse Research, j’ai utilisé cette approche pour extraire des corrélations significatives sur les fermetures d’Internet.

Inscrivez-vous au webinaire 2024 Pulse Research Review le 11 juin à partir de 15:00 UTC

Le regroupement de plusieurs sources de données permet d’obtenir une meilleure résolution

Le système holistique que j’ai mis au point permet aux utilisateurs de récupérer des données à partir de plusieurs sources de données fiables qui surveillent l’internet, notamment :

Le système vous permet de superposer les données de ces sources pour une période donnée afin de comparer chaque point de vue.

Lorsque l’on étudie les perturbations délibérées connues de l’internet, il est évident que toutes les sources de données ne montrent pas une diminution de la qualité lorsqu’une panne se produit. Par exemple, la figure 1 montre des données de connectivité pour l’Algérie provenant de l’IODA et de Google du 9 au 13 juin 2024. Les sections en surbrillance sont des annotations de Cloudflare Radar sur les perturbations signalées par le gouvernement, dont le calendrier correspond aux ordres précédents du gouvernement de restreindre la connectivité Internet dans le pays pendant les examens du baccalauréat. Vous pouvez consulter ces événements sur le site Pulse Internet Shutdown Tracker.

Graphique linéaire de séries temporelles montrant diverses mesures Internet pour l'Algérie du 9 au 13 juin.
Figure 1 – Exemple de données de connectivité et d’annotations provenant de Cloudflare Radar, Google et IODA pour l’Algérie du 9 au 13 juin. Les sections surlignées sont des coupures d’Internet signalées par Cloudflare Radar.

La figure 2 est un autre exemple de la manière dont les utilisateurs peuvent rassembler et annoter les données de l’OONI et du CitizenLab. Elle regroupe les services Internet par catégorie afin de montrer quelles catégories présentent le plus d’anomalies, en l’occurrence les médias d’information et les réseaux sociaux.

Graphique à colonnes montrant le nombre d'anomalies pour différentes catégories de services web.
Figure 2 – Exemple de catégorisation des données du test de connectivité Web de l’OONI à l’aide de la liste de tests de CitizenLab. Notez que le test de connectivité Web de l’OONI fournit une ventilation des catégories en ligne, mais pas par l’intermédiaire de son API.

Sur la base de ces graphiques, nous pouvons constater ce qui suit :

  • Temps et durée d’interruption prévisibles – Lesinterruptions apparaissent selon un modèle autour des moments d’examen, où la perturbation est censée contrer la tricherie potentielle. Nous pouvons le constater dans la chronologie, où les interruptions sont annotées, ainsi qu’à travers les données brutes et en utilisant la détection des anomalies.
  • Pas de coupure totale – Lesdonnées brutes montrent qu’en général, si l’internet est perturbé, ce n’est que partiellement.
  • Catégories similaires de sites touchés par la panne – Enexaminant les sites spécifiques perturbés ou présentant des anomalies, nous pouvons observer que toutes les périodes d’examen montrent que des types similaires de sites web sont touchés. La raison des différentes pannes étant la même, on peut s’attendre à ce que les mêmes informations soient touchées.
  • Différentes méthodes de perturbation – Lespannes apparaissent dans diverses sources de données pour chaque région, ce qui laisse supposer que différentes méthodes sont utilisées pour perturber l’internet.

Outre l’examen des interruptions, il est essentiel d’étudier les périodes qui n’ont pas fait l’objet d’une annotation d’interruption. Ces périodes montreront ce qui est censé être un comportement normal et dévoileront encore plus de périodes d’interruption qui ont encore besoin d’être annotées. Dans l’exemple présenté, nous pouvons observer une poignée de pannes potentielles le 9 juin, avant que la première panne annotée ne se produise, car ces périodes présentent des baisses similaires dans plusieurs sources de données.

Prochaines étapes

Nous continuerons à affiner le système afin d’en améliorer la précision et l’expérience utilisateur pour les analystes de données professionnels et amateurs. Il s’agit notamment de

  • Incorporer des sources de données supplémentaires, notamment de l’API Pulse de l’Internet Society, pour mieux comprendre l’impact des pannes.
  • Ajout d’interfaces intuitives pour automatiser le processus d’analyse.

L’analyse des pannes d’Internet est un défi permanent mais essentiel pour comprendre les causes et améliorer la résilience de l’Internet. Notre objectif est d’améliorer notre compréhension et nos rapports sur les interruptions d’Internet et autres pannes en employant une approche holistique avec de multiples points de vue.

Les candidatures pour la bourse de recherche et de mentorat Pulse 2025 sont désormais ouvertes. En savoir plus

Mike Vandersanden est doctorant à l’Université de Hasselt et chercheur à 2024 Pulse.