- Un chercheur boursier de Pulse a mis au point un nouveau système de suivi de l’arrêt de l’internet qui récupère des données API en source ouverte provenant de plusieurs sources afin d’obtenir une meilleure résolution des mesures du trafic internet, y compris lors d’anomalies.
- Les essais montrent que chaque système de mesure fournit des résultats variables, mais collectivement, ils peuvent aider à interpréter la cause des anomalies.
- D’autres sources de données et une interface intuitive pour automatiser le processus d’analyse sont en cours d’élaboration.
Il est difficile de mesurer l’internet. Chaque mesure est hautement subjective, en fonction des données auxquelles vous avez accès et de la manière dont vous les interprétez. Une façon de surmonter ces difficultés consiste à rassembler des données provenant de sources multiples afin d’obtenir une compréhension globale de la connectivité de l’internet lorsqu’il y a ou non un événement important.
En tant que boursier de 2024 Pulse Research, j’ai utilisé cette approche pour extraire des corrélations significatives sur les fermetures d’Internet.
Inscrivez-vous au webinaire 2024 Pulse Research Review le 11 juin à partir de 15:00 UTC
Le regroupement de plusieurs sources de données permet d’obtenir une meilleure résolution
Le système holistique que j’ai mis au point permet aux utilisateurs de récupérer des données à partir de plusieurs sources de données fiables qui surveillent l’internet, notamment :
- Cloudflare Radar, qui surveille le trafic web sur son réseau de diffusion de contenu (CDN), fournissant des données telles que la qualité de l’internet et la saturation du CDN ;
- Détection et analyse des pannes d’Internet(IODA), qui évalue la connectivité Internet au niveau d’un pays et d’un réseau grâce à diverses techniques de mesure actives et passives ;
- Le rapport de transparence de Google, qui affiche le trafic vers les services de Google pour chaque pays ; et
- Open Observatory of Network Interference (OONI), qui fournit des mesures générées par les utilisateurs sur la connectivité des services web.
Le système vous permet de superposer les données de ces sources pour une période donnée afin de comparer chaque point de vue.
Lorsque l’on étudie les perturbations délibérées connues de l’internet, il est évident que toutes les sources de données ne montrent pas une diminution de la qualité lorsqu’une panne se produit. Par exemple, la figure 1 montre des données de connectivité pour l’Algérie provenant de l’IODA et de Google du 9 au 13 juin 2024. Les sections en surbrillance sont des annotations de Cloudflare Radar sur les perturbations signalées par le gouvernement, dont le calendrier correspond aux ordres précédents du gouvernement de restreindre la connectivité Internet dans le pays pendant les examens du baccalauréat. Vous pouvez consulter ces événements sur le site Pulse Internet Shutdown Tracker.
La figure 2 est un autre exemple de la manière dont les utilisateurs peuvent rassembler et annoter les données de l’OONI et du CitizenLab. Elle regroupe les services Internet par catégorie afin de montrer quelles catégories présentent le plus d’anomalies, en l’occurrence les médias d’information et les réseaux sociaux.
Sur la base de ces graphiques, nous pouvons constater ce qui suit :
- Temps et durée d’interruption prévisibles – Lesinterruptions apparaissent selon un modèle autour des moments d’examen, où la perturbation est censée contrer la tricherie potentielle. Nous pouvons le constater dans la chronologie, où les interruptions sont annotées, ainsi qu’à travers les données brutes et en utilisant la détection des anomalies.
- Pas de coupure totale – Lesdonnées brutes montrent qu’en général, si l’internet est perturbé, ce n’est que partiellement.
- Catégories similaires de sites touchés par la panne – Enexaminant les sites spécifiques perturbés ou présentant des anomalies, nous pouvons observer que toutes les périodes d’examen montrent que des types similaires de sites web sont touchés. La raison des différentes pannes étant la même, on peut s’attendre à ce que les mêmes informations soient touchées.
- Différentes méthodes de perturbation – Lespannes apparaissent dans diverses sources de données pour chaque région, ce qui laisse supposer que différentes méthodes sont utilisées pour perturber l’internet.
Outre l’examen des interruptions, il est essentiel d’étudier les périodes qui n’ont pas fait l’objet d’une annotation d’interruption. Ces périodes montreront ce qui est censé être un comportement normal et dévoileront encore plus de périodes d’interruption qui ont encore besoin d’être annotées. Dans l’exemple présenté, nous pouvons observer une poignée de pannes potentielles le 9 juin, avant que la première panne annotée ne se produise, car ces périodes présentent des baisses similaires dans plusieurs sources de données.
Prochaines étapes
Nous continuerons à affiner le système afin d’en améliorer la précision et l’expérience utilisateur pour les analystes de données professionnels et amateurs. Il s’agit notamment de
- Incorporer des sources de données supplémentaires, notamment de l’API Pulse de l’Internet Society, pour mieux comprendre l’impact des pannes.
- Ajout d’interfaces intuitives pour automatiser le processus d’analyse.
L’analyse des pannes d’Internet est un défi permanent mais essentiel pour comprendre les causes et améliorer la résilience de l’Internet. Notre objectif est d’améliorer notre compréhension et nos rapports sur les interruptions d’Internet et autres pannes en employant une approche holistique avec de multiples points de vue.
Les candidatures pour la bourse de recherche et de mentorat Pulse 2025 sont désormais ouvertes. En savoir plus
Mike Vandersanden est doctorant à l’Université de Hasselt et chercheur à 2024 Pulse.
Les opinions exprimées par les auteurs de ce blog sont les leurs et ne reflètent pas nécessairement celles de l’Internet Society.