- Les pages jaunes de l’internet (IYP) intègrent plus de 50 ensembles de données de mesure pour aider les utilisateurs à analyser les topologies de l’internet.
- Le fait de disposer de tous ces ensembles de données en un seul endroit est pratique pour mener des études à grande échelle sur l’ampleur de l’utilisation des meilleures pratiques actuelles telles que la sécurité de l’acheminement.
- L’AIP est un projet à source ouverte.
Pour comprendre les performances de l’internet, il faut savoir rassembler et analyser des données provenant de sources multiples. Pulse est un projet qui y contribue en fournissant une vue d’ensemble de l’accessibilité, de l’évolution et de la résilience de l’internet. Pour ceux qui souhaitent aller plus loin, nous vous présentons les Pages jaunes de l’internet (IYP).
En bref, l’AIP intègre plus de 50 ensembles de données afin de fournir une base de données unifiée pour étudier l’internet.
La figure 1 présente un extrait de l’AIP montrant comment le site web isoc.org (nœud vert à gauche) est accessible via quatre adresses IP (nœuds roses) faisant partie de deux préfixes (nœuds bleus). Tous deux proviennent de l’AS13335 (nœud rouge), le réseau de diffusion de contenu (CDN) Cloudflare (nœud orange). En outre, les préfixes sont classés comme suit : Internet Routing Registry (IRR) Valid, Resource Public Key Infrastructure (RPKI) Valid et RPKI pour indiquer la résilience de chaque chemin en matière de sécurité du routage.

Cet exemple combine des données provenant de six organisations : OpenINTEL pour la résolution du système de noms de domaine (DNS) ; BGP.Tools pour la balise ‘Anycast’ ; Internet Health Report (IHR) pour l’état IRR et RPKI ; BGPKIT pour les données du protocole de passerelle frontalière (BGP) ; RIPE NCC pour les données RPKI ; et PeeringDB pour le nom de l’AS.
En savoir plus sur le travail de l’Internet Society pour sécuriser le routage mondial
Vous pouvez reproduire ce graphique en utilisant la requête suivante :
MATCH p0 = (:HostName {name:'isoc.org'})-[:RESOLVES_TO]-(:IP)-[:PART_OF]-(pfx:Prefix)-[:ORIGINATE]-(orig:AS)-[:NAME {reference_org:'PeeringDB'}]-(:Name)
OPTIONAL MATCH p1 = (pfx)-[:CATEGORIZED]-(:Tag)
OPTIONAL MATCH p2 = (orig)-[:CATEGORIZED]-(:Tag {label:'Content Delivery Network'})
RETURN p0, p1, p2
Le fait de disposer de tous ces ensembles de données en un seul endroit est également pratique pour mener des études à grande échelle. Par exemple, au lieu d’examiner un seul nom d’hôte, nous pouvons étendre l’exemple précédent en examinant les 1 millions de noms d’hôtes les plus populaires de Tranco et en comptant combien d’entre eux correspondent à des préfixes enregistrés dans RPKI.
Attention : 80 % des 1 million de noms d’hôtes les plus populaires sont couverts par la RPKI grâce aux CDN qui respectent les meilleures pratiques de routage.(En savoir plus)
L’avantage d’obtenir ces résultats avec l’AIP est qu’ils peuvent être facilement partagés et reproduits. Par exemple, vous pouvez exécuter la requête ci-dessus ou reproduire le résultat RPKI mentionné ci-dessus en exécutant les requêtes partagées dans ce carnet. Ainsi, toute personne disposant de requêtes peut produire les résultats et les mettre à jour en utilisant les données fraîches de l’AIPA. Nous illustrons également cela dans un blog APNIC où nous analysons la topologie de l’Internet au Japon et partageons la requête pour chaque résultat.
Démarrer avec l’AIP
La manière la plus simple de parcourir la base de données de l’AIP est de visiter le site web du RSI. Vous pouvez rechercher une ressource Internet (par exemple, AS, préfixe, nom de domaine) et obtenir les données de l’AIPJ relatives à cette ressource.
La figure 2 illustre la vue “routage” du réseau Internet Initiative Japan (par exemple, les AS connectés et les préfixes annoncés). Toutes les autres vues (à l’exception de la vue “surveillance”) fournissent des données de l’AIPJ par le biais de différents widgets.

Vous trouverez les onglets suivants pour chaque widget :
- L’onglet Graphique présente une représentation visuelle des données.
- L’onglet Données présente les données brutes sous forme de tableau que vous pouvez télécharger pour une analyse plus approfondie.
- L’onglet Cypher Query vous donne la requête exacte que nous avons utilisée pour extraire les données de l’AIP. Vous pouvez la réutiliser pour interroger directement la base de données de l’AIPA ou créer vos propres requêtes.
- L’onglet Métadonnées fournit des liens vers les ensembles de données originaux et la fraîcheur des données.
L’interrogation directe de l’AIP permet aux utilisateurs d’aller au-delà de la simple recherche. La courbe d’apprentissage est cependant assez raide. Nous recommandons aux lecteurs intéressés d’apprendre d’abord les bases du langage Cypher, puis la documentation de l’AIPJ et les exemples fournis dans la galerie de l’AIPJ. Enfin, pour tirer le meilleur parti de l’AIPA, vous pouvez télécharger et exécuter la base de données localement, ce qui constitue un bon moyen d’intégrer et d’analyser vos propres données dans l’AIPA.
Pour plus de détails sur ce travail, consultez notre article de recherche publié dans les actes de l’ACM IMC’24. Vous pouvez également nous contacter sur GitHub. L’AIP est un projet open-source ; vos commentaires et contributions sont les bienvenus !
Romain Fontugne est directeur adjoint du laboratoire de recherche de l’IIJ au Japon. Il se consacre aux mesures de l’Internet, à l’analyse du trafic et à la sécurité des réseaux.
Photo par Katie, Via Flickr