Photo of braided network cables

Cartographier qui dirige vraiment l’Internet : Présentation de “Borges”

Picture of Esteban Carisimo
Guest Author | Northwestern University
Catégories:
Twitter logo
LinkedIn logo
Facebook logo
November 19, 2025
En bref
  • Borges est un nouveau framework open-source qui fournit des cartes de propriété de réseau en temps réel.
  • Le cadre offre une résolution et une vitesse supérieures à celles des cadres précédents, ce qui est essentiel pour maintenir l’exactitude des données dans un contexte de volume élevé de transferts et d’acquisitions.
  • Comprendre qui exploite les réseaux sous-jacents de l’internet permet aux décideurs et aux chercheurs de mieux évaluer la résilience, la concentration, les politiques et la transparence de l’internet.

De nombreuses mesures, débats politiques et rapports d’incidents traitent les réseaux (connus sous le nom de systèmes autonomes ou AS) comme des acteurs indépendants. Dans la pratique, cependant, plusieurs AS appartiennent souvent au même groupe d’entreprises, ce qui influe sur notre conception de la concurrence, de la résilience et de la responsabilité. La saisie de ces relations révèle des interdépendances cachées, depuis le partage de la capacité de transmission et de câbles sous-marins jusqu’à l’approvisionnement conjoint.

Par exemple, Edgio – issu de la fusion de Limelight et Edgecast – a déposé le bilan et vendu ses actifs, pour finalement fermer son réseau de diffusion de contenu (CDN) en janvier 2025. En l’espace de trois ans, un opérateur autrefois prédominant a disparu, ce qui illustre la rapidité avec laquelle les relations entre les entreprises peuvent évoluer.

Une nouvelle étude de la Northwestern University et de ses collaborateurs offre une vision plus claire de ceux qui exploitent réellement l’internet, en associant les AS sous-jacents de l’internet aux organisations mères qui les contrôlent dans le monde réel.

Le système de l’équipe, Borges, combine les données du registre WHOIS, les enregistrements de PeeringDB, les signaux des sites web et les grands modèles de langage (LLM) pour découvrir des réseaux apparentés que les méthodes traditionnelles laissent souvent de côté. Borges fonctionne en continu à faible coût (environ 3 dollars par clic), ce qui constitue un moyen peu onéreux de tenir la carte à jour.

Comment Borges travaille-t-il ?

Borges (Better ORGanizations Entities mappingS) améliore AS→Organization mapping en utilisant trois indices complémentaires :

  • Identifiants WHOIS et PeeringDB qui relient les AS aux organisations enregistrées.
  • Extraction basée sur LLM qui permet de trouver des numéros AS (ASN) de frères et sœurs et des réseaux connexes à partir de textes non structurés (par exemple, les champs “notes” ou “aka”).
  • Analyse de sites web qui relie les marques et les filiales par le biais de redirections, de similitudes de domaines et de favicons.

Borges fait preuve d’une grande précision dans toutes ses étapes d’apprentissage (0,947 pour l’extraction d’ASN frères, 0,986 pour la détection de domaines ou de favicons partagés). En ce qui concerne le nouveau facteur d’organisation (θ), qui quantifie le nombre de réseaux indépendants dispersés qui sont regroupés avec précision sous une seule société mère, Borges obtient un score de 0,3576, ce qui lui permet de surpasser les systèmes antérieurs tels que AS2Org (de 7 %) et as2org+ (de 3,3 %), et d’obtenir un regroupement plus réaliste des réseaux sous la responsabilité de leurs sociétés mères. Le regroupement de réseaux précédemment dispersés augmente la base d’utilisateurs reconnus d’environ 192 millions de personnes (~5% de l’Internet mondial) et élargit les empreintes nationales de plusieurs fournisseurs.

Exemples pratiques

  • Sprint ↔ Cogent : Les champs de métadonnées de Sprint renvoient à cogentco.com, ce qui reflète l’acquisition par Cogent de la dorsale de Sprint.
  • Limelight (AS22822) & Edgecast (AS15133) → Edgio : Les deux se résolvent en edg.io, capturant le chemin de la fusion et du changement de marque.
  • Clearwire → Sprint → T-Mobile : les redirections historiques (clearwire.com → sprint.com → t-mobile.com) retracent la chaîne d’acquisition complète.
  • L’image de marque par le biais des favicons : Les filiales réutilisent souvent des favicons identiques ou presque identiques même si les domaines diffèrent légèrement, par exemple Digicel et Claro, révélant ainsi une structure d’entreprise commune par le biais d’une marque visuelle.

Des rediffusions régulières et peu coûteuses permettent à Borges de rester en phase avec l’évolution du paysage des entreprises sur Internet.

Une meilleure compréhension = de meilleures décisions

Borges est conçu pour suivre cette évolution : il est léger à exécuter, facile à programmer et peu coûteux à répéter, de sorte que la carte AS-organisation reste à jour au fur et à mesure de l’évolution du paysage de la propriété sur Internet. Cette plus grande fidélité des données nous permet de mieux comprendre :

  • Résilience et concentration. La consolidation de la propriété peut être une source de force ou créer des points d’échec uniques. De meilleures cartes permettent d’affiner l’évaluation des risques et les stratégies de diversification, en particulier lorsque le contrôle de l’entreprise change.
  • Réponse aux incidents. En cas de panne, de détournement ou d’interférence, le fait de connaître la famille réelle de l’opérateur accélère l’analyse des causes profondes et la responsabilisation, à condition que les correspondances soient mises à jour au fur et à mesure que les organisations changent.
  • Politique et transparence. Les décideurs politiques et les défenseurs des droits de l’homme bénéficient d’une vision plus claire du pouvoir du marché, des fusions et des dépendances transfrontalières qui façonnent l’expérience de l’utilisateur – mise à jour aussi fréquemment que l’exige le paysage.

Pour plus d’informations, veuillez vous référer à notre article “Learning AS-to-Organization Mappings with Borges”.Apprendre les correspondances AS-organisation avec Borgesque nous avons présenté à l’IMC ’25. Notre code et nos messages-guides sont également libres, ce qui garantit une reproductibilité totale (exécution en un seul clic, environ 3 dollars américains).

Esteban Carisimo est chercheur postdoctoral à AquaLab au sein du Département d’informatique à l’Université l’Université du Nord-Ouest.

Les opinions exprimées par les auteurs de ce blog sont les leurs et ne reflètent pas nécessairement celles de l’Internet Society.


Image par Philip Neumann de Pixabay

Contenus traduits

Les versions française et espagnole du contenu disponible sur le site Pulse de l’Internet Society peuvent provenir de services de traduction automatique et peuvent donc ne pas refléter avec exactitude le texte d’origine.

A noter que la version officielle est le texte en anglais.