Photo of a world map

Nautilus : Cartographie croisée de la dorsale Internet sous-marine

Picture of Alagappan Ramanathan
Guest Author | University of California Irvine
Catégories:
Twitter logo
LinkedIn logo
Facebook logo
April 17, 2024

Les câbles sous-marins constituent l’épine dorsale de l’internet et transportent plus de 99 % du trafic intercontinental. Cependant, cette infrastructure physique essentielle est de plus en plus vulnérable aux attaques ciblées d’acteurs malveillants et aux dommages accidentels causés par les activités humaines et les catastrophes naturelles.

Rien qu’en mars 2024, deux incidents importants ont souligné la fragilité de la connectivité mondiale : L’endommagement de trois câbles sous-marins dans la mer Rouge a perturbé 25 % du trafic de données entre l’Asie et l’Europe, tandis que l’endommagement de quatre câbles au large de la côte ouest de l’Afrique, actuellement attribué à une activité sismique sous-marine, a entraîné des pertes économiques quotidiennes s’élevant à des centaines de millions de dollars pour de nombreux pays africains.

Lire : Importantes coupures d’Internet en Afrique de l’Ouest et en Afrique australe

Avec une moyenne de plus d’une centaine de pannes de câbles sous-marins par an, l’impact de ces perturbations est encore amplifié dans les couches supérieures de l’Internet. Plusieurs systèmes autonomes (AS) partagent souvent un même câble, chacun ayant de nombreuses liaisons IP sur le câble. Par conséquent, lorsqu’un câble tombe en panne, toutes les liaisons IP reposant sur ce câble sont affectées.

Malgré l’importance cruciale des câbles sous-marins, nous avons une compréhension limitée de la manière dont leurs défaillances affectent la connectivité Internet de bout en bout. Pour faire la lumière sur l’impact de l’infrastructure des câbles sous-marins sur l’internet mondial, mes collègues et moi-même, à l’université de Californie, à Irvine, avons mis au point une solution complète en deux parties.

Dans la première partie de cette série de blogs, je vous présenterai Nautilus, un cadre de cartographie inter-couches conçu pour cartographier les liens IP et les câbles sous-marins correspondants. En donnant une image plus claire des relations entre ces couches du réseau, Nautilus jette les bases d’une analyse plus approfondie de la résistance de l’internet aux perturbations des câbles sous-marins, y compris une évaluation rapide de l’impact et des stratégies proactives en cas de défaillance des câbles.

Cartographie en couches croisées avec Nautilus

L’identification des câbles sous-marins spécifiques supportant un chemin de couche IP donné est complexe et décourageante. Nautilus relève ce défi en décomposant les chemins de la couche IP en leurs liens IP constitutifs et en cartographiant chaque lien individuellement sur la base de deux principes fondamentaux :

  • Géolocalisation: La localisation géographique des points d’extrémité des liaisons IP peut révéler des itinéraires potentiels de câbles sous-marins en fonction de la proximité des stations d’atterrissage des câbles. Ce principe repose sur l’hypothèse que les liaisons IP sont plus susceptibles d’utiliser l’infrastructure de câble sous-marin disponible la plus proche.
  • Propriété: Nautilus prend également en compte les relations de propriété et d’exploitation entre les systèmes de câbles sous-marins et les AS associés à chaque liaison IP. Une liaison IP a plus de chances d’utiliser un câble sous-marin particulier si l’AS correspondant possède ou exploite le système de câble. Ce principe tient compte des incitations économiques et stratégiques qui poussent les AS à donner la priorité à l’utilisation de leur propre infrastructure de câbles sous-marins lors de l’acheminement du trafic.

En appliquant ces principes, Nautilus génère sa cartographie transversale en quatre étapes clés.

Étape 1 : Classification des liens

Dans un premier temps, nous classons les liaisons IP en fonction de leur probabilité de traverser un câble sous-marin. Nautilus s’appuie sur la géolocalisation des points d’extrémité IP pour classer les liaisons en trois catégories : certainement sous-marines, potentiellement sous-marines et certainement terrestres.

Étape 2 : Géolocalisation (la pièce maîtresse)

La géolocalisation IP, qui révèle l’emplacement géographique des routeurs, peut être mise en corrélation avec les stations d’atterrissage des câbles sous-marins situés à proximité afin de relier les liens IP aux câbles correspondants. Cependant, les données de géolocalisation IP au niveau de la ville peuvent être imprécises. Pour atténuer ces imprécisions, Nautilus utilise une approche à plusieurs volets :

  • Utiliser plusieurs sources de géolocalisation pour augmenter la probabilité d’obtenir des résultats exacts.
  • Valider les données de géolocalisation à partir de tests de vitesse de lumière (SoL), qui déterminent le délai minimum attendu entre deux emplacements en fonction de la vitesse de la lumière dans les câbles à fibres optiques. La géolocalisation est considérée comme non valide si le délai signalé est inférieur au délai SoL.
  • Application de techniques de regroupement pour consolider les géolocalisations valides et réduire le nombre d’emplacements candidats pour chaque point d’extrémité de liaison.

Après avoir obtenu des données de géolocalisation validées et regroupées, Nautilus met en corrélation chaque combinaison de géolocalisations de points d’extrémité avec la carte des câbles sous-marins afin d’identifier les câbles potentiels pour chaque liaison IP.

La figure 1 illustre le processus par lequel Nautilus génère des jeux de câbles candidats pour une liaison IP sur la base des données de géolocalisation et de la carte des câbles sous-marins.

Animation GIF illustrant le processus par lequel Nautilus génère des jeux de câbles candidats pour une liaison IP sur la base des données de géolocalisation et de la carte des câbles sous-marins.
Figure 1 – Exemple de génération de candidats câbles Nautilus pour une liaison IP utilisant la géolocalisation.

Étape 3 : Propriété (le facteur d’affinage)

Si la géolocalisation permet d’identifier les correspondances potentielles entre les câbles, le fait de se fier uniquement à cette méthode permet souvent de trouver plusieurs candidats pour une seule liaison IP, en particulier dans les régions où la densité des câbles sous-marins est élevée. Par exemple, dans la figure 1, la liaison Taïwan-États-Unis comporte cinq câbles candidats, ce qui rend difficile la détermination du câble utilisé.

Nautilus s’appuie sur une propriété intercouche jusqu’alors inexplorée pour affiner ses prédictions : les informations relatives à la propriété qui font le lien entre la couche physique et la couche réseau. Nautilus part du principe que si une entité possède à la fois le point d’extrémité de la liaison IP et un câble proche, la liaison IP est plus susceptible d’utiliser ce câble spécifique.

Cette utilisation innovante des informations relatives à la propriété entre les différentes couches permet à Nautilus de réduire efficacement les ensembles de câbles candidats pour chaque liaison IP, même dans les régions à forte concentration de câbles sous-marins.

Étape 4 : Finalisation des choix de câbles

Nautilus utilise une approche nuancée pour affiner ses prédictions sur le câble en employant un schéma d’agrégation pondéré combinant les données de géolocalisation et de propriété plutôt que d’utiliser la propriété comme un simple filtre binaire. Ce système attribue un score de prédiction à chaque câble candidat, ce qui permet de classer et d’éliminer les correspondances de câbles les moins probables.

Le système d’agrégation pondérée équilibre soigneusement l’importance des informations relatives à la géolocalisation et à la propriété, en attribuant des pondérations appropriées à chaque facteur en fonction de leur importance relative dans la détermination de la probabilité qu’une liaison IP utilise un câble sous-marin spécifique. Cette approche permet à Nautilus de prendre des décisions plus éclairées, même dans les cas où les informations relatives à la propriété peuvent être incomplètes ou ambiguës.

La figure 2 montre comment Nautilus utilise les informations relatives à la propriété pour attribuer des notes et éliminer les câbles les moins probables dans l’exemple de la figure 1.

Animation GIF illustrant la manière dont Nautilus utilise les informations relatives à la propriété pour attribuer des scores et éliminer les câbles les moins probables.
Figure 2 – Exemple de Nautilus utilisant la propriété pour améliorer la cartographie.

Un coup d’œil sur les résultats de Nautilus

Nous avons généré une carte complète de la couche transversale sous-marine avec Nautilus en utilisant un ensemble massif de données – plus de 235 millions de traceroutes collectées par RIPE Atlas et CAIDA pendant 15 jours en mars 2022. Ces traceroutes ont permis d’obtenir 8,9 millions de liaisons IP valides (y compris IPv4 et IPv6), dont environ 1,3 million sont classées comme liaisons sous-marines par Nautilus.

La figure 3 ci-dessous illustre la répartition intercontinentale des liaisons IPv4 sous-marines.

Infographie montrant la distribution intercontinentale des liaisons IPv4 sous-marines.
Figure 3 – Distribution intercontinentale des liens IPv4. NA-EU représente environ 205 000 liens, suivi par EU-EU et AS-AS (non représentés sur la figure), qui représentent au moins 90 000 liens chacun.

Nautilus a réussi à cartographier 80 % des liens IP vers les câbles sous-marins. En moyenne, il a relié chaque lien IP à 2,04 câbles. La distribution complète est présentée dans la figure 4.

Diagramme à colonnes montrant le nombre de liens (en millions) qui voyagent à travers x nombre de câbles sous-marins définis et potentiels.
Figure 4 – Distribution du nombre de câbles prédits pour les liens appartenant à chaque catégorie.

Validation du mappage Nautilus

Pour valider la précision de la carte générée par Nautilus, nous utilisons plusieurs techniques, dont l’une consiste à analyser l’impact des défaillances des câbles sous-marins. Lorsqu’un segment de câble sous-marin tombe en panne, tous les liens IP reliés à ce segment devraient disparaître des traceroutes. Cela permet d’évaluer la précision du mappage de Nautilus en examinant la visibilité des liens mappés dans les scénarios de défaillance du câble.

Nous avons testé cette méthode de validation en utilisant la panne de quatre jours des câbles Falcon et SeaMeWe-5 au Yémen en 2022, qui a été causée par une attaque aérienne. En analysant les données traceroute collectées avant, pendant et après la panne, nous avons observé un changement significatif dans la visibilité des liens reliés à ces câbles. Environ 100 liens étaient visibles dans les traceroutes avant et après la perturbation. Cependant, seuls cinq liens reliés à ces câbles sont restés visibles pendant la panne.

Notamment, les cinq liens appartenaient à la catégorie “sous-marin potentiel”, ce qui indique que Nautilus a correctement identifié leur potentiel en tant que liens terrestres plutôt que sous-marins réels. Cette validation dans le monde réel et d’autres détaillées dans notre document démontrent l’efficacité de Nautilus en matière de cartographie.

Si vous souhaitez en savoir plus sur Nautilus, lisez notre article, qui devrait être publié à SIGMETRICS’24. La base de code et les résultats de Nautilus sont en libre accès. Restez à l’écoute de mon site web (lien ci-dessous) pour de futures mises à jour sur Nautilus.

Dans la prochaine partie de cette série de blogs, je vous présenterai Xaminer. Cet outil d’analyse de la résilience utilise une carte multicouche, telle que celle générée par Nautilus, et un modèle d’événement de défaillance pour identifier l’impact multicouche sur l’internet et extraire les modèles et les tendances de défaillance.

Alagappan Ramanathan est doctorant à l’université de Californie Irvine et boursier de recherche Pulse 2023.