La panne d’Internet en Italie, une tempête parfaite

Picture of Massimiliano Stucchi
Regional Technical Advisor - Europe, Internet Society
Catégories:
Twitter logo
LinkedIn logo
Facebook logo
February 8, 2023

Le dimanche 5 février, le plus grand fournisseur d’accès à Internet (FAI) d’Italie, TIM (anciennement Telecom Italia), a subi une panne de réseau majeure qui a affecté plus d’un utilisateur d’Internet italien sur trois pendant près de cinq heures.

Maintenant que la poussière est retombée, examinons ce qui s’est passé exactement et, ce faisant, discutons de l’importance pour les pays de disposer d’une redondance appropriée et de s’associer avec des partenaires locaux afin que des pannes de cette ampleur ne se reproduisent pas.

Pourquoi un internaute sur trois en Italie a-t-il perdu sa connectivité internet ?

Comme le montre la liste des réseaux dépendants de l’IIJ (figure 1), trois des huit plus grands réseaux italiens (sur la base du nombre d’utilisateurs) sont gérés par le groupe Telecom Italia – AS6762 SEABONE-NET (Sparkle), AS3269 ASM-IBSNAZ (le réseau national de téléphonie fixe) et AS16232 ASN-TIM (le réseau de téléphonie mobile de TIM).

Figure 1 – Liste de dépendance du réseau de l’IIJ montrant le pourcentage de la population italienne couverte par les principaux fournisseurs d’accès à Internet.

Sparkle est un opérateur international qui sert de fournisseur de transit pour de nombreux réseaux en Italie, mais qui ne dessert pas directement les utilisateurs finaux. Elle fonctionne comme une entité distincte, mais est entièrement détenue par Telecom Italia. Le réseau de lignes fixes de TIM (AS3269) dessert directement 20,8% de la population. Et parce qu’il est utilisé comme réseau de transport, il dessert indirectement environ 8,5 % de la population du pays. Si l’on ajoute les 8,4 % de la population desservis par son réseau mobile (AS16232), on atteint environ 38 % des habitants de l’Italie. Cela signifie que la panne de dimanche a touché plus d’un tiers du pays.

Le groupe des opérateurs de réseaux italiens(ITNOG) gère un groupe Telegram qui a été très actif pendant la panne, de nombreux participants essayant de comprendre ce qui se passait et les représentants de Sparkle fournissant des mises à jour sur la manière dont ils résolvaient le problème.

À l’heure où nous écrivons ces lignes, nous ne disposons pas d’une description détaillée de ce qui s’est passé :

  • Le problème concernait la connectivité internationale, que TIM achète à Sparkle.
  • Le problème a également affecté les résolveurs DNS sur le réseau de TIM, et apparemment certains de ses serveurs PPPoE.
  • La connectivité entre certains endroits du pays a également été interrompue à peu près au même moment.
  • Bien que cette panne ait touché différents réseaux et n’ait été signalée que par une poignée de personnes, il est important de la signaler, car certains câbles défectueux ont pu déclencher des problèmes sur des routeurs ou d’autres équipements de réseau.

Dans l’attente d’un post-mortem de la part de TIM et de Sparkle, nous pouvons supposer que ces problèmes auraient pu être évités si TIM disposait d’une plus grande redondance et d’une plus grande interconnexion.

L’importance de la redondance

Si vous êtes un opérateur de réseau, la gestion des défaillances doit être une priorité, de même que la conception de votre réseau de manière à éviter tout point de défaillance unique. TIM ne doit pas être considéré comme un bon exemple, car il s’appuie uniquement sur Sparkle pour la connectivité internationale, comme on peut le voir sur le Hurricane Electric BGP Toolkit (figure 2).

Figure 2 – Diagramme de routage montrant que tout le trafic de l’AS3269 à destination et en dehors de l’Italie passe par l’AS6762.

Il est courant que les opérateurs soient multihommes, c’est-à-dire qu’ils aient plus d’un autre opérateur comme fournisseur en amont, assurant ce que l’on appelle le “transit” vers le reste de l’internet.

Par exemple, la figure 3 ci-dessous montre comment Vodafone (AS30722), un concurrent de TIM en Italie, a cinq fournisseurs en amont – AS3356 (Lumen, anciennement Centurilink et Level3), AS1299 (Arelion), AS1273 (Vodafone Global Network), AS5396 (IRIDEOS Spa), AS6939 (Hurricane Electric) et AS1299 (Twelve99). Cette configuration offre une grande redondance en cas de panne de l’un de ces réseaux en amont.

Figure 3 – Diagramme de routage montrant que l’ensemble du trafic de l’AS30722 à destination et en dehors de l’Italie passe par cinq systèmes autonomes (AS) distincts.

Pourquoi le peering avec d’autres réseaux locaux est-il important ?

Avant 2013, TIM, en tant qu’opérateur historique de télécommunications en Italie, était contraint par la loi d’entrer en concurrence avec tous les opérateurs italiens. Cela signifie que sa matrice d’échange de trafic est vraiment complexe mais très diversifiée. Cependant, depuis 2013, les lois ont changé et presque toutes les relations de peering de TIM ont été interrompues. Pour en savoir plus, consultez la présentation de Marco d’Itri au Salottino MIX 2014 et celle de Luca Cicchelli (TOP-IX) et Mauro Magrassi (MIX) au European Peering Forum 2013.

Cela signifie que, dans de nombreux cas, si les utilisateurs locaux de l’internet veulent atteindre des utilisateurs sur l’un des réseaux de TIM, le trafic doit transiter par Francfort, en Allemagne, où il entre dans le réseau Sparkle (le seul fournisseur en amont de TIM), avant d’être acheminé vers TIM à Milan. Cela augmente la latence et le coût de la connexion avec les réseaux de TIM et pourrait être évité si TIM effectuait un peering local via l’un des nombreux points d’échange Internet (IXP) en Italie.

Découvrez comment les IXP rendent l’internet plus rapide et plus abordable.

C’est une situation que le TIM a choisie : elle ne repose sur aucune base technique. Il s’agit plutôt d’une position politique. Le peering avec la plupart des réseaux sur les deux points de peering où il a un port actif – NAMEX à Rome et MIX à Milan – ne nécessiterait qu’un effort minime.

En 2020 et 2021, TIM a temporairement mis en place des sessions d’échange de trafic avec tout réseau qui en faisait la demande afin d'”absorber” le trafic des personnes travaillant à domicile pendant les périodes de fermeture. TIM avait également mis en place un accord de peering avec TOP-IX, mais tout cela a été interrompu à la fin de l’année 2021.

Cette panne n’aurait pas pu mieux montrer l’importance des IXP et du contenu local. Il s’agit d’un domaine de travail sur lequel l’Internet Society s’est concentrée. Nous travaillons à la promotion des IXP et de l’interconnexion, et nous nous efforçons d’aider les pays à maintenir le trafic local grâce à notre vision 50/50, un plan ambitieux visant à maintenir au moins la moitié du trafic Internet local dans les économies émergentes d’ici à 2025..