Caractérisation de la centralisation et de la régionalisation de l'Internet
En bref
- Un nouvel ensemble de paramètres normalisés peut aider à mesurer la centralisation et la régionalisation de l'internet.
- Les facteurs géopolitiques, historiques et linguistiques déterminent également les entreprises et les pays sur lesquels on s'appuie pour l'infrastructure web.
- La communauté des chercheurs devrait envisager d'utiliser, d'adapter et de développer ces mesures pour étudier la dépendance dans d'autres facettes du web.
La centralisation de l'internet est devenue un sujet de débat de plus en plus actif. Comprendre qui contrôle l'internet a des implications majeures pour la vie privée, l'innovation et la résilience.
Bien que ce sujet ait fait l'objet de nombreuses discussions, il est nécessaire de disposer d'une mesure consolidée pour saisir la répartition de la dépendance entre les organisations, ce qui faciliterait une analyse approfondie. En outre, nous mettons l'accent sur la notion de régionalisation - la dépendance géopolitique à l'égard d'Internet - qui avait été négligée dans la discussion sur la centralisation.
Dans ce billet, nous présentons les mesures que nous avons récemment présentées à SIGCOMM 2025, qui nous permettent de dresser un tableau complet de la dépendance à l'égard du web. Nous discutons également de certains de nos résultats et expliquons pourquoi ils sont importants pour orienter les discussions sur l'Internet.
Centralisation ou régionalisation
Dans notre document, nous introduisons les mesures suivantes pour définir la centralisation et la régionalisation :
| Centralization | We introduce a hypothetical ‘decentralized’ scenario where every website accessed in a country has a unique provider. Centralization is thus calculated by comparing how different the distribution of provider usage is from the fully decentralized case. We use Wasserstein distance — also commonly known as Earth Mover’s Distance (EMD) — to measure centralization. |
| Regionalization | Usage |
| Endemicity | The concentration of usage in certain countries, or how specific the usage of a provider is. |
| Insularity | The fraction of websites for which that layer is served by a provider based in the same country. |
Nous proposons que la communauté des chercheurs utilise, adapte et développe ces mesures pour étudier la dépendance dans d'autres facettes du web.
Centralisation
Conformément aux travaux antérieurs, nous constatons qu'un grand nombre de sites web sont hébergés par une petite fraction de fournisseurs. Lorsque nous appliquons l'EMD pour mesurer le degré de centralisation, nous constatons que dans le cas le plus centralisé, 60 % des sites web en Thaïlande sont desservis par un seul fournisseur, Cloudflare (figure 1).
Figure 1 - Cloudflare est le fournisseur le plus populaire dans tous les pays, à l'exception du Japon. Alors que les pays les plus centralisés s'appuient ouvertement sur Cloudflare, les pays les moins centralisés ont tendance à s'appuyer sur une série de fournisseurs régionaux (représentés par les barres rouges).
Alors que la centralisation d'un pays est fortement corrélée à l'utilisation de deux fournisseurs mondialement populaires (Cloudflare et Amazon), nous trouvons également des exemples de fournisseurs régionaux (c.-à-d. des fournisseurs endémiques à une région) qui contribuent de manière significative à la centralisation. Par exemple, 22 % des sites web en Bulgarie et en Lituanie sont hébergés par SuperHosting.BG et UAB, respectivement, bien qu'aucune de ces organisations n'ait une présence mondiale, ce qui explique leur absence dans les travaux antérieurs.
Notre travail souligne que les prestataires régionaux sont un élément essentiel dans le débat sur la centralisation.
Nous constatons en outre que les certificats de sites web sont fortement centralisés - sept autorités de certification (AC), dont la plupart sont basées aux États-Unis, représentent 98 % des sites web. La centralisation sur un petit nombre d'autorités de certification n'est pas intrinsèquement mauvaise pour la sécurité de l'internet, car de nombreuses petites autorités de certification se débattent avec les exigences opérationnelles, et un degré modéré de centralisation réduit la surface d'attaque de la WebPKI. Quoi qu'il en soit, une conséquence évidente est que la grande majorité des pays dépendent de l'infrastructure américaine.
Régionalisation
La centralisation à elle seule ne permet pas de dresser un tableau complet de la dépendance. En prenant du recul par rapport aux fournisseurs spécifiques, nous constatons que des tendances se dégagent entre les pays.
Des facteurs géopolitiques, historiques et linguistiques ont déterminé les pays sur lesquels on compte pour l'infrastructure web. En effet, alors que nous observons une dépendance significative à l'égard de l'infrastructure américaine dans l'ensemble des pays (en raison de la présence de grands fournisseurs mondiaux dans cette région), nous notons que cette dépendance a diminué en Russie à la suite de l'invasion de l'Ukraine par les Russes en 2022.
D'autres modèles régionaux apparaissent également lorsque nous examinons les contextes historiques. Par exemple, de nombreux États post-soviétiques (à l'exception de l'Ukraine) dépendent encore de fournisseurs russes, et l'histoire de la colonisation peut expliquer la dépendance actuelle des pays africains à l'égard des fournisseurs français.
Le partage des langues peut également expliquer pourquoi les habitants d'un pays donné accèdent couramment à des sites web hébergés dans un autre pays. C'est peut-être la raison pour laquelle nous constatons une utilisation importante des fournisseurs iraniens en Afghanistan et des fournisseurs allemands en Autriche.
Une meilleure compréhension permet une meilleure conception
Les dynamiques géopolitiques que nous observons nous éclairent sur la manière dont nous pouvons mieux concevoir et évaluer les réseaux à l'échelle mondiale. Par exemple, si les principaux fournisseurs déploient de nouveaux protocoles et optimisations pour améliorer l'expérience des utilisateurs, ces avantages ne sont pas forcément ressentis de manière uniforme. Dans de nombreux pays, ces déploiements n'affectent qu'une petite partie des sites fréquentés par les utilisateurs. En outre, les chercheurs qui étudient la résilience des sites web gagneraient à comprendre comment la disponibilité et les performances peuvent être affectées non seulement par une panne de fournisseur, mais aussi par un schisme géopolitique entre deux pays.
Vous pouvez lire l'intégralité de notre article pour en savoir plus sur notre méthodologie de collecte et de classification des données, ainsi que sur d'autres aspects, tels que la centralisation des domaines de premier niveau.
Rumaisa Habib est en troisième année de doctorat à l'université de Stanford et travaille sous la direction de Zakir Durumeric au sein du groupe de recherche sur la sécurité empirique.
Les opinions exprimées par les auteurs de ce blog sont les leurs et ne reflètent pas nécessairement celles de l'Internet Society.
