- Un nouvel ensemble de paramètres normalisés peut aider à mesurer la centralisation et la régionalisation de l’internet.
- Les facteurs géopolitiques, historiques et linguistiques déterminent également les entreprises et les pays sur lesquels on s’appuie pour l’infrastructure web.
- La communauté des chercheurs devrait envisager d’utiliser, d’adapter et de développer ces mesures pour étudier la dépendance dans d’autres facettes du web.
La centralisation de l’internet est devenue un sujet de débat de plus en plus actif. Comprendre qui contrôle l’internet a des implications majeures pour la vie privée, l’innovation et la résilience.
Bien que ce sujet ait fait l’objet de nombreuses discussions, il est nécessaire de disposer d’une mesure consolidée pour saisir la répartition de la dépendance entre les organisations, ce qui faciliterait une analyse approfondie. En outre, nous mettons l’accent sur la notion de régionalisation – la dépendance géopolitique à l’égard d’Internet – qui a été négligée dans le débat sur la centralisation.
Dans ce billet, nous présentons les mesures que nous avons récemment présentées à SIGCOMM 2025, qui nous permettent de dresser un tableau complet de la dépendance à l’égard du web. Nous discutons également de certains de nos résultats et expliquons pourquoi ils sont importants pour orienter les discussions sur l’Internet.
Centralisation ou régionalisation
Dans notre document, nous introduisons les mesures suivantes pour définir la centralisation et la régionalisation :
| Centralisation | Nous introduisons un scénario hypothétique “décentralisé” dans lequel chaque site web consulté dans un pays a un fournisseur unique. La centralisation est donc calculée en comparant la différence entre la distribution de l’utilisation des fournisseurs et le cas totalement décentralisé. Nous utilisons la distance de Wasserstein – également connue sous le nom d’Earth Mover’s Distance (EMD) – pour mesurer la centralisation. | |
| Régionalisation | Utilisation | L’envergure d’un fournisseur, c’est-à-dire le nombre de sites web qu’il prend en charge. |
| Endémicité | La concentration de l’utilisation dans certains pays ou la spécificité de l’utilisation d’un fournisseur. | |
| Insularité | La fraction de sites web pour lesquels cette couche est desservie par un fournisseur basé dans le même pays. | |
Nous proposons que la communauté des chercheurs utilise, adapte et développe ces mesures pour étudier la dépendance dans d’autres facettes du web.
Centralisation
Conformément aux travaux antérieurs, nous constatons qu’un grand nombre de sites web sont hébergés par une petite fraction de fournisseurs. Lorsque nous appliquons l’EMD pour mesurer le degré de centralisation, nous constatons que dans le cas le plus centralisé, 60 % des sites web en Thaïlande sont desservis par un seul fournisseur, Cloudflare (figure 1).
Figure 1 – Cloudflare est le fournisseur le plus populaire dans tous les pays, à l’exception du Japon. Alors que les pays les plus centralisés s’appuient ouvertement sur Cloudflare, les pays les moins centralisés ont tendance à s’appuyer sur une série de fournisseurs régionaux (représentés par les barres rouges).
Alors que la centralisation d’un pays est fortement corrélée à l’utilisation de deux fournisseurs mondialement populaires (Cloudflare et Amazon), nous trouvons également des exemples de fournisseurs régionaux (c.-à-d. des fournisseurs endémiques à une région) qui contribuent de manière significative à la centralisation. Par exemple, 22 % des sites web en Bulgarie et en Lituanie sont hébergés par SuperHosting.BG et UAB, respectivement, bien qu’aucune de ces organisations n’ait une présence mondiale, ce qui explique leur absence dans les travaux antérieurs.
Notre travail souligne que les prestataires régionaux sont un élément essentiel dans le débat sur la centralisation.
Nous constatons en outre que les certificats de sites web sont fortement centralisés – sept autorités de certification (AC), dont la plupart sont basées aux États-Unis, représentent 98 % des sites web. La centralisation sur un petit nombre d’autorités de certification n’est pas intrinsèquement mauvaise pour la sécurité de l’internet, car de nombreuses petites autorités de certification se débattent avec les exigences opérationnelles, et un degré modéré de centralisation réduit la surface d’attaque de la WebPKI. Quoi qu’il en soit, une conséquence évidente est que la grande majorité des pays dépendent de l’infrastructure américaine.
Régionalisation
La centralisation à elle seule ne permet pas de dresser un tableau complet de la dépendance. En prenant du recul par rapport aux fournisseurs spécifiques, nous constatons que des tendances se dégagent entre les pays.
Des facteurs géopolitiques, historiques et linguistiques ont déterminé les pays sur lesquels on compte pour l’infrastructure web. En effet, alors que nous observons une dépendance significative à l’égard de l’infrastructure américaine dans l’ensemble des pays (en raison de la présence de grands fournisseurs mondiaux dans cette région), nous notons que cette dépendance a diminué en Russie à la suite de l’invasion de l’Ukraine par les Russes en 2022.
D’autres modèles régionaux apparaissent également lorsque nous examinons les contextes historiques. Par exemple, de nombreux États post-soviétiques (à l’exception de l’Ukraine) dépendent encore de fournisseurs russes, et l’histoire de la colonisation peut expliquer la dépendance actuelle des pays africains à l’égard des fournisseurs français.
Le partage des langues peut également expliquer pourquoi les habitants d’un pays donné accèdent couramment à des sites web hébergés dans un autre pays. C’est peut-être la raison pour laquelle nous constatons une utilisation importante des fournisseurs iraniens en Afghanistan et des fournisseurs allemands en Autriche.
Une meilleure compréhension permet une meilleure conception
Les dynamiques géopolitiques que nous observons nous éclairent sur la manière dont nous pouvons mieux concevoir et évaluer les réseaux à l’échelle mondiale. Par exemple, si les principaux fournisseurs déploient de nouveaux protocoles et optimisations pour améliorer l’expérience des utilisateurs, ces avantages ne sont pas forcément ressentis de manière uniforme. Dans de nombreux pays, ces déploiements n’affectent qu’une petite partie des sites fréquentés par les utilisateurs. En outre, les chercheurs qui étudient la résilience des sites web gagneraient à comprendre comment la disponibilité et les performances peuvent être affectées non seulement par une panne de fournisseur, mais aussi par un schisme géopolitique entre deux pays.
Vous pouvez lire l’intégralité de notre article pour en savoir plus sur notre méthodologie de collecte et de classification des données, ainsi que sur d’autres aspects, tels que la centralisation des domaines de premier niveau.
Rumaisa Habib est en troisième année de doctorat à l’université de Stanford et travaille sous la direction de Zakir Durumeric au sein de l’Empirical Security Research Group. Groupe de recherche sur la sécurité empirique.
Les opinions exprimées par les auteurs de ce blog sont les leurs et ne reflètent pas nécessairement celles de l’Internet Society.


