Abstract banner image with the letters IPFS

Les défis de la mesure des réseaux décentralisés : Le cas du système de fichiers interplanétaire

Picture of Yiannis Psaras
Research Scientist, ProbeLab — Guest Author
Catégories:
Twitter logo
LinkedIn logo
Facebook logo
June 6, 2023

Le web décentralisé, également connu sous le nom de web 3.0, est une approche innovante du web traditionnel que nous utilisons actuellement. Il offre aux utilisateurs plus de résilience, de sécurité et de contrôle sur l’endroit où leurs données sont stockées. Toutefois, en raison de sa structure décentralisée et pair-à-pair (P2P), le Web 3.0 rend difficile la mesure et le suivi de ses performances.

Dans ce billet, nous parlerons de notre expérience de mesure de la stabilité, de la performance et de la cartographie de l’InterPlanetary File System (IPFS), l’un des plus grands réseaux P2P décentralisés en activité.

Points clés :
  • Mesurer les performances et caractériser le trafic dans les réseaux décentralisés et sans autorisation est plus difficile que pour les réseaux centralisés.
  • Les performances de l’IPFS en matière de diffusion de contenu ne sont pas à la hauteur de celles des homologues centralisés des plateformes Web 2.0 traditionnelles, mais elles répondent aux exigences d’une grande variété de cas d’utilisation de l’internet. Il s’agit notamment du stockage et de la livraison de sites web et de fichiers généraux, du chat et de l’édition de documents interactifs.
  • Des méthodes de mesure innovantes nous ont permis de découvrir des détails importants concernant l’un des sous-systèmes centraux de routage de contenu d’IPFS, la table de hachage distribuée (DHT) publique d’IPFS.
  • Les passerelles HTTP IPFS sont un moyen populaire d’accéder au contenu du réseau IPFS, avec plus de 300 millions de requêtes par jour, la majorité d’entre elles provenant d’Amérique du Nord et de l’Union européenne.

Qu’est-ce que le système de fichiers interplanétaire ?

Dans un réseau décentralisé, aucune autorité centrale ou grande entreprise ne contrôle les données. Au lieu de cela, les données sont stockées sur un réseau d’ordinateurs, qui sont souvent connectés de manière P2P, ce qui rend plus difficile pour les pirates informatiques de faire tomber le réseau car il n’y a pas de point de défaillance unique. Les utilisateurs ont ainsi davantage de contrôle sur leurs données et leurs informations personnelles ne sont pas à la merci d’une seule entreprise. Elle encourage également un paysage technologique plus innovant et plus diversifié, où les utilisateurs peuvent choisir parmi différentes applications et plateformes, toutes construites sur la même infrastructure décentralisée.

IPFS est un réseau P2P décentralisé à code source ouvert, conçu par la communauté, et l’un des réseaux web décentralisés les plus largement adoptés.

L’une des caractéristiques uniques de l’IPFS est sa nature d’adressage de contenu, qui contraste avec le fonctionnement d’adressage d’hôte des protocoles Internet. IPFS convient donc au stockage et à la distribution de contenu à grande échelle, grâce à ses propriétés de mise en cache inhérentes. Dans le système IPFS, lorsqu’un contenu est demandé par l’un des homologues du réseau, il est temporairement (ou définitivement, si l’homologue l’indique) mis en cache et peut être servi à partir de cet homologue du réseau lorsqu’il est demandé ultérieurement. Il est clair que cela apporte des avantages significatifs dans le cas de contenus populaires qui sont demandés et servis plusieurs fois et qui, par conséquent, sont mis en cache en de nombreux points du réseau.

L’Amérique du Nord et l’Europe bénéficient le plus de l’augmentation du nombre de serveurs

Bien que des indicateurs de performance aient été élaborés par plusieurs ingénieurs et membres de la communauté, ils ne fournissaient pas suffisamment de données pour permettre de prendre des décisions éclairées sur les processus opérationnels et l’optimisation des protocoles. Mes collègues et moi-même, au ProbeLab, avons donc cherché à améliorer la visibilité des performances des différents éléments qui forment collectivement le réseau IPFS. Notre objectif a été de :

  • Contrôler la stabilité du réseau en termes de temps de fonctionnement des nœuds et de fluctuation de la taille du réseau.
  • Évaluer les performances du réseau en termes de publication et de récupération de contenu sur le réseau.
  • Établir une cartographie approximative du réseau (par exemple, la géolocalisation des pairs) pour orienter les décisions de conception.

Nous avons atteint les objectifs susmentionnés en développant et en utilisant un robot d’exploration de réseau spécialement conçu, une flotte de sondes de réseau (nœuds) et des journaux d’infrastructure. L’ouverture et le développement communautaire d’IPFS nécessitent que la communauté et les développeurs qui contribuent à IPFS ou s’en inspirent soient conscients des performances du réseau. C’est pourquoi nous avons créé un site web pour informer la communauté des détails de notre méthodologie et des résultats que nous obtenons grâce à notre infrastructure. Vous trouverez ci-dessous un résumé des résultats que nous avons obtenus jusqu’à présent en contrôlant les performances de l’IPFS :

  • Le taux d’attrition des pairs est élevé, la majorité (~80%) des nœuds quittant le réseau dans les deux heures qui suivent leur adhésion. Malgré le taux élevé de désabonnement, le nombre stable de nœuds qui restent en ligne assure une résilience remarquable du réseau, comme nous l’avons constaté lors d’un incident survenu au début de cette année.
  • Environ 20 000 nœuds de serveurs DHT sont constamment en ligne.
  • La majorité des nœuds du serveur DHT IPFS sont situés en Amérique du Nord et en Europe (figure 1), ce qui donne un avantage aux demandes provenant de ces régions. Nous avons constaté que le temps de découverte du contenu de ces régions est d’environ 150 à 300 ms.
Diagramme à barres montrant le nombre de nœuds de serveurs dans chaque pays
Figure 1 – Géolocalisation des nœuds du réseau IPFS DHT en termes d’adresses IP.
  • Les passerelles HTTP IPFS sont un moyen populaire d’accéder au contenu du réseau IPFS, avec plus de 300 millions de requêtes par jour, la majorité provenant d’Amérique du Nord et d’Europe.

En se plongeant dans ces détails, on découvre des résultats importants et un potentiel d’optimisation qui ne serait pas possible sans ces outils et ces études. Il s’agit d’une étape nécessaire pour que les performances et l’adoption des protocoles et réseaux du Web 3.0 soient comparables à ceux que nous utilisons aujourd’hui.

Vous trouverez plus de résultats dans notre article ACM SIGCOMM 2022.

En savoir plus

Toutes les actions sur les mesures du réseau sont publiques et rapportées sur le dépôt Github. Nous organisons toutes les deux semaines des heures de bureau au cours desquelles nous invitons la communauté et nos collaborateurs externes à se joindre à nous, à poser des questions et à discuter de sujets d’actualité. Vous pouvez vous inscrire et adhérer ici.

Vous pouvez également contacter l’équipe ProbeLab par courriel ([email protected]) ou via IPFS Discord ou Filecoin Slack sur le canal #probe-lab.

Yiannis Psaras s’intéresse depuis longtemps aux réseaux centrés sur l’information ou le contenu et a apporté plusieurs contributions notables dans ce domaine. Les opinions exprimées par les auteurs de ce blog sont les leurs et ne reflètent pas nécessairement celles de l’Internet Society.