Abstract banner image with the letters IPFS

Los retos de medir las redes descentralizadas: El caso del Sistema de Archivos Interplanetarios

Picture of Yiannis Psaras
Research Scientist, ProbeLab — Guest Author
Categorias:
Twitter logo
LinkedIn logo
Facebook logo
June 6, 2023

La web descentralizada, también conocida como Web 3.0, es un enfoque innovador de la web tradicional que utilizamos actualmente. Proporciona a los usuarios más resistencia, seguridad y control sobre dónde se almacenan sus datos. Sin embargo, debido a su estructura descentralizada y entre iguales (P2P), la Web 3.0 dificulta la medición y supervisión de su rendimiento.

En este post, hablaremos de nuestra experiencia midiendo la estabilidad, el rendimiento y la cartografía de InterPlanetary File System (IPFS), una de las mayores redes P2P descentralizadas en funcionamiento.

Puntos clave:
  • Medir el rendimiento y caracterizar el tráfico en redes descentralizadas y sin permisos es más difícil que en las redes centralizadas.
  • El rendimiento de entrega de contenidos de IPFS está por detrás del rendimiento alcanzado por sus homólogos centralizados de las plataformas Web 2.0 tradicionales, pero sigue cumpliendo los requisitos de una gran variedad de casos de uso de Internet. Entre ellas se incluyen el almacenamiento y la entrega de archivos generales y de sitios web, el chat y la edición interactiva de documentos.
  • Las innovadoras metodologías de medición nos han permitido descubrir detalles importantes de uno de los subsistemas centrales de enrutamiento de contenidos de IPFS, la tabla hash distribuida (DHT) pública de IPFS.
  • Las pasarelas HTTP públicas de IPFS son una forma popular de acceder a los contenidos de la red IPFS, ya que atienden más de 300 millones de solicitudes al día, la mayoría de las cuales proceden de Norteamérica y la UE.

¿Qué es el Sistema Interplanetario de Archivos?

En una web descentralizada, ninguna autoridad central ni grandes empresas controlan los datos. En su lugar, los datos se almacenan en una red de ordenadores, que suelen estar conectados de forma P2P, lo que dificulta a los piratas informáticos la caída de la red al no existir un único punto de fallo. Esto garantiza que los usuarios tengan más control sobre sus datos y que su información personal no esté a merced de una sola empresa. También fomenta un panorama tecnológico más innovador y diverso, en el que los usuarios pueden elegir entre diversas aplicaciones y plataformas, todas ellas construidas sobre la misma infraestructura descentralizada.

IPFS es una red P2P descentralizada, de código abierto y construida por la comunidad, y es una de las redes web descentralizadas más ampliamente adoptadas.

Una de las características únicas de IPFS es su naturaleza de direccionamiento de contenido, que contrasta con el funcionamiento de direccionamiento de host de los protocolos de Internet. Esto hace que IPFS sea adecuado para el almacenamiento y distribución de contenidos a gran escala de forma eficiente debido a las propiedades inherentes de almacenamiento en caché. En IPFS, cuando un contenido es solicitado por uno de los pares de la red, se almacena temporalmente (o permanentemente, si así lo indica el par) en caché y puede ser servido desde ese par de la red cuando se solicite posteriormente. Evidentemente, esto aporta ventajas significativas en el caso de contenidos populares que se solicitan y sirven varias veces y, como resultado, se almacenan en caché en muchos puntos de la red.

Norteamérica y Europa son los países más beneficiados por tener más servidores

Aunque varios ingenieros y miembros de la comunidad habían elaborado indicadores de rendimiento, éstos no proporcionaban datos suficientes para tomar decisiones informadas sobre los procesos operativos y la optimización de los protocolos. Mis colegas y yo en ProbeLab, por lo tanto, hemos tratado de aumentar la visibilidad del rendimiento de los diferentes componentes que colectivamente forman la red IPFS. Nuestro objetivo ha sido:

  • Supervisar la estabilidad de la red en términos de tiempo de actividad de los nodos y fluctuación del tamaño de la red.
  • Evaluar el rendimiento de la red en términos de publicación y obtención de contenidos de la red.
  • Trazar una cartografía aproximada de la red (por ejemplo, geolocalización de los compañeros) para orientar las decisiones de diseño.

Hemos alcanzado estos objetivos desarrollando y utilizando un rastreador de red específico, una flota de sondas de red (nodos) y registros de infraestructura. La apertura y el desarrollo comunitario del IPFS hacen necesario que la comunidad y los desarrolladores que contribuyen o se basan en el IPFS conozcan el rendimiento de la red. Por ello, hemos creado un sitio web para informar a la comunidad de los detalles de nuestra metodología y los resultados que estamos obteniendo con nuestra infraestructura. A continuación se resumen los resultados que hemos obtenido hasta ahora del seguimiento del rendimiento del IPFS:

  • La rotación de nodos es alta, y la mayoría (~80%) los abandona a las dos horas de unirse a la red. A pesar de la elevada tasa de rotación, el número estable de nodos que permanecen en línea proporciona una notable resistencia a la red, como pudimos comprobar durante un incidente a principios de este año.
  • Alrededor de ~20k nodos del servidor DHT están constantemente en línea.
  • La mayoría de los nodos del servidor DHT de IPFS se encuentran en Norteamérica y Europa (Figura 1), lo que supone una ventaja para las solicitudes procedentes de estas regiones. Hemos comprobado que el tiempo de descubrimiento de contenidos de esas regiones es de unos 150-300 ms.
Gráfico de barras que muestra el número de nodos servidores en cada país
Figura 1 – Geolocalización de los nodos de la red DHT IPFS en términos de direcciones IP.
  • Las pasarelas HTTP públicas de IPFS son una forma popular de acceder a los contenidos de la red IPFS, ya que atienden más de 300 millones de solicitudes al día, la mayoría de las cuales proceden de Norteamérica y Europa.

Al profundizar en estos detalles se descubren hallazgos importantes y un potencial de optimización que no sería posible sin este tipo de herramientas y estudios. Se trata de un paso necesario para que el rendimiento y la adopción de los protocolos y redes de la Web 3.0 sean comparables a los que utilizamos hoy en día.

Encontrará más resultados en nuestro documento ACM SIGCOMM 2022.

Más información

Todas las medidas de la red son públicas y se publican en el repositorio de Github. Celebramos horas de oficina quincenales en las que invitamos a la comunidad y a nuestros colaboradores externos a unirse, plantear preguntas y debatir temas candentes. Puede inscribirse y participar aquí.

También puede ponerse en contacto con el equipo de ProbeLab por correo electrónico ([email protected]) o a través de IPFS Discord o Filecoin Slack en el canal #probe-lab.

Yiannis Psaras se interesa desde hace tiempo por las redes centradas en la información o los contenidos, y ha realizado varias contribuciones notables en este campo. Las opiniones expresadas por los autores de este blog son suyas y no reflejan necesariamente los puntos de vista de la Internet Society.