Los retos de medir las redes descentralizadas: El caso del sistema de archivos interplanetario
La web descentralizada, también conocida como Web 3.0, es un enfoque innovador de la web tradicional que utilizamos actualmente. Proporciona a los usuarios más resistencia, seguridad y control sobre dónde se almacenan sus datos. Sin embargo, debido a su estructura descentralizada y de igual a igual (P2P), la Web 3.0 hace que medir y supervisar su rendimiento sea todo un reto.
En este post, hablaremos de nuestra experiencia midiendo la estabilidad, el rendimiento y la cartografía de InterPlanetary File System (IPFS), una de las mayores redes P2P descentralizadas en funcionamiento.
Puntos clave:
- Medir el rendimiento y caracterizar el tráfico en las redes descentralizadas y sin permisos es más difícil que en las redes centralizadas.
- El rendimiento de la entrega de contenidos del IPFS está por detrás del rendimiento alcanzado por sus homólogos centralizados de las plataformas Web 2.0 tradicionales, pero sigue cumpliendo los requisitos de una gran variedad de casos de uso de Internet. Entre ellos se incluyen el almacenamiento y la entrega de sitios web y archivos en general, el chat y la edición interactiva de documentos.
- Las innovadoras metodologías de medición nos han permitido descubrir detalles importantes de uno de los subsistemas centrales de enrutamiento de contenidos del IPFS, la tabla hash distribuida (DHT) pública del IPFS.
- Las pasarelas HTTP públicas del IPFS son una forma popular de acceder a los contenidos de la red IPFS, ya que atienden más de 300M de solicitudes al día, la mayoría de las cuales proceden de Norteamérica y la UE.
¿Qué es el Sistema Interplanetario de Archivos?
En una web descentralizada, ninguna autoridad central ni grandes empresas controlan los datos. En su lugar, los datos se almacenan en una red de ordenadores, que a menudo están conectados de forma P2P, lo que hace más difícil que los piratas informáticos puedan hacer caer la red, ya que no existe un único punto de fallo. Esto garantiza que los usuarios tengan un mayor control sobre sus datos y que su información personal no esté a merced de una única corporación. También fomenta un panorama tecnológico más innovador y diverso, en el que los usuarios pueden elegir entre varias aplicaciones y plataformas, todas ellas construidas sobre la misma infraestructura descentralizada.
IPFS es una red P2P descentralizada, de código abierto y construida por la comunidad, y es una de las redes web descentralizadas más ampliamente adoptadas.
Una de las características únicas de IPFS es su naturaleza de direccionamiento de contenidos, que contrasta con el funcionamiento de direccionamiento de host de los protocolos de Internet. Esto hace que IPFS sea adecuado para el almacenamiento y la distribución de contenidos a gran escala de forma eficiente debido a las propiedades inherentes de almacenamiento en caché. En IPFS, cuando el contenido es solicitado por uno de los pares de la red, se almacena temporalmente (o permanentemente, si así lo indica el par) en caché y puede ser servido desde ese par de la red cuando se solicite posteriormente. Evidentemente, esto aporta ventajas significativas en el caso de contenidos populares que se solicitan y sirven varias veces y, como resultado, se almacenan en caché en muchos puntos de la red.
Norteamérica y Europa se benefician más de tener más servidores
Aunque varios ingenieros y miembros de la comunidad habían construido indicadores de rendimiento, esto no proporcionaba datos suficientes para tomar decisiones informadas sobre los procesos operativos y las optimizaciones de los protocolos. Por ello, mis colegas y yo en ProbeLab hemos tratado de aumentar la visibilidad del rendimiento de los distintos componentes que forman colectivamente la red IPFS. Nuestro objetivo ha sido:
- Supervise la estabilidad de la red en términos de tiempo de actividad de los nodos y fluctuación del tamaño de la red.
- Evalúe el rendimiento de la red en términos de publicación y obtención de contenidos de la red.
- Trace una cartografía aproximada de la red (por ejemplo, la geolocalización de los pares) para orientar las decisiones de diseño.
Hemos logrado los objetivos anteriores desarrollando y utilizando un rastreador de red creado a tal efecto, una flota de sondas de red (nodos) y registros de infraestructura. La apertura y el desarrollo comunitario del IPFS requieren que la comunidad y los desarrolladores que contribuyen o construyen sobre el IPFS conozcan el rendimiento de la red. Como tal, hemos construido un sitio web para informar a la comunidad de los detalles de nuestra metodología y de los resultados que estamos viendo a través de nuestra infraestructura. A continuación encontrará un resumen de los resultados que hemos obtenido hasta el momento de la supervisión del rendimiento del IPFS:
- El churn de nodos es elevado, y la mayoría (~80%) de los nodos se marchan en las dos horas siguientes a su incorporación a la red. A pesar de la elevada tasa de churn, el número estable de nodos que permanecen en línea proporciona una notable resistencia a la red, como pudimos comprobar durante un incidente a principios de este año.
- Alrededor de ~20k nodos del servidor DHT están constantemente en línea.
- La mayoría de los nodos del servidor DHT de IPFS se encuentran en Norteamérica y Europa (Figura 1), lo que da ventaja a las solicitudes procedentes de estas regiones. Hemos comprobado que el tiempo de descubrimiento de contenidos desde esas regiones es de unos 150-300 ms.
- Las pasarelas HTTP públicas del IPFS son una forma popular de acceder a los contenidos de la red IPFS, ya que atienden más de 300M de solicitudes al día, la mayoría de las cuales proceden de Norteamérica y Europa.
Profundizar en estos detalles descubre importantes hallazgos y un potencial de optimización que no sería posible sin este tipo de herramientas y estudios. Se trata de un paso necesario para que el rendimiento y la adopción de los protocolos y redes de la Web 3.0 sean comparables a los que utilizamos hoy en día.
Puede encontrar más resultados en nuestra ponencia ACM SIGCOMM 2022.
Saber más
Toda la acción sobre las mediciones de la red es pública y se informa de ella en el repositorio de Github. Celebramos horas de oficina quincenales en las que invitamos a la comunidad y a nuestros colaboradores externos a unirse, plantear preguntas y debatir temas candentes. Puede registrarse y unirse aquí.
También puede ponerse en contacto con el equipo de ProbeLab por correo electrónico ([email protected]) o a través de IPFS Discord o Filecoin Slack en el canal #probe-lab.
Yiannis Psaras se interesa desde hace tiempo por las redes centradas en la información o en los contenidos y ha realizado varias contribuciones notables en este ámbito. Las opiniones expresadas por los autores de este blog son suyas y no reflejan necesariamente los puntos de vista de la Internet Society.
