- Un becario de investigación de Pulse ha desarrollado un nuevo sistema de seguimiento de paradas de Internet que recupera datos API de código abierto de varias fuentes para proporcionar una mayor resolución de las mediciones del tráfico de Internet, incluso durante las anomalías.
- Las pruebas demuestran que cada sistema de medición proporciona resultados distintos, pero colectivamente pueden ayudar a interpretar la causa de las anomalías.
- Se está trabajando en más fuentes de datos y en interfaces intuitivas para automatizar el proceso de análisis.
Medir Internet es difícil. Cada medición es muy subjetiva, dependiendo de los datos a los que puedas acceder y de cómo los interpretes. Una forma de superar estos retos es cotejar datos de múltiples fuentes para formar una comprensión holística de la conectividad a Internet cuando hay y cuando no hay un acontecimiento significativo.
Como becario de 2024 Pulse Research, he utilizado este enfoque para extraer correlaciones significativas sobre los cierres de Internet.
Inscríbete en el seminario web 2024 Pulse Research Review el 11 de junio a partir de las 15:00 UTC
Cotejar varias fuentes de datos proporciona una mayor resolución
El sistema holístico que he desarrollado permite a los usuarios recuperar datos de múltiples fuentes de datos de confianza que supervisan Internet, entre ellas:
- Cloudflare Radar, que supervisa el tráfico web en su red de distribución de contenidos (CDN), proporcionando datos como la calidad de Internet y la saturación de la CDN;
- Detección y Análisis de Interrupciones de Internet(IODA), que evalúa la conectividad a Internet a nivel de país y de red mediante diversas técnicas de medición activas y pasivas;
- Informe de Transparencia de Google, que muestra el tráfico a los servicios de Google para cada país; y
- Observatorio Abierto de Interferencias en Red (OONI), que proporciona mediciones generadas por los usuarios sobre la conectividad a los servicios web.
El sistema te permite estratificar los datos de estas fuentes durante un periodo seleccionado para comparar cada punto de vista.
Al investigar las interrupciones deliberadas conocidas de Internet, se observa que no todas las fuentes de datos muestran una disminución de la calidad cuando se produce un corte. Por ejemplo, la Figura 1 muestra datos de conectividad para Argelia de IODA y Google del 9 al 13 de junio de 2024. Las secciones resaltadas son anotaciones de Cloudflare Radar de las interrupciones dirigidas por el gobierno de las que se ha informado, cuyo calendario se corresponde con anteriores órdenes del gobierno de restringir la conectividad a Internet en el país durante sus exámenes de Bachillerato. Puedes ver estos eventos de interrupción en el Rastreador de Interrupciones de Internet de Pulse.
La Figura 2 es otro ejemplo de cómo los usuarios pueden cotejar y anotar datos de OONI y CitizenLab. Agrupa los servicios de Internet por categorías para mostrar qué categorías experimentan más anomalías, en este caso, los Medios de Noticias y las Redes Sociales.
Basándonos en estos gráficos, podemos observar lo siguiente:
- Tiempo y duración predecibles de las interrupciones:las interrupciones aparecen según un patrón en torno a los momentos del examen, en los que se supone que la interrupción contrarresta posibles trampas. Podemos ver esto en la línea de tiempo, donde se anotan las interrupciones, así como a través de los datos brutos y utilizando la detección de anomalías.
- No hay interrupción total-Losdatos brutos muestran que, normalmente, aunque Internet se interrumpe, es sólo parcialmente.
- Categorías de sitios similares que experimentan lainterrupciónExaminando los sitios concretos que sufren interrupciones o muestran anomalías, podemos observar que todos los periodos de examen muestran tipos similares de sitios web afectados. Como el motivo de las distintas interrupciones es el mismo, cabe esperar que se vea afectada la misma información.
- Diferentes métodos de interrupción:las interrupciones aparecen en varias fuentes de datos de cada región, lo que indica que se están utilizando diferentes métodos para interrumpir Internet.
Además de mirar las interrupciones, es esencial investigar los periodos que no tienen una anotación de interrupción. Estos periodos mostrarán lo que se supone que es un comportamiento normal y desvelarán aún más periodos de interrupción que todavía necesitan anotación. En el ejemplo mostrado, podemos observar un puñado de interrupciones potenciales el 9 de junio, antes de que se produzca la primera interrupción anotada, ya que estos periodos muestran caídas similares en varias fuentes de datos.
Próximos pasos
Seguiremos perfeccionando el sistema para mejorar su precisión y la experiencia de usuario para los analistas de datos profesionales y aficionados. Esto incluye
- Incorporar fuentes de datos adicionales, incluidas las de la API Internet Society Pulse, para proporcionar una mayor comprensión del impacto de las interrupciones.
- Añadir interfaces intuitivas para automatizar el proceso de análisis.
Analizar los cortes de Internet es un reto continuo, pero esencial para comprender las causas y mejorar la resistencia de Internet. Nuestro objetivo es mejorar nuestra comprensión e información sobre los cortes de Internet y otras interrupciones empleando un enfoque holístico con múltiples puntos de vista.
Ya están abiertas las solicitudes para la Beca de Investigación y Tutoría Pulso 2025. Más información
Mike Vandersanden es estudiante de doctorado en la Universidad de Hasselt y becario de investigación de 2024 Pulse.
Las opiniones expresadas por los autores de este blog son suyas y no reflejan necesariamente los puntos de vista de la Internet Society.