Desarrollo de un enfoque holístico para medir los cortes de Internet
En resumen
- Un investigador de Pulse ha desarrollado un nuevo sistema de seguimiento de paradas de Internet que recupera datos de código abierto y API de varias fuentes para ofrecer una mayor resolución de las mediciones del tráfico de Internet, incluso durante las anomalías.
- Las pruebas demuestran que cada sistema de medición proporciona resultados diferentes, pero colectivamente pueden ayudar a interpretar la causa de las anomalías.
- Se está trabajando en más fuentes de datos y en una interfaz intuitiva para automatizar el proceso de análisis.
Medir Internet es difícil. Cada medición es muy subjetiva y depende de los datos a los que se pueda acceder y de cómo se interpreten. Una forma de superar estos retos es cotejar datos de múltiples fuentes para formarse una idea holística de la conectividad a Internet cuando hay y cuando no hay un evento significativo.
Como becario de 2024 Pulse Research, he utilizado este enfoque para extraer correlaciones significativas sobre los cierres de Internet.
Inscríbase en el seminario web sobre la revisión de la investigación del pulso 2024 el 11 de junio a partir de las 15:00 UTC
La recopilación de múltiples fuentes de datos proporciona una mayor resolución
El sistema holístico que he desarrollado permite a los usuarios recuperar datos de múltiples fuentes de datos fiables que supervisan Internet, entre ellas:
- Cloudflare Radar, que supervisa el tráfico web en su red de distribución de contenidos (CDN), proporcionando datos como la calidad de Internet y la saturación de la CDN;
- Detección y Análisis de Cortes de Internet(IODA), que evalúa la conectividad a Internet a nivel de país y de red mediante diversas técnicas de medición activas y pasivas;
- Informe de transparencia de Google, que muestra el tráfico a los servicios de Google de cada país; y
- Observatorio Abierto de Interferencias en Red (OONI), que proporciona mediciones generadas por los usuarios sobre la conectividad a los servicios web.
El sistema le permite estratificar los datos de estas fuentes durante un periodo seleccionado para comparar cada punto de vista.
Al investigar las interrupciones deliberadas conocidas de Internet, resulta evidente que no todas las fuentes de datos muestran una disminución de la calidad cuando se produce un corte. Por ejemplo, la figura 1 muestra datos de conectividad para Argelia de IODA y Google del 9 al 13 de junio de 2024. Las secciones resaltadas son anotaciones de Cloudflare Radar de interrupciones informadas dirigidas por el gobierno, cuyo calendario se corresponde con anteriores órdenes gubernamentales de restringir la conectividad a Internet en el país durante sus exámenes de Bachillerato. Puede consultar estos eventos de interrupción en el Rastreador de interrupciones de Internet Pulse.
La figura 2 es otro ejemplo de cómo los usuarios pueden cotejar y anotar los datos de OONI y CitizenLab. Agrupa los servicios de Internet por categorías para mostrar qué categorías experimentan más anomalías, en este caso, los medios de noticias y las redes sociales.
Basándonos en estos gráficos, podemos observar lo siguiente:
- Tiempo y duración predeciblesde las interrupciones-Las interrupciones aparecen según un patrón en torno a los momentos del examen, en los que se supone que la interrupción contrarresta posibles trampas. Podemos ver esto en la línea de tiempo, donde se anotan las interrupciones, así como a través de los datos brutos y utilizando la detección de anomalías.
- No hay interrupción total-Losdatos brutos muestran que, por lo general, aunque Internet se interrumpe, es sólo parcialmente.
- Categorías de sitios similares que experimentan la interrupciónAlexaminar los sitios específicos que sufren interrupciones o muestran anomalías, podemos observar que todos los periodos de examen muestran tipos similares de sitios web afectados. Como el motivo de los diferentes cortes es el mismo, cabe esperar que se vea afectada la misma información.
- Diferentes métodos de interrupción-Loscortes aparecen en varias fuentes de datos para cada región, lo que insinúa que se están utilizando diferentes métodos para interrumpir Internet.
Además de fijarse en las interrupciones, es esencial investigar los periodos que no tienen una anotación de interrupción. Estos periodos mostrarán lo que se supone que es un comportamiento normal y desvelarán aún más periodos de cortes que todavía necesitan anotación. En el ejemplo mostrado, podemos observar un puñado de cortes potenciales el 9 de junio, antes de que se produzca el primer corte anotado, ya que estos periodos muestran caídas similares en varias fuentes de datos.
Próximos pasos
Seguiremos perfeccionando el sistema para mejorar su precisión y la experiencia de usuario para los analistas de datos profesionales y aficionados. Esto incluye:
- Incorpore fuentes de datos adicionales, incluidas las de la API Internet Society Pulse, para conocer mejor el impacto de las interrupciones.
- Añadir interfaces intuitivas para automatizar el proceso de análisis.
Analizar los cortes de Internet es un reto continuo pero esencial para comprender las causas y mejorar la resistencia de Internet. Nuestro objetivo es mejorar nuestra comprensión e información sobre los cortes de Internet y otras interrupciones empleando un enfoque holístico con múltiples puntos de vista.
Ya están abiertas las solicitudes para la beca de investigación y tutoría Pulse 2025. Más información
Mike Vandersanden es estudiante de doctorado en la Universidad de Hasselt y becario de investigación de 2024 Pulse.
Las opiniones expresadas por los autores de este blog son suyas y no reflejan necesariamente los puntos de vista de la Internet Society.
