Photo of several mountain ranges of varying heights

Desarrollar un enfoque holístico para medir las interrupciones de Internet

Picture of Mike Vandersanden
Guest Author | Hasselt University and Pulse Research Fellow
Categorias:
Twitter logo
LinkedIn logo
Facebook logo
December 5, 2024
En resumen
  • Un becario de investigación de Pulse ha desarrollado un nuevo sistema de seguimiento de paradas de Internet que recupera datos API de código abierto de varias fuentes para proporcionar una mayor resolución de las mediciones del tráfico de Internet, incluso durante las anomalías.
  • Las pruebas demuestran que cada sistema de medición proporciona resultados distintos, pero colectivamente pueden ayudar a interpretar la causa de las anomalías.
  • Se está trabajando en más fuentes de datos y en interfaces intuitivas para automatizar el proceso de análisis.

Medir Internet es difícil. Cada medición es muy subjetiva, dependiendo de los datos a los que puedas acceder y de cómo los interpretes. Una forma de superar estos retos es cotejar datos de múltiples fuentes para formar una comprensión holística de la conectividad a Internet cuando hay y cuando no hay un acontecimiento significativo.

Como becario de 2024 Pulse Research, he utilizado este enfoque para extraer correlaciones significativas sobre los cierres de Internet.

Inscríbete en el seminario web 2024 Pulse Research Review el 11 de junio a partir de las 15:00 UTC

Cotejar varias fuentes de datos proporciona una mayor resolución

El sistema holístico que he desarrollado permite a los usuarios recuperar datos de múltiples fuentes de datos de confianza que supervisan Internet, entre ellas:

El sistema te permite estratificar los datos de estas fuentes durante un periodo seleccionado para comparar cada punto de vista.

Al investigar las interrupciones deliberadas conocidas de Internet, se observa que no todas las fuentes de datos muestran una disminución de la calidad cuando se produce un corte. Por ejemplo, la Figura 1 muestra datos de conectividad para Argelia de IODA y Google del 9 al 13 de junio de 2024. Las secciones resaltadas son anotaciones de Cloudflare Radar de las interrupciones dirigidas por el gobierno de las que se ha informado, cuyo calendario se corresponde con anteriores órdenes del gobierno de restringir la conectividad a Internet en el país durante sus exámenes de Bachillerato. Puedes ver estos eventos de interrupción en el Rastreador de Interrupciones de Internet de Pulse.

Gráfico lineal de series temporales que muestra diversas mediciones de Internet en Argelia del 9 al 13 de junio.
Figura 1 – Ejemplo de datos de conectividad y anotaciones procedentes de Cloudflare Radar, Google e IODA para Argelia del 9 al 13 de junio. Las secciones resaltadas son cortes de Internet notificados por Cloudflare Radar.

La Figura 2 es otro ejemplo de cómo los usuarios pueden cotejar y anotar datos de OONI y CitizenLab. Agrupa los servicios de Internet por categorías para mostrar qué categorías experimentan más anomalías, en este caso, los Medios de Noticias y las Redes Sociales.

Gráfico de columnas que muestra el recuento de anomalías de varias categorías de servicios web.
Figura 2 – Ejemplo de categorización de datos de la Prueba de Conectividad Web OONI mediante la lista de pruebas de CitizenLab. Ten en cuenta que la Prueba de Conectividad Web OONI proporciona un desglose de categorías en línea, pero no a través de su API.

Basándonos en estos gráficos, podemos observar lo siguiente:

  • Tiempo y duración predecibles de las interrupciones:las interrupciones aparecen según un patrón en torno a los momentos del examen, en los que se supone que la interrupción contrarresta posibles trampas. Podemos ver esto en la línea de tiempo, donde se anotan las interrupciones, así como a través de los datos brutos y utilizando la detección de anomalías.
  • No hay interrupción total-Losdatos brutos muestran que, normalmente, aunque Internet se interrumpe, es sólo parcialmente.
  • Categorías de sitios similares que experimentan lainterrupciónExaminando los sitios concretos que sufren interrupciones o muestran anomalías, podemos observar que todos los periodos de examen muestran tipos similares de sitios web afectados. Como el motivo de las distintas interrupciones es el mismo, cabe esperar que se vea afectada la misma información.
  • Diferentes métodos de interrupción:las interrupciones aparecen en varias fuentes de datos de cada región, lo que indica que se están utilizando diferentes métodos para interrumpir Internet.

Además de mirar las interrupciones, es esencial investigar los periodos que no tienen una anotación de interrupción. Estos periodos mostrarán lo que se supone que es un comportamiento normal y desvelarán aún más periodos de interrupción que todavía necesitan anotación. En el ejemplo mostrado, podemos observar un puñado de interrupciones potenciales el 9 de junio, antes de que se produzca la primera interrupción anotada, ya que estos periodos muestran caídas similares en varias fuentes de datos.

Próximos pasos

Seguiremos perfeccionando el sistema para mejorar su precisión y la experiencia de usuario para los analistas de datos profesionales y aficionados. Esto incluye

  • Incorporar fuentes de datos adicionales, incluidas las de la API Internet Society Pulse, para proporcionar una mayor comprensión del impacto de las interrupciones.
  • Añadir interfaces intuitivas para automatizar el proceso de análisis.

Analizar los cortes de Internet es un reto continuo, pero esencial para comprender las causas y mejorar la resistencia de Internet. Nuestro objetivo es mejorar nuestra comprensión e información sobre los cortes de Internet y otras interrupciones empleando un enfoque holístico con múltiples puntos de vista.

Ya están abiertas las solicitudes para la Beca de Investigación y Tutoría Pulso 2025. Más información

Mike Vandersanden es estudiante de doctorado en la Universidad de Hasselt y becario de investigación de 2024 Pulse.