Foto de varias cadenas montañosas de distintas alturas|||

Desarrollo de un enfoque holístico para medir los cortes de Internet

Photo of Mike Vandersanden
Categorías:

En resumen

  • Un investigador de Pulse ha desarrollado un nuevo sistema de seguimiento de paradas de Internet que recupera datos de código abierto y API de varias fuentes para ofrecer una mayor resolución de las mediciones del tráfico de Internet, incluso durante las anomalías.
  • Las pruebas demuestran que cada sistema de medición proporciona resultados diferentes, pero colectivamente pueden ayudar a interpretar la causa de las anomalías.
  • Se está trabajando en más fuentes de datos y en una interfaz intuitiva para automatizar el proceso de análisis.

Medir Internet es difícil. Cada medición es muy subjetiva y depende de los datos a los que se pueda acceder y de cómo se interpreten. Una forma de superar estos retos es cotejar datos de múltiples fuentes para formarse una idea holística de la conectividad a Internet cuando hay y cuando no hay un evento significativo. 

Como becario de 2024 Pulse Research, he utilizado este enfoque para extraer correlaciones significativas sobre los cierres de Internet.

Inscríbase en el seminario web sobre la revisión de la investigación del pulso 2024 el 11 de junio a partir de las 15:00 UTC

La recopilación de múltiples fuentes de datos proporciona una mayor resolución

El sistema holístico que he desarrollado permite a los usuarios recuperar datos de múltiples fuentes de datos fiables que supervisan Internet, entre ellas: 

El sistema le permite estratificar los datos de estas fuentes durante un periodo seleccionado para comparar cada punto de vista.

Al investigar las interrupciones deliberadas conocidas de Internet, resulta evidente que no todas las fuentes de datos muestran una disminución de la calidad cuando se produce un corte. Por ejemplo, la figura 1 muestra datos de conectividad para Argelia de IODA y Google del 9 al 13 de junio de 2024. Las secciones resaltadas son anotaciones de Cloudflare Radar de interrupciones informadas dirigidas por el gobierno, cuyo calendario se corresponde con anteriores órdenes gubernamentales de restringir la conectividad a Internet en el país durante sus exámenes de Bachillerato. Puede consultar estos eventos de interrupción en el Rastreador de interrupciones de Internet Pulse.

Gráfico lineal de series temporales que muestra diversas mediciones de Internet en Argelia del 9 al 13 de junio.
Figura 1 - Un ejemplo de datos de conectividad y anotaciones procedentes de Cloudflare Radar, Google e IODA para Argelia del 9 al 13 de junio. Las secciones resaltadas son cortes de Internet notificados por Cloudflare Radar.

La figura 2 es otro ejemplo de cómo los usuarios pueden cotejar y anotar los datos de OONI y CitizenLab. Agrupa los servicios de Internet por categorías para mostrar qué categorías experimentan más anomalías, en este caso, los medios de noticias y las redes sociales.

Gráfico de columnas que muestra el recuento de anomalías para varias categorías de servicios web.
Figura 2 - Ejemplo de categorización de los datos de la prueba de conectividad web de OONI mediante la lista de pruebas de CitizenLab. Tenga en cuenta que la prueba de conectividad web de OONI sí ofrece un desglose de categorías en línea, pero no a través de su API.

Basándonos en estos gráficos, podemos observar lo siguiente: 

  • Tiempo y duración predeciblesde las interrupciones-Las interrupciones aparecen según un patrón en torno a los momentos del examen, en los que se supone que la interrupción contrarresta posibles trampas. Podemos ver esto en la línea de tiempo, donde se anotan las interrupciones, así como a través de los datos brutos y utilizando la detección de anomalías. 
  • No hay interrupción total-Losdatos brutos muestran que, por lo general, aunque Internet se interrumpe, es sólo parcialmente. 
  • Categorías de sitios similares que experimentan la interrupciónAlexaminar los sitios específicos que sufren interrupciones o muestran anomalías, podemos observar que todos los periodos de examen muestran tipos similares de sitios web afectados. Como el motivo de los diferentes cortes es el mismo, cabe esperar que se vea afectada la misma información. 
  • Diferentes métodos de interrupción-Loscortes aparecen en varias fuentes de datos para cada región, lo que insinúa que se están utilizando diferentes métodos para interrumpir Internet. 

Además de fijarse en las interrupciones, es esencial investigar los periodos que no tienen una anotación de interrupción. Estos periodos mostrarán lo que se supone que es un comportamiento normal y desvelarán aún más periodos de cortes que todavía necesitan anotación. En el ejemplo mostrado, podemos observar un puñado de cortes potenciales el 9 de junio, antes de que se produzca el primer corte anotado, ya que estos periodos muestran caídas similares en varias fuentes de datos. 

Próximos pasos

Seguiremos perfeccionando el sistema para mejorar su precisión y la experiencia de usuario para los analistas de datos profesionales y aficionados. Esto incluye: 

  • Incorpore fuentes de datos adicionales, incluidas las de la API Internet Society Pulse, para conocer mejor el impacto de las interrupciones.
  • Añadir interfaces intuitivas para automatizar el proceso de análisis.

Analizar los cortes de Internet es un reto continuo pero esencial para comprender las causas y mejorar la resistencia de Internet. Nuestro objetivo es mejorar nuestra comprensión e información sobre los cortes de Internet y otras interrupciones empleando un enfoque holístico con múltiples puntos de vista. 

Ya están abiertas las solicitudes para la beca de investigación y tutoría Pulse 2025. Más información

Mike Vandersanden es estudiante de doctorado en la Universidad de Hasselt y becario de investigación de 2024 Pulse.