Mesurer la censure sur l'internet sans volontaires ni points de vue

29 Novembre 2023

Guest Author | University of Maryland, Internet Society Pulse Research Fellow (2023).

Catégories:

Shutdown

Les régimes autoritaires censurent souvent les sites web à l'intérieur de leurs frontières, menaçant ainsi la communication libre et ouverte sur l'internet. Il est essentiel de mesurer ce qui est bloqué, comment les censeurs opèrent et comment la censure évolue dans le temps pour comprendre et contourner ces efforts de censure.

Malheureusement, il est difficile de mesurer de telles choses, en particulier dans les pays qui limitent la capacité des chercheurs à trouver des points d'appui, qu'il s'agisse de volontaires, de points d'observation ou de serveurs en direct.

Grâce à ma bourse de recherche Pulse, je m'appuie sur les recherches que mes collègues et moi-même avons menées à l'université du Maryland et à l'université de Chicago pour surmonter plusieurs de ces difficultés et améliorer la façon dont la communauté des évaluateurs peut mesurer la censure de manière longitudinale sans avoir besoin d'aide à l'intérieur du pays.

Postulez maintenant pour la bourse de recherche Pulse 2024 et inscrivez-vous au webinaire d'évaluation de la bourse de recherche Pulse 2023.

Points clés :

La mesure de la censure de l'internet nécessite traditionnellement des points d'extrémité - volontaires, points d'observation ou serveurs en direct - dans les pays censurés pour vérifier si les sites web et/ou les services sont accessibles.
Notre technique consiste à faire croire aux dispositifs de censure que nous effectuons des tests à l'intérieur des frontières du censeur.
Les résultats préliminaires montrent que cette technique permet de mesurer certains pays que les efforts de mesure complémentaires ne peuvent pas mesurer longitudinalement, tels que le Brunei et le Tadjikistan.

Il existe actuellement un large éventail d'initiatives - comme OONI et CensoredPlanet - qui mesurent la censure sur l'internet en demandant des URL et en observant si les sites web correspondants sont accessibles. L'une des limites de ces projets est qu'ils dépendent de la recherche de points d'accès dans les pays censurés pour effectuer ces requêtes.

Cette situation est encore aggravée dans les pays à faible population, à régime très répressif, à faible taux de pénétration de l'Internet et à infrastructure Internet médiocre. Dans ces pays, même lorsque de tels paramètres sont disponibles, ils sont souvent limités à une petite poignée de mesures, suivies de périodes d'absence de mesures ou de faibles mesures, ce qui ne nous donne qu'un aperçu de la censure à un moment donné.

Pour relever ce défi, mes collègues et moi-même avons mis au point une nouvelle technique qui permet de mesurer la censure de manière longitudinale sans nécessiter d'aide de la part du pays. Cette technique tire parti de deux bizarreries dans la manière dont certains pays censurent.

De nombreux pays déploient une censure bidirectionnelle qui bloque le trafic censuré, que la requête reçue par les censeurs provienne de l'intérieur ou de l'extérieur du pays (figure 1). Cela signifie que nous pouvons demander à nos clients de mesurer le niveau de censure en envoyant des requêtes depuis l'extérieur du pays censuré vers des serveurs situés dans le pays censuré.

Toutefois, il peut être difficile de trouver ces serveurs publics dans les pays censurés pour les raisons susmentionnées.

Infographie montrant la censure bidirectionnelle entre le client aux États-Unis et le serveur en Iran. — Figure 1 - Censure bidirectionnelle au Turkménistan agissant sur le trafic provenant de l'extérieur du régime de censure.

Cependant, nous n'avons pas toujours besoin d'un serveur réactif pour déclencher la censure de manière bidirectionnelle, car certains dispositifs de censure (boîtes intermédiaires) ont un comportement non conforme au protocole TCP.

A middlebox is a computer networking device that can transform, inspect, filter, and manipulate Internet traffic — otherwise known as connection tampering — that is deemed restricted between clients and servers due to copyright infringement, corporate network interference, or Internet censorship.

Un événement de censure HTTP(S) ordinaire se produit lorsqu'un client se connecte à un serveur en direct avec une poignée de main TCP à trois voies et envoie un paquet PSH+ACK qui contient une requête vers un site web censuré. Le censeur voit cette demande et prend des mesures de blocage, soit en interrompant ou en limitant le trafic du client, soit en renvoyant une page de blocage au client, soit en renvoyant un paquet de réinitialisation (figure 2), appelé RST, au client pour mettre fin à la connexion.

Figure 2 - Diagramme en cascade de la censure HTTP(S) via un paquet RST.

La poignée de main tripartite TCP nécessite une réponse du serveur - un paquet SYN+ACK. Cependant, notre objectif est de mesurer la censure dans des endroits où il n'y a pas de serveur du tout.

Pour atteindre notre objectif, nous nous appuyons sur le fait que les censeurs sont susceptibles de manquer certains paquets au sein d'une connexion en raison des routes asymétriques, de l'équilibrage de la charge et du trafic intense. Par exemple, un censeur peut manquer le paquet ACK envoyé par un client au serveur dans le cadre d'une poignée de main TCP à trois voies.

Lorsque le client envoie un nouveau paquet PSH+ACK avec un domaine censuré, on peut s'attendre à ce que le censeur ne tienne pas compte du paquet car, du point de vue du censeur, il n'y a pas de connexion en cours puisque le client et le serveur n'ont pas effectué de poignée de main TCP à trois voies. Pourtant, de nombreux censeurs prennent des mesures de blocage, comme l'envoi d'un paquet RST au client (figure 3). De nombreux censeurs ne sont donc pas totalement conformes au protocole TCP. Ils s'appuient uniquement sur la présomption, et non sur la confirmation, d'une connexion en cours pour bloquer une requête censurée.

Figure 3 - Diagramme en cascade du comportement de non-conformité TCP d'un censeur.

Cela signifie que nous pouvons créer des séquences de paquets qui déclenchent la censure sans qu'aucun serveur vivant n'ait besoin de compléter la poignée de main TCP pour déclencher la censure.

En reprenant l'exemple précédent, le client peut envoyer un paquet SYN suivi d'un paquet PSH+ACK à une adresse IP qui ne répond pas pour déclencher la censure (figure 4).

Figure 4 - Diagramme en cascade du déclenchement de la censure HTTP(S) sans serveurs réels.

Cela signifie que nous pouvons maintenant mesurer la censure dans des réseaux qui n'ont pas de participants. Grâce à la censure bidirectionnelle, nous pouvons envoyer ces séquences de paquets à partir de clients que nous contrôlons en dehors du pays de censure. De plus, nous pouvons diriger nos mesures de censure vers des adresses IP non réactives, sans utilisateurs ni machines derrière elles, ce qui permet d'atténuer les risques potentiels pour les utilisateurs et les préoccupations éthiques concernant les connexions à des machines vivantes.

La séquence de paquets SYN suivie d'une séquence PSH+ACK est l'une des nombreuses séquences qui déclenchent certaines censures. Cependant, il ne s'agit pas d'une séquence de paquets standard qui déclenchera avec succès la censure dans tous les régimes de censure. Par conséquent, nous devons découvrir quelles séquences de paquets déclenchent la censure des middleboxes dans les différents régimes de censure.

Lors de ma première tentative d'application de cette technique, mes collègues et moi-même avons étudié la censure au Turkménistan - unpays notoirement difficile à mesurer de l'intérieur, étant donné sa faible pénétration de l'Internet et ses lois extrêmement sévères sur l'utilisation de l'Internet. J'ai tenté de déclencher les boîtes intermédiaires de censure dans le pays en créant manuellement des séquences de paquets. J'ai découvert que l'envoi à deux reprises d'un paquet SYN suivi d'un paquet PSH+ACK, séparés par un intervalle de 5 à 29 secondes entre les paquets, déclenchait avec succès la censure.

Bien qu'encourageants, ces résultats ont nécessité un effort manuel considérable, qui ne pourra pas être étendu à d'autres pays ou à d'autres fournisseurs de services Internet au sein d'un même pays.

Dans le cadre de ma bourse de recherche Pulse, je développe des techniques qui automatisent la découverte de séquences de paquets déclenchant la censure, ce qui nous permet de mesurer la censure dans de nombreux pays du monde qui sont hors de portée des techniques de mesure traditionnelles.

Pour ce faire, j'ai l'intention d'utiliser Geneva, unalgorithme génétique open-source qui s'entraîne contre des censeurs en direct pour découvrir des séquences de paquets qui échappent à la censure. Cependant, au lieu de faire en sorte que Geneva échappe à la censure, j'ai l'intention de le modifier pour qu'il découvre des séquences de paquets qui déclenchent la censure. Cela impliquera d'ajouter de nouvelles capacités à Geneva. Par exemple, Geneva n'aurait pas été capable de trouver la séquence de paquets utilisée pour déclencher la censure au Turkménistan car Geneva ne supporte pas les pauses entre les envois de paquets.

Pour que cette technique de mesure de la censure fonctionne, nous avons besoin à la fois d'une censure bidirectionnelle et d'un dispositif de censure qui peut être trompé pour censurer à l'aide de séquences de paquets spécialement conçues. Jusqu'à présent, nous avons trouvé

Le Belarus, le Brunei, la Chine, l'Iran, la Libye, la Russie, le Tadjikistan et l'Ouzbékistan pratiquent une censure bidirectionnelle.
L'envoi à deux reprises d 'un paquet PSH+ACK déclenche avec succès la censure au Tadjikistan, tandis que la séquence SYN suivie d'un paquet PSH+ACK est suffisante pour les autres pays.
Le Burundi, la Guinée équatoriale, le Kirghizstan et le Myanmar ne pratiquent pas la censure bidirectionnelle, et nous ne pouvons donc pas les étudier avec cette technique.

Nous sommes en train d'étudier d'autres pays qui ont longtemps été négligés afin de comprendre quels domaines sont censurés, dans quelle mesure les politiques de censure dans un pays donné sont homogènes, comment les politiques de censure diffèrent entre les régions du monde et comment la censure évolue dans le temps.

Si vous souhaitez en savoir plus, lisez notre résumé détaillé et notre article sur notre étude du Turkménistan.

Et restez au courant des développements futurs via notre site web.

Sadia Nourin est étudiante en master d'informatique à l'université du Maryland et chercheuse à Pulse.

Les opinions exprimées par les auteurs de ce blog sont les leurs et ne reflètent pas nécessairement celles de l'Internet Society.

Photo par Bob Shand Via Flickr.

Tags: