Foto de un libro de páginas amarillas abierto||

Las Páginas Amarillas de Internet

Photo of Romain Fontugne
Categorías:

En resumen

  • Las Páginas Amarillas de Internet (PIA) integran más de 50 conjuntos de datos de medición para ayudar a los usuarios a analizar las topologías de Internet.
  • Disponer de todos estos conjuntos de datos en un solo lugar resulta práctico para realizar estudios a gran escala sobre la magnitud del uso de las mejores prácticas actuales, como la seguridad de las rutas.
  • El AIP es un proyecto de código abierto.

Comprender cómo está funcionando Internet requiere habilidad para cotejar y analizar datos procedentes de múltiples fuentes. Pulse es un proyecto que está contribuyendo a ello al ofrecer una visión general de la accesibilidad, evolución y resistencia de Internet. Para quienes deseen profundizar más, presentamos las Páginas Amarillas de Internet (PIA).

En pocas palabras, el AIP integra más de 50 conjuntos de datos para proporcionar una base de datos unificada que permita estudiar Internet.

La figura 1 representa un extracto del AIP que muestra cómo se puede acceder al sitio web isoc.org (nodo verde de la izquierda) a través de cuatro direcciones IP (nodos rosas) que forman parte de dos prefijos (nodos azules). Ambos tienen su origen en AS13335 (nodo rojo), la red de distribución de contenidos (CDN) Cloudflare (nodo naranja). Además, los prefijos están clasificados como Internet Routing Registry (IRR) Valid, Resource Public Key Infrastructure (RPKI) Valid y RPKI para indicar la resistencia de seguridad de enrutamiento de cada ruta.

Infografía que muestra la ruta del sitio web isoc.org
Figura 1 - Ejemplo que muestra cómo se modelan los datos en el AIP. El nodo verde representa el nombre de host "isoc.org", los nodos rosas son direcciones IP, los nodos azules son prefijos IP, los nodos marrones son etiquetas, el nodo rojo es un sistema autónomo (SA) y el nodo naranja es el nombre del SA.

Este ejemplo combina datos de seis organizaciones: OpenINTEL para la resolución del sistema de nombres de dominio (DNS); BGP.Tools para la etiqueta 'Anycast'; Internet Health Report (IHR) para los estados IRR y RPKI; BGPKIT para los datos del protocolo de pasarela fronteriza (BGP); RIPE NCC para los datos RPKI; y PeeringDB para el nombre del AS.

Más información sobre el trabajo de la Internet Society para asegurar el enrutamiento global

Puede reproducir este gráfico usted mismo utilizando la siguiente consulta:

MATCH p0 = (:HostName {name:'isoc.org'})-[:RESOLVES_TO]-(:IP)-[:PART_OF]-(pfx:Prefix)-[:ORIGINATE]-(orig:AS)-[:NAME {reference_org:'PeeringDB'}]-(:Name)

OPTIONAL MATCH p1 = (pfx)-[:CATEGORIZED]-(:Tag)

OPTIONAL MATCH p2 = (orig)-[:CATEGORIZED]-(:Tag {label:'Content Delivery Network'})

RETURN p0, p1, p2

Disponer de todos estos conjuntos de datos en un solo lugar también resulta práctico para realizar estudios a gran escala. Por ejemplo, en lugar de examinar un único nombre de host, podemos ampliar el ejemplo anterior examinando los 1M de nombres de host más populares de Tranco y contando cuántos de ellos corresponden a prefijos registrados en RPKI.

Spoiler alert: el 80% de los 1M de nombres de host más populares están cubiertos por RPKI gracias a que las CDN siguen las mejores prácticas de enrutamiento.(Más información)

Una ventaja de obtener estos resultados con el AIP es que pueden compartirse y reproducirse fácilmente. Por ejemplo, puede ejecutar la consulta anterior o reproducir el resultado RPKI mencionado anteriormente ejecutando las consultas compartidas en este cuaderno. Por lo tanto, cualquiera que disponga de consultas puede producir los resultados y actualizarlos utilizando datos frescos del AIP. También ilustramos esto en un blog de APNIC en el que analizamos la topología de Internet en Japón y compartimos la consulta para cada resultado.

Primeros pasos con el AIP

La forma más sencilla de consultar la base de datos del AIP es visitar el sitio web del RSI. Puede buscar un recurso de Internet (por ejemplo, AS, prefijo, nombre de dominio) y obtener los datos del AIP relacionados con ese recurso. 

La figura 2 ilustra la vista de 'enrutamiento' para la red de la Iniciativa Internet de Japón (por ejemplo, los AS conectados y los prefijos anunciados). Todas las demás vistas (excepto la de 'supervisión') proporcionan datos del AIP a través de diferentes widgets.

Captura de pantalla del sitio web del Informe sobre la salud en Internet que muestra los datos de enrutamiento para AS2497
Figura 2 - Datos de enrutamiento del AIP para AS2497. La página web del RSI es la forma más sencilla de consultar el AIP.

Encontrará las siguientes pestañas para cada widget:

  • La pestaña Gráfico muestra una representación visual de los datos.
  • La pestaña Datos ofrece los datos brutos en un formato de tabla que puede descargar para su posterior análisis. 
  • La pestaña Cypher Query le ofrece la consulta exacta que utilizamos para extraer los datos del AIP. Puede reutilizarla para consultar directamente la base de datos de AIP o elaborar sus propias consultas.
  • La pestaña Metadatos ofrece enlaces a los conjuntos de datos originales y la frescura de los datos. 

Consultar directamente el AIP permite a los usuarios ir más allá de las simples búsquedas. Sin embargo, la curva de aprendizaje es bastante pronunciada. Recomendamos a los lectores interesados que aprendan primero los fundamentos del lenguaje Cypher y después la documentación y los ejemplos de AIP que se ofrecen en la galería de AIP. Por último, para sacar el máximo partido a AIP, puede descargar y ejecutar la base de datos localmente, lo que constituye una buena forma de integrar y analizar sus propios datos en AIP.

Para más detalles sobre este trabajo, consulte nuestro artículo de investigación publicado en las actas de ACM IMC'24. También puede ponerse en contacto con nosotros en GitHub. El AIP es un proyecto de código abierto; ¡los comentarios y contribuciones son muy bienvenidos!

Romain Fontugne es director adjunto del Laboratorio de Investigación del IIJ (Japón) y se dedica a las mediciones de Internet, el análisis del tráfico y la seguridad de las redes.

Las opiniones expresadas por los autores de este blog son suyas y no reflejan necesariamente los puntos de vista de la Internet Society.


Foto de Katie, Vía Flickr