Photo of an open yellow pages book

Las Páginas Amarillas de Internet

Picture of Romain Fontugne
Guest Author | IIJ Research Lab
Categorias:
Twitter logo
LinkedIn logo
Facebook logo
February 11, 2025
En resumen
  • Las Páginas Amarillas de Internet (PIA) integran más de 50 conjuntos de datos de medición para ayudar a los usuarios a analizar las topologías de Internet.
  • Disponer de todos estos conjuntos de datos en un solo lugar es útil para realizar estudios a gran escala sobre la escala de uso de las mejores prácticas actuales, como la seguridad de las rutas.
  • El AIP es un proyecto de código abierto.

Comprender cómo está funcionando Internet requiere habilidad para cotejar y analizar datos de múltiples fuentes. Pulse es un proyecto que está ayudando a hacerlo, proporcionando una visión general de la accesibilidad, evolución y resistencia de Internet. Para quienes deseen profundizar más, presentamos las Páginas Amarillas de Internet (PIA).

En pocas palabras, el AIP integra más de 50 conjuntos de datos para proporcionar una base de datos unificada para estudiar Internet.

La Figura 1 representa un extracto del AIP que muestra cómo se puede acceder al sitio web isoc.org (nodo verde izquierdo) a través de cuatro direcciones IP (nodos rosas) que forman parte de dos prefijos (nodos azules). Ambos proceden de AS13335 (nodo rojo), la red de distribución de contenidos (CDN) Cloudflare (nodo naranja). Además, los prefijos están clasificados como Registro de Enrutamiento de Internet (IRR) Válido, Infraestructura de Clave Pública de Recursos (RPKI) Válido y RPKI para indicar la resistencia de seguridad de enrutamiento de cada ruta.

Infografía que muestra la ruta del sitio web isoc.org
Figura 1 – Ejemplo de cómo se modelan los datos en el AIP. El nodo verde representa el nombre de host “isoc.org”, los nodos rosas son direcciones IP, los nodos azules son prefijos IP, los nodos marrones son etiquetas, el nodo rojo es un sistema autónomo (SA) y el nodo naranja es el nombre del SA.

Este ejemplo combina datos de seis organizaciones: OpenINTEL para la resolución del sistema de nombres de dominio (DNS); BGP.Tools para la etiqueta “Anycast”; Internet Health Report (IHR) para los estados IRR y RPKI; BGPKIT para los datos del protocolo de pasarela fronteriza (BGP); RIPE NCC para los datos RPKI; y PeeringDB para el nombre del AS.

Más información sobre el trabajo de la Internet Society para asegurar el enrutamiento global

Puedes reproducir este gráfico por ti mismo utilizando la siguiente consulta:

MATCH p0 = (:HostName {name:'isoc.org'})-[:RESOLVES_TO]-(:IP)-[:PART_OF]-(pfx:Prefix)-[:ORIGINATE]-(orig:AS)-[:NAME {reference_org:'PeeringDB'}]-(:Name)

OPTIONAL MATCH p1 = (pfx)-[:CATEGORIZED]-(:Tag)

OPTIONAL MATCH p2 = (orig)-[:CATEGORIZED]-(:Tag {label:'Content Delivery Network'})

RETURN p0, p1, p2

Disponer de todos estos conjuntos de datos en un solo lugar también es útil para realizar estudios a gran escala. Por ejemplo, en lugar de examinar un único nombre de host, podemos ampliar el ejemplo anterior examinando el millón de nombres de host más populares de Tranco y contando cuántos de ellos corresponden a prefijos registrados en RPKI.

Spoiler alert: el 80% de los 1M de nombres de host más populares están cubiertos por RPKI gracias a que las CDN siguen las mejores prácticas de enrutamiento.(Más información)

Una ventaja de obtener estos resultados con el AIP es que se pueden compartir y reproducir fácilmente. Por ejemplo, puedes ejecutar la consulta anterior o reproducir el resultado RPKI mencionado anteriormente ejecutando las consultas compartidas en este cuaderno. Por tanto, cualquiera que disponga de consultas puede producir los resultados y actualizarlos utilizando datos frescos de IYP. También ilustramos esto en un blog de APNIC donde analizamos la topología de Internet en Japón y compartimos la consulta para cada resultado.

Primeros pasos con el AIP

La forma más sencilla de consultar la base de datos del AIP es visitar el sitio web del RSI. Puedes buscar un recurso de Internet (por ejemplo, AS, prefijo, nombre de dominio) y obtener los datos del AIP relacionados con ese recurso.

La Figura 2 ilustra la vista de “enrutamiento” para la red de la Iniciativa Internet de Japón (por ejemplo, los AS conectados y los prefijos anunciados). Todas las demás vistas (excepto la de “monitorización”) proporcionan datos del AIP a través de diferentes widgets.

Captura de pantalla del sitio web del Informe sobre la salud en Internet que muestra los datos de enrutamiento para AS2497
Figura 2 – Datos de enrutamiento del AIP para AS2497. El sitio web del RSI es la forma más sencilla de consultar el AIP.

Encontrarás las siguientes pestañas para cada widget:

  • La pestaña Gráfico muestra una representación visual de los datos.
  • La pestaña Datos proporciona los datos brutos en un formato de tabla que puedes descargar para su posterior análisis.
  • La pestaña Consulta Cypher te proporciona la consulta exacta que utilizamos para extraer los datos del AIP. Puedes reutilizarla para consultar directamente la base de datos de AIP o elaborar tus propias consultas.
  • La pestaña Metadatos proporciona enlaces a los conjuntos de datos originales y a la frescura de los datos.

Consultar directamente el AIP permite a los usuarios ir más allá de las simples búsquedas. Sin embargo, la curva de aprendizaje es bastante pronunciada. Recomendamos que los lectores interesados aprendan primero los conceptos básicos del lenguaje Cypher y, a continuación, la documentación y los ejemplos de AIP que se ofrecen en la galería de AIP. Por último, para sacar el máximo partido a AIP, puedes descargar y ejecutar la base de datos localmente, lo que constituye una buena forma de integrar y analizar tus propios datos en AIP.

Para más detalles sobre este trabajo, consulta nuestro artículo de investigación publicado en las actas de ACM IMC’24. También puedes ponerte en contacto con nosotros en GitHub. El AIP es un proyecto de código abierto; ¡los comentarios y contribuciones son muy bienvenidos!

Romain Fontugne es Director Adjunto del Laboratorio de Investigación del IIJ, Japón, y se dedica a las mediciones de Internet, el análisis del tráfico y la seguridad de las redes.


Foto de Katie, Vía Flickr