Escáner de seguridad SiteGuardian
Documentación técnica para operadores de sitios web y administradores de WAF
¿Qué es SiteGuardian?
SiteGuardian es un servicio automatizado de monitorización de seguridad y cumplimiento de sitios web con sede en la UE. Nuestro escáner comprueba en los sitios web las cabeceras de seguridad, la configuración SSL/TLS, la seguridad DNS, la accesibilidad (WCAG 2.2), el cumplimiento de cookies (RGPD/ePrivacy) y el rendimiento.
Operamos dos tipos de escaneos:
- Monitorización de clientes — Sitios web registrados por nuestros clientes para monitorización continua (uptime cada 60 segundos, comprobaciones profundas cada hora).
- EU Security Benchmark — Análisis anonimizado de la postura de seguridad en más de 15.000 sitios web de la UE para benchmarking sectorial (escaneos semanales).
Cadenas User-Agent
SiteGuardian/1.4 (+https://siteguardian.io/bot; EU compliance & uptime monitoring)
Si ves este User-Agent en los logs de tu servidor, significa que tu sitio está siendo escaneado por SiteGuardian — bien por monitorización de cliente o como parte de nuestro EU Security Benchmark.
Direcciones IP
Todos los escaneos del lado del servidor se originan desde las siguientes direcciones IP. Los escaneos basados en navegador pueden originarse desde IPs residenciales.
Escáner de servidor (Hetzner, Alemania)
Nota: Las direcciones IP pueden cambiar. Recomendamos verificar la cadena User-Agent en combinación con la IP para el whitelisting. Esta página siempre muestra las IPs actuales.
Lista de IPs legible por máquina: /bot/ips.json
¿Qué comprueba el escáner?
Cabeceras de seguridad
HSTS, CSP, X-Frame-Options, Referrer-Policy, Permissions-Policy, CORS
SSL/TLS
Validez del certificado, versión TLS, suites de cifrado, precarga HSTS
Seguridad DNS
DNSSEC, CAA, DANE/TLSA, MTA-STS, TLS-RPT, BIMI
Seguridad del correo
SPF, DKIM, DMARC, SMTP STARTTLS
Accesibilidad
WCAG 2.2 AA (axe-core), EAA / EN 301 549
Cumplimiento de cookies
Transferencias de datos pre-consentimiento, detección CMP, RGPD Art. 6/7
Comportamiento de las peticiones
- El escáner de servidor envía únicamente peticiones GET y HEAD
- El escáner de navegador carga las páginas normalmente (GET) — sin envíos de formularios ni peticiones POST
- Máximo 2 peticiones por minuto por dominio (escáner de servidor)
- Los escaneos del benchmark se ejecutan semanalmente — no es crawling en tiempo real
- El escáner respeta robots.txt para el user agent SiteGuardian
- Todos los datos se procesan en la UE (Hetzner, Alemania)
- No se almacena ni redistribuye contenido — solo metadatos de seguridad
Configuración del WAF
Si tu Web Application Firewall bloquea SiteGuardian, puedes poner nuestro escáner en la lista blanca. Recomendamos combinar User-Agent y dirección IP para mayor seguridad.
Cloudflare
- Ve a Security → WAF → Custom Rules
- Crea una nueva regla:
# Nombre de la regla: Allow SiteGuardian(http.user_agent contains "SiteGuardian")# Acción: Skip
- Para mayor seguridad, combina con verificación de IP:
(http.user_agent contains "SiteGuardian"
and ip.src in { 136.243.129.238 2a01:4f8:212:318f::2 })
AWS WAF
- Crea un IP Set con las IPs de SiteGuardian
- Crea un grupo de reglas con:
- Condición de coincidencia de cadena:
User-Agent contains "SiteGuardian" - Condición de IP set: coincide con el IP Set de SiteGuardian
- Condición de coincidencia de cadena:
- Añádelo a tu Web ACL con la acción Allow
nginx / Apache
robots.txt
Nuestro escáner de servidor respeta robots.txt. Para permitir SiteGuardian:
Allow: /
Para bloquear:
Disallow: /
Nota: Las comprobaciones de monitorización de clientes (uptime, expiración SSL) no respetan robots.txt, ya que las configura explícitamente el propietario del sitio. Solo los escaneos del benchmark respetan robots.txt.
Tratamiento de datos
- SiteGuardian se opera desde Alemania y procesa todos los datos dentro de la UE.
- No almacenamos el contenido de las páginas — solo metadatos técnicos (cabeceras, registros DNS, puntuaciones).
- Los datos del benchmark están anonimizados y agregados por sector y país.
- Los resultados de escaneos individuales nunca se comparten públicamente.
Contacto
Preguntas, dudas o problemas de whitelisting:
- Correo electrónico: bot@siteguardian.io
- Abuso: abuse@siteguardian.io
- Sitio web: siteguardian.io
Operador
GÜNTER WEBER
MOMMENHEIMER STRASSE 48
55129 MAINZ
Alemania