Scanner de Segurança SiteGuardian
Documentação técnica para operadores de websites e administradores de WAF
O que é o SiteGuardian?
O SiteGuardian é um serviço automatizado de monitorização de segurança e conformidade de websites, sediado na UE. O nosso scanner verifica websites quanto a cabeçalhos de segurança, configuração SSL/TLS, segurança DNS, acessibilidade (WCAG 2.2), conformidade de cookies (RGPD/ePrivacy) e desempenho.
Operamos dois tipos de scans:
- Monitorização de clientes — Websites registados pelos nossos clientes para monitorização contínua (disponibilidade a cada 60 segundos, verificações aprofundadas de hora a hora).
- Benchmark de Segurança UE — Análise anónima da postura de segurança em mais de 15 000 websites da UE para benchmarking da indústria (scans semanais).
Strings User-Agent
SiteGuardian/1.4 (+https://siteguardian.io/bot; EU compliance & uptime monitoring)
Se vir este User-Agent nos registos do seu servidor, significa que o seu website está a ser analisado pelo SiteGuardian — seja através de monitorização de clientes ou como parte do nosso Benchmark de Segurança UE.
Endereços IP
Todos os scans do lado do servidor têm origem nos seguintes endereços IP. Os scans baseados em navegador podem ter origem em IPs residenciais.
Scanner de servidor (Hetzner, Alemanha)
Nota: Os endereços IP podem mudar. Recomendamos verificar a string User-Agent em combinação com o IP para fins de allowlist. Esta página mostra sempre os IPs atuais.
Lista de IPs legível por máquina: /bot/ips.json
O que é que o scanner verifica?
Cabeçalhos de segurança
HSTS, CSP, X-Frame-Options, Referrer-Policy, Permissions-Policy, CORS
SSL/TLS
Validade do certificado, versão TLS, suites de cifras, HSTS preload
Segurança DNS
DNSSEC, CAA, DANE/TLSA, MTA-STS, TLS-RPT, BIMI
Segurança do email
SPF, DKIM, DMARC, SMTP STARTTLS
Acessibilidade
WCAG 2.2 AA (axe-core), EAA / EN 301 549
Conformidade de Cookies
Transferências de dados pré-consentimento, deteção de CMP, RGPD Art. 6.º/7.º
Comportamento de pedidos
- O scanner de servidor envia apenas pedidos GET e HEAD
- O scanner de navegador carrega páginas normalmente (GET) — sem submissões de formulário, sem pedidos POST
- Máximo de 2 pedidos por minuto por domínio (scanner de servidor)
- Os scans de benchmark correm semanalmente — não é crawling em tempo real
- O scanner respeita o robots.txt para o user agent SiteGuardian
- Todos os dados são processados na UE (Hetzner, Alemanha)
- Nenhum conteúdo é armazenado ou redistribuído — apenas metadados de segurança
Configuração WAF
Se a sua Web Application Firewall bloquear o SiteGuardian, pode colocar o nosso scanner na allowlist. Recomendamos corresponder tanto o User-Agent como o endereço IP por motivos de segurança.
Cloudflare
- Aceder a Security → WAF → Custom Rules
- Criar uma nova regra:
# Nome da regra: Allow SiteGuardian(http.user_agent contains "SiteGuardian")# Ação: Skip
- Para maior segurança, combine com verificação de IP:
(http.user_agent contains "SiteGuardian"
and ip.src in { 136.243.129.238 2a01:4f8:212:318f::2 })
AWS WAF
- Criar um IP Set com os IPs do SiteGuardian
- Criar um Rule Group com:
- Condição de correspondência de string:
User-Agent contains "SiteGuardian" - Condição de IP set: corresponde ao IP Set do SiteGuardian
- Condição de correspondência de string:
- Adicionar à sua Web ACL com a ação Allow
nginx / Apache
robots.txt
O nosso scanner de servidor respeita o robots.txt. Para permitir o SiteGuardian:
Allow: /
Para bloquear:
Disallow: /
Nota: As verificações de monitorização de clientes (disponibilidade, expiração SSL) não respeitam o robots.txt, uma vez que são explicitamente configuradas pelo proprietário do website. Apenas os scans de benchmark respeitam o robots.txt.
Tratamento de dados
- O SiteGuardian é operado a partir da Alemanha e processa todos os dados dentro da UE.
- Não armazenamos o conteúdo das páginas — apenas metadados técnicos (cabeçalhos, registos DNS, pontuações).
- Os dados de benchmark são anonimizados e agregados por indústria e país.
- Os resultados individuais dos scans nunca são partilhados publicamente.
Contacto
Questões, preocupações ou problemas de allowlist:
- Email: bot@siteguardian.io
- Abuso: abuse@siteguardian.io
- Website: siteguardian.io
Operador
GÜNTER WEBER
MOMMENHEIMER STRASSE 48
55129 MAINZ
Alemanha