For the complete documentation index, see llms.txt. This page is also available as Markdown.

Governance della scansione del sito web: spiegazione di ImpactCINDAgent

Questo articolo spiega come identificare, verificare e controllare ImpactCINDAgent.

ImpactCINDAgent è un web crawler gestito da impact.com e utilizzato per verificare che le pagine sui siti dei partner e dei brand usino correttamente il tracciamento di impact.com e siano conformi agli accordi con i brand.

Se il tuo sito partecipa a un programma di partnership di impact.com, ImpactCINDAgent recupera periodicamente le pagine per:

  • Verificare il tracciamento: Assicurarsi che i link e i tag di tracciamento siano installati correttamente e funzionino.

  • Verificare la conformità: Controllare che il contenuto della pagina sia coerente con gli accordi pubblicati sulla sicurezza del brand e sulla conformità.

  • Segnalare: Estrarre metadati non personali (titoli, URL canonici, immagini dei prodotti, SKU) per alimentare i report per i partner.

  • Scoprire: Eseguire crawl più ampi per individuare contenuti che promuovono brand iscritti a impact.com su domini non ancora registrati nella piattaforma.

Identificare ImpactCINDAgent

ImpactCINDAgent si identifica tramite una specifica stringa User-Agent.

Stringa User-Agent completa: Mozilla/5.0 (compatible; ImpactCINDAgent) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.0.0 Safari/537.36

Verificare una richiesta

Se devi confermare che una richiesta provenga effettivamente da impact.com (e non sia uno User-Agent falsificato), usa uno dei seguenti metodi, elencati dal meno al più autorevole:

Metodo 1: verifica dell'intervallo IP (alta affidabilità)

Conferma che l'IP sorgente della richiesta rientri in questi intervalli controllati da impact.com:

Intervalli CIDR:

  • 163.116.128.0/17

  • 162.10.0.0/17

  • 31.186.239.0/24

  • 8.39.144.0/24

  • 8.36.116.0/24

Indirizzi individuali: 34.145.188.137, 35.245.212.57, 34.21.56.213, 34.48.90.233, 35.245.229.167, 34.150.151.151, 35.245.185.65, 35.188.242.212, 34.86.33.122, 34.145.224.193, 35.245.135.218, 35.221.1.178, 34.150.217.77, 107.175.80.80, 162.212.175.22, 107.172.69.119

Metodo 2: verifica della firma (massima affidabilità)

Ogni richiesta proveniente da ImpactCINDAgent è firmata crittograficamente (in base a RFC 9421). Puoi verificare le firme rispetto alla nostra directory delle chiavi pubbliche. Questa implementazione è eseguita sulla specifica web-bot-auth che si basa sulla RFC 9421 specifica.

Comportamento previsto:

  • Navigazione headless: ImpactCINDAgent usa un browser headless reale. Esegue una GET request, rende la pagina, esegue JavaScript e recupera le sotto-risorse (CSS/JS) per vedere la pagina esattamente come farebbe un utente.

  • Screenshot: Può acquisire uno screenshot per la revisione interna della conformità. Questi non sono mai pubblici.

  • Reindirizzamenti: Segue i reindirizzamenti, anche tra origini diverse.

  • Nessuna azione distruttiva: Non invia moduli, non aggira CAPTCHA/paywall e non esegue POST/DELETE richieste.

Controllare l'accesso

ImpactCINDAgent rispetta le direttive di robots.txt indirizzate specificamente a ImpactCINDAgent o il carattere jolly *.

Bloccare completamente

Impostare un tasso di crawl

Se il crawler sta influenzando le prestazioni del tuo sito, usa la direttiva Crawl-delay .

Limiti di velocità e back-off

ImpactCINDAgent riduce automaticamente la frequenza delle richieste se il tuo server restituisce:

  • HTTP 429 (Troppe richieste)

  • HTTP 503 (Servizio non disponibile)

  • Rispetta anche l'header Retry-After se fornito.

Ultimo aggiornamento

È stato utile?