合作伙伴的网站抓取要求

作为合作伙伴,您可能需要采取某些步骤,例如配置 User-Agent 标识,以确保 impact.com 监督合规的爬虫能够以编程方式访问并从您的网站检索数据,且不会中断并具有适当的授权。本指南主要面向负责管理网站访问和安全设置的开发人员、IT 管理员和技术团队。

如何允许 impact.com 的监督合规 Bot

作为合作伙伴,impact.com 的监督合规 Bot 可能会监控您网站上的内容,以确保特定内容与您与品牌的协议一致。每个被监控的项目都需要单独访问您网站,因此包含大量被监控内容的网站将相应收到更多请求。

如果限制了 impact.com 的监督合规 Bot(例如返回 HTTP 429 – 请求过多或 HTTP 403 – 禁止),我们可能无法审查和验证您的内容,这可能会影响合规可见性。

为确保监控不间断:

  • 使用提供的 User-Agent 将 impact.com 监督合规 Bot 列入允许名单。

  • 避免阻止或限制来自 impact.com 监督合规 Bot 的合法请求。

  • 使用请求头中包含的签名验证 impact.com 监督合规 Bot,以确认真实性并防止伪造。

  • 通过允许并验证 impact.com 监督合规 Bot,您可确保您的内容被准确审查并反映在 impact.com 系统中。

User-Agent 标识

我们的爬虫使用自定义 User-Agent 在网络请求中标识自己。这使您作为合作伙伴能够将 impact.com 的合规流量与其他机器人和爬虫区分开来。

用于列入允许名单的 User-Agent 字符串(请按显示内容精确使用):

Mozilla/5.0 (compatible;Impact.com Agent) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.0.0 Safari/537.36

验证 impact.com 爬虫请求

为确认传入流量来自 impact.com 爬虫,每个请求都包含一个自定义的 HMAC 签名头:

X-Impact-Crawler-Signature: <hmac signature>

该签名允许您使用已知的密钥和共享算法对请求进行身份验证。它确保请求来自 impact.com 且未被篡改。

chevron-right签名构造hashtag

签名构造

我们使用以下流程计算签名:

  • 密钥: /impact/crawler/signature/

  • 要签名的数据: User-Agent

  • HMAC 算法: HMAC-SHA256

  • 签名输出: 十六进制字符串

chevron-right如何验证(伪代码)hashtag
circle-exclamation

用于监管合规监控的 IP 列入允许名单

为支持持续的监督合规监控,请将以下 IP 地址范围列入允许名单。这可确保来自 impact.com 的流量不会被意外阻止,从而使站点监控得以继续进行而不被中断。

允许以下 IP 范围:

  • 163.116.128.0/17

  • 162.10.0.0/17

  • 31.186.239.0/24

  • 8.39.144.0/24

  • 8.36.116.0/24

  • 34.145.188.137

  • 35.245.212.57

  • 34.21.56.213

  • 34.48.90.233

  • 35.245.229.167

  • 34.150.151.151

  • 35.245.185.65

  • 35.188.242.212

  • 34.86.33.122

  • 34.145.224.193

  • 35.245.135.218

  • 35.221.1.178

  • 34.150.217.77

我们建议更新您的防火墙或访问控制列表,以允许来自以下 impact.com IP 地址范围的传入流量。

circle-info

建议: 如需就监督合规监控和机器人访问进行技术协调或咨询问题, 联系支持arrow-up-right.

最后更新于

这有帮助吗?