Skip to main content

Perplexity 被指无视屏蔽措施抓取网站内容Cloudflare 近日发布研究报告,指控 AI 初创公司 Perplexity 在网站明确设置禁止 AI 抓取的情况下,仍通过更换爬虫身份信息和网络地址等手段,绕过 robots.txt 屏蔽并抓取大量内容

  1. Perplexity 被指无视屏蔽措施抓取网站内容

    Cloudflare 近日发布研究报告,指控 AI 初创公司 Perplexity 在网站明确设置禁止 AI 抓取的情况下,仍通过更换爬虫身份信息和网络地址等手段,绕过 robots.txt 屏蔽并抓取大量内容。该行为被观测到涉及数万个域名,每天发起数百万次请求。Cloudflare 称,相关客户曾多次投诉 Perplexity 无视屏蔽规则,公司随后通过技术手段确认了这一行为,并已将 Perplexity 的爬虫移出认证名单,升级了拦截措施。

    Perplexity 发言人否认相关指控,称 Cloudflare 的报告为“推销行为”,并质疑报告中的证据。此前,媒体也曾指 Perplexity 未经授权抓取内容并涉嫌抄袭。Cloudflare 近期还推出工具和市场,帮助网站所有者对 AI 抓取行为收费或直接阻止。

    TechCrunch

    🍀频道 🍵茶馆 📮投稿
    👎 124 😁 56 ❤️ 9 👍 6 emoji 5 🔥 3