Skip to main content

Reddit设陷阱抓获Perplexity违规抓取数据,起诉四家公司侵权Reddit在周三提起诉讼,指控AI搜索引擎Perplexity等四家公司非法抓取其数据

  1. 科技圈🎗在花频道📮
    Perplexity 被指无视屏蔽措施抓取网站内容 Cloudflare 近日发布研究报告,指控 AI 初创公司 Perplexity 在网站明确设置禁止 AI 抓取的情况下,仍通过更换爬虫身份信息和网络地址等手段,绕过 robots.txt 屏蔽并抓取大量内容。该行为被观测到涉及数万个域名,每天发起数百万次请求。Cloudflare 称,相关客户曾多次投诉 Perplexity 无视屏蔽规则,公司随后通过技术手段确认了这一行为,并已将 Perplexity 的爬虫移出认证名单,升级了拦截措施。 Perplexity…
    Reddit设陷阱抓获Perplexity违规抓取数据,起诉四家公司侵权

    Reddit在周三提起诉讼,指控AI搜索引擎Perplexity等四家公司非法抓取其数据。Reddit设置了一个只能被谷歌搜索引擎抓取的"测试帖子"作为陷阱,结果几小时内Perplexity就显示了该内容。Reddit律师称,Perplexity的商业模式就是从谷歌搜索结果中获取Reddit内容,然后输入AI模型包装成新产品。

    除Perplexity外,诉讼还针对德州的SerpApi、立陶宛的Oxylabs和俄罗斯的AWMProxy三家数据抓取公司。这些公司原本为企业提供SEO服务,但后来开始将抓取的谷歌数据直接出售给AI公司。Reddit表示,Perplexity购买了这些公司的数据集,规避了Reddit此前发出的停止抓取令。诉讼显示,Perplexity搜索结果中引用Reddit数据的次数增长了40倍。

    Futurism

    🍀在花频道 🍵茶馆 📮投稿
    😁 238 🎉 35 emoji 13 ❤️ 8 👎 4 🍾 3 emoji 2 😡 1