Perplexity AI 被指控秘密抓取被禁止的网站内容-低调大师

Perplexity AI 被指控秘密抓取被禁止的网站内容

2025-08-05 193

根据互联网基础设施提供商 Cloudflare 的最新研究报告，人工智能初创公司 Perplexity 被指控在抓取网站内容时忽视了明确的阻止指令。Cloudflare 表示，他们观察到 Perplexity 在尝试抓取网页时隐藏了自己的身份，以此规避网站的偏好设置。

Perplexity 等人工智能产品通常依赖于从互联网收集大量数据，而这些初创公司长期以来在未获得许可的情况下抓取文本、图像和视频，以便支持其产品的正常运作。近年来，许多网站通过使用标准的 Robots.txt 文件来应对这一问题，该文件指示搜索引擎和 AI 公司哪些页面可以被索引，哪些页面不可以。然而，当前这些努力的成效并不显著。

根据 Cloudflare 的分析，Perplexity 似乎通过更改其机器人的 “用户代理” 来绕过这些限制。“用户代理” 是指用于识别网站访问者的设备和版本类型的信号。Cloudflare 还提到，Perplexity 更改了其自治系统网络（ASN），这是一个识别互联网上大型网络的数字标识。Cloudflare 在数万个域名和数百万个请求中观察到了这一行为，凭借机器学习和网络信号的结合成功识别了这一爬虫。

Perplexity 的发言人 Jesse Dwyer 对 Cloudflare 的指控表示反驳，并称其博客文章为 “推销”。他补充称，文中截图显示并没有访问内容。他进一步声称，Cloudflare 所提到的爬虫并非其所拥有的。Cloudflare 表示，他们最初注意到这些问题是由于客户投诉 Perplexity 仍在抓取其网站内容，尽管这些网站已通过 Robots 文件阻止了该爬虫的访问。

Cloudflare 的分析表明，Perplexity 不仅使用了其声明的用户代理，还在其被阻止时利用一个模拟 Google Chrome 的通用浏览器。最终，Cloudflare 决定将 Perplexity 的爬虫从其验证列表中移除，并采取新的技术来阻止其活动。

值得注意的是，Cloudflare 最近对人工智能爬虫表示反对，并推出了一个市场，允许网站所有者向访问其网站的 AI 爬虫收费。Cloudflare 的首席执行官马修・普林斯曾警告称，人工智能正在破坏互联网的商业模式，尤其是出版商的盈利模式。这并非 Perplexity 第一次面临未经授权抓取的指控，早在去年，《连线》杂志等媒体就曾指控 Perplexity 抄袭其内容。

微信关注我们

原文链接：https://www.oschina.net/news/364217

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

“香山”实现业界首个开源芯片的产品级交付与首次规模化应用

开源高性能RISC-V处理器核“香山”产业落地取得里程碑式突破。7月16-19日，在上海举办的2025 RISC-V中国峰会期间，北京开源芯片研究院（以下简称开芯院）在大会报告中宣布第三代“香山”（昆明湖）IP核已实现了首批量产客户的产品级交付。7月26-28日，世界人工智能大会期间，集成了第二代“香山”（南湖）IP核的某国产量产GPGPU芯片正式亮相，基于该芯片的智能加速卡出货量已上万——“香山”（南湖）IP核实现规模化应用。香山IP核在业界首次实现了产品级交付与规模化应用，标志着开源高性能处理器IP核正式进入产业落地阶段，为RISC-V产业技术研发、商业落地开辟了一条不同于传统ARM模式、基于开源模式的新路径。香山IP核的首次产品级交付与规模化应用，就如1990年代中期开源操作系统Linux首次在企业中部署应用，具有重要的里程碑意义，必将产生深远影响。开源高性能RISC-V处理器核第二代“香山”（南湖）已实现首次规模化应用开源高性能RISC-V处理器核“香山”，源于中国科学院在2019年的前瞻布局。中国科学院计算技术研究所（以下简称计算所）于2021年6月成功研制了第一...

2025-08-05

199

KiCad EDA 是一款开源的电子设计自动化（EDA）软件，基于 GPLv3 开源协议，最初由法国人 Jean-Pierre Charras 于 1992 年推出，现由 KiCad 开源社区维护。 KiCad 提供了一个完整的设计流程，从原理图到 PCB 布局，以及 3D 模型和 BOM 生成。KiCad支持多种文件格式，可以与其他EDA软件兼容，并且可以在多种操作系统上运行，包括 Windows，Linux 和 Mac OS X，软件包含工程项目管理、原理图设计、线路板绘制、符号库设计、封装库设计、线路板 3D 显示、Gerber 查看、线路板实用计算等工具。 KiCad EDA 官网：https://www.kicad.org/ KiCad EDA 开源中国https://gitee.com/kicad-eda

2025-08-05

153

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。