联网能力，让 LLM Chat 成为轻易突破的入侵入口-低调大师

联网能力，让 LLM Chat 成为轻易突破的入侵入口

2024-06-18 378

https://x.com/Kinsgar_L/status/1802605685580144915

大模型生成内容，这个“生态”里，接下来必定会发生世界级安全事故，就看具体类型是普通人轻易中招导致重大损失，还是技术人大意中招，又或者是大模型应用的 WorkFlow 上自动化中中招了。

这断言基于 4 个核心要点：

1、当前大模型生成内容的无法一眼/亿眼丁真性，并且短期内还是无解的。

2、大模型训练语料的清洗问题。对于内容准确性还无法做到多么牛皮。

3、【特别是 AI Chat 联网能力，带来了严重的隐患，这搜索引擎相当于一个轻易突破的入侵入口】。

4、生成内容没有评论交互环境。这是与传统内容生成产品（UGC、PGC）最大的，但又是完全不必要的区别点。

假如大模型直接返回了这种命令，阁下又该如何应对？

已经实测过，在网站发布了内容，被搜索引擎抓去，可以【快速地】进入大模型生成内容里。当然被索引进来生成的权重问题是另一个研究话题了。就算 Gemini 有核验功能，也只能索源，增加了一点置信度而已，但本质问题还存在。

www.oschina.net 这个 WizMap 的页面信息我看它是上午 10 点多更新的，中午的时候我这个跟 Gemini 的问答就已经把它的信息抓过来生成给我了。

怎么解？

1、技术上演进，当然包括各方面，幻觉问题、理解大模型内部 DNA/逻辑等。

2、垂直领域专业化，比如限定范围、人工。

3、联“网”限定，谁说这个网一定得是搜索引擎这种，换个思路，联一个指定的可控 RAG 之类的“内容数据库”即可。这部分本质也是上边第 2 点“限定范围”的一种具体处理。

4、产品形态上去处理其实更好做：AI Chat 产品上增加【生成内容评论交互环境】，内容的本质上是做 UGC、PUC 整合，整体是“社区化”。对比一下就很明显了：为何像知乎那么多抖机灵回答，我们不会太在意前边讲的这种安全问题，sudo rm -rf / 这种回答知乎上不是没有，而是有评论环境“指正”，给了一些“容错率”，而这也是在 AI Chat 之前的现状，该怎么样还是怎么样，AI Chat 在这方面做到这一步已经足够理想了先，别奢求一步把这种“传统问题”都解决了。（直接搞得定那当然更好啊😆）

5、产品上，Gemini 的核验功能，实际上是一种不错的辅助，但不足够，需要更多策略来进行“辅助”，包括更直接的索引针对源内容的“评价”（也就是前边说的评论交互的信息）、包括索引时需要“官方信息”权重更高之类的更严格的一套权重算法。

6、产品上，对于可直接复制去运行这样的生成内容，配套严格的测试环境之类的能力。

特别是【生成内容评论交互环境】这个产品形态，目前似乎没有人在集成去做。包括原有的问答产品，本身已经是社区化了的，本身是最好去做出 AI Chat 产品差异化的，本身是最好去做好这个一眼/亿眼丁真问题的。这是最令人失望的。。。但其实这样“庞大”的“内容社区化”，其实也不好做，还是要基于“限定范围”这个方向。

另一个断言：类似 SQL 注入、XSS 这样专门的针对前边提到的利用大模型联网“漏洞”的攻防体系会诞生。这一套攻防的核心点：

搜索引擎抓取权重研究，包括平台本身权重的利用、攻击内容（兼顾问与答）资源稀缺性研究等。

一旦大模型联网索引本身采用另一套权重算法，那么需要新的研究。

一旦 AI Chat 产品采用“社区化”，产品形态增加了评论交互能力，那么攻防研究重点也将增加到“AI 评论”本身这个大方向。而其实，这个方向已经在不断发生。。。一言难尽：

这么一绕，总体来说，产品形态去整合 AIGC 与 UGC、PGC，做生成内容评论交互环境还是有一些问题要处理。但既然 Stack Overflow 有能力去“辨别” AI Chat 生成的内容，那么这条路还是可以走。当然，不要把希望【全】押在“有能力辨别 AIGC 的内容”，这本身不很光明。

一通逼逼之后，发现现成的就有一个案例，但比较小，还达不到我所谓的“世界级”：一家名为 Reworkd 的初创公司在尝试商业化过程中，通过使用 ChatGPT 生成的代码进行项目迁移，导致服务因为代码错误无法正常订阅，造成超过 1 万美元的损失和服务 5 天的停机。。。UUID 生成逻辑有问题，看出来了吗？

https://www.oschina.net/news/297642

微信关注我们

原文链接：https://www.oschina.net/news/297743/llm-chat-would-be-hacked

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

李彦宏：智能体是 AI 时代的网站，将形成数百万量级生态

近日，百度创始人、董事长兼首席执行官李彦宏在百度内部分享中表示，智能体是AI时代的网站，将会有几百万、甚至更大量的智能体出现，形成庞大生态。李彦宏分析，智能体就像互联网时代的网站，门槛足够低。 “当时看网站是怎么做出来的？通过浏览器一看源代码，非常简单，稍微改一点，我也可以做出来，今天做智能体跟这个很类似……起个名字，告诉它回答什么、不回答什么，就做成了。”他指出，智能体将会大量出现、形成生态。“未来，在各行各业、各个领域都会依据自己具体的场景，根据自己特有的经验、规则、数据，做出来这些智能体。” “智能体不仅能对话，还具备反思和规划能力，如果说的不对，它能自己想想哪儿错了，它还有规划能力，为了实现目的，能规划要调用什么工具。”李彦宏表示，智能体的这些能力正在逐步完善、门槛也足够低，随着基础大模型能力增强，将诞生更多有价值的应用。展望未来，李彦宏认为，智能体或许还将具备协作能力。“有些复杂的任务，可以通过多个智能体来完成，就像公司里有CEO，还有财务、技术、销售主管，他们协作起来，能完成一个非常复杂的任务。” 他认为，如果多个智能体能协作来完成复杂任务，这将会对智能体生态的发展形成极...

2024-06-18

345

美国司法部已对 Adobe 提起诉讼，指控 Adobe 在没有充分披露在第一年取消该计划可能要花费数百美元的情况下，向消费者推销"按年付费"套餐服务。使得消费者难以取消订阅，违反了《恢复网上购物者信心法案》（Restore Online Shoppers’ Confidence Act）。 “Adobe 在没有明确披露重要计划条款的情况下，就让消费者加入其默认的、最有利可图的订阅计划，从而损害了消费者的利益。” 2012 年后，Adobe 转向订阅模式，要求消费者按期付费使用公司的热门软件。此后，订阅收入占据了该公司收入的大部分比例。而根据投诉，当消费者通过该公司网站购买订阅时，Adobe 会将消费者推向其“按年付费”订阅计划，并将其预先选择为默认计划。 Adobe 在注册时会突出显示该计划的“每月”费用，但却隐藏了提前终止费 (ETF) 及其金额，即消费者在第一年取消计划时剩余月费的 50%。该公司在网站上以不显眼的小字体形式注明了 ETF 披露信息，或者需要消费者将鼠标悬停在小图标上才能看到披露信息，使其难以发现。导致很多消费者都不知道 ETF 的存在，也不知道"按年付费"计划要求...

2024-06-18

366

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。