联网能力,让 LLM Chat 成为轻易突破的入侵入口
大模型生成内容,这个“生态”里,接下来必定会发生世界级安全事故,就看具体类型是普通人轻易中招导致重大损失,还是技术人大意中招,又或者是大模型应用的 WorkFlow 上自动化中中招了。
这断言基于 4 个核心要点:
1、当前大模型生成内容的无法一眼/亿眼丁真性,并且短期内还是无解的。
2、大模型训练语料的清洗问题。对于内容准确性还无法做到多么牛皮。
3、【特别是 AI Chat 联网能力,带来了严重的隐患,这搜索引擎相当于一个轻易突破的入侵入口】。
4、生成内容没有评论交互环境。这是与传统内容生成产品(UGC、PGC)最大的,但又是完全不必要的区别点。
假如大模型直接返回了这种命令,阁下又该如何应对?
已经实测过,在网站发布了内容,被搜索引擎抓去,可以【快速地】进入大模型生成内容里。当然被索引进来生成的权重问题是另一个研究话题了。就算 Gemini 有核验功能,也只能索源,增加了一点置信度而已,但本质问题还存在。
www.oschina.net 这个 WizMap 的页面信息我看它是上午 10 点多更新的,中午的时候我这个跟 Gemini 的问答就已经把它的信息抓过来生成给我了。
怎么解?
1、技术上演进,当然包括各方面,幻觉问题、理解大模型内部 DNA/逻辑等。
2、垂直领域专业化,比如限定范围、人工。
3、联“网”限定,谁说这个网一定得是搜索引擎这种,换个思路,联一个指定的可控 RAG 之类的“内容数据库”即可。这部分本质也是上边第 2 点“限定范围”的一种具体处理。
4、产品形态上去处理其实更好做:AI Chat 产品上增加【生成内容评论交互环境】,内容的本质上是做 UGC、PUC 整合,整体是“社区化”。对比一下就很明显了:为何像知乎那么多抖机灵回答,我们不会太在意前边讲的这种安全问题,sudo rm -rf / 这种回答知乎上不是没有,而是有评论环境“指正”,给了一些“容错率”,而这也是在 AI Chat 之前的现状,该怎么样还是怎么样,AI Chat 在这方面做到这一步已经足够理想了先,别奢求一步把这种“传统问题”都解决了。(直接搞得定那当然更好啊😆)
5、产品上,Gemini 的核验功能,实际上是一种不错的辅助,但不足够,需要更多策略来进行“辅助”,包括更直接的索引针对源内容的“评价”(也就是前边说的评论交互的信息)、包括索引时需要“官方信息”权重更高之类的更严格的一套权重算法。
6、产品上,对于可直接复制去运行这样的生成内容,配套严格的测试环境之类的能力。
特别是【生成内容评论交互环境】这个产品形态,目前似乎没有人在集成去做。包括原有的问答产品,本身已经是社区化了的,本身是最好去做出 AI Chat 产品差异化的,本身是最好去做好这个一眼/亿眼丁真问题的。这是最令人失望的。。。但其实这样“庞大”的“内容社区化”,其实也不好做,还是要基于“限定范围”这个方向。
另一个断言:类似 SQL 注入、XSS 这样专门的针对前边提到的利用大模型联网“漏洞”的攻防体系会诞生。这一套攻防的核心点:
搜索引擎抓取权重研究,包括平台本身权重的利用、攻击内容(兼顾问与答)资源稀缺性研究等。
一旦大模型联网索引本身采用另一套权重算法,那么需要新的研究。
一旦 AI Chat 产品采用“社区化”,产品形态增加了评论交互能力,那么攻防研究重点也将增加到“AI 评论”本身这个大方向。而其实,这个方向已经在不断发生。。。一言难尽:
这么一绕,总体来说,产品形态去整合 AIGC 与 UGC、PGC,做生成内容评论交互环境还是有一些问题要处理。但既然 Stack Overflow 有能力去“辨别” AI Chat 生成的内容,那么这条路还是可以走。当然,不要把希望【全】押在“有能力辨别 AIGC 的内容”,这本身不很光明。
一通逼逼之后,发现现成的就有一个案例,但比较小,还达不到我所谓的“世界级”:一家名为 Reworkd 的初创公司在尝试商业化过程中,通过使用 ChatGPT 生成的代码进行项目迁移,导致服务因为代码错误无法正常订阅,造成超过 1 万美元的损失和服务 5 天的停机。。。UUID 生成逻辑有问题,看出来了吗?

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
李彦宏:智能体是 AI 时代的网站,将形成数百万量级生态
近日,百度创始人、董事长兼首席执行官李彦宏在百度内部分享中表示,智能体是AI时代的网站,将会有几百万、甚至更大量的智能体出现,形成庞大生态。李彦宏分析,智能体就像互联网时代的网站,门槛足够低。 “当时看网站是怎么做出来的?通过浏览器一看源代码,非常简单,稍微改一点,我也可以做出来,今天做智能体跟这个很类似……起个名字,告诉它回答什么、不回答什么,就做成了。”他指出,智能体将会大量出现、形成生态。“未来,在各行各业、各个领域都会依据自己具体的场景,根据自己特有的经验、规则、数据,做出来这些智能体。” “智能体不仅能对话,还具备反思和规划能力,如果说的不对,它能自己想想哪儿错了,它还有规划能力,为了实现目的,能规划要调用什么工具。”李彦宏表示,智能体的这些能力正在逐步完善、门槛也足够低,随着基础大模型能力增强,将诞生更多有价值的应用。 展望未来,李彦宏认为,智能体或许还将具备协作能力。“有些复杂的任务,可以通过多个智能体来完成,就像公司里有CEO,还有财务、技术、销售主管,他们协作起来,能完成一个非常复杂的任务。” 他认为,如果多个智能体能协作来完成复杂任务,这将会对智能体生态的发展形成极...
- 下一篇
美国司法部起诉 Adobe 隐瞒终止费,阻止消费者取消订阅
美国司法部已对 Adobe 提起诉讼,指控 Adobe 在没有充分披露在第一年取消该计划可能要花费数百美元的情况下,向消费者推销"按年付费"套餐服务。使得消费者难以取消订阅,违反了《恢复网上购物者信心法案》(Restore Online Shoppers’ Confidence Act)。 “Adobe 在没有明确披露重要计划条款的情况下,就让消费者加入其默认的、最有利可图的订阅计划,从而损害了消费者的利益。” 2012 年后,Adobe 转向订阅模式,要求消费者按期付费使用公司的热门软件。此后,订阅收入占据了该公司收入的大部分比例。而根据投诉,当消费者通过该公司网站购买订阅时,Adobe 会将消费者推向其“按年付费”订阅计划,并将其预先选择为默认计划。 Adobe 在注册时会突出显示该计划的“每月”费用,但却隐藏了提前终止费 (ETF) 及其金额,即消费者在第一年取消计划时剩余月费的 50%。该公司在网站上以不显眼的小字体形式注明了 ETF 披露信息,或者需要消费者将鼠标悬停在小图标上才能看到披露信息,使其难以发现。导致很多消费者都不知道 ETF 的存在,也不知道"按年付费"计划要求...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Linux系统CentOS6、CentOS7手动修改IP地址
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS6,CentOS7官方镜像安装Oracle11G