大语言模型也会“脑腐” (Brain Rot)
一篇《LLMs CAN GET "BRAIN ROT"!》(大语言模型也会“脑腐”!)的论文,大概意思是推/微博刷多了大模型也会变得更笨、更黑暗。
https://arxiv.org/abs/2510.13928
这篇论文的核心是提出并验证了 “大语言模型脑腐假说”(LLM Brain Rot Hypothesis),就是持续向LLM投喂网络上的“垃圾数据”,会导致其产生持久性的认知能力下降 。
如何定义“垃圾数据”? 他们从真实的Twitter/X语料库中,通过两种方式来定义和构建“垃圾数据”与其对照组 :
1️⃣M1 (Engagement Degree - 互动度指标):将短小但互动量极高(点赞、回复、引用多)的帖子定义为“垃圾”数据 。与之相对,长篇且无人问津的帖子被视为“对照”数据 。这模拟了社交媒体上追求“短平快”和病毒式传播的现象。
2️⃣M2 (Semantic Quality - 语义质量指标):将内容耸人听闻、使用点击诱饵(Clickbait)语言、包含阴谋论或肤浅生活方式的帖子定义为“垃圾”数据 。而内容事实准确、逻辑清晰、有教育价值的被视为“对照”数据 。
他们让四个不同系列和大小的LLM(如Llama3 8B)在这些特制的数据集上进行持续预训练和指令微调,最后在多个基准测试上评估其“认知能力”变化 。
几个结论:
1️⃣认知能力显著下降:经过“垃圾数据”训练的LLM,在推理、长文本理解和安全性方面的表现都出现了明显下滑 。例如,在一项推理任务中,随着垃圾数据比例从0%升到100%,模型得分从74.9分骤降至57.2分 。
2️⃣特别是在M1(高互动度)垃圾数据的投喂下,模型呈现出更高的自恋和心理变态等不良人格特质 。
3️⃣导致模型推理能力下降的首要原因是“思维跳跃” 。模型越来越倾向于省略或直接跳过推理链条,而不是按部就班地思考,从而直接给出错误答案 。
4️⃣用“干净”数据进行后续训练来“治疗”这些脑腐的模型,但发现效果有限 。即使使用了数倍于垃圾数据的干净数据,也无法将其性能完全恢复到基线水平,这表明这种认知损害是“深度内化”的 。
5️⃣帖子的流行度是比内容语义质量更好的“脑腐”效应预测指标 。那些短小精悍、病毒式传播的内容,对AI的负面影响可能比那些明确的“低质量”内容更大 。
来源:https://weibo.com/2194035935/QaaL3i3tW
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
LangChain 获 1.25 亿美元融资,估值飙升至 12.5 亿美元
LangChain 宣布成功融资1.25亿美元,企业估值达到12.5亿美元,资金将用于构建代理工程平台。 并计划发布新功能,加速构建可靠代理,包括 LangChain 和 LangGraph 1.0 版本、全新 Insights Agent 以及无代码代理构建器。本轮融资由 IVP 领投,现有投资者 Sequoia、Benchmark 和 Amplify 以及新投资者 CapitalG 和 Sapphire Ventures 参投。 根据介绍,LangChain 成立于2022年,最初是由机器学习工程师 Harrison Chase创办的一个开源项目。随着 AI 时代的到来,该公司迅速崛起,解决了早期大型语言模型(LLM)应用开发中的一些难题,比如网页搜索、API 调用和数据库交互等。 2023年4月,Chase推出了 LangChain 初创公司,并成功获得了来自 Benchmark 的1000万美元种子轮融资。紧接着,他在一周后又完成了由 Sequoia 领投的2500万美元 A 轮融资,此时 LangChain 的估值已达到2亿美元。 随着先进模型的基础设施不断增加,LangCh...
-
下一篇
诺奖得主莱维特称 AI 时代学历价值下降
在日前于上海举行的2025年可持续全球领导者大会上,诺贝尔化学奖得主、斯坦福大学教授迈克尔·莱维特(Michael Levitt)在接受新浪财经独家对话时,谈到AI与教育的未来,莱维特提出了一个颇具争议的观点:学历将变得越来越不重要。 莱维特教授认为,人工智能正在彻底改变知识的获取方式。“过去,教育是知识的入口;现在,AI让任何人都能获取知识。”他指出,世界上许多科技巨头创始人——比尔·盖茨、扎克伯格、谷歌的拉里·佩奇与谢尔盖·布林——都在大学中途退学。“他们能进入顶尖大学,说明足够聪明;但他们的想法比课堂更重要。” “未来,一个没有大学文凭但会用AI的年轻人,可能比传统意义上的‘名校毕业生’更具竞争力。”AI让知识变得“可说即得”,哪怕一个不识字的人,只要能说话,也能通过AI完成任何事情。这意味着教育特权正在被削弱。 “未来,一个聪明但没上大学的年轻人,与名校毕业生的差距,会越来越小。”
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- MySQL数据库中FOR UPDATE的使用
- Red5直播服务器,属于Java语言的直播服务器
- Mario游戏-低调大师作品
- Docker容器配置,解决镜像无法拉取问题
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程


微信收款码
支付宝收款码