首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/382714

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

谷歌提出嵌套学习(Nested Learning)架构, 解决“灾难性遗忘”问题

据谷歌官方消息,NeurIPS 2025 收录了该公司提出的一项重磅研究,其团队提出 Nested Learning(嵌套学习)新方法,旨在解决机器学习中的 “灾难性遗忘” 问题。 该方法打破模型架构与优化算法分离的传统框架,将模型视为相互关联的多层嵌套优化问题,通过多时间尺度更新和连续内存系统,实现新旧知识的协同保留。 嵌套学习允许大脑的每个组成部分进行多时间尺度的更新,同时表明诸如 Transformer 等众所周知的架构,实际上是具有不同更新频率的线性层。嵌套学习模型中的统一结构与多频率更新机制,与人脑的神经波动与神经可塑性结构十分相似。它使我们能够在人工模型中定义「多时间尺度更新」:每个学习组件可在不同频率下更新参数。通过定义「更新频率」,即每个组件参数被调整的频率,我们可以将这些优化问题组织成有序的层级结构。 作为概念验证的 Hope 架构,基于该方法设计而成,具备自修改能力与无限循环学习层级。 实验表明,Hope 在语言建模、常识推理及长上下文任务中,性能显著优于 Transformer、Mamba2 等现有最优模型。该范式为新一代自改进 AI 提供了坚实基础,有望缩小当前...

AI 生成社交媒体内容易被识别,情感表达仍待提升

来自苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究团队近日发布了一项最新研究,揭示了大语言模型生成的社交媒体帖子在内容识别方面的不足。研究表明,这些 AI 生成的帖子在各大社交平台上容易被人类识别,识别准确率达到70% 至 80%,远高于随机猜测的结果。 研究人员测试了九个不同的大语言模型,包括 Apertus、DeepSeek、Gemma、Llama、Mistral、Qwen 等,分析了它们在 Bluesky、Reddit 和 X 平台上的表现。 结果显示,这些 AI 生成的内容在 “毒性评分” 上具有显著差异,这成为区分 AI 与人类帖子的重要因素。换句话说,如果在某个帖子下出现特别尖锐或搞笑的评论,那么这很可能是人类用户所写。 研究指出,虽然大语言模型可以模仿在线对话的形式,但在捕捉情感表达方面却显得捉襟见肘。自发和富有感情的表达是人类社交互动的特点,而 AI 在这方面的表现远不如人类。此外,研究还发现,在特定情况下,例如在马斯克的 X 平台上发表积极情感或在 Reddit 上讨论政治,AI 模型的表现尤为不佳。 从整体来看,参与测试的 AI 模型在模仿 X 平台的帖子时表...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

用户登录
用户注册