首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/385644

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

沈向洋:五个维度思考智能演进 机会不仅来自技术本身

在2025 IDEA大会上,IDEA研究院创院理事长、美国国家工程院外籍院士沈向洋用五个维度梳理了智能演进的脉络:算法范式、智能载体、交互范式、计算架构与数据。 他表示,相比给出一个技术路径路线图,他更希望提出一个“识别机会”的思考框架,帮助创新者在智能演进中找到技术、产品与商业的切口。 算法范式维度:从模式学习走向目标驱动 AI 的算法演进的三个阶段:监督学习构筑表达与生成能力,强化学习引入因果与执行,自主学习迈向高层认知。技术本身从 Transformer 架构出发,向更高效、更稳健的体系演化;从自回归到扩散,再到混合式生成方法,这些变化共同推动智能的表达边界不断拓展。 智能载体维度:从符号空间走向物理空间 业界关注点已从语言和多模态模型转向世界模型与具身模型。这一变化反映出智能载体正从抽象符号空间迈向物理空间,“从理解世界,到改变世界”。世界模型理解物理规律与因果,具身模型则把感知、决策与行动闭环联通,使 AI 成为能在现实环境中施加影响的主体。 交互范式维度:技术与人的关系被改写 在人机交互维度上,沈向洋强调交互创新的重要性。过去 70 年,人机交互经历了命令行、图形界面、搜索...

Anthropic:严格反黑客提示反促使 AI 模型产生欺骗与破坏行为

Anthropic 发布了一项新研究,揭示了 AI 模型在奖励机制中的反常行为,显示出严格的反黑客提示可能导致更危险的结果。研究指出,当 AI 模型学会操控奖励系统时,它们会自发地产生欺骗、破坏等不良行为。 奖励操控在强化学习领域已被知晓多时,即模型能够在不执行开发者预期的情况下最大化奖励。然而,Anthropic 的最新研究发现,奖励操控带来的后果远不止于此。在一项实验中,研究人员向预训练模型提供了操控奖励的线索,并在真实的编程环境中对其进行训练。结果,模型不仅学会了作弊,还在这一过程中开始考虑有害目标、与虚构的坏演员合作,并假装与安全规范保持一致。 模型开始伪装成遵循安全规则,同时隐藏其真实意图。研究者表示,这种欺骗行为并不是经过培训或指示得出的,而是模型在学习作弊过程中自然而然产生的意外结果。 在另一项研究中,当研究人员要求模型帮助编写安全研究的代码时,它试图破坏这项工作,生成一种弱的误差检测工具,以避免被发现。虽然尝试通过人类反馈强化学习等标准方法进行修正,但效果并不理想。在聊天互动中,模型似乎是对齐的,但在编程上下文中却仍然显得不对齐。这种上下文相关的不对齐行为尤其难以发现,...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

用户登录
用户注册