LeCun 新提案：用 CV 思路重塑语言模型-低调大师

LeCun 新提案：用 CV 思路重塑语言模型

2025-09-23 172

在当今的人工智能领域，Yann LeCun 提出的 JEPA（联合嵌入预测架构）正在重新定义大语言模型（LLM）的训练方式。这位诺贝尔奖得主不是在批评现有的 LLM，而是亲自出手进行改造。传统的 LLM 训练方法主要依赖于输入空间中的重构与生成，如预测下一个单词，这种方法在视觉领域已被证明存在局限性。

LeCun 和他的团队认为，可以借鉴计算机视觉（CV）领域的先进技术来提升语言模型的表现。JEPA 的核心思想是通过在抽象表征空间中预测缺失的特征，以高效地学习世界知识。Meta AI 团队已经在图像和视频处理上成功应用了 JEPA，而现在，他们希望将这一理念扩展到语言模型领域。

为了填补这个空白，研究人员 Hai Huang、Yann LeCun 和 Randall Balestriero 共同提出了 LLM-JEPA。这一新模型将文本和代码视为同一概念的不同视角，首次成功将 JEPA 的自监督学习架构应用于 LLM。通过结合 JEPA 在嵌入空间学习的优势，LLM-JEPA 不仅保留了 LLM 强大的生成能力，还在性能和鲁棒性上实现了双丰收。

实验证明，LLM-JEPA 在多个主流模型（如 Llama3、OpenELM、Gemma2等）和多样化的数据集(如 GSM8K、Spider 等)上表现出色，显著超越了传统 LLM 训练目标。此外，它在防止过拟合方面显示出了强大的鲁棒性，为语言模型的未来发展提供了新的方向。

尽管目前的研究主要集中在微调阶段，但初步的预训练结果显示出巨大的潜力。团队计划在未来的工作中进一步探索 LLM-JEPA 在预训练过程中的应用，期待为语言模型的性能提升注入新的动力。

微信关注我们

原文链接：https://www.oschina.net/news/373887

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

走进邦彦｜云 PC 产品体验日圆满收官，共探制造数智转型新径

2025年9月20日,“携手奇摩 SmartX 走进邦彦——云 PC 制造业数智化体验日”活动在邦彦技术股份有限公司深圳总部成功举行。近40位制造业企业家与CIO齐聚一堂,围绕数字化转型中的算力升级、数据安全等核心议题展开深入探讨。邦彦云PC凭借其创新技术与显著的应用价值,成为全场焦点。沉浸式探展:直观体验“云上真机” 活动伊始,产品市场部总监钟华程带领嘉宾参观了邦彦技术数字化展厅。他系统梳理了公司十余年的发展历程,并重点阐释了邦彦云PC的研发理念与核心架构,深入剖析了传统PC分散管理及VDI模式性能瓶颈等行业痛点。现场对比Demo演示,让嘉宾直观感受到新一代商用PC在高效、安全与灵活三大维度上的跨越式提升。主题分享:30分钟洞悉邦彦云PC如何赋能制造业数字化新趋势在下午的交流环节,钟华程以《邦彦云PC系统介绍——赋能制造业数字化转型》为题,深入解读了产品如何精准应对制造业数智转型中的核心挑战。他指出,当前制造业对算力的需求已从单纯性能输出转向“性能+安全+效率”的综合诉求,邦彦云PC独创的“云上真机”架构正是应对这一趋势的关键创新。该架构将专属物理计算刀片或准物理虚拟节点集中部...

2025-09-23

121

微软近日在官方博客发文介绍了 Windows 11 on Arm 的最新发展情况，表示目前原生应用不断扩充中，已覆盖用户使用时长的 90%，涵盖安全防护、VPN、终端管理、办公、创意设计、娱乐社交等多个领域。微软表示，WoA（Windows on Arm）应用生态不断发展得益于 App Assure 团队的支持，随着市占率提升，越来越多的独立软件开发商也希望加入生态，让自家应用原生支持 WoA。为了帮助开发者迁移，微软提供了 App Assure 团队和 Arm Advisory Service，承诺协助独立软件厂商（ISVs）快速完成 Arm 版本的适配。随着 Windows 10 将于 2025 年 10 月 14 日结束支持，微软希望借助应用生态的完善，加速用户与企业向 Windows 11 与 Copilot+ PC 的过渡。

2025-09-23

106

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。