Meta 开源创新大模型架构 AU-Nets
Meta 开源了创新大模型架构 AU-Nets(Autoregressive U-Nets),其通过自回归 U-Net 架构彻底改变了传统语言模型的分词和处理模式,能够直接从原始字节开始学习,动态将字节组合成单词、词对甚至多达四个单词的组合,形成多尺度序列表示。
https://arxiv.org/pdf/2506.14761
AU-Nets 的设计灵感来源于医学图像分割领域的 U-Net 架构,包含独特的收缩路径(压缩字节序列为高层次语义单元,提取宏观语义信息)和扩张路径(逐步还原高层次信息到原始序列长度,融合局部细节),并通过跳跃连接确保信息不丢失,提升生成能力和预测准确性 。在推理阶段,AU-Nets 采用自回归生成机制,确保文本生成的连贯性和准确性,同时提高推理效率。
该架构已开源,相关代码和研究成果已发布在 GitHub:https://github.com/facebookresearch/lingua/tree/main/apps/aunet

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
美国职场现象:六分之一员工因 AI 焦虑而 “假装” 使用人工智能
在美国职场,人工智能(AI)的迅速普及正对员工的工作产生深远影响。最近,近岸招聘公司 Howdy.com 发布的一项调查显示,约有 16% 的员工在工作中会假装使用 AI,目的是为了取悦他们的上司。 调查发现,约四分之三的雇主期待员工以某种形式使用 AI,其中大约一半的人是在正式的工作场合使用,另有四分之一则是在非正式场合。然而,由于对 AI 的不安和缺乏信心,很多员工在没有足够能力的情况下依然感到必须使用这项技术。超过五分之一的员工在面对 AI 的时候感到不安,甚至在某些情况下会选择 迎合这种新技术。 尽管很多公司声称 AI 可以帮助提高工作效率,但实际上,三分之一的员工认为,学习和使用 AI 所耗费的时间与传统工作方式差不多。此外,很多员工在使用 AI 输出的结果时,并没有进行严格的检查,导致潜在错误的增加。 更有趣的是,除了假装使用 AI 的员工,还有一些人在实际上使用 AI,但却选择不告诉他们的上司。根据 Slack 去年10月的调查,约48% 的全球办公员工表示,他们对向管理层坦白使用 AI 感到不安,害怕被视为能力不足或不够勤奋。 AI 带来的焦虑不仅限于对工作的影响。根据...
- 下一篇
AI 搜索创企 Perplexity CEO 盛赞 Qwen3-Coder
7月24日,全球知名AI搜索Perplexity CEO Aravind Srinivas发推盛赞阿里开源的Qwen3-Coder,称“令人惊叹的成绩!开源赢爆了。” Qwen3-Coder具备全球顶级的Agent能力,在SWE-Bench Multilingual、Aider-Polyglot、Spider2、Mind2Web等多项Agent能力指标中超越美国Claude4模型,取得最佳性能表现,而Qwen3-Coder API价格远低于Claude,平均仅为其三分之一。
相关文章
文章评论
共有0条评论来说两句吧...