苹果发布全新 FS-DFM 模型，提升长文本生成效率-低调大师

苹果发布全新 FS-DFM 模型，提升长文本生成效率

2025-10-14 175

苹果公司与俄亥俄州立大学研究团队联合发布了名为FS-DFM（Few-Step Discrete Flow-Matching）的全新语言模型。该模型在长文本生成方面实现了重大突破，通过三步法优化了迭代机制，使其在文本生成的困惑度和熵等关键指标上优于其他大型模型。

生成速度大幅提升

FS-DFM模型仅需8轮快速迭代即可生成高质量长文本，速度较传统扩散模型提升128倍，显著缩短了长文本生成的等待时间。

文本质量保持领先

在困惑度（衡量文本准确性和流畅性）和熵（衡量选词置信度）等关键指标上，FS-DFM的表现优于拥有数十亿参数的主流模型（如Dream-7B、LLaDA-8B），且参数量仅为1.7亿至17亿，实现了“小模型大效果”。

技术创新与优化

动态迭代预算：模型可根据任务需求自动调整迭代深度，避免冗余计算。
教师指导机制：引入高精度“教师模型”引导迭代，确保更新精准且稳定。
稳态收敛策略：优化迭代步长，加速模型收敛，减少步骤的同时保证质量。

详情：https://machinelearning.apple.com/research/fs-dfm

微信关注我们

原文链接：https://www.oschina.net/news/377398

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

马斯克收到黄仁勋亲手交付的 AI 超算 DGX Spark

英伟达官方账号在X上发帖称：“为了庆祝DGX Spark从周三开始全球发货，我们的CEO黄仁勋今天在德克萨斯州的星舰基地将首批产品亲手交付给了SpaceX首席工程师埃隆·马斯克。这次交流与这款新的桌面AI超算的起源——NVIDIA DGX-1超级计算机——有关，因为马斯克是2016年从黄仁勋那里收到的第一批DGX-1的用户之一。” 马斯克回应称：“这是DGX Spark，每瓦特计算能力比DGX-1多100倍。DGX-1是第一个专用的AI计算机，詹森2016年在OpenAI 交付给了我！”

2025-10-14

155

抖音 SAIL 团队与 LV-NUS Lab 联手推出了一款名为 SAIL-VL2 的多模态大模型，并已开源。这个新模型在保持较小参数规模的同时，还在复杂推理任务中超过了许多同类模型，甚至能与更大型的闭源模型相抗衡。 SAIL-VL2的参数设置分为2B 和8B，在106个数据集上实现了性能的突破，尤其在 MMMU、MathVista 等复杂推理基准测试中表现优异。SAIL-VL2在数据、训练及架构设计上进行了三大方面的创新。在架构设计上，SAIL-VL2引入了稀疏混合专家（MoE），以优化性能和计算效率。其视觉编码器 SAIL-ViT 采用渐进式优化，逐步提升视觉 - 语言的对齐能力。这种创新设计使得 SAIL-VL2在推理时仅需激活部分参数，大幅度提升了模型的计算效率。数据层面上，SAIL-VL2构建了高质量的多模态语料库，通过评分过滤和合成增强手段，确保数据的准确性和多样性。同时，团队还设计了一套渐进式的训练框架，从基础感知逐步过渡到复杂推理，使得模型在不同任务中的表现更加出色。通过全链路优化，SAIL-VL2在基础模型的性能上取得了显著进展。数据显示，该模型在多项基准测试中...

2025-10-14

159

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。