MOSS-Speech 发布：真正的语音到语音大模型-低调大师

MOSS-Speech 发布：真正的语音到语音大模型

2025-11-20 148

国内AI领域最知名的教授之一 —— 复旦大学计算机学院教授邱锡鹏和他学生创立的公司近期发布了MOSS-Speech，声称是真正的语音到语音（Speech-to-Speech）大模型。

据官方介绍，这款模型标志着国产AI迈入了“真语音到语音交互”的新阶段。它与传统“语音识别—文本生成—语音合成”的级联方案不同，MOSS-Speech 实现了直接从语音理解到语音生成，无需文本中介。该模型可在生成回答的同时捕捉语调、情绪、笑声等非文字信号，使机器“说话”更自然、更具人性。

MOSS-Speech 核心特性如下：

真正的语音到语音建模：无需文本引导。
层拆分架构：在预训练文本 LLM 的基础上新增模态特定层。
冻结预训练策略：在保留原 LLM 的能力的同时引入语音理解和生成能力。
SOTA性能：在语音问答和语音到语音任务中表现出色。

MOSS-Speech 在语音到语音评测指标上取得了 SOTA 成绩。

预训练模型评测结果

指令微调模型评测结果

更多细节查看 Demo 和技术报告

视频 Demo：https://moss-speech.open-moss.com/
在线 Demo：https://huggingface.co/spaces/fnlp/MOSS-Speech
GitHub 主页：https://github.com/OpenMOSS/MOSS-Speech
技术报告：https://github.com/OpenMOSS/MOSS-Speech/blob/main/papers/MOSS-Speech Technical Report.pdf

微信关注我们

原文链接：https://www.oschina.net/news/384740

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

欧盟计划放宽数字监管法规

欧盟委员会19日提出一揽子精简、调整数字与科技监管的改革建议，主要对《人工智能法案》和《通用数据保护条例》等“松绑”，以提升欧洲竞争力。在针对《人工智能法案》的调整上，欧盟委员会建议，将就业、执法等敏感领域高风险人工智能系统的相关规定，最迟比原定时间推后16个月生效。根据现行《人工智能法案》时间表，相关规定原计划自2026年8月起适用。在针对《通用数据保护条例》的调整上，欧盟委员会将允许科技企业处理公民的个人数据来训练其人工智能模型，只要使用个人数据不违反欧盟或各成员国的法律，并且符合《通用数据保护条例》的所有要求。过去10年间，欧盟相继出台《通用数据保护条例》和《人工智能法案》等一系列数字监管法规。这些法案遭到一些欧洲企业批评，认为增加了合规成本，影响企业创新活力，使欧洲企业在全球竞争中处于不利地位。美国也多次批评欧盟的监管举措，认为其“针对”美国企业。据悉，本次提出的改革建议仍需依照欧盟立法程序提交欧洲议会和欧盟理事会审议，表决通过后方可正式生效。（新华社）

2025-11-20

147

联想集团公布了截至2025年9月30日的2025/26财年第二财季业绩报告，数据显示，当季联想营收同比增长15%，达到1464亿元人民币，创下财季历史新高;经调整后的净利润同比增长25%，达36.6亿元人民币，展现出强劲的增长势头。从业务板块来看，联想各业务集团均实现显著增长。其中，IDG智能设备业务集团营收达1081亿元人民币，同比增长12%，在全球PC市场加速复苏的背景下表现尤为亮眼。值得一提的是，AI终端设备营收在IDG整体营收中的占比大幅提升至36%，同比提升17个百分点，成为推动该业务集团增长的重要引擎。ISG基础设施方案业务集团实现营收约293亿元人民币，同比提升24%；SSG解决方案与服务业务集团营收同比增长近20%，各业务协同发展，共同助力联想业绩攀升。在业绩发布会上，联想集团董事长兼CEO杨元庆透露了联想在AI领域的最新布局。他表示，明年1月6号将在联想创新科技大会上推出个人超级智能体。这一智能体不仅能协同各类可穿戴与环境感知设备，实现听你所听、见你所见、记你所记，还能调度各种便携式设备，通过个性化的算法与模型持续学习用户习惯、预测意图，最终成为用户的个人智能双...

2025-11-20

139

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。