首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/384747

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

MOSS-Speech 发布:真正的语音到语音大模型

国内AI领域最知名的教授之一 ——复旦大学计算机学院教授邱锡鹏和他学生创立的公司近期发布了MOSS-Speech,声称是真正的语音到语音(Speech-to-Speech)大模型。 据官方介绍,这款模型标志着国产AI迈入了“真语音到语音交互”的新阶段。它与传统“语音识别—文本生成—语音合成”的级联方案不同,MOSS-Speech 实现了直接从语音理解到语音生成,无需文本中介。该模型可在生成回答的同时捕捉语调、情绪、笑声等非文字信号,使机器“说话”更自然、更具人性。 MOSS-Speech 核心特性如下: 真正的语音到语音建模:无需文本引导。 层拆分架构:在预训练文本 LLM 的基础上新增模态特定层。 冻结预训练策略:在保留原 LLM 的能力的同时引入语音理解和生成能力。 SOTA性能:在语音问答和语音到语音任务中表现出色。 MOSS-Speech 在语音到语音评测指标上取得了 SOTA 成绩。 预训练模型评测结果 指令微调模型评测结果 更多细节查看 Demo 和技术报告 视频 Demo:https://moss-speech.open-moss.com/ 在线 Demo:https:/...

微软 AI 首席执行官:听到有人说 AI 不怎么样,我忍不住笑了

微软 AI 首席执行官 Mustafa Suleyman 最近在 X(原 Twitter)发文,针对近期用户对 Windows 上 AI(例如 Copilot)功能的不满作出回应。他对部分用户觉得 AI 功能“平庸”表示惊讶,称能够进行流畅对话、生成图像和视频的 AI 是重大进步,不应被低估。 高强度网上冲浪的马斯克也在这条推文下面表达了支持的态度:Good point。 此次争议源于微软推动 Windows 成为“智能代理式操作系统”(agentic OS)的战略,Windows 的高层(Pavan Davuluri)此前表示 Windows 将深度整合 AI,成为一个可以“自主”做决策、完成任务的系统。不过部分用户对此表达不满,认为微软在基础体验(如稳定性和性能)尚未完善的情况下,过度推进 AI 功能。 Suleyman 显然对这些怀疑者 (“cynics”) 很不以为然,觉得他们没能真正理解 AI 的潜力。从他的视角来看,AI 是未来,应广泛融入软件体验。而当前用户的 “不满意” 更多是认知落差,而非技术的问题。

相关文章

发表评论

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

用户登录
用户注册