阿里巴巴推出端到端语音识别大模型 FunAudio-ASR-低调大师

阿里巴巴推出端到端语音识别大模型 FunAudio-ASR

2025-09-17 218

阿里巴巴通义实验室宣布正式推出 FunAudio-ASR —— 一款专为解决企业落地难题而生的端到端语音识别大模型。它不仅拥有高精度的通用识别能力，还通过创新的 Context 增强模块，针对性优化了“幻觉”、“串语种”等工业场景中的关键问题。

这个模型的最大亮点在于它的创新 “Context 模块”，让高噪声环境下的语音识别准确率得到了显著提升，幻觉率从78.5% 大幅降低至10.7%，降幅近乎70%。这一技术突破为语音识别行业树立了新的标杆，尤其适用于嘈杂的场合，如会议、公共场所等。

FunAudio-ASR 模型在训练过程中使用了数千万小时的音频数据，并将大语言模型的语义理解能力融入其中，使其在远场、嘈杂和多说话人等复杂条件下的表现，已经超越了诸如 Seed-ASR、KimiAudio-8B 等众多主流语音识别系统。通过这一技术的应用，用户在进行语音识别时，能够享受到更清晰、更精准的识别效果。

除了完整版本外，阿里还推出了轻量化版本 FunAudio-ASR-nano。该版本在保持高识别准确率的同时，降低了推理成本，适合那些对资源要求较高的部署环境。无论是大企业还是小型团队，都能找到适合自己的解决方案。

目前，FunAudio-ASR 已经在钉钉的 “AI 听记” 功能、视频会议以及 DingTalk A1硬件中得到了实际应用。此外，其 API 也已在阿里云百炼平台上正式上线，方便开发者进行集成和使用。对于企业用户而言，这意味着他们可以利用这一先进技术提升会议效率，增强沟通效果。

微信关注我们

原文链接：https://www.oschina.net/news/372731

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

OpenAI 聘请前 xAI 财务主管，强化算力预算管理

据报道，OpenAI已任命Mike Liberatore为新任业务财务主管。他曾担任埃隆·马斯克旗下AI初创公司xAI的首席财务官，在任期间主导了xAI 100亿美元融资，并推动数据中心规模扩张，于今年7月离职。据OpenAI透露，Liberatore将向首席财务官Sarah Friar汇报，负责统筹公司数据中心与基础设施的快速增长预算，并与Greg Brockman团队紧密协作，管理算力战略相关的合同与投资。当前OpenAI估值已达5000亿美元，此前刚与甲骨文签署价值3000亿美元的云服务协议，此次人事任命被视为强化算力资源财务规划的重要举措。行业分析指出，随着AI算力竞争加剧，具备大型算力项目资金运作经验的人才愈发成为科技公司争抢的焦点。

2025-09-17

176

根据 The Register 的报道，甲骨文近日对其 MySQL 团队进行了大规模裁员，约有 70 名员工受到影响，其中不乏核心和资深开发者。 MySQL 联合创始人 Monty Widenius 表示对此“感到悲伤”，虽然对 Oracle 走向商业化和云端产品并不意外，但仍担心 MySQL 社区版未来受到威胁。 Widenius 还提到，当初创建 MariaDB 的目的之一就是“为下一代 MySQL”提供一个更稳定、更可持续的开源未来。现在这些事件被视为验证了他的担忧。曾在 MySQL 担任性能工程师的知名社区成员 Peter Zaitsev 也对裁员表示强烈批评，担忧这是 Oracle 在削弱 MySQL 社区版（Community Edition）的影响力，甚至可能在“慢慢地杀掉” MySQL 社区版本。消息称 MySQL 团队已被并入 Oracle Heatwave 业务单元，未来开发重点将转向云端分析和 AI 相关功能，而非传统的社区版本迭代。业内担心，这可能意味着 Oracle 正在边缘化 MySQL 社区版，鼓励用户转向其商业产品。Widenius 也借机提醒用户...

2025-09-17

214

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。