阿里通义发布语音识别模型 Qwen3-ASR-Flash-低调大师

阿里通义发布语音识别模型 Qwen3-ASR-Flash

2025-09-09 170

通义千问系列最新的语音识别模型 Qwen3-ASR-Flash已正式发布，它基于Qwen3基座模型，经海量多模态数据以及千万⼩时规模的ASR（自动语音识别）数据训练构建而成。

Qwen3-ASR-Flash实现了⾼精度⾼鲁棒性的语⾳识别性能，⽀持11种语⾔和多种⼝⾳。与众不同的是，Qwen3-ASR-Flash⽀持⽤户以任意格式提供⽂本上下⽂，从⽽获得定制化的 ASR 结果，同时还⽀持歌声识别。

Qwen3-ASR-Flash 单模型支持多种语言、方言和口音的精准转录：

中文：包括普通话以及四川话、闽南语、吴语、粤语等主要方言。
英语：支持英式、美式及多种其他地区口音。
其他支持语言：法语、德语、俄语、意大利语、西班牙语、葡萄牙语、日语、韩语和阿拉伯语。

Qwen3-ASR-Flash的核心特性：

领先的识别准确率：Qwen3-ASR-Flash在多个中英文，多语种benchmark测试中表现最优。
惊艳的歌声识别能力：支持歌唱识别,包括清唱与带bgm的整歌识别，实测错误率低于8%。
定制化识别：用户可以以任意格式(如词汇表、段落或完整文档)提供背景文本，模型能智能利用该上下文识别并匹配命名实体和其他关键术语，输出定制化的识别结果。
语种识别与非人声拒识：模型能精确分辨语音的语种，自动过滤非语音片段，包括静音和背景噪声。
鲁棒性：面对长难句、句中语言切换和重复词语等困难文本模式，以及在复杂的声学环境中，模型仍能保持高准确率。

体验方式：

ModelScope：https://modelscope.cn/studios/Qwen/Qwen3-ASR-Demo

HuggingFace: https://huggingface.co/spaces/Qwen/Qwen3-ASR-Demo

阿里云百炼API：https://bailian.console.aliyun.com/?tab=doc#/doc/?type=model&url=2979031

微信关注我们

原文链接：https://www.oschina.net/news/371054

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Databricks 融资 10 亿美元，估值超 1000 亿美元

Databricks 宣布即将完成 10 亿美元的 K 轮融资，对应估值超过 1000 亿美元。此轮融资由 Andreessen Horowitz、Insight Partners、MGX、Thrive Capital 和 WCM Investment Management 共同领投。 Databricks 表示，将利用这笔新资金加速其 AI 战略——扩展 Agent Bricks，推出全新 Lakebase 产品线，并推动全球增长。以及支持 Databricks 未来的 AI 收购，并深化 AI 研究。在公告中，Databricks 还透露了部分财务状况，披露其第二季度的年收入运行率超过 40 亿美元，同比增长 50%，并在过去 12 个月中实现了正自由现金流。该公司还表示，其人工智能产品的年营收运行率近期已超过10亿美元，净留存率超过140%，目前有超过650家客户使用Databricks的产品，年收入超过100万美元。目前，共有超过2万家企业和组织在使用其软件。 Databricks 联合创始人兼首席执行官 Ali Ghodsi 在公告中表示：“我们的团队正在构建企业未来几十...

2025-09-09

180

知名 Android 第三方桌面启动器 Nova Launcher 创始人和原始开发者 Kevin Barry 宣布，他已经离开收购 Nova Launcher 的分析公司 Branch，并不再参与该项目。 https://teslacoilapps.com/nova/solong.html 据悉，Nova Launcher 由 Kevin Barry 带队开发，于 2022 年被 Branch 收购。当时，Branch 承诺不会将 Nova Launcher 变为订阅式付费、带有广告的普通 Android 桌面启动器。据 Kevin Barry 透露，其在过去几个月不断为 Nova Launcher 的开源进行付出。其表示，虽然 Branch 曾在收购 Nova Launcher 时承诺，其若离职，Nova Launcher 最终则会开源，但 Barry 现被要求停止开发 Nova Launcher 和终止进行开源工作。

2025-09-09

273

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。