阿里通义发布语音识别模型 Qwen3-ASR-Flash
通义千问系列最新的语音识别模型 Qwen3-ASR-Flash已正式发布,它基于Qwen3基座模型,经海量多模态数据以及千万⼩时规模的ASR(自动语音识别)数据训练构建而成。
Qwen3-ASR-Flash实现了⾼精度⾼鲁棒性的语⾳识别性能,⽀持11种语⾔和多种⼝⾳。与众不同的是,Qwen3-ASR-Flash⽀持⽤户以任意格式提供⽂本上下⽂,从⽽获得定制化的 ASR 结果,同时还⽀持歌声识别。
Qwen3-ASR-Flash 单模型支持多种语言、方言和口音的精准转录:
-
中文:包括普通话以及四川话、闽南语、吴语、粤语等主要方言。
-
英语:支持英式、美式及多种其他地区口音。
-
其他支持语言:法语、德语、俄语、意大利语、西班牙语、葡萄牙语、日语、韩语和阿拉伯语。
Qwen3-ASR-Flash的核心特性:
-
领先的识别准确率:Qwen3-ASR-Flash在多个中英文,多语种benchmark测试中表现最优。
-
惊艳的歌声识别能力:支持歌唱识别,包括清唱与带bgm的整歌识别,实测错误率低于8%。
-
定制化识别:用户可以以任意格式(如词汇表、段落或完整文档)提供背景文本,模型能智能利用该上下文识别并匹配命名实体和其他关键术语,输出定制化的识别结果。
-
语种识别与非人声拒识:模型能精确分辨语音的语种,自动过滤非语音片段,包括静音和背景噪声。
-
鲁棒性:面对长难句、句中语言切换和重复词语等困难文本模式,以及在复杂的声学环境中,模型仍能保持高准确率。
体验方式:
ModelScope:https://modelscope.cn/studios/Qwen/Qwen3-ASR-Demo
HuggingFace: https://huggingface.co/spaces/Qwen/Qwen3-ASR-Demo
阿里云百炼API:https://bailian.console.aliyun.com/?tab=doc#/doc/?type=model&url=2979031

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Databricks 融资 10 亿美元,估值超 1000 亿美元
Databricks 宣布即将完成 10 亿美元的 K 轮融资,对应估值超过 1000 亿美元。此轮融资由 Andreessen Horowitz、Insight Partners、MGX、Thrive Capital 和 WCM Investment Management 共同领投。 Databricks 表示,将利用这笔新资金加速其 AI 战略——扩展 Agent Bricks,推出全新 Lakebase 产品线,并推动全球增长。以及支持 Databricks 未来的 AI 收购,并深化 AI 研究。 在公告中,Databricks 还透露了部分财务状况,披露其第二季度的年收入运行率超过 40 亿美元,同比增长 50%,并在过去 12 个月中实现了正自由现金流。 该公司还表示,其人工智能产品的年营收运行率近期已超过10亿美元,净留存率超过140%,目前有超过650家客户使用Databricks的产品,年收入超过100万美元。目前,共有超过2万家企业和组织在使用其软件。 Databricks 联合创始人兼首席执行官 Ali Ghodsi 在公告中表示:“我们的团队正在构建企业未来几十...
-
下一篇
知名 Android 第三方桌面 Nova Launcher 将停止维护
知名 Android 第三方桌面启动器 Nova Launcher 创始人和原始开发者 Kevin Barry 宣布,他已经离开收购 Nova Launcher 的分析公司 Branch,并不再参与该项目。 https://teslacoilapps.com/nova/solong.html 据悉,Nova Launcher 由 Kevin Barry 带队开发,于 2022 年被 Branch 收购。当时,Branch 承诺不会将 Nova Launcher 变为订阅式付费、带有广告的普通 Android 桌面启动器。 据 Kevin Barry 透露,其在过去几个月不断为 Nova Launcher 的开源进行付出。其表示,虽然 Branch 曾在收购 Nova Launcher 时承诺,其若离职,Nova Launcher 最终则会开源,但 Barry 现被要求停止开发 Nova Launcher 和终止进行开源工作。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- MySQL数据库在高并发下的优化方案
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2全家桶,快速入门学习开发网站教程
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Dcoker安装(在线仓库),最新的服务器搭配容器使用
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2配置默认Tomcat设置,开启更多高级功能