阿里巴巴推出端到端语音识别大模型 FunAudio-ASR

阿里巴巴通义实验室宣布正式推出 FunAudio-ASR —— 一款专为解决企业落地难题而生的端到端语音识别大模型。它不仅拥有高精度的通用识别能力,还通过创新的 Context 增强模块,针对性优化了“幻觉”、“串语种”等工业场景中的关键问题。

这个模型的最大亮点在于它的创新 “Context 模块”,让高噪声环境下的语音识别准确率得到了显著提升,幻觉率从78.5% 大幅降低至10.7%,降幅近乎70%。这一技术突破为语音识别行业树立了新的标杆,尤其适用于嘈杂的场合,如会议、公共场所等。

FunAudio-ASR 模型在训练过程中使用了数千万小时的音频数据,并将大语言模型的语义理解能力融入其中,使其在远场、嘈杂和多说话人等复杂条件下的表现,已经超越了诸如 Seed-ASR、KimiAudio-8B 等众多主流语音识别系统。通过这一技术的应用,用户在进行语音识别时,能够享受到更清晰、更精准的识别效果。

除了完整版本外,阿里还推出了轻量化版本 FunAudio-ASR-nano。该版本在保持高识别准确率的同时,降低了推理成本,适合那些对资源要求较高的部署环境。无论是大企业还是小型团队,都能找到适合自己的解决方案。

目前,FunAudio-ASR 已经在钉钉的 “AI 听记” 功能、视频会议以及 DingTalk A1硬件中得到了实际应用。此外,其 API 也已在阿里云百炼平台上正式上线,方便开发者进行集成和使用。对于企业用户而言,这意味着他们可以利用这一先进技术提升会议效率,增强沟通效果。

优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/372731

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

相关文章

发表评论

资源下载

更多资源
优质分享Android(本站安卓app)

优质分享Android(本站安卓app)

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario,低调大师唯一一个Java游戏作品

Mario,低调大师唯一一个Java游戏作品

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Apache Tomcat7、8、9(Java Web服务器)

Apache Tomcat7、8、9(Java Web服务器)

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Java Development Kit(Java开发工具)

Java Development Kit(Java开发工具)

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具。