近日,云蝠智能宣布完成12月第三次重大产品升级,全新FunASR引擎正式震撼上线,版本同步迭代至8.4.2。该引擎依托先进的端到端语音识别架构,实现了语音交互精准度与处理效率的双重跃升,将为智能客服、AI呼叫、会议协作等多元场景注入全新动能,标志着云蝠智能在语音交互技术领域迈入规模化落地的新阶段。
在人工智能大模型重塑产业格局的背景下,语音作为最自然的人机交互方式,正从“能用”向“好用”加速演进,企业对语音识别系统的精准性、实时性、场景适配性提出了更高要求。云蝠智能全新上线的FunASR引擎,深度融合阿里达摩院Paraformer非自回归核心技术,打破传统“积木式”模块拼接的局限,构建了集语音前端处理、核心识别、标点恢复、热词增强于一体的完整链路架构,在精度、速度与部署效率之间实现了前所未有的平衡。
此次上线的FunASR引擎具备三大核心技术优势。其一,识别精度实现质的飞跃。引擎通过上亿小时音频数据训练,可精准捕捉互联网、科技、家装、畜牧、保险等十余个垂直行业的专业术语及行业“黑话”,实测在保险行业准确率提升18%,在家装、畜牧领域准确率提升15%-20%。同时支持动态注入1000+热词,大幅提升品牌名称、项目代号、人名等专属词汇的识别精准度,有效解决了行业专有名词识别难的痛点。其二,处理效率大幅提升。依托Paraformer并行解码机制,引擎可在一次前向传播中生成整句文本,相较于传统自回归模型,吞吐量提升8-10倍,实现“边说边识别”的流式交互体验,尾延迟显著降低,完美适配实时字幕、会议转录、AI外呼等对响应速度敏感的场景。其三,部署与适配更具灵活性。引擎支持HTTP、websocket等多种接口,可导出ONNX、TensorRT等多种格式,灵活部署于CPU、GPU或边缘设备,同时兼容流式与离线两种识别模式,满足不同企业的多样化部署需求。
除核心识别能力升级外,云蝠智能同步完成了多项功能优化,构建了更完善的产品生态。在智能体模块,通过多次识别机制进一步提升模型理解精准度,MCP新增header参数支持身份认证调用,打分方案新增公共模版库,插件函数返回参数可在文本测试和通话详情中直观展示;呼叫中台新增重呼二次提醒功能,避免误操作,Webhook推送等后续动作新增配置攻略,并支持将客户拉入黑名单等操作;数据公海、短信审核、代理端安全管理等模块均完成体验优化,全方位提升企业数字化运营效率。
据了解,FunASR引擎已在多个实际场景中展现出强大的产业价值。在工业巡检场景中,集成该引擎的智能机器人可在高噪声环境下实现与运维人员的实时语音交互,运维人员通过语音指令即可快速查询设备温度、告警状态等关键信息,大幅简化响应流程;在客服场景中,引擎可快速准确识别用户咨询意图,结合大模型质检能力实现工单智能处理与API回传,将客服响应时间缩短50%以上。未来,该引擎还将广泛应用于会议纪要生成、医疗病历转录、法庭记录自动化等更多领域,持续赋能企业数字化转型。
云蝠智能相关负责人表示,全新FunASR引擎的上线是公司在语音交互领域技术沉淀的重要成果。依托该引擎的核心优势,云蝠智能将进一步完善AI语音解决方案,为企业提供更精准、高效、安全的语音交互服务,助力更多行业突破人机交互瓶颈,开启语音交互精准新时代。后续,公司还将基于企业真实场景需求,持续推进技术迭代与功能创新,深化行业场景适配,为产业智能化升级贡献更多力量。