声网联合美团、xbench 发布 AI 外呼智能体评测基准：VoiceAgentEval-低调大师

声网联合美团、xbench 发布 AI 外呼智能体评测基准：VoiceAgentEval

2026-02-10 123

声网宣布联合美团、xbench 共同推出用于评估大模型在 AI 外呼场景性能表现的综合评测标准 VoiceAgentEval ，旨在填补行业空白，让从业者更清晰的了解在真实 AI 外呼业务场景中各个大模型的综合性能表现，并为 AI 外呼场景的落地与技术体验的优化提供核心参考依据。

根据介绍，VoiceAgentEval 实现了从“基准测试构建”、“用户模拟器”和“交互质量评估方法”三个主要维度评估 AI 外呼的能力。

该框架的主要特点包括：

基准测试构建：构建一个基于真实外呼业务数据的语料库。该语料库涵盖六大业务领域（客服、销售、招聘、金融、调研、主动关怀与通知）和 30 个子场景。对于每个子场景建立了详细的评估方案，包括场景特定的流程分解、加权评分系统和领域自适应指标，为细致和客观的评估奠定了坚实基础。
用户模拟器：通过利用来自真实业务场景的交互数据，我们构建了大量有效且稳定的用户模拟器。这使得能够在可控和可复现的环境中测试模型，检查它们在不同沟通风格下的任务完成能力。
评估方法：建立“文本+语音”双维度评估，针对文本评估开发了一个双层评估系统，包括任务流程遵循和一般交互能力，通过标准化场景设计和定量评分机制实现精确评估。语音评估方面，在三大场景中建立了 15 个指标，这些指标整合了专家评分和客观数据，为语音识别准确性、音频质量和交互体验提供多维度量化。

微信关注我们

原文链接：https://www.oschina.net/news/403271

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

千问最新图像基座模型 Qwen-Image-2.0 正式发布

阿里巴巴正式发布新一代图像生成及编辑模型Qwen-Image-2.0。该模型支持1K token的超长文字输入和2K高分辨率，可准确渲染复杂指令。 Qwen-Image-2.0主要特色包括：更专业的文字渲染：1k token指令支持，直出专业信息图，包括PPT/海报/漫画等。更细腻的真实质感：2k分辨率支持，细腻刻画写实场景，包括人物/自然/建筑等。更强的语义遵循：理解生成一体化，生图编辑二合一。更轻量的模型架构：更小模型，更快速度。作为千问大模型的图像生成模型底座，Qwen-Image-2.0集生图和编辑于一体，在AI Arena文生图评测中斩获1029分，位列全球第三。根据提供图片（图左）生成一个九宫格带不同拍照姿势的组图（图右）目前，阿里云百炼上已开通API邀测，开发者也可直接通过Qwen Chat（https://chat.qwen.ai/）免费体验新模型。

2026-02-10

125

苹果公司与中国人民大学研究团队联合推出了新 AI 模型 VSSFlow，能够在单一系统内从无声视频中同时生成环境音效和语言语音，这标志着视频到音频生成领域的一个重要突破。以往视频到声音（Video-to-Sound，V2S）模型在生成自然环境音效方面效果有限，而文本到语音（TTS）模型则专注语音生成，无法兼顾环境声和对话内容。此外，独立训练语音和音效模型的传统做法往往需要复杂的多阶段流程，并可能导致性能下降。 VSSFlow 创新点 VSSFlow 采用统一架构，同时处理环境音效和语音输出，在模型内部实现任务融合。该系统将视觉输入与语音转录信息融合，在生成音频时同时参考视频画面特征和文本提示，从而提高音频内容与画面的匹配度。研究团队发现，在单一训练过程中让语音和环境声互相辅助，能够提升整体性能，这与过去认为联训会互相干扰的观点相反。为了让模型输出既有环境背景音又有准确语音，团队进一步对模型进行微调，使用包含混合音频的合成样本训练。最终生成音频时，模型从随机噪声开始推断，并利用 10 帧/秒的视频视觉线索来塑造环境声，同时根据提供的文字脚本生成清晰语音。苹果已将 VSSFlow...

2026-02-10

133

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。