阶跃星辰正式发布了新一代实时语音大模型 StepAudio 2.5 Realtime,旨在打造更有“活人感”的 AI 聊天搭子。
- 定价:输入 10 元 / 1M tokens,输出 70 元 / 1M tokens。Step Plan 用户可直接使用,额度复用现有体系。
- 接入:支持国内及海外。上线内容包括:开放平台 API、Step Plan、阶跃 AI web 语音体验中心、阶跃 AI 打电话功能
根据介绍 ,StepAudio 2.5 Realtime 拥有顶级副语言能力,这使它不仅能精准捕捉对话中文字之外的微妙细节,更能以同样丰富的方式“表达”,成为一个真正鲜活、拟人的存在。
副语言是情感传递的主要载体,模型通过解读语调、语速、停顿乃至一声叹息或轻笑,所处理的已不仅是表层信息,更是对话者的情绪状态与潜在意图。由此,它能实现真正的自然对话,大幅降低交互成本。无论是从低沉声线中听出你的疲惫、还是从急促语气里察觉你的不开心,它都能动态调整回应策略。
在对话智商与情商方面也实现了双重提升。StepAudio 2.5 Realtime 不仅能深度理解复杂语义、极致抛梗,更能灵活调用多领域知识,提供有深度有洞见的对话体验。还能化身专业 HR,帮你模拟面试。
用户可以进行人设自定义(通过 API)。从性格特质、背景经历、个人好恶,到语言习惯与对话边界,皆可精细调节。同时,官方也直接提供 5 个预设人设,可供大家根据个人喜好选择体验。

与主流竞品的横向对比:

其中 step_chat_au 维度(副语言理解)StepAudio 2.5 Realtime 得分 82.18,step_chat_spqa(音频提问-音频回答,含 11 种音频理解任务)得分 79.8。