MiniMax 发布最新语音模型 MiniMax Speech 2.6
MiniMax 发布了最新的语音模型 MiniMax Speech 2.6,全面升级突破Voice Agent场景,超低延时,专业格式无障碍,更高自然度。 1. 超低延时,更灵敏:整体交互更顺畅 对音频生成链路进行了全面优化,使端到端延迟低于250毫秒,达到了行业顶尖水平。在实时对话等对响应速度有严苛要求的场景中,音频生成不再是瓶颈,确保整体交互更流畅。 2. 专业格式无障碍,更聪明:信息传递更流畅 Speech 2.6 现已支持多种语言的网址、邮箱、电话号码、日期及金额等非标准文本格式的直接转换。无论您是结合大语言模型使用,还是需要在业务中处理动态变化的实体信息,都无需再进行繁琐的文本预处理。输入即正确,实现信息传递更流畅。 例如,在传统TTS中需要正确朗读下面一段话,则需要做一系列转换: +1 415 415 9921 → “plus one, four one five, four one five, nine nine two one ” $1,234.56 → “one thousand two hundred thirty-four dollars and fifty-...