xAI 发布 Grok Voice Agent API
xAI正式发布Grok Voice Agent API,面向开发者开放其在Tesla车辆及移动应用中已验证的语音代理技术。据介绍,该API支持数十种语言,具备实时工具调用与网络搜索能力,平均首音频响应时间低于1秒,在Big Bench Audio评测中位列第一。
Grok Voice Agent API在Big Bench Audio音频推理基准测试中排名第一,平均首音频响应时间小于1秒,比最接近的竞争对手快近5倍。该API采用固定费率计费,每分钟连接时间收费0.05美元。
Grok Voice Agent采用自研全栈语音技术,包括语音活动检测、分词器与音频模型,定价为每分钟0.05美元。API兼容OpenAI Realtime规范,并提供Ara、Eve、Leo等多款自然表达语音。
目前支持通过xAI LiveKit插件或浏览器语音沙盒快速接入。

