“智谱AI输入法”发布,底座模型同步开源
智谱AI正式发布并开源GLM-ASR系列语音识别模型,并推出基于该系列模型打造的桌面端“智谱AI输入法”。
本次发布模型与产品包括:
- GLM-ASR-2512:全球领先的云端语音识别模型;
- GLM-ASR-Nano-2512:参数量仅1.5B的开源SOTA端侧语音模型;
- 智谱AI输入法:将语音识别与大模型深度融合的桌面端效率工具。
据介绍,GLM-ASR-2512是智谱新一代语音识别模型,支持将语音实时转换为文字。在多场景、多语种、多口音的真实复杂环境测试中,保持行业领先的识别表现,字符错误率(CER)仅为0.0717。
在此基础上,智谱AI开源了GLM-ASR-Nano-2512。这是一个1.5B参数的端侧模型,却取得了当前开源语音识别方向的SOTA表现,并在部分测试中优于若干闭源模型。它将识别能力压缩到本地运行,在保证高精度的同时,实现更强的隐私保护与更低的交互延迟。
基于上述模型能力,智谱AI正式上线智谱AI输入法,让用户在PC端用语音丝滑交互。用户不但可以实现精准的语音转文字,还可以实现翻译、改写等智能操作,真正实现“指尖即模型,语音即指令”。
即日起,智谱AI输入法面向所有用户开放,并免费提供2000积分,相当于28天使用时长。
-
GLM-ASR-2512
-
GLM-ASR-Nano-2512
-
智谱AI输入法:Mac/Win访问下载:https://autoglm.zhipuai.cn/autotyper/


