智谱 GLM 4.6 大模型适配寒武纪、摩尔线程芯片
智谱刚刚上线了 GLM 系列的最新版本:GLM-4.6。
GLM-4.6 已在寒武纪领先的国产芯片上实现 FP8+Int4 混合量化部署,这是首次在国产芯片投产的 FP8+Int4 模型芯片一体解决方案,在保持精度不变的前提下,大幅降低推理成本,为国产芯片在大模型本地化运行上开创了可行路径。
此外,基于 vLLM 推理框架部署,摩尔线程新一代 GPU 可基于原生 FP8 精度稳定运行 GLM-4.6,充分印证了 MUSA 架构和全功能 GPU 在生态兼容与快速支持方面的强大优势。
GLM-4.6 和寒武纪、摩尔线程国产芯片的组合,即将通过智谱 MaaS 平台正式面向大众和企业提供服务。未来,国产原创 GLM 大模型与国产芯片将联合推动在模型训练和推理环节的性能与效率优化。
随着 GLM-4.6 发布,智谱同步升级 GLM Coding Plan(最低 20 元包月畅玩套餐),此前订阅 GLM Coding Plan 包月套餐的用户自动升级至 GLM-4.6,新增:
-
图像识别与搜索能力。
-
支持 Claude Code、Roo Code、Kilo Code、Cline 等 10 + 主流编程工具。
-
面向高频重度开发者提供 GLM Coding Max,是 Claude Max (20x) plan 三倍用量。
同时推出 GLM Coding Plan 企业版套餐,为企业级用户提供兼具安全、成本效益与国际顶尖性能的编码套餐。
