智谱开源多模态大模型 GLM-4.6V 系列-低调大师

智谱开源多模态大模型 GLM-4.6V 系列

2025-12-09 81

智谱AI正式开源GLM-4.6V系列多模态大模型，包含高性能版GLM-4.6V（106B-A12B）与轻量免费版GLM-4.6V-Flash（9B）。该系列实现“图像即参数，结果即上下文”的原生多模态工具调用能力，支持128K视觉上下文，可处理约150页文档或1小时视频。

GLM-4.6V（106B-A12B）：面向云端与高性能集群场景的基础版；
GLM-4.6V-Flash（9B）：面向本地部署与低延迟应用的轻量版。

作为 GLM 系列在多模态方向上的一次重要迭代，GLM-4.6V 将训练时上下文窗口提升到 128k tokens，在视觉理解精度上达到同参数规模 SOTA，并首次在模型架构中将 Function Call（工具调用）能力原生融入视觉模型，打通从「视觉感知」到「可执行行动（Action）」的链路，为真实业务场景中的多模态 Agent 提供统一的技术底座。

模型在30余项多模态基准评测中达同规模SOTA水平，API价格较上一代降低50%。典型应用涵盖智能图文生成、视觉导购Agent、前端代码复刻及长视频理解。模型权重与代码已在GitHub、Hugging Face及魔搭社区同步开放。

开源与部署

为了让更多开发者和研究者快速上手，智谱同步开放了模型权重、推理代码与在线调用能力。

开源资源

GLM-4.6V 的模型权重、推理代码与示例工程：

GitHub：https://github.com/zai-org/GLM-V
Hugging Face：https://huggingface.co/collections/zai-org/glm-46v
魔搭社区：https://modelscope.cn/collections/GLM-46V-37fabc27818446

已支持的推理框架包括 SGLang、vLLM、transformers、xLLM Ascend NPU，开发者可以在 GPU 与多种国产 NPU 环境下按需部署 GLM-4.6V 与 GLM-4.6V-Flash。

开放平台与在线调用

除了本地部署，智谱也提供云端托管推理与 API，方便直接接入业务：

开放平台：https://docs.bigmodel.cn/cn/guide/models/vlm/glm-4.6v
Coding Plan 视觉理解 MCP：https://docs.bigmodel.cn/cn/coding-plan/mcp/vision-mcp-server

在线体验入口：

z.ai：选择 GLM-4.6V 模型，即刻体验多模态理解与工具调用能力；
智谱清言 APP / 网页版：上传图片或视频，开启「推理模式」，体验多模态推理与长上下文能力。

技术 blog：z.ai/blog/glm-4.6v

微信关注我们

原文链接：https://www.oschina.net/news/388666/z-ai-glm-4-6v

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

英伟达确认可向中国出售 H200 芯片：美方批准出口并抽成 25%

科技媒体 TechCrunch 消息称，美国商务部已批准英伟达向中国的特定客户出口其先进 AI 芯片H200，这标志着英伟达高端 GPU 时隔数月后重新获得进入中国市场的通道。美国政府还将从相关销售中收取25% 的分成。美国总统特朗普已在其社交媒体上公开宣布了这一决定。对此，英伟达发表声明表示欢迎这一进展。公司发言人称：“我们赞赏特朗普总统的决定，该决定允许美国芯片行业参与竞争，从而支持美国的高薪工作岗位和制造业。政府允许英伟达向经过商务部审查的商业客户提供 H200芯片，是一个兼顾了各方利益的周全平衡，这对美国非常有利。”声明显示，英伟达不仅成功争取到了对华销售窗口，也重申了其在美国制造业和就业层面的战略价值。值得注意的是，就在一周前，英伟达 CEO 黄仁勋（Jensen Huang）刚在白宫与特朗普会面，双方讨论了出口管制相关议题。虽然黄仁勋当时未透露细节，但外界普遍认为，他对放宽出口限制进行了关键游说，而此次批准也被视为会谈的直接成果。

2025-12-09

28

最近，我们留意到不少刚接触 OpenAgents 的用户，都会问一个问题：“在实际场景里，OpenAgents 到底该怎么用？” 为了让大家更直观地感受 OpenAgents 的能力，我们准备了一系列开箱即用的演示案例——从单智能体对话到多智能体协作，覆盖多种实用场景。下面这 5 个 Demo，即便你是毫无经验的新手，也能轻松上手。你将学会：单智能体启动与对话多智能体角色协作实时信息流处理任务驱动的研究团队事件驱动与模块集成无需复杂配置，每个 Demo 都是完整、可运行的示例，可直观感受从单智能体对话到多智能体协作的完整进阶旅程。 OpenAgents 完整教程： https://openagents.org/docs/tutorials/tutorials Demo1 Hello World：回复消息的单智能体只需几步，就能启动你的第一个智能体“Charlie”。在聊天频道里打个招呼，它会热情回应。这是最简洁的 OpenAgents 示例 —— 一个会对任何消息做出回复的智能体。它非常适合用来验证你的安装是否正确，并熟悉最基础的操作流程。你将了解到：如何启动...

2025-12-09

37

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。