谷歌发布 Gemma 4 12B，无需编码器的统一多模态模型-低调大师

谷歌发布 Gemma 4 12B，无需编码器的统一多模态模型

2026-06-04 48

Google于6月3日正式发布了Gemma 4 12B，这是一款统一的多模态模型，在不需要传统多模态编码器的情况下实现了视觉和音频的直接处理。这个参数量的模型被设计为在消费级硬件上运行——仅需16GB显存或统一内存即可在本地运行，这意味着它可以直接部署在高端笔记本电脑上，无需云端算力支持。

从架构角度看，Gemma 4 12B的核心创新在于取消了传统多模态模型中的编码器组件。通常多模态模型需要独立的视觉编码器和音频编码器将图像和声音转换为与文本token维度匹配的表示，但Gemma 4 12B采用了一种轻量级的嵌入层来处理视觉输入——仅包含单次矩阵乘法、位置嵌入和归一化操作，大幅降低了计算复杂度。音频信号则直接投影到文本token维度空间，无需专门的音频编码器。这种"无编码器"设计使得整个模型的体积得以精简，同时也减少了推理时的计算步骤。

在性能方面，Gemma 4 12B的表现接近Google更大的26B MoE模型，在多项基准测试中展现出强大的多步推理和代理工作流能力。模型配备了Multi-Token Prediction（MTP）drafters，可以同时预测多个token来加速推理过程。截至发布时，Gemma 4系列模型的累计下载量已突破1.5亿次，显示出开发者社区对Google开源模型系列的高度认可。

这款模型采用Apache 2.0许可证开源发布，权重已在Hugging Face和Kaggle平台上架。支持的推理框架包括LM Studio、Ollama、MLX、SGLang和vLLM等，Google自家的AI Edge Gallery也提供了端侧部署支持。在生产环境方面，开发者可以通过Google Cloud的Model Garden、Cloud Run和GKE进行大规模部署。

参考来源：https://blog.google/innovation-and-ai/technology/developers-tools/introducing-gemma-4-12b/

微信关注我们

原文链接：https://www.oschina.net/news/451788/google-gemma-4-12b

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

月之暗面 Kimi Work 开启公测：通用型本地 Agent

月之暗面宣布推出 Kimi Work Beta 版，一个面向知识工作者的通用型本地 Agent，可以熟练运用于金融、科研及办公等场景。目前已随 Kimi 最新测试版 Mac 和 Windows 客户端推出：内核是 Kimi Code，每天几十万程序员和 Kimi 全员在用的本地 Coding Agent，提供本地 Agent 基础能力，包括安装和使用技能（Skill）、运行定时任务等。继承了在线版 Kimi Agent 的建站、PPT 等专业 Skills 和金融、科研、法律等专业数据库。内置了 Kimi WebBridge 方案。支持 Agent 集群，最高可以根据任务复杂度，自主...

2026-06-04

51

近日，2026 高通&瑞莎 AI 开发者日在深圳成功举行。本次大会以“AI 共进，开源新生”为主题，吸引了众多嵌入式开发者、软硬件生态伙伴以及开源社区爱好者的关注。作为国内领先的开源操作系统社区，deepin 携最新适配成果亮相大会，设立了专属体验展位。在现场，deepin 重点展示了 deepin 25 操作系统在瑞莎（Radxa）全新发布的 Dragon Q8B 以及 Dragon Q6A 等高通平台开发板上的最新适配进展，向与会者呈现了国产桌面操作系统在多架构、高性能硬件上的全新可能。极速适配的背后：主线化与标准化的力量在本次展会上，最引人注目的展品...

2026-06-04

40

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。