Google DeepMind 开源 Gemma 4-低调大师

Google DeepMind 开源 Gemma 4

2026-04-03 69

谷歌宣布正式推出 Gemma 4 系列多模态模型，采用 Apache 2 许可，“这是我们迄今为止最智能的开放模型”。

官方文档介绍称，Gemma 是一系列先进的轻量级开放模型，其开发采用了与 Gemini 模型相同的研究成果和技术。 Gemma 由 Google DeepMind 和 Google 的其他团队共同开发，其名称源自拉丁语 gemma，意为“宝石”。

与 Gemma-3n 类似，Gemma 4 支持图像、文本和音频输入，并生成文本响应。文本解码器基于 Gemma 模型，并支持长上下文窗口。图像编码器与 Gemma 3 的编码器类似，但进行了两项关键改进：可变宽高比和可配置的图像 token 输入数量，以便用户在速度、内存和质量之间找到最佳平衡点。所有型号均支持图像（或视频）和文本输入，而小型版本（E2B 和 E4B）还支持音频输入。

Gemma 4 共包含四个版本：Gemma 4 E2B，有效 20 亿参数；Gemma 4 E4B，有效 40 亿参数；Gemma 4 31B 稠密模型以及 Gemma 4 26B 混合专家（MoE），激活参数 4B，总参数 26B。

Model	Parameter Size	Context Window	Checkpoints
Gemma 4 E2B	2.3B effective, 5.1B with embeddings	128k	base, IT
Gemma 4 E4B	4.5B effective, 8B with embeddings	128k	base, IT
Gemma 4 31B	31B dense model	256K	base, IT
Gemma 4 26B A4B	mixture-of-experts with 4B activated/26B total parameters	256K	base, IT

Gemma 4 借鉴了此前 Gemma 版本和其他开源模型中使用的多个架构组件，并剔除了 Altup 等复杂或不确定的功能。这种组合旨在实现跨库和设备的高度兼容性，能够高效支持长上下文和代理用例，同时非常适合量化。

这一特征组合（结合训练数据和配方）使 310 亿参数的稠密模型实现了 1452 的 LMArena 估计分数（仅文本），而 260 亿参数的 MoE 模型仅凭 40 亿个活跃参数就达到了 1441 分。

31B 模型目前在行业标准的 Arena AI 文本排行榜上名列全球开放模型第 3 位，26B 模型则名列第 6 位。在榜单中，Gemma 4 的表现甚至超越了规模达其 20 倍的模型。

以下是 Gemma 4 的主要架构特点：

交替使用局部滑动窗口和全局全上下文注意力层。较小的稠密模型使用 512 个 token 的滑动窗口，而较大的模型使用 1024 个 token 的滑动窗口。
Dual RoPE 配置：标准 RoPE 用于滑动层，比例 RoPE 用于全局层，以实现更长的上下文。
Per-Layer Embeddings (PLE)：一个额外的嵌入表，将一个小的残差信号输入到每个解码器层。
共享 KV 缓存：模型的最后 N 层重用来自前面层的键值状态，消除冗余的 KV 投影。
Vision encoder：使用学习到的 2D 位置和多维 RoPE。保留原始宽高比，并且可以将图像编码为几种不同的 token budgets（70、140、280、560、1120）。
Audio encoder：USM-style conformer，其基础架构与 Gemma-3n 中的架构相同。

基准测试结果

更多详情可查看官方公告。

微信关注我们

原文链接：https://www.oschina.net/news/417088/gemma-4

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

AIGC For Future 全球挑战赛正式启幕，OSChina 邀您直通日内瓦

当 AIGC 的浪潮席卷全球，创新的边界正被重新定义。3月31日联合国日内瓦万国宫，一场面向未来的全球数字创新行动——“AIGC For Future 全球挑战赛”正式拉开帷幕。作为2026全球数字经济大会的重要国际活动之一，由国际电信联盟（ITU）与全球数字经济城市联盟（DEC40）联合主办，北京市经信局、北京市广电局联合承办的“AIGC For Future全球挑战赛”面向全球正式发布。这不仅是一项国际赛事的启动，更是中国数字经济创新力量走向全球、参与全球数字治理与合作的重要一步。从北京到日内瓦，从城市实践到全球舞台，一条以数字技术为纽带的国际合作路径正在加速形成。依托国际电信联盟（ITU）这一联合国专门机构，以及全球数字经济城市联盟（DEC40）的城市网络，大赛将连接全球30多个国家、百余家媒体与多元产业资源，构建一个跨地域、跨文化、跨产业的AIGC协同创新生态。这也标志着，AIGC技术正从工具层走向全球公共议题，成为推动可持续发展与国际合作的重要力量。 OSChina 正式受邀成为本次赛事的官方合作伙伴，向全社区开发者发出最诚挚的创新邀约：让技术回应真实世界，用创意点...

2026-04-02

78

针对部分账号滥用 AI 工具，对经典影视剧、动画片等内容进行颠覆性篡改、“魔性” 解构与低俗化改编的问题，微信发布“关于 “AI 魔改” 视频阶段性治理的公告（第六期）”。公告指出，经平台巡查发现，个别账号存在违规发布不良导向 “AI 魔改” 视频的行为，根据国家相关法律法规要求以及《腾讯微信软件许可服务协议》《微信视频号运营规范》的相关规定，平台对相关短视频内容和账号进行处置，2026 年 3 月累计处置违规短视频内容 3800 条，处置相关账号 1 个。下架内容案例： 1、AI魔改《三国演义》《水浒传》等经典影视作品，扭曲原著精神、颠覆角色设定、恶意解构主流共识； 2、AI魔改历史名人、英模故事，歪曲历史、亵渎英雄、误导青少年价值观，伤害民族感情； 3、AI魔改未成年人熟知的动画形象，恶意邪典化、恐怖化的改编内容。

2026-04-03

80

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。