Google DeepMind 开源 Gemma 4
谷歌宣布正式推出Gemma 4 系列多模态模型,采用 Apache 2 许可,“这是我们迄今为止最智能的开放模型”。 官方文档介绍称,Gemma 是一系列先进的轻量级开放模型,其开发采用了与Gemini模型相同的研究成果和技术。 Gemma 由 Google DeepMind 和 Google 的其他团队共同开发,其名称源自拉丁语gemma,意为“宝石”。 与 Gemma-3n 类似,Gemma 4 支持图像、文本和音频输入,并生成文本响应。文本解码器基于 Gemma 模型,并支持长上下文窗口。图像编码器与 Gemma 3 的编码器类似,但进行了两项关键改进:可变宽高比和可配置的图像 token 输入数量,以便用户在速度、内存和质量之间找到最佳平衡点。所有型号均支持图像(或视频)和文本输入,而小型版本(E2B 和 E4B)还支持音频输入。 Gemma 4 共包含四个版本:Gemma 4 E2B,有效 20 亿参数;Gemma 4E4B,有效 40 亿参数;Gemma 431B 稠密模型以及Gemma 426B 混合专家(MoE),激活参数 4B,总参数 26B。 Model Param...
