谷歌发布 2.7 亿参数的多模态模型:Gemma 3 270M
谷歌发布了专为任务特定微调设计的 2.7 亿参数紧凑模型 Gemma 3 270M,该模型具备高能效和内置指令遵循能力,并支持 INT4 精度运行。Gemma 3 270M 包含 1.7 亿嵌入参数、1 亿 Transformer 参数以及 25.6 万词汇量,为特定领域和语言的微调提供了坚实的基础。
Gemma 3 270M 具有很高的能效。它提供了生产就绪的量化感知训练(QAT)检查点,支持在 INT4 精度下运行,性能损失极小,非常适用于资源受限的设备。模型还附带了指令微调版本,可实现开箱即用。该模型的核心价值在于通过微调释放其潜力,能够高精度、高速度且经济高效地执行文本分类、数据提取等任务。
它适用于情感分析、实体提取、查询路由等高吞吐量、定义明确的任务。其小巧的尺寸支持快速微调迭代和设备上运行,确保了用户隐私。开发者可以通过 Hugging Face、Ollama、Kaggle、LM Studio 和 Docker 下载 Gemma 3 270M。
它支持在 Vertex AI、llama.cpp、Gemma.cpp、LiteRT、Keras 和 MLX 等多种推理工具上运行。

