谷歌发布 Gemini 3 Flash:成本更低、速度更快
谷歌正式推出 Gemini 3 Flash,作为 Gemini 3 系列的最新成员,该模型在保持前沿推理能力的同时,显著提升速度并降低成本。
Gemini 3 Flash 已在 Gemini 应用、AI Mode 搜索、Vertex AI 及开发者平台 Google Antigravity 等产品中全球上线。该模型在 GPQA Diamond、MMMU Pro 等权威评测中表现优异,推理速度较 Gemini 2.5 Pro 提升 3 倍,Token 消耗减少 30%。其高效性能已获 JetBrains、Figma、Bridgewater Associates 等企业采用,适用于智能编码、多模态分析及实时交互场景。
在 SWE-bench Verified 基准测试中,Gemini 3 Flash 的解决率达到 78%,仅次于 GPT-5.2 的 80%,不仅超越 Gemini 2.5 系列,甚至优于同门的 Gemini 3 Pro,Pro 的准确率为 76.2%。
Gemini 3 Flash 定价为每 100 万输入 token 0.50 美元,每 100 万输出 token 3.00 美元。虽然略高于 Gemini 2.5 Flash 的每 100 万输入 token 0.30 美元和输出 token 2.50 美元,但谷歌表示,新一代 Flash 模型性能超越 Gemini 2.5 Pro,速度却达到其三倍。
谷歌已将 Gemini 3 Flash 作为默认模型推送至 Gemini App 以及搜索中的 AI Mode。谷歌表示,该模型面向全球用户免费开放,带来更强的日常 AI 能力。



