Google在I/O 2026上正式发布Gemini 3.5 Flash,这是Google最新一代结合前沿智能与行动能力的模型系列。

3.5 Flash定位为迄今最强的Agentic和编程模型,在Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)和MCP Atlas(83.6%)等具有挑战性的基准测试中均超越Gemini 3.1 Pro,并在多模态理解(CharXiv Reasoning 84.2%)方面处于领先地位。最亮眼的数据是:输出token速度是其他前沿模型的4倍。


3.5 Flash已全面上线:通过Gemini应用和AI Mode向全球数十亿用户开放;通过Google Antigravity平台和Gemini API向开发者提供;通过Gemini Enterprise Agent Platform向企业提供服务。3.5 Pro版本也已在内部使用,计划下月发布。
在Agent任务方面,3.5 Flash与更新后的Antigravity工具链结合,成为部署协作式子Agent的强大引擎。在监督下,它能够可靠地执行多步骤工作流和编码任务,同时保持前沿性能。Shopify已经在利用3.5 Flash运行并行子Agent,对复杂数据进行长期分析,从而实现更准确的商户增长预测。

安全性方面,Gemini 3.5基于Google前沿安全框架开发,强化了网络和CBRN安全防护,并通过可解释性工具帮助在模型提供响应前检查和理解其内部推理。
本次I/O上,Google还宣布了基于3.5 Flash的个性化AI Agent——Gemini Spark。它24小时运行,在用户指导下帮助处理数字生活中的各种任务。Gemini Spark现已向部分信任测试者开放,美国的Google AI Ultra订阅用户预计下周可以使用Beta版本。
参考来源:https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/