谷歌发布 Gemini 2.5 Flash:性能与效率的平衡之作
2025年4月17日,谷歌正式宣布通过Google AI Studio和Vertex AI平台推出Gemini 2.5 Flash预览版。作为2.0 Flash的全面升级,这款新模型在保持速度和成本优势的同时,显著提升了推理能力,成为谷歌首款真正意义上的混合推理模型。
思考能力成为焦点
Gemini 2.5 Flash最引人注目的特点在于其可控制的思考能力。不同于传统模型直接生成输出,Gemini 2.5系列模型能够在响应前进行「思考」过程,更好地理解提示,分解复杂任务,并规划回答。这一特性使模型在处理需要多步推理的复杂任务时(如解决数学问题或分析研究问题)能够给出更准确、更全面的答案。
据谷歌官方介绍,在LMArena的Hard Prompts基准测试中,Gemini 2.5 Flash表现出色,仅次于2.5 Pro。这一成就标志着较小规模模型也能实现接近顶级模型的推理能力,为开发者提供了更经济的选择。
精细化控制思考预算
谷歌深知不同使用场景对质量、成本和延迟有着不同的权衡要求。为此,Gemini 2.5 Flash引入了「思考预算」(thinking budget)机制,允许开发者对模型在思考阶段可以生成的最大token数量进行精细控制。更高的预算可以让模型进行更深入的推理,提高输出质量。
值得注意的是,思考预算仅设置上限,模型不会浪费资源——如果提示不需要太多思考,模型会自动调整使用的思考量。谷歌表示,模型已经训练成能够根据任务复杂度自动决定思考时间的长短。
如果开发者希望保持最低成本和延迟,同时仍然获得比2.0 Flash更好的性能,可以将思考预算设为0。当然,他们也可以在API中使用参数或在Google AI Studio和Vertex AI中使用滑块来设置特定的思考预算。对于2.5 Flash,预算范围可以从0到24576个token。
性价比领先的思考模型
Gemini 2.5 Flash的价格策略引人注目。根据谷歌提供的数据,这款模型保持了最佳的价格性能比,尤其是相较于竞争对手的同类产品。在输入价格方面,每百万token为0.15美元,输出价格为每百万token 0.60美元,相比OpenAI的o4-mini、Anthropic的Claude Sonnet 3.7和xAI的Grok 3 Beta等竞品,具有明显的成本优势。
在性能上,Gemini 2.5 Flash在多项基准测试中表现出色。例如,在「Humanity's Last Exam」(无工具)测试中达到了12.1%的成绩,在GPQA Diamond科学测试中达到了78.3%的单次尝试成绩,在AIME 2025数学测试中达到了78.0%的单次尝试成绩。虽然在某些指标上略逊于更昂贵的模型,但考虑到其价格,这些成绩令人印象深刻。
开发者反应褒贬不一
在技术社区Hacker News上,对谷歌AI产品的讨论热度颇高。一些用户表示,自从谷歌将Gemini 2.5 Pro(实验版)免费提供以来,他们已成为谷歌模型的忠实用户。用户zoogeny分享道:「Gemini 2.5 Pro是如此大的进步,以至于我对谷歌的模型整体产生了信心。它不仅在我接触的大多数主题上比我更聪明,而且也不是完全顺从。该模型会对我提出反驳,而不是扭曲自己以找到同意的方式。」
一些用户甚至表示已取消对Anthropic的订阅,转而使用谷歌的服务。用户jeeeb称:「在并排比较Gemini Pro和Claude Sonnet 3.7的编码回答几次后,我决定取消我的Anthropic订阅,只使用Gemini。」
然而,也有用户提出了一些担忧。有人指出,谷歌Gemini网页应用存在基本层面的问题,如速度慢、卡在「显示思考」环节、拒绝接受一次性发送的20万token提示等。另有用户担忧谷歌可能会像过去一样,通过提供免费服务直到竞争对手消亡,然后降低质量的方式来操控市场。
行业影响与前景
Gemini 2.5 Flash的发布进一步加剧了AI模型市场的竞争。有分析认为,谷歌正在AI竞赛中悄然领先,特别是在企业应用领域。相较于OpenAI和Anthropic等竞争对手,谷歌拥有垂直整合的芯片渠道、深厚的供应链和丰富的运营知识,为其提供了显著的成本优势。
此外,谷歌拥有的海量数据资源也是其不可忽视的优势。随着基础模型提供商已经处理完普通爬网数据并竞相消费视频和剩余内容,新数据变得越来越有价值,成为长期竞争的关键因素。
Gemini 2.5 Flash的推出标志着谷歌在AI领域的野心。虽然目前仍处于预览阶段,但谷歌表示,将继续改进这一模型,并将很快推出更多功能,然后才会将其正式发布用于全面生产。
随着AI技术的快速发展,不同公司之间的竞争日益激烈。对于开发者和用户来说,这场竞争带来了更多选择,也推动了AI技术的不断进步。谷歌能否凭借Gemini 2.5 Flash在这场竞争中赢得优势,值得市场持续关注。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
百度创始人李彦宏 2025 年首场演讲海报曝光
百度创始人李彦宏的2025年首场演讲海报曝光,他将于4月25日在Create2025百度AI开发者大会上,带来持续1个小时的演讲《模型的世界,应用的天下》。 海报背景文案囊括了MCP、智能体、数字人、模型成本等AI热点议题,预告了李彦宏将在大会现场带来百度AI的全新产品发布和业务进展。 此前,百度预告将在Create大会上发布文心大模型4.5 Turbo,从海报看,李彦宏或将在演讲中详细介绍这款模型的特色和能力。 文心大模型 4.5 Turbo 强在哪里? MCP 会带来更开放的生态吗? 智能体应用的下一站在哪里? 模型迭代太快,应用会不会过时? 开发者的机会在哪里? 相关阅读:百度文心大模型 4.5 Turbo 将于 4 月 25 日亮相
- 下一篇
Grok 新增“记忆”功能,可回复个性化内容
马斯克旗下 xAI宣布Grok 新增 “记忆” 功能,能根据用户过去的对话内容记住相关细节。用户寻求推荐或建议时会得到个性化的回复 —— 当然前提是用户的使用频率足够高,让它能 “学会” 你的喜好。 同时,“记忆” 也是透明的,用户可以确切地看到 Grok 知晓的内容,并选择 “忘记” 什么。 相比之下,ChatGPT 早已支持类似的记忆功能,且最近升级后,能够调用用户完整的聊天历史。谷歌的 Gemini 同样具备持久记忆,能根据不同用户的习惯调整回应。 目前,Grok 的这项记忆功能已通过测试版形式登陆Grok.com网站以及 iOS 和Android应用,但暂不向欧盟和英国用户开放。 用户可以在设置菜单的“数据控制”页面关闭该功能,也能在网页端的 Grok 聊天界面,通过点击记忆下方的图标删除单条记忆 ——Android 版本很快也将支持这一操作。 xAI 表示,X 平台上的 Grok 也将逐步具备“记忆”功能。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2全家桶,快速入门学习开发网站教程
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- 2048小游戏-低调大师作品
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS关闭SELinux安全模块