您现在的位置是:首页 > 文章详情

谷歌发布 Gemini 2.5 Flash:性能与效率的平衡之作

日期:2025-04-18点击:14

2025年4月17日,谷歌正式宣布通过Google AI Studio和Vertex AI平台推出Gemini 2.5 Flash预览版。作为2.0 Flash的全面升级,这款新模型在保持速度和成本优势的同时,显著提升了推理能力,成为谷歌首款真正意义上的混合推理模型。

思考能力成为焦点

Gemini 2.5 Flash最引人注目的特点在于其可控制的思考能力。不同于传统模型直接生成输出,Gemini 2.5系列模型能够在响应前进行「思考」过程,更好地理解提示,分解复杂任务,并规划回答。这一特性使模型在处理需要多步推理的复杂任务时(如解决数学问题或分析研究问题)能够给出更准确、更全面的答案。

据谷歌官方介绍,在LMArena的Hard Prompts基准测试中,Gemini 2.5 Flash表现出色,仅次于2.5 Pro。这一成就标志着较小规模模型也能实现接近顶级模型的推理能力,为开发者提供了更经济的选择。

精细化控制思考预算

谷歌深知不同使用场景对质量、成本和延迟有着不同的权衡要求。为此,Gemini 2.5 Flash引入了「思考预算」(thinking budget)机制,允许开发者对模型在思考阶段可以生成的最大token数量进行精细控制。更高的预算可以让模型进行更深入的推理,提高输出质量。

值得注意的是,思考预算仅设置上限,模型不会浪费资源——如果提示不需要太多思考,模型会自动调整使用的思考量。谷歌表示,模型已经训练成能够根据任务复杂度自动决定思考时间的长短。

如果开发者希望保持最低成本和延迟,同时仍然获得比2.0 Flash更好的性能,可以将思考预算设为0。当然,他们也可以在API中使用参数或在Google AI Studio和Vertex AI中使用滑块来设置特定的思考预算。对于2.5 Flash,预算范围可以从0到24576个token。

性价比领先的思考模型

Gemini 2.5 Flash的价格策略引人注目。根据谷歌提供的数据,这款模型保持了最佳的价格性能比,尤其是相较于竞争对手的同类产品。在输入价格方面,每百万token为0.15美元,输出价格为每百万token 0.60美元,相比OpenAI的o4-mini、Anthropic的Claude Sonnet 3.7和xAI的Grok 3 Beta等竞品,具有明显的成本优势。

在性能上,Gemini 2.5 Flash在多项基准测试中表现出色。例如,在「Humanity's Last Exam」(无工具)测试中达到了12.1%的成绩,在GPQA Diamond科学测试中达到了78.3%的单次尝试成绩,在AIME 2025数学测试中达到了78.0%的单次尝试成绩。虽然在某些指标上略逊于更昂贵的模型,但考虑到其价格,这些成绩令人印象深刻。

开发者反应褒贬不一

在技术社区Hacker News上,对谷歌AI产品的讨论热度颇高。一些用户表示,自从谷歌将Gemini 2.5 Pro(实验版)免费提供以来,他们已成为谷歌模型的忠实用户。用户zoogeny分享道:「Gemini 2.5 Pro是如此大的进步,以至于我对谷歌的模型整体产生了信心。它不仅在我接触的大多数主题上比我更聪明,而且也不是完全顺从。该模型会对我提出反驳,而不是扭曲自己以找到同意的方式。」

一些用户甚至表示已取消对Anthropic的订阅,转而使用谷歌的服务。用户jeeeb称:「在并排比较Gemini Pro和Claude Sonnet 3.7的编码回答几次后,我决定取消我的Anthropic订阅,只使用Gemini。」

然而,也有用户提出了一些担忧。有人指出,谷歌Gemini网页应用存在基本层面的问题,如速度慢、卡在「显示思考」环节、拒绝接受一次性发送的20万token提示等。另有用户担忧谷歌可能会像过去一样,通过提供免费服务直到竞争对手消亡,然后降低质量的方式来操控市场。

行业影响与前景

Gemini 2.5 Flash的发布进一步加剧了AI模型市场的竞争。有分析认为,谷歌正在AI竞赛中悄然领先,特别是在企业应用领域。相较于OpenAI和Anthropic等竞争对手,谷歌拥有垂直整合的芯片渠道、深厚的供应链和丰富的运营知识,为其提供了显著的成本优势。

此外,谷歌拥有的海量数据资源也是其不可忽视的优势。随着基础模型提供商已经处理完普通爬网数据并竞相消费视频和剩余内容,新数据变得越来越有价值,成为长期竞争的关键因素。

Gemini 2.5 Flash的推出标志着谷歌在AI领域的野心。虽然目前仍处于预览阶段,但谷歌表示,将继续改进这一模型,并将很快推出更多功能,然后才会将其正式发布用于全面生产。

随着AI技术的快速发展,不同公司之间的竞争日益激烈。对于开发者和用户来说,这场竞争带来了更多选择,也推动了AI技术的不断进步。谷歌能否凭借Gemini 2.5 Flash在这场竞争中赢得优势,值得市场持续关注。

原文链接:https://www.oschina.net/news/345237
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章