Gemini 2.5 Flash-Lite 稳定版(GA)发布
谷歌宣布其速度最快、成本最低的 Gemini 2.5 Flash-Lite 模型已正式进入稳定状态(GA)。
Gemini 2.5 Flash-Lite 在性能和成本之间取得了平衡,原生支持 100 万 token 上下文等高级功能。该模型定价为每百万输入 token 0.10 美元,每百万输出 token 0.40 美元,与 GPT-4.1 Nano 的价格相当。与预览版相比,其音频输入定价降低了 40%。
Gemini 2.5 Flash-Lite 在编码、数学、推理和多模态理解等多个基准上表现优于 2.0 Flash-Lite,支持 100 万 token 的上下文窗口、可控的思考预算(thinking budgets),以及 Grounding with Google Search、代码执行和 URL 上下文等原生工具。
开发者现在可以通过在代码中指定 gemini-2.5-flash-lite 来使用该稳定版模型。原有的预览版别名计划于 8 月 25 日移除。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
阿里开源 AI 编程模型 Qwen3-Coder
阿里通义千问宣布正式推出 Qwen3-Coder,“这是我们迄今为止最具代理能力的代码模型。” 根据介绍,Qwen3-Coder 拥有多个尺寸,其中 Qwen3-Coder-480B-A35B-Instruct 是当前最强大的版本。这是一个 480B 参数激活 35B 参数的 MoE 模型,原生支持 256K token 的上下文并可通过 YaRN 扩展到 1M token,拥有卓越的代码和 Agent 能力。 Qwen3-Coder-480B-A35B-Instruct 在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 上取得了开源模型的 SOTA 效果,可以与 Claude Sonnet4 媲美。 与此同时,阿里方面还推出并开源了一款用于代理式编程的命令行工具:Qwen Code。Qwen Code 基于 Gemini Code 进行二次开发,但进行了 prompt 和工具调用协议适配,使得 Qwen Code 可以最大程度激发 Qwen3-Coder 在 Agentic Coding 任务上的表现。Qwen3-Code...
- 下一篇
诚邀您参与 2025 网民网络安全感满意度调查活动
“2025网民网络安全感满意度调查活动”定于7月22日0时至31日24时开展样本采集工作,全国同步开通问卷答题通道,面向广大网民广泛征集意见。 诚邀各位参与问卷填写,动动手指,说说感受: 公众网民:https://myd.iscn.org.cn/#/s/8N7eFYUI?sourceId=706730 从业人员:https://myd.iscn.org.cn/#/s/z4PrSkac?sourceId=706730 网民网络安全感满意度调查活动以“网络安全为人民,网络安全靠人民”为主题,每年举办一届,是一个全国性、公益性网络安全社会调查活动。 活动采取线上问卷调查方式开展,网民群众可在每年的样本采集期间通过参与答卷,反映上网用网的感受、评价、建议及意见,是广大网民表达诉求、意见、建议的绿色通道。 为保障网民权益,让网民放心答题,本调查以不记名方式进行,问卷不涉及个人隐私信息。所采集的数据经汇总后仅用于相关课题研究。 与亿万网民同心而行,与国家网络安全同向而进。2025年度调查活动将继续秉承“以人为本”的理念,携手社会各界力量,进一步“听民声,集民意,解民忧,畅民心”,助力提升网民群众的...
相关文章
文章评论
共有0条评论来说两句吧...