谷歌发布新图像生成模型 nano banana
谷歌正式发布了其最先进的图像生成与编辑模型——Gemini 2.5 Flash Image(又名 nano banana)。
据官方介绍,Gemini 2.5 Flash Image 的主要特点包括下面几点:
- 充分保持角色的一致性:它可以轻松地将同一个角色置于不同的环境中,或者从多个角度展示同一款产品,同时完美地保持其核心主体不变。
- 基于提示的图片编辑:允许用户通过简单的自然语言指令,对图片进行精准的局部修改 。
- 利用 Gemini 的现实世界知识:模型可借助 Gemini 强大的世界知识库,让图像生成变得更加「智能」。
- 多幅图像融合:可以将一张图片中的物体「放」进另一张图片的场景里,整个过程只需一条提示指令就能完成。
性能表现上,Gemini 2.5 Flash Image 在多项基准测试上均为第一名,超越 OpenAI ChatGPT 4o(GPT Image 1 high)、Qwen Image Edit 等模型。
关于调用 API,具体的定价是每百万输出 token 30 美元,官方介绍,生成一张图片大约消耗 1290 个输出 token,也就是说,每张图片的成本约为 0.039 美元,换算下来人民币不到 3 毛钱。
目前,Gemini 2.5 Flash Image 已经可以通过 Gemini APP、Gemini API、Google AI Studio 和 Vertex AI 进行访问。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
苹果内部正探讨收购 Mistral 和 Perlextity 可能性
据报道,苹果公司内部已就收购法国人工智能初创公司 Mistral 以及美国的 Perplexity 展开讨论。这一举措旨在增强其人工智能能力,以应对谷歌和三星等竞争对手的领先优势。 此前,苹果首席执行官蒂姆・库克在上个月暗示,公司对大规模人工智能相关收购持开放态度,以加速其人工智能发展路线图,这与苹果以往在并购方面的保守姿态有所不同。Mistral 在去年 B 轮融资后估值超过 60 亿美元,本月有报道称该公司正在洽谈以 100 亿美元估值筹集 10 亿美元资金。今年早些时候,彭博社也曾报道,苹果高管内部讨论过对 Perplexity 的潜在收购意向。 据《The Information》报道,苹果服务业务主管埃迪・库伊是收购人工智能公司以增强苹果产品实力的主要倡导者,他曾提议收购 Netflix 和特斯拉,但均被库克否决。而软件业务主管克雷格・费德里吉则对大规模人工智能收购持谨慎态度,他认为苹果有能力内部构建人工智能技术。 目前,苹果对这两起潜在收购仍存顾虑,因其可能涉及巨额资金,而苹果历史上极少有超亿美元的收购交易。若联邦裁决终止苹果与谷歌 200 亿美元的默认搜索引擎合作,苹...
- 下一篇
vivo 等提出 DiMo-GUI:模态分治 + 动态聚焦,GUI 智能体推理时扩展的新范式
作者:vivo 互联网算法团队 本文入选 EMNLP 2025 Main Conference EMNLP 会议全称为 Conference on Empirical Methods in Natural Language Processing,由国际计算语言学协会 ACL 举办,是自然语言处理和人工智能领域最重要的学术会议之一。EMNLP 2025 会议共有 8174 篇投稿,Main Conference 接收率仅为 22.16%。 项目主页: https://github.com/vivo/DiMo-GUI 摘要: 本文介绍了一种无需额外训练的 GUI 定位框架 DiMo-GUI,针对多模态大语言模型(MLLMs)在复杂图形用户界面(GUI)定位任务中的挑战,通过动态视觉推理与模态感知优化显著提升性能。DiMo-GUI 采用逐级缩放的动态定位机制,迭代裁剪聚焦目标区域,减少视觉冗余;同时分离文本与图标模态,独立推理后结合指令评估确定最终目标,有效平衡多模态处理能力。在 GUI 定位任务最新的基准数据集上,DiMo-GUI 相较基线展现显著性能提升。作为即插即用框架,DiMo-GU...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS7,CentOS8安装Elasticsearch6.8.6
- 设置Eclipse缩进为4个空格,增强代码规范
- Windows10,CentOS7,CentOS8安装Nodejs环境
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- MySQL8.0.19开启GTID主从同步CentOS8