谷歌发布新图像生成模型 nano banana-低调大师

谷歌发布新图像生成模型 nano banana

2025-08-27 180

谷歌正式发布了其最先进的图像生成与编辑模型——Gemini 2.5 Flash Image（又名 nano banana）。

据官方介绍，Gemini 2.5 Flash Image 的主要特点包括下面几点：

充分保持角色的一致性：它可以轻松地将同一个角色置于不同的环境中，或者从多个角度展示同一款产品，同时完美地保持其核心主体不变。
基于提示的图片编辑：允许用户通过简单的自然语言指令，对图片进行精准的局部修改。
利用 Gemini 的现实世界知识：模型可借助 Gemini 强大的世界知识库，让图像生成变得更加「智能」。
多幅图像融合：可以将一张图片中的物体「放」进另一张图片的场景里，整个过程只需一条提示指令就能完成。

性能表现上，Gemini 2.5 Flash Image 在多项基准测试上均为第一名，超越 OpenAI ChatGPT 4o（GPT Image 1 high）、Qwen Image Edit 等模型。

关于调用 API，具体的定价是每百万输出 token 30 美元，官方介绍，生成一张图片大约消耗 1290 个输出 token，也就是说，每张图片的成本约为 0.039 美元，换算下来人民币不到 3 毛钱。

目前，Gemini 2.5 Flash Image 已经可以通过 Gemini APP、Gemini API、Google AI Studio 和 Vertex AI 进行访问。

微信关注我们

原文链接：https://www.oschina.net/news/368669/google-gemini-2-5-flash-image

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

苹果内部正探讨收购 Mistral 和 Perlextity 可能性

据报道，苹果公司内部已就收购法国人工智能初创公司 Mistral 以及美国的 Perplexity 展开讨论。这一举措旨在增强其人工智能能力，以应对谷歌和三星等竞争对手的领先优势。此前，苹果首席执行官蒂姆・库克在上个月暗示，公司对大规模人工智能相关收购持开放态度，以加速其人工智能发展路线图，这与苹果以往在并购方面的保守姿态有所不同。Mistral 在去年 B 轮融资后估值超过 60 亿美元，本月有报道称该公司正在洽谈以 100 亿美元估值筹集 10 亿美元资金。今年早些时候，彭博社也曾报道，苹果高管内部讨论过对 Perplexity 的潜在收购意向。据《The Information》报道，苹果服务业务主管埃迪・库伊是收购人工智能公司以增强苹果产品实力的主要倡导者，他曾提议收购 Netflix 和特斯拉，但均被库克否决。而软件业务主管克雷格・费德里吉则对大规模人工智能收购持谨慎态度，他认为苹果有能力内部构建人工智能技术。目前，苹果对这两起潜在收购仍存顾虑，因其可能涉及巨额资金，而苹果历史上极少有超亿美元的收购交易。若联邦裁决终止苹果与谷歌 200 亿美元的默认搜索引擎合作，苹...

2025-08-27

204

作者：vivo 互联网算法团队本文入选 EMNLP 2025 Main Conference EMNLP 会议全称为 Conference on Empirical Methods in Natural Language Processing，由国际计算语言学协会 ACL 举办，是自然语言处理和人工智能领域最重要的学术会议之一。EMNLP 2025 会议共有 8174 篇投稿，Main Conference 接收率仅为 22.16%。项目主页： https://github.com/vivo/DiMo-GUI 摘要：本文介绍了一种无需额外训练的 GUI 定位框架 DiMo-GUI，针对多模态大语言模型（MLLMs）在复杂图形用户界面（GUI）定位任务中的挑战，通过动态视觉推理与模态感知优化显著提升性能。DiMo-GUI 采用逐级缩放的动态定位机制，迭代裁剪聚焦目标区域，减少视觉冗余；同时分离文本与图标模态，独立推理后结合指令评估确定最终目标，有效平衡多模态处理能力。在 GUI 定位任务最新的基准数据集上，DiMo-GUI 相较基线展现显著性能提升。作为即插即用框架，DiMo-GU...

2025-08-27

241

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。