替兄弟们试过了,Nano Banana 是真心能打!
某红书最新的起号方法,出奇得一致。随便翻一下,几乎全被各式精致、逼真的手办图刷屏了。仔细深扒,不管是 AI 圈、二次元圈、萌宠圈,还是骑行圈、健身圈、模特圈,感觉大家都在用 AI 生成 3D 手办,咔咔吸粉~
那么,他们具体玩的是哪一款模型呢?请出今天的主角: Nano Banana 。
起初, Nano Banana 在 LM Arena 平台匿名出现,因生图表现太过能打,引得无数网友猜测其归属。直至两天后,Google 才下场认领,原来是他们刚上线的 Gemini-2.5-Flash-Image-Preview 。官方的介绍有三:
-
SOTA 图像生成和编辑
-
令人难以置信的主体一致性
-
闪电般快速
主打一个言简意赅。而在笔者查阅资料的过程中还发现:Gemini-2.5-Flash-Image-Preview 支持 32K 上下文,提供了温度(可以控制模型的创造力)以及一些高级设置。价格方面,该模型输入/输出文本的价格是 0.3/2.5 美元,输入/输出图像的价格是 0.3/30 美元。知识截止时间是 2025 年 6 月。
大概计算下来, 该模型生成每张图像的成本大约为 0.039 美元(约 0.27 元人民币),价格也很平民化。当然,好模还得跑了才知道!目前,Nano Banana 已经在 Google AI Studio 和 Gemini API 中提供了预览,大家可以免费使用。同时,笔者也为大家整理了 5 个 Nano Banana 的创意玩法,一并奉上~
体验入口:
在 Gemini 中使用,地址: https://gemini.google.com/
在 AI Studio 中使用,地址: https://aistudio.google.com/
玩法一:纹理修改
首先要为大家介绍的,是 Nano Banana 强大的 「电商级」纹理修改功能。
比如说,你准备发朋友圈,但手里只有一张低等级牛肉的照片,想整高级一点,怎么办呢?只需要把原图丢给 Nano Banana ,然后输入提示词:
Adjust the grain of the beef to that of S3-grade beef
把牛肉的纹路改成 S3 级别牛排的纹路,就可以得到你想要的高级氛围感~
左为原图输入,右为模型输出
而这样的纹路修改,笔者在谷歌的 AI Studio 的环境下只需要运行 11.5s ,丝毫没有多余的思考过程及文字,属于是直接将图片甩了出来。并且,由于模型对“一致性”的重视,所输出的图片将严格遵守提示词指令,如果大家有别的增改,例如:添加氛围灯、旁边放杯红酒、切块放置等等,只需要继续在 Chat 框里添加新的提示词。
*笔者还发现:在 AI Studio 环境下,使用英文提示词的成功率远大于中文提示词,大段的中文提示词容易被当作文本,被模型原封不动吐回来。
Nano Banana 的纹路修改功能,特别适用于工业设计的样品纹理开版,而对于电商平台 低成本生成产品展示图也非常方便,进一步提高了设计人员的工作效率。但在实测过程中,笔者总感觉这个功能有点邪修,如果后续广泛应用于修改食材纹路、玉石纹路、布样纹路,那么非标领域的广告真实性将很难保证。
玩法二:草图控制
分享一个不那么容易被大家想到的玩法:通过草图(或线稿),修改图片角色的动作。
实测中,笔者找了一张《进击的巨人》中的兵长的图片,然后自己用笔在白纸上手绘了一张动作草图,然后丢给 Nano Banana ,输入提示词:
Make the character in Picture 1 pose in the posture shown in Picture 2, with an image aspect ratio of 1:1
让图片一的角色摆出图片二所示的动作,画幅比例1:1 ,就可以得到:
左为原图输入(图一),中为草图输入(图二),右为模型输出
虽然最后生成的图片,并没有与图二完全保持一致,但整体来说:Nano Banana 所生成的图片,其人物面部表情,已经非常贴合了,且在细节方面丝毫没有偷懒: 图一人物袖标“自由之翼”为9根羽毛,图三 AI 输出的“自由之翼”依旧为9根羽毛。
鉴于笔者的画工着实不济,后续我又找了两张动漫图片,加一张表情包,还是丢给 Nano Banana ,输入提示词:
The two characters interact in the posture shown in Picture 3. The scene background should match the atmosphere of the image, and interactive effects between the environment and the characters should be added. The image aspect ratio is set to 1:1
两名角色以图三所示的姿势展开互动,场景背景需与画面氛围相契合,并加入环境与角色的互动效果, 画面比例 设定为 1:1 ,就可以得到:
似乎 Nano Banana 在处理图片时,还考虑到了人类世界的一些真实可能,例如:右边女性角色在攻击的同时,另一只手保持出握拳的姿势。而在场景处理方面,走廊地板上还对应生成了来自于天花板的灯光投影。
笔者只想说:或许哈,等 Nano Banana 的生成能力再提一个数量级,那么大家后面想看什么,基本就可以自己画了~
玩法三:无提示词
刚才笔者测试的,还只是动漫角色,这部分,带大家来看看 Nano Banana 的 AI 人像生成效果,并且: 不用提示词,而是将文字直接标注在图片上。例如这样:
上为原图输入,下为模型输出
大家可以看到,在没有输入任何提示词的情况下,Nano Banana 依旧可以根据图片中的文字说明,进行 AI 图片生成,并且图中两个的衣服均与原图保持一致。细节来了: 鉴于原图出现了两个人物,Nano Banana 在生成时还细节地让两名角色的空间位置保持了协调,而不是呆板地放置在那里。
但是,目前 Nano Banana 图片标注功能所生成的图片,清晰度还不算很高,期待它优化后的表现~
玩法四:图片拆分
以上实例,多多少少聊的都是“多图融合”,那么图片拆分呢?Nano Banana 在视觉推理上的能力可是非常强大的。比如,笔者向 Nano Banana 输入一张人像图片,并输入:
Extract the clothing worn by the characters in the picture separately to form a single product collection.
将图片中的角色的衣服单独挑出来,形成一个单品合集,就可以得到:
左为原图输入,右为模型输出
这对服装设计师来说,绝对的“垂死病中惊坐起”。一方面,Nano Banana 可以(几乎)原封不动地将原图模特身上的单品拆解下来,并且恰到好处地添加一些光影效果,完成了基础指令;另一方面,Nano Banana 还在外套的领口处添加了内胆设计,颜色也与整体画面很兼容,又带来了新的创意点。
玩法五:画面转绘
上一次被 AI 转绘惊艳,还是那一幅幅的“吉卜力”风格的 AI 照片,而现在,大家只需要在 Nano Banana 输入风格提示词,就可以得到超高一致性的各类风格 AI 转绘。
笔者自己用同一张图片,试了几款风格,提示词如下:
Convert this image to a black-and-white comic style. (黑白漫画风格)
Convert this image to an oil painting style. (油画风格)
Convert this image to a pop art style. (波普风格)
左一为原图输入,其余均为模型输出
之前使用 GPT-4o 、Flux Kontext ,图片转绘功能也让我觉得很牛,但也就那样, 涉及到人像、产品时,一点细微的变形,就让它们的商业价值大大降低。
相较之,Nano Banana 会更加一致、严谨,这一点从水纹、石块的细节上就可以得知,看一下对比图:
左为 Nano Banana 生成 ,右为某 AI 生成 (提示词一致)
右图的人像,基本已经脱离原图,不仅刻意收了腰线,还有点网红脸;而水纹方面,也是那种大粗笔的色块覆盖,且出现了一些不属于原图的色系。
玩法五:3D手办图
正如文章一开始所说,目前有很多博主在用 Nano Banana 起号、吸粉,笔者也把我实测到的结果,分享给大家,提示词如下:
Transform this photo into a character figurine. Place a packaging box printed with the character's image behind the figurine, and display a computer next to it, with the Blender modeling production process shown on the screen. Put a circular plastic base in front of the packaging box, on which the character figurine stands. Ensure the PVC material exhibits a clear and realistic texture, and set the scene in an indoor environment as much as possible.
将这张照片转换为一个角色手办。在手办背后放置一个印有该角色图像的包装盒,并在旁边展示一台电脑,屏幕上显示 Blender 建模的制作过程。在包装盒前方放置一个圆形塑料底座,上面站立着角色手办。让 PVC 材质呈现出清晰真实的质感,并尽量将场景设置在室内环境中,就可以得到:
不得不说,整个流程异常丝滑,但笔者也发现了一个大问题: 无论是 Nano Banana ,还是其他生图模型,在对于文字生成上面,基本上都会出现乱码,这也是笔者在多次测试过程中,都出现了一个情况。
写在最后:
从上述案例,我们可以得知:Nano Banana 已经不再只是一个图像生成模型,而是逐渐朝 「视觉推理 + 创意设计」的商业级工具迈进。这意味着什么?
意味着 Nano Banana 直接动了 Stable Diffusion 和 Photoshop 的蛋糕,因为后两者还是有一定的学习门槛,但 Nano Banana 只需要用户输入一句话、一张图,就能快速得到想要的图片,妥妥的 降本增效。
LM Arena 投票 榜单
另一方面,Nano Banana 是一种极致压缩、能在移动端运行的生图模型。换句话说,它不再是“ AI 工坊里的实验品”,而是真正能嵌入到 社交、广告、应用的“即时生成引擎”。
试想一下,某个刚刚创业的大学生,想在自己的电商平台上架一款运动鞋。过去,他需要自己搞定模特、摄影、美工、后期、文案,整个流程至少需要花 3-4 天;而现在,他将产品图上传给 Nano Banana 驱动的“ AI 商品助手”,就可以快速生成各类 banner 、产品展示、节日氛围图等等—— Nano Banana 把 AI 生图从“后台实验室”带到了“前台实时场景”。
最后,笔者还是需要向兄弟们提醒一句:Nano Banana 的强大一致性,意味着也可能会生成一些违规、违纪的图片出来 (懂得都懂),这一点,模型谈不上道德与否,但 AI 生图也不是法外之地。
散会~

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Altman:OpenAI 的 Codex 使用量激增 10 倍
OpenAI首席执行官Sam Altman近日宣布,该公司的人工智能编码工具Codex在过去两周内的使用量激增了10倍。这一显著增长表明,业界对OpenAI最新且最先进的AI模型GPT-5的强大功能有了更广泛的认识。作为Codex的核心驱动力,GPT-5正以其卓越的性能推动技术生态系统的变革。 Codex集成了GPT-5,提供了一系列强大功能,包括与VS Code、Cursor和Windsurf等平台的IDE扩展,支持无缝代码编辑和本地更改预览。此外,最近的更新还包括本地与云端任务切换、GitHub代码审查集成以及基于GPT-5重建的命令行界面(CLI),使其成为程序员的强大工具。这些改进使Codex成为处理复杂编码任务的领先解决方案,用户对其在多个代码库中处理复杂工作流程的能力赞不绝口。 AIbase指出,开发者对GPT-5在推理能力、速度和多模态功能方面的提升给予了高度评价,这些特性使Codex能够更高效地应对复杂的编程挑战。其“思考”模式下高达196,000个令牌的处理能力,使得处理长篇输入更加连贯,进一步提升了其在大型项目中的实用性。 Altman表示:“未来还会有更多改进,但...
-
下一篇
国内IT企业的底子到底有多薄弱?
敏捷、DevOps、CMMI、IPD……近年来,研发管理领域的各类框架与工具不断迭代,管理者们急于借新方法打破效率瓶颈。 可现实往往是:学完敏捷就拉着团队开每日站会,引入DevOps就搭了CI/CD流水线方法,流程改了多次,团队的研发效率却始终难有质的提升,投入与产出的落差,成了许多企业的老大难。 不久前,阿道接触到一位刚开始用禅道的朋友,我们也就这一问题交流了许多。这位朋友的经历恰好也为这个行业难题提供了独特的视角。 很有意思的是,他大学是学通信工程的,在校期间更多的是系统学习传统软件工程体系——从需求文档规范到瀑布式开发流程,每一步都强调严谨与标准化;而毕业后,他又先后进入互联网与金融领域,不同行业对响应、迭代的不同要求,又让他不得不主动接纳敏捷、精益等更多样化的管理思路。 两种截然不同的知识与实践背景,让他对研发管理有了更辩证的思考:为什么有些团队用上了最前沿的管理方法,却还是走不出方案有效,落地却满是纰漏的怪圈? 我们一致认为,流程优化的落地效果,始终依赖团队底层的工程实践能力。研发管理如果脱离扎实的工程实践谈流程创新,终究是空中楼阁。 点击获取禅道DevOps工程实践落地方案...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Windows10,CentOS7,CentOS8安装Nodejs环境
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- SpringBoot2全家桶,快速入门学习开发网站教程
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Docker容器配置,解决镜像无法拉取问题
- CentOS7,8上快速安装Gitea,搭建Git服务器
- MySQL8.0.19开启GTID主从同步CentOS8
- Dcoker安装(在线仓库),最新的服务器搭配容器使用