您现在的位置是:首页 > 文章详情

苹果发布 Pico-Banana-400K 数据集,助力文本引导图像编辑研究

日期:2025-10-29点击:5

苹果公司近日发布Pico-Banana-400K数据集,含40万张精选图像,该数据集依托Google Gemini-2.5系列模型构建,相关研究论文《Pico-Banana-400K:面向文本引导图像编辑的大规模数据集》同步公开。

https://www.arxiv.org/abs/2510.19808

数据集采用非商业研究许可,仅限学术与AI研究使用,不可商用。其构建以OpenImages的真实照片为基础,涵盖35种编辑类型(分8类),经Gemini-2.5-Flash-Image(Nano-Banana)生成编辑图像后,由Gemini-2.5-Pro审核指令合规性与视觉质量。数据集包含单轮编辑、多轮编辑序列及成败结果偏好对。

尽管苹果公司承认Nano-Banana存在技术局限,但期望该数据集为下一代编辑模型提供训练与基准测试基础。研究论文可在arXiv查阅,数据集于GitHub免费开放。

原文链接:https://www.oschina.net/news/380273
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章