苹果发布 Pico-Banana-400K 数据集,助力文本引导图像编辑研究
苹果公司近日发布Pico-Banana-400K数据集,含40万张精选图像,该数据集依托Google Gemini-2.5系列模型构建,相关研究论文《Pico-Banana-400K:面向文本引导图像编辑的大规模数据集》同步公开。
https://www.arxiv.org/abs/2510.19808
数据集采用非商业研究许可,仅限学术与AI研究使用,不可商用。其构建以OpenImages的真实照片为基础,涵盖35种编辑类型(分8类),经Gemini-2.5-Flash-Image(Nano-Banana)生成编辑图像后,由Gemini-2.5-Pro审核指令合规性与视觉质量。数据集包含单轮编辑、多轮编辑序列及成败结果偏好对。
尽管苹果公司承认Nano-Banana存在技术局限,但期望该数据集为下一代编辑模型提供训练与基准测试基础。研究论文可在arXiv查阅,数据集于GitHub免费开放。
 关注公众号
关注公众号
					低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 
							
								
								    上一篇
								      OpenMemory - AI 记忆引擎OpenMemory 是一个开源、可自托管的 AI 记忆引擎,专为大语言模型(LLM)应用设计,赋予 AI 代理长期、结构化且具备语义理解的记忆能力。 它采用独特的 分层记忆分解(HMD)架构,将记忆划分为情景、语义、程序、情感和反思等多个“认知扇区”,并通过稀疏的“路标图”实现高效、可解释的联想检索。相比传统向量数据库或 SaaS 记忆服务(如 Zep、Supermemory),OpenMemory 在响应速度上快 2–3 倍,成本低 6–10 倍,并支持本地嵌入模型(如 Ollama、BGE、E5),保障数据隐私与完全控制权。 适用于智能助手、AI 代理、企业 Copilot、数字日记等需要长期、安全、可解释记忆的场景。 
- 
							
								
								    下一篇
								      绿盟科技发布2025三季报:收入微增,亏损大幅收窄,现金流持续为正10月29日晚,绿盟科技发布了2025年三季度报告。绿盟科技立足自身业务,围绕经营目标,做好“3+3+X+Y”战略聚焦,不断提升自身能力。以“数”与“智”为核心方向,聚焦AI安全、数据安全与实战攻防三大领域,持续深化创新与落地,完善产品矩阵、积累标杆案例,共同推进重大项目加速落地,探索智能时代安全能力的新形态。 绿盟科技2025年前三季度营业收入12.80亿元,与上年同期相比微增;实现归属上市公司所有者净利润-1.96亿元,同比减亏39.85%;毛利率60.37%,同比和环比角度均有所提升;2025年1-9月经营活动产生的现金流量净额6967.47万元,现金流持续为正。其中单三季度实现营业收入4.79亿元,同比增长1.22%;实现归属上市公司所有者净利润-2460万元,同比减亏65.54%。 绿盟科技坚定探索新技术、新领域,继续坚持以“客户需求+技术驱动”引领产品研发和市场拓展,秉持开放、协同的理念,让安全成为数智发展的底色与动力,以安全之稳,护创新之进。 
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- 面试大杂烩
- Red5直播服务器,属于Java语言的直播服务器
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- MySQL表碎片整理

 
			


 
				 
				 
				 
				 
				 
				 
				



 微信收款码
微信收款码 支付宝收款码
支付宝收款码