字节跳动开源统一图像定制框架 DreamO
字节跳动正式开源了全新图像定制框架DreamO。该框架集成了图像换装、换脸、造型调整、风格迁移以及多主体组合等多种功能,旨在通过单一模型完成各种定制化任务。
https://github.com/bytedance/DreamO
DreamO基于DiT(Diffusion Transformer)图像模型,通过IP(Item Prompt)、ID(Identity Prompt)和Style三大参数,分别实现对人物、服装或物体的精准替换、面部特征的高度一致性保持以及画风迁移。该框架支持多主体融合编辑,并通过统一的参数设置实现无缝整合,降低了使用门槛。
DreamO的代码和文档已在Hugging Face和GitHub上完整提供,采用Apache 2.0许可证。其可训练参数约为4亿,能在8-10秒内生成高质量图像。
官方提供了在线演示空间供用户体验。DreamO的开源有望加速其在全球开发者社区的普及,推动更多创新应用的诞生,并在创意设计、电商广告、社交媒体等领域发挥潜力。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
ChatGPT 为「Deep Research」添加 PDF 导出功能
ChatGPT 为其「深度研究(Deep Research)」功能添加了一项新特性(目前正在网页端进行测试),允许用户将生成的报告直接导出为 PDF 格式。 ChatGPT 生成的研究报告通常包含表格等格式,直接从 ChatGPT 进行复制粘贴操作可能会导致样式丢失或出错,所以现在 OpenAI 带来下载 PDF 功能。 此功能旨在解决之前复制报告内容时格式易丢失的问题,使用户能更方便地分享和保存保留原始布局的研究成果。
- 下一篇
通义灵码全面支持 Qwen3,并正式上线编程智能体
根据「通义大模型」公众号消息,通义灵码已全面支持 Qwen3,并正式上线编程智能体。 只需 2 步即可一键启用通义灵码的智能体模式: 打开 VS Code 或 JetBrains 系列 IDE; 将通义灵码插件升级至 2.5.0 或以上版本; 通义灵码安装教程:https://lingma.aliyun.com/download 升级后的通义灵码,不再只是“写代码”的工具,而是真正能“理解任务”的智能搭档。依托 Qwen3 的强大能力,结合智能体与 MCP 能力,通义灵码可以自动感知项目结构、分析需求内容,并通过调用多种编程工具,帮助开发者高效完成整个编码任务。
相关文章
文章评论
共有0条评论来说两句吧...