字节跳动与港中大等联合开源 DreamOmni2-低调大师

字节跳动与港中大等联合开源 DreamOmni2

2025-10-27 65

字节跳动与香港中文大学、香港科技大学和香港大学联合研发的 DreamOmni2系统已正式开源。

DreamOmni2 致力于提升人工智能在图像处理中的指令遵循能力，实现了真正的多模态指令理解。这一系统能够同时理解文本指令与参考图像，显著改善了以往模型在处理抽象概念（如风格、材质、光照）时的局限性，且用户与 AI 之间的交互更加自然。

为了训练 AI 理解复杂的文本和图像指令，DreamOmni2的研发团队开发了一套创新的三阶段流程。首先，通过训练提取模型，AI 能够精准提取图像中的特定元素或抽象属性。接着，利用提取模型生成多模态指令编辑数据，形成包含源图像、指令、参考图像和目标图像的训练样本。最后，通过进一步提取与组合生成更多参考图像，构建出丰富的多模态指令生成数据集。

在模型架构方面，DreamOmni2提出了索引编码和位置编码偏移方案，确保模型能够准确识别多张输入图像。同时，引入视觉语言模型（VLM），有效解决了用户指令与模型理解之间的鸿沟。这种创新设计提升了系统在处理指令时的准确性，使其能够更好地理解用户的真实意图。

经过测试，DreamOmni2在多模态指令编辑任务上的表现超越了所有参与比较的开源模型，接近顶尖商业模型。与传统的商业模型相比，DreamOmni2在处理复杂指令时，能够提供更高的准确性和一致性，避免了不必要的变更和图像瑕疵。

微信关注我们

原文链接：https://www.oschina.net/news/379787

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Windows 10 停止支持引发换机潮，Mac 设备出货量大增

微软已于 10 月 14 日正式终止了对 Windows 10 的支持，在此之前微软就一直在推动用户升级 Windows 11，但是事实似乎并未完全按照微软的剧本发展。虽然部分 Windows PC 制造商的出货量有所增长，但根据 Counterpoint Research 的数据，苹果成为主要受益者之一。研究机构 Counterpoint 指出，在 2025 年 10 月支持截止前，全球近 40% 的 PC 仍运行 Windows 10，这一压力促使企业与消费市场提前更新设备，带动整体出货量上升。根据 Counterpoint Research 的报告，在 2025 年第三季度，全球 PC 市场整体同比增长了 8.1%，这波增长的主要驱动力来自于两个方面：一是用户需要升级硬件以兼容 Windows 11；二是为了对冲美国高额进口关税的风险，公司提前囤积了库存。这种转向的部分原因在于 Windows 11 的硬件限制，许多看似性能足够的设备，由于缺乏 TPM 2.0，无法安装 Windows 11，这促使部分用户转向限制较少的苹果生态系统。 Counterpoint 还指出，前五...

2025-10-27

65

PAM（（Privileged Account Management，即特权账号管理)，是组织信息安全体系中至关重要的一环，主要用于管理和监控具有高权限账号的用户访问权限。简单来说，PAM就像是一个“超级管理员”，专门负责管理那些拥有高权限账号（例如Root、Administrator、免密sudo账号等）用户的登录和操作行为，确保这些高权限账号的用户访问不会被滥用。在2025年5月发布的JumpServer v4.10 LTS版本中，JumpServer真正将“PAM”与“堡垒机审计”合二为一，通过PAM模块提供一整套高效的特权账号管理功能，包括自动发现、批量推送、密码备份、账号改密、风险检测以及与第三方系统的集成。 2025年10月16日，飞致云开源技术播客火热开麦！首期内容聚焦“JumpServer的PAM功能设计”主题，受访嘉宾是JumpServer开源项目创始人及产品总监广宏伟。在本期播客中，广宏伟分享了JumpServer的PAM（特权账号管理）功能“从0到1”的设计心路和核心功能。 Q1：JumpServer在2025年5月发布了v4.10 LTS版本，我们看到在这个版...

2025-10-27

73

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。