腾讯混元发布 52B 参数多模态理解模型 Large-Vision-低调大师

腾讯混元发布 52B 参数多模态理解模型 Large-Vision

2025-08-13 229

腾讯混元团队近日发布了全新的多模态理解模型——混元Large-Vision，该模型采用腾讯混元擅长的MoE（专家混合）架构，激活参数达到52B规模，在性能与效率之间实现了良好平衡。

混元Large-Vision的核心亮点在于其强大的多模态输入支持能力。该模型不仅支持任意分辨率的图像处理，还能处理视频和3D空间输入，为用户提供了全方位的视觉理解体验。这一技术突破意味着用户可以直接输入各种格式和尺寸的视觉内容，无需进行复杂的预处理操作。

MoE架构通过动态激活部分专家网络来处理不同类型的输入，既保证了模型的强大性能，又避免了全参数激活带来的计算资源浪费。52B的激活参数规模在当前多模态模型中处于先进水平，能够处理复杂的视觉理解任务。

该模型还重点提升了多语言场景理解能力，这对于全球化应用具有重要意义。在处理包含多种语言文字的图像或视频时，混元Large-Vision能够准确识别和理解不同语言环境下的视觉内容，为跨语言的多模态应用提供了技术基础。

混元Large-Vision支持任意分辨率图像输入的特性尤其值得关注。传统的视觉模型往往需要将输入图像调整到固定尺寸，这可能导致信息丢失或画质下降。而混元Large-Vision能够直接处理原始分辨率的图像，保持了视觉信息的完整性，这对于需要精细视觉分析的应用场景具有重要价值。

3D空间输入支持则进一步扩展了模型的应用范围，为虚拟现实、增强现实、3D建模等领域的AI应用提供了强有力的技术支撑。结合视频处理能力，该模型有望在智能监控、视频分析、内容创作等多个行业发挥重要作用。

微信关注我们

原文链接：https://www.oschina.net/news/365893

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

昆仑万维开源 Skywork UniPic 2.0

昆仑万维宣布正式开源 Skywork UniPic 2.0 模型——面向统一多模态建模的高效训练和推理框架，围绕生成和编辑模块轻量化、连接多模态理解模型进行联合训练，构建了理解、生图、编辑一体化的核心能力，旨在实现“高效、高质、统一”的多模态生成模型。目前，Skywork UniPic 2.0 及其系列模型已全面开源，涵盖模型权重、推理代码、强化策略等。 Skywork UniPic 2.0 由三个核心模块组成：生图编辑（下图中）：基于 SD3.5-Medium 架构将原本只支持文本输入的模型改进成也接受文本图像同时输入，然后通过高质量图像生成和编辑数据的训练将原本生图能力扩展成生图、编辑双能力。统一模型能力（下图左侧与中间）：通过冻结生图编辑模块，多模态模型（Qwen2.5-VL-7B），Pre-Train连接器来构建出理解生成编辑一体化能力，再通过连接器和生图编辑模块一起联合微调，实现最终的一体化理解、生图、编辑模型。生图编辑后训练（下图右）：为提升生图编辑整体性能，设计了基于Flow-GRPO的渐进式双任务强化策略，实现了生成与编辑任务在不互相干扰下的协同优化，在预训练的...

2025-08-13

234

阿里通义Qwen团队宣布对Qwen Chat的Deep Research能力进行了升级。此次升级旨在提供更智能、更具洞察力的研究报告。新版本通过更深入的搜索来获取更丰富的研究发现，并提高了信息准确性以减少幻觉现象。技术上，新版本支持模块化工具和并行执行。此外，一个重要的新增功能是多模态输入支持，允许用户上传文件和图像进行研究。用户可通过官方链接体验此项新功能。 https://chat.qwen.ai/?inputFeature=deep_research

2025-08-13

204

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。