开源多模态大模型“书生·万象 3.0”发布-低调大师

开源多模态大模型“书生·万象 3.0”发布

2025-04-17 382

上海人工智能实验室（上海 AI 实验室）升级并开源了通用多模态大模型书生·万象3.0（InternVL3）。

根据介绍，通过采用创新的多模态预训练和后训练方法，InternVL3 多模态基础能力全面提升，在专家级基准测试、多模态性能全面测试中，10亿~780亿参数的全量级版本在开源模型中性能均位列第一，同时大幅提升了图形用户界面（GUI）智能体、建筑场景图纸理解、空间感知推理以及通识学科推理等方面的能力。

在专家级多学科领域知识推理基准测试MMMU中再次突破开源模型极限，取得72.2分；
基于司南OpenCompass开源评测框架，研究团队对InternVL3进行了全面系统的评估，包括多学科推理、文档理解、多图像 / 视频理解、现实世界理解、多模态幻觉检测、视觉定位、多语言能力以及以语言为中心的基准测试。评测结果显示，InternVL3在开源多模态大模型中性能表现最优，创造了开源多模态大模型的性能新标杆，性能接近闭源模型Gemini-2.5-Pro；
创新提出原生多模态预训练方法，将语言和多模态学习整合于同一个预训练阶段，提升及拓展多模态能力的同时，进一步提升纯语言能力；
提出混合偏好优化算法以及多模态测试阶段增强，通过负监督修正模型响应分布，大幅提升模型推理能力。

公测版本：https://chat.intern-ai.org.cn/

微信关注我们

原文链接：https://www.oschina.net/news/345071

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

豆包 1.5·深度思考模型发布

在今日火山引擎AI创新巡展杭州站现场，火山引擎总裁谭待发布了最新的豆包1.5·深度思考模型，升级豆包·文生图模型3.0、豆包·视觉理解模型。同时，面向Agent服务，发布OS Agent解决方案、GUI Agent大模型——豆包1.5·UI-TARS模型；面向大规模推理，发布AI云原生·ServingKit推理套件。据透露，截至2025年3月底，豆包大模型日均tokens调用量已超过12.7万亿，是2024年12月的3倍，是一年前刚刚发布时的106倍。IDC报告显示，2024年中国公有云大模型调用量激增，火山引擎以46.4%的市场份额位居中国市场第一。豆包1.5·深度思考模型在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出。同时，模型采用MoE架构，总参数200B，激活参数为20B，低于业界同类模型参数规模的50%，具备显著的推理成本优势。基于高效算法，豆包1.5·深度思考模型在提供行业极高并发承载能力的同时，实现20毫秒极低延迟。此外，豆包1.5·深度思考模型还具备视觉理解能力，可以像人类一样，不光基于文字思考，更能基于所见画面思考，思考更立体，让模型同时拥有“...

2025-04-17

469

Claude 母公司 Anthropic 宣布对其 AI 助手 Claude 进行重要升级，旨在进一步增强其作为高效协作工具的实用性。本次更新引入了两项新功能，Research 和 Google Workspace 深度集成。 Claude 本次新增的 Research 功能，与此前 OpenAI 在 ChatGPT 中所推出的 Deep Research 类似，能够主动进行多轮搜索，逐步深入问题并进行多角度探索，最后系统性地为用户提供更高质量的回答内容。值得一提的是，本次 Claude 的 Research 拥有代理式（Agentic）搜索框架，支持自主规划并执行多步骤搜索任务。其核心特性包括：代理式（Agentic）搜索框架：Claude 不再局限于单一查询，而是能够以代理方式运作，自主规划并执行多步骤、相互关联的搜索任务。跨源信息整合：该功能支持同时检索并分析来自用户授权的内部数据源（如企业知识库）以及广泛的互联网公开信息。系统性问题探索：对于复杂或开放性的用户查询，Claude 能够从多个维度进行系统性探索，深度挖掘信息。可验证的综合答案：最终输出为结构化、内容全...

2025-04-17

272

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。