AI 视频公司 Runway 发布世界模型 GWM‑1-低调大师

AI 视频公司 Runway 发布世界模型 GWM‑1

2025-12-16 99

AI 视频公司 Runway 近日宣布推出通用“世界模型”家族 GWM-1，并同步更新其旗舰视频生成模型 Gen‑4.5。

GWM-1 基于 Gen‑4.5 构建，可逐帧生成、实时运行，并通过摄像机姿态、机器人指令、音频等动作进行交互式控制，包含「GWM Worlds」「GWM Avatars」「GWM Robotics」三种后训练变体：

GWM Worlds 能在长时间移动序列中维持空间连贯性，允许定义环境的几何、光照和物理规则，并对输入动作作出准确响应；
GWM Robotics 被描述为基于机器人数据训练的「学习型模拟器」，可生成动作条件的视频滚动，支持「反事实」生成以探索不同轨迹与结果，以降低昂贵的真实数据采集与线下测试风险；
GWM Avatars 为音频驱动的交互式视频生成模型，可在长时对话中稳定呈现自然的人类动作与表情（面部表情、眼球运动、口型同步、手势），适用于实时辅导与教育、客户支持与服务、培训模拟、互动娱乐与游戏等场景。

Runway 在直播中称，其战略正从影视制作扩展至机器人、物理与生命科学，并强调世界模型位于 AI 进步前沿：仅靠语言模型难以解决机器人技术、疾病、科学发现等问题，真正的进步需要模型像人类一样在模拟环境中体验世界并从错误中学习。

Gen‑4.5 的更新集中在画面保真度与创意控制，并新增原生音频生成与编辑、多镜头视频编辑等能力；官方同时承认现阶段视频生成仍存在因果推理、客体恒存性与成功偏差等常见局限，这些问题将作为世界模型研究的重点方向持续迭代。

微信关注我们

原文链接：https://www.oschina.net/news/390046

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Manus 1.6 发布：Max 性能、移动开发和 Design View

通用智能体 Manus 正式发布 1.6 版本，主要变化如下：引入旗舰级别 Agent：Manus 1.6 Max 用于构建超越 Web 的应用的移动开发以及用于交互式图像创建的设计视图。本次发布的核心是 Manus 1.6 Max，作为新的旗舰 Agent。它通过更先进的规划和问题解决架构，带来了可衡量的性能提升。更高的任务成功率： Max 显著提高了单次任务的成功率。现在，更多的任务可以自主完成，无需人工干预，这是其增强智能的直接体现。更高的用户满意度：在双盲测试中，用户满意度提高了 19.2% 以上。这源于更高质量的输出、更高的准确性以及更可靠的工具使用。更智能的广泛研究：广泛研究中的所有子 Agent 现在都在 Max 架构上运行，确保每个并行任务都以最高水平执行，从而获得更深入、更准确的洞察。增强的电子表格功能： Max 在电子表格任务中表现出特别强大的性能。从复杂的财务建模和数据分析到自动化报告生成，Max 可以处理以前需要人工专业知识的复杂工作流程。优化的 Web 开发： Max 还为 Web 开发带来了显著改进，包括更好的 UI 美观性、页面功能和交...

2025-12-16

84

据悉，昇思MindSpore开源社区将于 2025 年 12 月 25 日在杭州举办昇思人工智能框架峰会。本次峰会在展区、CodeLabs、WorkShop等环节提供了丰富的案例，本篇文章以其中CodeLabs中的DeepSeek-OCR为例，深入介绍其技术实现，更多案例欢迎来到峰会现场进行体验和实操。当文本遇见视觉，AI模型正重新定义信息压缩的边界在人工智能快速发展的今天，DeepSeek团队于2025年10月推出的DeepSeek-OCR模型带来了一场文本处理范式的革命。这一创新模型不仅实现了10倍压缩率下97%的解码精度，更探索了通过视觉模态压缩长上下文的全新路径。而昇思MindSpore框架的day0支持能力，则为这一前沿技术的快速部署应用提供了坚实基础。 DeepSeek-OCR：重新定义文本压缩的边界 DeepSeek-OCR 是 DeepSeek AI 于 2025 年 10 月发布的多模态模型，以探索视觉 - 文本压缩边界为核心目标，为文档识别、图像转文本提供创新方案。其采用 DeepEncoder 视觉编码器与 DeepSeek3B-MoE-A570M ...

2025-12-16

87

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。