万相2.6系列模型正式发布，上线国内首个角色扮演功能-低调大师

万相2.6系列模型正式发布，上线国内首个角色扮演功能

2025-12-17 59

万相2.6系列模型已经正式发布，面向专业影视制作和图像创作场景进行了全面升级。

根据官方公告，全新的万相2.6是国内首个支持角色扮演功能的视频模型，支持音画同步、多镜头生成及声音驱动等功能。已同步上线阿里云百炼、万相官网。

万相2.6视频生成升级亮点

角色扮演：万物皆可入戏，万相2.6能参考输入视频中的角色外观和音色、实现角色扮演，按照提示词生成单人、多人、人与物合拍的视频。
多镜头叙事：万相2.6可将用户简单的提示词转换为多分镜脚本，生成包含多个镜头的连贯叙事视频，并且保持多镜头间的主体、场景等关键信息的一致性。
自然音画同步：多人对话场景稳定生成，真实自然的人声表达，声音质感提升，更好听的音乐和歌曲生成。
15s长视频生成：生成视频最长15s（参考生视频10s），提升画面时空内容容量，支持更完整叙事。
音频驱动生成：万相2.6可根据用户输入的文本和音频，驱动生成视频，并实现多镜头演绎。

万相2.6文生图升级亮点

艺术风格的高度美学与可控性

精准捕捉艺术灵魂：对各类风格关键词理解深入，还原度更高，画面整体风格统一且完整。
风格融合自然流畅：支持多种艺术风格有机融合，过渡平滑，创作出独具一格的视觉作品。
细节刻画生动丰富：对「肌理、色彩、笔触」等细节的呈现更为到位，赋予图像故事感与表现力。

真实人像质感，光影细节到位

在写实人像生成中，人物神态自然、肤质真实，有效削弱“AI感”。模型综合优化构图与光影，呈现更具表现力的人像视角。

文字生成，图表、插画与海报设计

可依据中英文长文本内容，结合美学设计与图文协调性，精准生成海报、图文说明、信息图表等，实现内容与视觉的高度统一。

详情查看：https://mp.weixin.qq.com/s/HU19meKxI2PDVYgXBNx5Qw

目前支持在阿里云百炼平台调用API，或在通义万相官网直接体验。

https://tongyi.aliyun.com/wan/

https://bailian.console.aliyun.com/?tab=model#/model-market/all?providers=wan

微信关注我们

原文链接：https://www.oschina.net/news/390307

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Xiaomi MiMO 大模型负责人罗福莉：MiMo-V2-Flash 是 AGI 路线图中的第二步

今日上午，在小米2025小米人车家全生态合作伙伴大会上，Xiaomi MiMO大模型负责人罗福莉完成入职后的小米首秀，并正式发布和开源最新MoE大模型MiMo-V2-Flash。罗福莉同步在社交媒体发布了对MiMo-V2-Flash的介绍： MiMo-V2-Flash 已正式上线。这只是我们 AGI 路线图中的第二步，但我想把一些真正产生决定性效果的工程选择随手记下来。架构：我们最终采用了 Hybrid SWA。它足够简单、足够优雅，而且在内部基准测试中，在长上下文推理上明显优于其他线性注意力（Linear Attention）变体。另外，固定 KV cache 与现有基础设施的兼容性要友好得多。备注：窗口大小 128 是那个“甜点值”（512 反而会拉低性能）；sink values 是不可妥协的，千万别省略。 MTP（Multi-Token Prediction）：这一点在高效 RL 中被严重低估了。除了第一层以外，MTP 实际上只需要极少的微调，就能达到很高的 accept length。使用 3 层 MTP 时，我们在编程任务中看到了 accept length 大于...

2025-12-17

78

2025年12月17日，在香港举行的全球图形学领域备受瞩目的顶级学术盛会 SIGGRAPH Asia 2025上，摩尔线程在3D Gaussian Splatting Reconstruction Challenge（3DGS 重建挑战赛）中凭借自研技术 LiteGS 出色的算法实力和软硬件协同优化能力，斩获大赛银奖，再次证明摩尔线程在新一代图形渲染技术上的深度积累与学术界的高度认可。 3DGS：下一代图形渲染的范式革命，开启AI加速的高效渲染时代 3D Gaussian Splatting（3DGS，三维高斯溅射）是2023年提出的一项革命性3D 场景表示与渲染技术，以可参数化的3D 高斯分布为核心，实现了画质、效率与资源占用之间的卓越平衡。与传统 NeRF 相比，3DGS 在保持逼真渲染质量的前提下，将渲染效率提升数百至上千倍，并在光线追踪、VR/AR 实时渲染、多模态融合等方向展现出极强的适应性与扩展性。（*上图仅作示意）作为近年来快速发展的神经渲染技术，3DGS不仅在三维重建与实时渲染等方向展现出卓越优势，也在更广泛的AI 场景中具备潜在的基础价值。尤其是在具身智能（Emb...

2025-12-17

80

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。