通义大模型开源发布 3D 数字人大模型-低调大师

通义大模型开源发布 3D 数字人大模型

2025-04-08 616

通义大模型开源发布 LHM 可驱动 3D数字人生成模型，可单图秒级生成超写实3D数字人，基于生成的3D数字人搭建了完整的实时交互对话工程链路，包括LLM、ASR、TTS和数字人模块，即输入一张图片、即可与这张图片所生成的数字人化身进行低延迟的实时对话，应用于客服、教育、陪伴等场景。

LHM是一个单视角输入、端到端的Transformer模型，依赖于人体先验模型SMPL-X进行驱动，最终输出一个可驱动的高斯3D人体模型。你可以把LHM看作一个“魔法工具”，它能帮你用一张照片快速生成一个可以在电脑里动起来的3D数字人。

根据介绍，项目团队通过Vision Transformer技术将单张图片拆解为小块，并借助Meta的Mae模型编码身体特征。为获取更精细的人体头部特征，还设计了Head Tokenization方式（借鉴DINOv2网络结构），通过提取多感受的特征信息，并结合MLP映射，捕捉头部的整体结构细节。

基于人体先验模型SMPL-X，基于Transformer回归出五个关键高斯特征：坐标偏移、透视程度、表面颜色值、高斯大小和旋转向量。这些特征定义了3D模型的形状、颜色和动态表现能力。

通过高斯渲染技术，得到T-pose下的人体先验图，并与SMPL-X建立一一映射关系，就可以直接索引SMPL-X中的骨骼，从而实现让3D数字人动起来的效果，最终得到一个真实且可驱动的3D高斯模型。

开发团队提出了Body-Head Transformer架构，借鉴了多模态Transformer（SD3）的设计理念，通过自适应Token和多层次Self-Attention机制，有效融合2D与3D Token。具体来说，先将头部Token输入到Multi-modality Transformer中学习头部特征，再将其与身体的随机Token结合，输入到Body Multi-modality Transformer 中，同步学习头部和身体的特征。

LHM有三大应用方向：动作重现、游戏角色生成和虚拟现实探索。你可以生成3D数字人并指定动作，比如跳舞、打篮球等，这些动作流畅且细节还原度高。还能在游戏领域，生成的3D资产可以无缝融入渲染管线，作为游戏角色使用。未来，LHM还可以与VR眼镜结合，生成的数字人可以直接进入虚拟现实世界，与玩家互动。

微信关注我们

原文链接：https://www.oschina.net/news/343306

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

【直播预告】全网爆吹的 MCP 到底是啥？

MCP（Model Context Protocol ，模型上下文协议）是一种开放协议，为 AI 如何查找、连接和使用外部工具（无论是查询数据库还是运行命令）制定了明确的规则。 2024 年 11 月 25 日，Anthropic 宣布 MCP 开源，并在三个月后突然引爆AI界，如今其关注度甚至超过了 LangChain 和 CrewAI。与其他专有 SDK 或一次性框架不同，MCP 是开放的且无模型绑定，并已获得主流 AI 厂商的支持。尤其是当OpenAI宣布拥抱MCP时，这直接推动行业将MCP视为大模型调用外部工具的事实标准。不过，MCP 不是灵丹妙药，与任何新兴技术一样，它也有自己的一系列复杂性和挑战。与此同时，MCP 仍处于起步阶段，其潜力才刚刚被发掘出来。拒绝概念炒作，直面技术本质——4月11日19:00，与真正在写代码、做架构、趟过坑的实践者，聊一聊这个突然走红的大模型上下文协议。直播主题：全网爆吹的MCP到底是啥？直播时间：4月11日晚19:00-20:30 直播平台：视频号“OSC 开源社区” 直播嘉宾：主持人：冯若航，磐吉云数 CEO ...

2025-04-07

133

针对近日流传的有关 Meta 人为提高了其 Llama 4 模型基准测试结果的争议问题，Meta AI 部门副总裁 Ahmad Al-Dahle 发文回应称：我们很高兴能把 Llama 4 介绍给大家。我们已经听到很多人在使用这些模型时取得了很好的效果。尽管如此，我们也听到了一些关于不同服务质量参差不齐的报告。由于我们在这些模型准备就绪后就立即进行了发布，因此我们预计需要几天时间才能让所有公开的实现版本都调整到位。我们将继续进行错误修复和并吸引合作伙伴。我们还听说有人声称我们在测试集上进行了训练，但这根本不是事实，我们绝不会这么做。我们的理解是，人们看到的质量参差不齐是由于需要稳定实现。我们相信 Llama 4 模型是一项重大进步，我们期待与社区合作，共同挖掘其价值。相关阅读： Meta 发布 Llama 4 大模型

2025-04-08

222

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。