腾讯混元 3D 再升级,推出业界首个美术级 3D 生成大模型
腾讯混元3D宣布再次升级,带来了业界首个美术级3D生成大模型Hunyuan3D-PolyGen。根据介绍,该模型主要是为解决3D资产生成中布线质量和复杂物体建模的难题,提升美术师建模效率。
为实现从“可看”到“可用”的3D生成,Hunyuan3D-PolyGen采用自回归网格生成框架,通过显式、离散的顶点与面片建模,进行空间推理,生成高质量、符合美术规范的3D模型。其核心框架包括以下三个步骤:
- 网格序列化:将网格的顶点和面片转化为Token序列,用以表示Mesh结构。
- 自回归建模:以点云作为输入Prompt,利用自回归模型生成Mesh的Token序列。
- 序列解码:将生成的Token序列反向解码为顶点与面片,重建3D网格。
现有的mesh自回归方法,表达一个面通常需要9个token(一个面片三个顶点,每个顶点三个坐标),mesh表达冗余程度高,在给定有限的上下文窗口下,仅可对低面片(2k面以下)的简单模型进行建模,为了提升可建模面数,实现复杂mesh建模,混元团队自研了高压缩率mesh表征BPT(Blocked and Patchified Tokenization),设计block索引和patch压缩,使表达相同 mesh 所需的token序列更短,如下图所示:
1) block索引:将网格空间分成多个block,顶点的表征由(x,y,z)空间坐标转化为(block, offset)索引坐标,token数量可降低33%;
2) patch压缩:将相邻面片组成patch(一个中心顶点和边缘顶点),减少相邻面片之间共用顶点的冗余,结合共享block等技巧,token数量可进一步降低约41%。
利用以上压缩算法BPT,表征mesh的token数量可压缩74%,即平均用2.3个token即可表征一个面,极大提升了模型的可建模面数,由下图可看出,对比现有mesh自回归方法,可建模的模型更加复杂(可达2w+面),细节更多。
此外,其还研发了mesh自回归的强化学习后训练框架,在预训练模型的基础上进行后训练,设计稳定生成和美术规范奖励来引导模型生成更好的结果。通过强化学习,可以提升模型生成“好结果”的概率,降低模型生成“差结果”的概率,从而提升了模型生成的稳定性。
更多详情可查看官方公告。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
xAI 将于北京时间周四上午 11 点直播发布 Grok 4
马斯克宣布,xAI将于太平洋时间周三晚上8点(北京时间周四上午11点)通过直播形式发布Grok 4模型。 根据爆料,Grok 4模型具有以下亮点: 多模态输入:Grok 4支持文本和图像输入,意味着不仅能像以前一样和你对话,还能「看懂」图像。 130k Token的上下文窗口:虽然比一些竞品的200k或百万级别的token小了一些,但从xAI目前的策略来看,似乎是为了「快、准、实时」而做的权衡; 推理能力与结构化输出:Grok 4具备强大的推理能力,能够理解复杂的任务需求,并提供清晰的结构化输出,适用于更加多样化的应用场景,不仅限于自然语言处理; 函数调用和数学推理:Grok 4 不仅可以帮你解答复杂的数学问题,甚至可以调用函数、自动执行任务。 与此同时,面向程序员的Grok 4 Code更是精装版:它将会深度集成在Cursor编辑器中,专门为代码补全、bug分析、代码生成等工作优化。 另外值得一提的是,Grok 4还被马斯克赋予了一个雄心勃勃的目标:重写整个人类的在线知识库——添加缺失信息,删除错误内容,然后基于这个“纯净版”知识库重新训练模型。
- 下一篇
OpenAI 联合创始人 Andej Karpathy 提出「细菌编程」
近期,OpenAI 联合创始人 Andej Karpathy 继「氛围编程」(vibe coding)、「上下文工程」(Context Engineering)之后,又创造了一个新词——「细菌式编程」(Bacterial code)。 Andrej Karpathy 分享了维护开源社区的看法,提倡要“细菌DNA”式的编码风格。 🧬 如何像细菌一样写代码,来建立一个繁荣的开源社区 细菌的代码(基因组)有以下特点: 🦠 小巧 (每一行代码都消耗能量) 🦠 模块化 (被组织成可相互替换的“操纵子”群组) 🦠 独立自足 (通过“水平基因转移”可以轻松地“复制粘贴”) 💡 如果代码块是小巧、模块化、独立自足且极易复制粘贴的,那么社区就能通过“水平基因转移”的方式蓬勃发展。 对于你写的任何一个函数(基因)或类(操纵子),你能想象有人在不了解你其余代码、也无需导入任何新依赖的情况下,喊一声“我的了!”(yoink)就直接拿去用并从中获益吗?你的代码能成为 GitHub 上热门的 Gist 吗? 这种编码风格使得细菌能够占领地球上从寒冷到炎热、从酸性到碱性的每一个生态位,甚至包括地球深处和太...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Hadoop3单机部署,实现最简伪集群
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Windows10,CentOS7,CentOS8安装Nodejs环境
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Linux系统CentOS6、CentOS7手动修改IP地址
- Docker安装Oracle12C,快速搭建Oracle学习环境