腾讯混元 3D 再升级，推出业界首个美术级 3D 生成大模型-低调大师

腾讯混元 3D 再升级，推出业界首个美术级 3D 生成大模型

2025-07-08 106

腾讯混元3D宣布再次升级，带来了业界首个美术级3D生成大模型Hunyuan3D-PolyGen。根据介绍，该模型主要是为解决3D资产生成中布线质量和复杂物体建模的难题，提升美术师建模效率。

为实现从“可看”到“可用”的3D生成，Hunyuan3D-PolyGen采用自回归网格生成框架，通过显式、离散的顶点与面片建模，进行空间推理，生成高质量、符合美术规范的3D模型。其核心框架包括以下三个步骤：

网格序列化：将网格的顶点和面片转化为Token序列，用以表示Mesh结构。
自回归建模：以点云作为输入Prompt，利用自回归模型生成Mesh的Token序列。
序列解码：将生成的Token序列反向解码为顶点与面片，重建3D网格。

现有的mesh自回归方法，表达一个面通常需要9个token（一个面片三个顶点，每个顶点三个坐标），mesh表达冗余程度高，在给定有限的上下文窗口下，仅可对低面片（2k面以下）的简单模型进行建模，为了提升可建模面数，实现复杂mesh建模，混元团队自研了高压缩率mesh表征BPT（Blocked and Patchified Tokenization)，设计block索引和patch压缩，使表达相同 mesh 所需的token序列更短，如下图所示：

1) block索引：将网格空间分成多个block，顶点的表征由(x,y,z)空间坐标转化为(block, offset)索引坐标，token数量可降低33%；

2) patch压缩：将相邻面片组成patch（一个中心顶点和边缘顶点），减少相邻面片之间共用顶点的冗余，结合共享block等技巧，token数量可进一步降低约41%。

利用以上压缩算法BPT，表征mesh的token数量可压缩74%，即平均用2.3个token即可表征一个面，极大提升了模型的可建模面数，由下图可看出，对比现有mesh自回归方法，可建模的模型更加复杂（可达2w+面），细节更多。

此外，其还研发了mesh自回归的强化学习后训练框架，在预训练模型的基础上进行后训练，设计稳定生成和美术规范奖励来引导模型生成更好的结果。通过强化学习，可以提升模型生成“好结果”的概率，降低模型生成“差结果”的概率，从而提升了模型生成的稳定性。

更多详情可查看官方公告。

微信关注我们

原文链接：https://www.oschina.net/news/359296

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

xAI 将于北京时间周四上午 11 点直播发布 Grok 4

马斯克宣布，xAI将于太平洋时间周三晚上8点（北京时间周四上午11点）通过直播形式发布Grok 4模型。根据爆料，Grok 4模型具有以下亮点：多模态输入：Grok 4支持文本和图像输入，意味着不仅能像以前一样和你对话，还能「看懂」图像。 130k Token的上下文窗口：虽然比一些竞品的200k或百万级别的token小了一些，但从xAI目前的策略来看，似乎是为了「快、准、实时」而做的权衡；推理能力与结构化输出：Grok 4具备强大的推理能力，能够理解复杂的任务需求，并提供清晰的结构化输出，适用于更加多样化的应用场景，不仅限于自然语言处理；函数调用和数学推理：Grok 4 不仅可以帮你解答复杂的数学问题，甚至可以调用函数、自动执行任务。与此同时，面向程序员的Grok 4 Code更是精装版：它将会深度集成在Cursor编辑器中，专门为代码补全、bug分析、代码生成等工作优化。另外值得一提的是，Grok 4还被马斯克赋予了一个雄心勃勃的目标：重写整个人类的在线知识库——添加缺失信息，删除错误内容，然后基于这个“纯净版”知识库重新训练模型。

2025-07-08

140

近期，OpenAI 联合创始人 Andej Karpathy 继「氛围编程」（vibe coding）、「上下文工程」（Context Engineering）之后，又创造了一个新词——「细菌式编程」（Bacterial code）。 Andrej Karpathy 分享了维护开源社区的看法，提倡要“细菌DNA”式的编码风格。 🧬 如何像细菌一样写代码，来建立一个繁荣的开源社区细菌的代码（基因组）有以下特点： 🦠 小巧（每一行代码都消耗能量） 🦠 模块化（被组织成可相互替换的“操纵子”群组） 🦠 独立自足（通过“水平基因转移”可以轻松地“复制粘贴”） 💡 如果代码块是小巧、模块化、独立自足且极易复制粘贴的，那么社区就能通过“水平基因转移”的方式蓬勃发展。对于你写的任何一个函数（基因）或类（操纵子），你能想象有人在不了解你其余代码、也无需导入任何新依赖的情况下，喊一声“我的了！”（yoink）就直接拿去用并从中获益吗？你的代码能成为 GitHub 上热门的 Gist 吗？这种编码风格使得细菌能够占领地球上从寒冷到炎热、从酸性到碱性的每一个生态位，甚至包括地球深处和太...

2025-07-08

116

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。