您现在的位置是:首页 > 文章详情

微软研究院发布 RenderFormer,基于 Transformer 的神经渲染模型

日期:2025-09-15点击:2

微软研究院近日发布了RenderFormer,这是一个纯机器学习的神经架构,旨在通过机器学习完全替代传统图形计算,实现全功能3D渲染,无需传统图形计算。

RenderFormer整体架构如下:

  • 双分支Transformer架构:分为视角无关(View-Independent)和视角相关(View-Dependent)两个阶段。视角无关阶段通过自注意力机制捕捉阴影、漫反射等全局光照效果;视角相关阶段通过交叉注意力机制建模可见性、反射等视角依赖效果。
  • 相对空间位置编码:创新性地采用改进的旋转位置编码(RoPE),基于三角形的3D空间位置而非序列索引,保持场景平移不变性。

据介绍,RenderFormer是首个证明神经网络能学习完整图形渲染流水线的模型,支持任意3D场景和全局光照效果,无需依赖光线追踪或光栅化技术。它通过三角形令牌(triangle tokens)表示3D场景,编码空间位置、表面法线及材质属性,结合光线束令牌(ray bundle tokens)处理视角信息,实现端到端渲染。该成果已获SIGGRAPH 2025接收并开源。

https://microsoft.github.io/renderformer

原文链接:https://www.oschina.net/news/372349
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章