微软研究院发布 RenderFormer,基于 Transformer 的神经渲染模型
微软研究院近日发布了RenderFormer,这是一个纯机器学习的神经架构,旨在通过机器学习完全替代传统图形计算,实现全功能3D渲染,无需传统图形计算。
RenderFormer整体架构如下:
- 双分支Transformer架构:分为视角无关(View-Independent)和视角相关(View-Dependent)两个阶段。视角无关阶段通过自注意力机制捕捉阴影、漫反射等全局光照效果;视角相关阶段通过交叉注意力机制建模可见性、反射等视角依赖效果。
- 相对空间位置编码:创新性地采用改进的旋转位置编码(RoPE),基于三角形的3D空间位置而非序列索引,保持场景平移不变性。
据介绍,RenderFormer是首个证明神经网络能学习完整图形渲染流水线的模型,支持任意3D场景和全局光照效果,无需依赖光线追踪或光栅化技术。它通过三角形令牌(triangle tokens)表示3D场景,编码空间位置、表面法线及材质属性,结合光线束令牌(ray bundle tokens)处理视角信息,实现端到端渲染。该成果已获SIGGRAPH 2025接收并开源。
https://microsoft.github.io/renderformer

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
亚马逊云科技否认大中华区裁员
9月15日,有消息称亚马逊云科技(AWS)大中华区计划裁员,预计将发生在9月底至10月之间,或涉及超20%的员工,目前AWS大中华区人员规模不到1700人。 对此,亚马逊云科技发言人表示:“相关报道严重失实,亚马逊云科技持续在中国积极招聘人才,为中国企业提供全球领先、安全可靠的云技术。” 今年7月,亚马逊发布了2025年第二季度财报,二季度营收同比增长13%至1677亿美元;净利润181.64亿美元,与上年同期的134.85亿美元相比大幅增长35%;稀释后每股收益为1.68美元。亚马逊已承诺今年在AI领域的投资将高达1000亿美元。亚马逊AWS云业务在二季度营收308.73亿美元,略高于市场预期的308亿美元,同比增长17%,增速与上一季度持平。 AWS的增速仍低于其主要竞争对手微软云和谷歌云。在电话会上,亚马逊CEO安迪·贾西试图向分析师保证,和其云计算竞争对手相比,AWS一直保持着“相当重要”的领导地位,他对公司AI产品的发展感到乐观:“我们AWS领域的业务规模比其他公司的云业务大得多,我认为第二位的规模约为AWS的65%。” 官网资料显示,亚马逊云科技于2013年进入中国,通过本...
-
下一篇
OpenAI Evals 新增原生音频输入和评估功能
OpenAI的Evals工具现已支持原生音频输入和音频评分,无需文本转录即可直接评估模型的音频响应。这项新功能极大简化了语音识别和生成模型的评估过程,使得开发者能够更高效地测试和优化其音频应用。 通过使用Evals的原生音频支持,用户可以上传音频文件,并直接在平台上进行性能评估。这一改进不仅减少了数据处理的复杂性,还提高了评估结果的准确性和可靠性。对于需要频繁测试和调整音频模型的开发者来说,这是一个重要的进步。 应用场景包括但不限于:智能语音助手的开发与优化、语音识别系统的性能评估,以及音频内容生成的质量控制。 如需了解更多关于如何使用Evals的新功能,参考官方Cookbook指南:https://cookbook.openai.com/examples/evaluation/use-cases/evalsapi_audio_inputs
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS关闭SELinux安全模块
- Windows10,CentOS7,CentOS8安装Nodejs环境
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- SpringBoot2全家桶,快速入门学习开发网站教程
- MySQL数据库在高并发下的优化方案
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS7,8上快速安装Gitea,搭建Git服务器