OpenAI Evals 新增原生音频输入和评估功能-低调大师

OpenAI Evals 新增原生音频输入和评估功能

2025-09-15 205

OpenAI的Evals工具现已支持原生音频输入和音频评分，无需文本转录即可直接评估模型的音频响应。这项新功能极大简化了语音识别和生成模型的评估过程，使得开发者能够更高效地测试和优化其音频应用。

通过使用Evals的原生音频支持，用户可以上传音频文件，并直接在平台上进行性能评估。这一改进不仅减少了数据处理的复杂性，还提高了评估结果的准确性和可靠性。对于需要频繁测试和调整音频模型的开发者来说，这是一个重要的进步。

应用场景包括但不限于：智能语音助手的开发与优化、语音识别系统的性能评估，以及音频内容生成的质量控制。

如需了解更多关于如何使用Evals的新功能，参考官方Cookbook指南：https://cookbook.openai.com/examples/evaluation/use-cases/evalsapi_audio_inputs

微信关注我们

原文链接：https://www.oschina.net/news/372353

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

微软研究院发布 RenderFormer，基于 Transformer 的神经渲染模型

微软研究院近日发布了RenderFormer，这是一个纯机器学习的神经架构，旨在通过机器学习完全替代传统图形计算，实现全功能3D渲染，无需传统图形计算。 RenderFormer整体架构如下：双分支Transformer架构：分为视角无关（View-Independent）和视角相关（View-Dependent）两个阶段。视角无关阶段通过自注意力机制捕捉阴影、漫反射等全局光照效果；视角相关阶段通过交叉注意力机制建模可见性、反射等视角依赖效果。相对空间位置编码：创新性地采用改进的旋转位置编码（RoPE），基于三角形的3D空间位置而非序列索引，保持场景平移不变性。据介绍，RenderFormer是首个证明神经网络能学习完整图形渲染流水线的模型，支持任意3D场景和全局光照效果，无需依赖光线追踪或光栅化技术。它通过三角形令牌（triangle tokens）表示3D场景，编码空间位置、表面法线及材质属性，结合光线束令牌（ray bundle tokens）处理视角信息，实现端到端渲染。该成果已获SIGGRAPH 2025接收并开源。 https://microsoft.github.i...

2025-09-15

194

据报道，自2025年秋季学期起，北京市1400余所中小学全面开设人工智能通识教育课程，覆盖183万余名中小学生，成为全国首个省级全域推进人工智能通识教育的地区。报道称，课程资源方面，首批覆盖全学段的 160 套市级课程资源已上线，每套资源包含 15 分钟左右的核心教学视频、教学指南及活动任务单；通过「视频 + 工具 + 任务单」模式满足教师授课、备课及学生自主学习 3 类场景需求，搭建 AI「课程超市」和「应用超市」，为课堂教学提供基础支撑。市教委相关负责人表示，北京市将持续优化人工智能教育课程资源，结合教学反馈迭代更新；开展应用示范校评选和优秀案例推广，形成可复制经验。同时，负责人还表示，要深化「京娃」系列智能体研发，拓展「AI + 教育」应用场景等，以首批课程资源为起点，力争将北京中小学人工智能教育打造成全国标杆，真正让数字技术赋能每一位师生，为培养担当民族复兴大任的时代新人奠定坚实基础。

2025-09-15

226

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。