OpenAI 发布企业 AI 评估框架指南-低调大师

OpenAI 发布企业 AI 评估框架指南

2025-11-20 135

OpenAI 发布了一套企业 AI 评估框架指南，旨在帮助企业将业务目标转化为可衡量的 AI 成果，从而规模化地实现投资回报。据据介绍，全球超过一百万企业使用 OpenAI 技术，OpenAI 内部团队通过数十个定制化评估体系提升模型在特定产品和流程中的表现。

OpenAI 提供了一个通用评估方法论：

Specify（定义）：明确 AI 的任务流程、关键输入输出、失败模式，并通过跨职能专家快速构建参考案例库。
Measure（衡量）：建立贴近真实业务的测试环境，包括自动化评分、人工审核、边界场景测试，以及持续监控。
Improve（改进）：基于评估结果不断迭代 prompt、管道或逻辑，形成数据飞轮，将真实反馈转化为长期积累的数据资产。

核心方法论涵盖明确目标、测量表现和持续改进三个阶段，要求组建跨职能团队构建” 黄金标准” 测试集，结合领域专家判断与自动化评分，建立数据飞轮实现系统迭代。

该方法适用于内部工具与消费者产品，可补充传统 A/B 测试，强调管理技能与清晰目标设定是 AI 时代核心竞争力。

微信关注我们

原文链接：https://www.oschina.net/news/384800/openai-evals-drive-next-chapter-of-ai

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Nvidia 与 OpenAI 的百亿美元投资协议存不确定性

两个月前，Nvidia 首席执行官黄仁勋与 OpenAI 首席执行官山姆・奥尔特曼在加州圣荷西共同宣布了一项历史性的协议，Nvidia 将在未来数年内对 OpenAI 投资高达1000亿美元。这笔投资将随着 OpenAI 的 AI超级计算设施的上线而逐步到位，尽管具体的建设时间表和每个数据中心的成本尚未披露。然而，在 Nvidia 最近的季度财报中，这家芯片制造商提醒投资者，公告和正式合同之间存在显著差异。 Nvidia 在其财报的风险因素部分表示:“我们没有确保与 OpenAI 或其他潜在投资达成最终协议的保证，或者任何投资能够按照预期条件完成。”Nvidia 最近一直在加大投资力度，将其不断扩大的现金储备用于支持购买其图形处理器（GPU）的公司。除了与 OpenAI 的协议外，Nvidia 还在本季度宣布了对英特尔投资50亿美元的承诺，并与 Anthropic 达成了最高可达100亿美元的投资协议。尽管 Nvidia 对与 OpenAI 的合作持乐观态度，但这一不确定性并未影响其对未来增长的期待。Nvidia 首席财务官科莱特・克雷斯在财报电话会议上指出，OpenAI 的用户...

2025-11-20

149

数字图书馆巨头OverDrive向俄亥俄州北区联邦法院提起诉讼，指控OpenAI的文本生成视频应用“Sora”在名称、图标及配色方案上与自家面向学生的阅读App“Sora”构成混淆，涉嫌商标侵权、不正当竞争与欺诈性商业行为。 OverDrive表示，其“Sora”品牌自 2018 年推出以来已覆盖美国1. 2 万所K- 12 学区，而OpenAI在明知情况下仍于 2024 年 2 月发布同名产品，并在视觉设计上采用相似紫蓝渐变与书本元素，导致教师、图书馆员及学生产生误认，影响其市场份额与品牌声誉。诉讼要求法院颁发永久禁令，禁止OpenAI继续使用“Sora”标识，并索赔经济损失与律师费，金额暂未披露。 OpenAI尚未提交答辩，但公司在对外声明中强调其“Sora”为生成式视频模型，与电子阅读软件不属于同一类别，暗示将主张商标类别差异进行抗辩。法律人士指出，若法院认定双方服务存在“相关渠道”与“相同受众”，OverDrive的商标权利范围可能获得扩张性保护，此案亦被视为AI时代跨品类商标冲突的标杆诉讼。

2025-11-21

119

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。