OpenAI CEO：巨型 AI 模型时代已结束-低调大师

OpenAI CEO：巨型 AI 模型时代已结束

2023-04-18 433

OpenAI 首席执行官 Sam Altman 在麻省理工学院日前举办的 Imagination in Action 活动中表示，孕育 ChatGPT 聊天机器人的研究战略已经结束；且行业未来的进步方向尚未清晰。

Altman 并未预测将来可能出现的研究策略或技术。但他认为，进一步的发展不会来自于将模型继续做大。“我认为我们正处于将模型做大这一时代的尽头。我们将以其他方式使它们变得更好。”

一些原因可能在于，成本的飙升和收益的递减遏制了扩展。有数据表明，ChatGPT 需要超过 10000 个 GPU 来进行训练，保持运行还需要更多资源。目前，GPU 市场主要由 Nvidia 主导；而该公司最新的专为 AI 和高性能计算 (HPC) 设计的 H100 GPU，每件价格高达 30603 美元。

OpenAI 在描述 GPT-4 的一篇文章中指出，预估扩大模型规模的回报越来越少。Altman 也透露，训练 GPT-4 花费的金额已经超过了 1 亿美元；此外，公司在数据中心的建造数量和速度方面也存在有物理限制。

图源：维基百科

自 OpenAI 于 11 月推出 ChatGPT 以来，一些科技公司纷纷加码该赛道；微软将 ChatGPT 技术整合到 Bing 中、谷歌推出了名为 Bard 的竞争对手等。与此同时，包括 Anthropic、AI21、 Cohere 和 Character.AI 在内的众多资金充足的初创公司也投入大量资源来构建更大的算法，以追赶 OpenAI 的脚步。这一新型聊天机器人在大众日常生活中的使用率也越来越高。

美国《连线》杂志认为，Altman 的表态意味着开发和部署新的 AI 算法的赛道中出现了意外转折。Altman 的这一发声也暗示着，GPT-4 可能是 OpenAI 将模型做大并向其提供更多数据的战略中的最后一个重大进展。

Cohere (在 LLM 领域与 OpenAI 竞争) 的联合创始人 Nick Frosst 曾在谷歌从事 AI 方面的工作，他对 Altman 所持的“做大不会永远奏效”想法表示赞同。他也认为，Transformer 的进展超出了规模。“有很多方法可以让 Transformer 变得更好、更有用，而且很多方法不涉及向模型添加参数。新的 AI 模型设计或架构，以及基于人类反馈的进一步调整是许多研究人员已经在探索的有前途的方向。”

此外，Altman 还在与 TechCrunch 的采访中表示，尺寸是对模型质量的错误衡量；并将其与曾经的芯片速度竞赛进行了比较。

“我认为人们过于关注参数数量，也许参数数量肯定会呈上升趋势。但这让我想起了 1990 年代和 2000 年代芯片的 gigahertz race，当时每个人都试图指向一个大数字。我认为重要的是，我们应该关注如何快速提高能力......我们想要向世界提供的是最有能力、最有用和最安全的模型。我们在这里不是为参数数量而自娱自乐。”

延伸阅读：

OpenAI CEO 奥特曼称目前并未训练 GPT-5

微信关注我们

原文链接：https://www.oschina.net/news/237450/openai-ceo-age-of-giant-ai-models-ending

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Rust 浏览器排版引擎 Servo 将采用新布局引擎 Layout 2020

Servo 是使用 Rust 开发的实验性浏览器引擎，最初由 Mozilla 发起，与其他浏览器引擎相比，Servo 在内存安全性、速度和并发性方面具有优势。 2020 年 Mozilla 大裁员期间裁掉了 Servo 引擎团队，Servo 的开发此后陷入了停滞。后来，Servo 项目后来找到 Linux 基金会托管，寻求为其它项目提供一个高性能的、安全的、可嵌入的模块化渲染引擎。过去几个月，Servo 项目的开发再次活跃。其官方博客表示正在考虑采用新的布局引擎：Layout 2020。Servo 项目目前有两个布局引擎——Layout 2013 和 Layout 2020，顾名思义，其开发分别始于 2013 年和 2020 年，其中 Layout 2020 设计弥补 Layout 2013 的多个不足之处，开发者表示他们认为 Layout 2020 是项目继续前进的最佳布局引擎，计划不久之后迁移到该引擎。 Servo 目前有两种布局引擎：Layout 2013 和 Layout 2020。顾名思义，两者的开发分别始于 2013 年和 2020 年，这两种引擎的开发都已基本停滞。虽然...

2023-04-18

583

国产显卡厂商摩尔线程正在致力于优化旗下显卡产品的软件生态。据外媒 phoronix 报道，摩尔线程的工程师最近对视频加速 API (VA-API) 库和视频库 FFmpeg 都提交了一些驱动代码。摩尔线程成立于 2020 年，致力于研发国产 GPU 芯片及显卡产品。去年年底摩尔线程发布了旗下最新的 GPU 芯片“春晓”和对应的显卡 MTTS80。 MTTS80 显卡搭配了 16GB GDDR6 显存，256 位宽，支持最多四路 8K 分辨率的显示输出。据官方介绍，该显卡支持图形渲染、多媒体处理、AI计算与物理仿真，可进行计算机视觉、自然语言理解等经典模型的训练，也可以在 AV1、HEVC 和 H.264 等主流视频格式下进行编解码加速。官方发布会称 MTTS80显卡的单精点浮点算力 TFLOPS 可堪堪追平老黄家的 RTX 3060 Ti 。但该显卡在系统驱动和图形接口、游戏优化等软件生态方面还不够完善，目前仅支持 Windows 系统和 DirectX 图形。显卡支持的游戏也不多，对很多游戏还仅支持低版本的 DirectX ，导致其实际游戏性能等表现其实更接近 RTX 10系...

2023-04-18

570

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。