OpenAI CEO:巨型 AI 模型时代已结束
OpenAI 首席执行官 Sam Altman 在麻省理工学院日前举办的 Imagination in Action 活动中表示,孕育 ChatGPT 聊天机器人的研究战略已经结束;且行业未来的进步方向尚未清晰。
Altman 并未预测将来可能出现的研究策略或技术。但他认为,进一步的发展不会来自于将模型继续做大。“我认为我们正处于将模型做大这一时代的尽头。我们将以其他方式使它们变得更好。”
一些原因可能在于,成本的飙升和收益的递减遏制了扩展。有数据表明,ChatGPT 需要超过 10000 个 GPU 来进行训练,保持运行还需要更多资源。目前,GPU 市场主要由 Nvidia 主导;而该公司最新的专为 AI 和高性能计算 (HPC) 设计的 H100 GPU,每件价格高达 30603 美元。
OpenAI 在描述 GPT-4 的一篇文章中指出,预估扩大模型规模的回报越来越少。Altman 也透露,训练 GPT-4 花费的金额已经超过了 1 亿美元;此外,公司在数据中心的建造数量和速度方面也存在有物理限制。
图源:维基百科
自 OpenAI 于 11 月推出 ChatGPT 以来,一些科技公司纷纷加码该赛道;微软将 ChatGPT 技术整合到 Bing 中、谷歌推出了名为 Bard 的竞争对手等。与此同时,包括 Anthropic、AI21、 Cohere 和 Character.AI 在内的众多资金充足的初创公司也投入大量资源来构建更大的算法,以追赶 OpenAI 的脚步。这一新型聊天机器人在大众日常生活中的使用率也越来越高。
美国《连线》杂志认为,Altman 的表态意味着开发和部署新的 AI 算法的赛道中出现了意外转折。Altman 的这一发声也暗示着,GPT-4 可能是 OpenAI 将模型做大并向其提供更多数据的战略中的最后一个重大进展。
Cohere (在 LLM 领域与 OpenAI 竞争) 的联合创始人 Nick Frosst 曾在谷歌从事 AI 方面的工作,他对 Altman 所持的“做大不会永远奏效”想法表示赞同。他也认为,Transformer 的进展超出了规模。“有很多方法可以让 Transformer 变得更好、更有用,而且很多方法不涉及向模型添加参数。新的 AI 模型设计或架构,以及基于人类反馈的进一步调整是许多研究人员已经在探索的有前途的方向。”
此外,Altman 还在与 TechCrunch 的采访中表示,尺寸是对模型质量的错误衡量;并将其与曾经的芯片速度竞赛进行了比较。
“我认为人们过于关注参数数量,也许参数数量肯定会呈上升趋势。但这让我想起了 1990 年代和 2000 年代芯片的 gigahertz race,当时每个人都试图指向一个大数字。我认为重要的是,我们应该关注如何快速提高能力......我们想要向世界提供的是最有能力、最有用和最安全的模型。我们在这里不是为参数数量而自娱自乐。”
延伸阅读:

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Rust 浏览器排版引擎 Servo 将采用新布局引擎 Layout 2020
Servo 是使用 Rust 开发的实验性浏览器引擎,最初由 Mozilla 发起,与其他浏览器引擎相比,Servo 在内存安全性、速度和并发性方面具有优势。 2020 年 Mozilla 大裁员期间裁掉了 Servo 引擎团队,Servo 的开发此后陷入了停滞。后来,Servo 项目后来找到 Linux 基金会托管,寻求为其它项目提供一个高性能的、安全的、可嵌入的模块化渲染引擎。 过去几个月,Servo 项目的开发再次活跃。其官方博客表示正在考虑采用新的布局引擎:Layout 2020。Servo 项目目前有两个布局引擎——Layout 2013 和 Layout 2020,顾名思义,其开发分别始于 2013 年和 2020 年,其中 Layout 2020 设计弥补 Layout 2013 的多个不足之处,开发者表示他们认为 Layout 2020 是项目继续前进的最佳布局引擎,计划不久之后迁移到该引擎。 Servo 目前有两种布局引擎:Layout 2013 和 Layout 2020。顾名思义,两者的开发分别始于 2013 年和 2020 年,这两种引擎的开发都已基本停滞。虽然...
- 下一篇
国产显卡厂商摩尔线程为 VA-API、FFmpeg 贡献代码
国产显卡厂商摩尔线程正在致力于优化旗下显卡产品的软件生态。据外媒 phoronix 报道, 摩尔线程的工程师最近对视频加速 API (VA-API) 库和视频库 FFmpeg 都提交了一些驱动代码。 摩尔线程成立于 2020 年,致力于研发国产 GPU 芯片及显卡产品。去年年底摩尔线程发布了旗下最新的 GPU 芯片“春晓”和对应的显卡 MTTS80。 MTTS80 显卡搭配了 16GB GDDR6 显存,256 位宽,支持最多四路 8K 分辨率的显示输出。 据官方介绍,该显卡支持图形渲染、多媒体处理、AI计算与物理仿真,可进行计算机视觉、自然语言理解等经典模型的训练,也可以在 AV1、HEVC 和 H.264 等主流视频格式下进行编解码加速。 官方发布会称 MTTS80显卡的单精点浮点算力 TFLOPS 可堪堪追平老黄家的 RTX 3060 Ti 。但该显卡在系统驱动和图形接口、游戏优化等软件生态方面还不够完善,目前仅支持 Windows 系统和 DirectX 图形。显卡支持的游戏也不多,对很多游戏还仅支持低版本的 DirectX ,导致其实际游戏性能等表现其实更接近 RTX 10系...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- 2048小游戏-低调大师作品
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- SpringBoot2全家桶,快速入门学习开发网站教程
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS6,CentOS7官方镜像安装Oracle11G