Databricks 开源 LLM,训练只需三个小时、30 美元

大数据分析公司 Databricks Inc 近日也加入了生成式 AI 领域的竞争之中,发布了一个名为 Dolly 的开源大型语言模型,将模型命名为 Dolly 是为了向第一只克隆羊多莉致敬。

像 ChatGPT 和 Bard 这样的生成式 AI,它们使用的数据通常来自于在成千上万不同网站,使用的数据量十分惊人,而且想要使用这些数据训练 AI 还需要数以千计的强大 GPU 在背后提供支持。

Databricks 希望通过开源 Dolly 及其训练数据,让任何人都能开发出一个真正像人类的 AI,而无需投资数百万美元,也让这类 AI 不再是只有大型科技公司才能负担得起的东西,数以百万计的小公司也将能够从中受益。

除此之外,让各个小公司构建自己的模型,而不将数据通过 API 发送给专有模型背后的服务提供商,也可以保护小公司的敏感数据和专有的知识产权。此外,一些公司可能在模型质量、成本和期望行为方面有不同的权衡,这些公司也可以根据需求调整模型。

Databricks 首席执行官 Ali Ghodsi 表示,Dolly 只需要非常少的数据和非常短的时间就能完成训练。

只需 30 美元、一台服务器和三个小时,我们就能教 Dolly 开始进行人类级别的交互。

Databricks 没有从头开始创建自己的模型,而是基于 EleutherAI 在 2021 年开源的自然语言处理模型 —— GPT-J。GPT-J 是一个基于 GPT-3,由 60 亿个参数组成的自然语言处理 AI 模型。该模型在一个 800GB 的开源文本数据集上进行训练,并且能够与类似规模的 GPT-3 模型相媲美。

Databricks 说,尽管模型小得多,只有 60 亿个参数,以及较小的数据集和训练时间(ChatGPT 的参数是 1750 亿个),但 Dolly 仍然表现出了 ChatGPT 所展示的同样的 "神奇的人类互动能力"。

Databricks 目前已经在 GitHub 上开源了一个简单的 Databricks notebook,开发者可以使用它在 Databricks 上自己构建 Dolly。

优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/234368/databricks-dolly

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

相关文章

发表评论

资源下载

更多资源
优质分享Android(本站安卓app)

优质分享Android(本站安卓app)

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario,低调大师唯一一个Java游戏作品

Mario,低调大师唯一一个Java游戏作品

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Eclipse(集成开发环境)

Eclipse(集成开发环境)

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。

Java Development Kit(Java开发工具)

Java Development Kit(Java开发工具)

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具。