AI2 开源新 LLM,重新定义 open AI
艾伦人工智能研究所(Allen Institute for AI,简称 AI2)宣布推出一个名为 OLMo 7B 的新大语言模型,并开源发布了预训练数据和训练代码。OLMo 7B 被描述为“一个真正开放的、最先进的大型语言模型”。
AI2 是由已故的微软公司联合创始人保罗-艾伦(Paul Allen)于 2014 年在西雅图创办的一家非营利组织。该组织表示,他们开源 OLMo 模型旨在让 AI 研究社区充分了解最先进的大语言模型(LLM),从而推动自然语言处理的发展,并以科学的方式正视现有 LLM 存在的问题。
“通过向公众完全开放 OLMo 及其训练数据,AI2 在协作构建世界上最好的开放语言模型方面迈出了一大步。”
OLMo 框架具有一套完全开放的 AI 开发工具,包括:
- 完整的预训练数据:该模型建立在 AI2 的 Dolma 语料库上,该语料库具有三万亿个用于语言模型预训练的 token 开放语料,包括生成训练数据的代码。
- 训练代码和模型权重: OLMo 框架包括 7B 规模的四个模型变体的完整模型权重,每个模型至少训练有 2T token。提供了推理代码、训练指标和训练日志。
- 评估:开发中使用的评估套件已发布,每个模型包含 500 多个 checkpoints,来自训练过程中的每 1000 个步骤,以及 Catwalk 项目下的评估代码。
在接下来的几个月中,AI2 计划继续迭代 OLMo,并将不同的模型大小、模式、数据集和功能引入 OLMo 系列。
OLMo 项目负责人、AI2 NLP 研究高级主管、华盛顿大学艾伦学院教授 Noah Smith 表示:
“有了 OLMo,open 就是真正意味上的'open',AI 研究界的每个人都可以访问模型创建的各个方面,包括训练代码、评估方法、数据等。AI 曾经是一个以活跃的研究社区为中心的开放领域,但随着模型的发展、成本的增加以及开始转化为商业产品,AI 工作开始闭门造车。我们希望通过 OLMo 扭转这一趋势,让研究界能够团结起来,以科学的方式更好地理解和使用语言模型,从而开发出更负责任的 AI 技术,造福于每个人。”
更多详情可查看官方博客。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
天津大学发布中国首个脑机接口开源软件平台 MetaBCI 研究成果
近日,天津大学神经工程团队在数学与计算生物学领域SCI一区TOP期刊《Computers in Biology and Medicine》上发表论文,介绍了中国首个脑机接口开源软件平台MetaBCI的技术架构与实现方法。 https://www.sciencedirect.com/science/article/pii/S0010482523012714?via%3Dihub 据介绍,MetaBCI针对BCI领域数据分布散乱、算法复现困难、在线系统效率低的问题,规范了BCI数据结构与预处理流程、开发了通用的算法框架、利用了双进程和双线程提高在线实时效率,有助于降低构建脑-机接口系统的技术门槛,减少研发成本,促进转化落地。 MetaBCI由离线分析模块Brainda、刺激呈现模块Brainstim和在线数据流模块Brainflow三大部分构成,提供了面向BCI软件层面全链条开发的解决方案。 面向离线分析需求,Brainda统一了现有公开数据集接口,优化了脑电数据读取、处理流程,复现多种主要BCI数据分析及解码算法,以此提高研究者的算法开发效率; 面向刺激呈现需求,Brainstim提供了...
- 下一篇
面壁智能发布端侧大模型“面壁MiniCPM”
2月1日,面壁智能举办新品发布会,推出了最新的旗舰级多模态大模型“面壁MiniCPM”,参数规模为20亿,使用了1TB精选数据进行训练。 面壁智能CEO李大海在发布会上表示,MiniCPM-2B在多项主流评测榜单、中英文平均成绩均超越了开源的Mistral-7B,英文榜单的平均分甚至超越了Falcon-40B、MPT-30B等百亿参数模型。 所谓“端侧大模型”,即模型服务部署在手机、电脑、IoT设备等本地终端,直接由终端芯片完成推理过程,无需联网。作为一款端侧大模型,MiniCPM 声称“跑通国际主流手机品牌与终端 CPU 芯片,老手机也无压力”,但从吞吐量来看,实际表现或许有待提升。 开源地址(内含技术报告): MiniCPM GitHub:https://github.com/OpenBMB/MiniCPM OmniLMM GitHub:https://github.com/OpenBMB/OmniLMM
相关文章
文章评论
共有0条评论来说两句吧...