AI2 开源新 LLM，重新定义 open AI-低调大师

AI2 开源新 LLM，重新定义 open AI

2024-02-02 424

艾伦人工智能研究所（Allen Institute for AI，简称 AI2）宣布推出一个名为 OLMo 7B 的新大语言模型，并开源发布了预训练数据和训练代码。OLMo 7B 被描述为“一个真正开放的、最先进的大型语言模型”。

AI2 是由已故的微软公司联合创始人保罗-艾伦（Paul Allen）于 2014 年在西雅图创办的一家非营利组织。该组织表示，他们开源 OLMo 模型旨在让 AI 研究社区充分了解最先进的大语言模型（LLM），从而推动自然语言处理的发展，并以科学的方式正视现有 LLM 存在的问题。

“通过向公众完全开放 OLMo 及其训练数据，AI2 在协作构建世界上最好的开放语言模型方面迈出了一大步。”

OLMo 框架具有一套完全开放的 AI 开发工具，包括：

完整的预训练数据：该模型建立在 AI2 的 Dolma 语料库上，该语料库具有三万亿个用于语言模型预训练的 token 开放语料，包括生成训练数据的代码。
训练代码和模型权重： OLMo 框架包括 7B 规模的四个模型变体的完整模型权重，每个模型至少训练有 2T token。提供了推理代码、训练指标和训练日志。
评估：开发中使用的评估套件已发布，每个模型包含 500 多个 checkpoints，来自训练过程中的每 1000 个步骤，以及 Catwalk 项目下的评估代码。

在接下来的几个月中，AI2 计划继续迭代 OLMo，并将不同的模型大小、模式、数据集和功能引入 OLMo 系列。

OLMo 项目负责人、AI2 NLP 研究高级主管、华盛顿大学艾伦学院教授 Noah Smith 表示:

“有了 OLMo，open 就是真正意味上的'open'，AI 研究界的每个人都可以访问模型创建的各个方面，包括训练代码、评估方法、数据等。AI 曾经是一个以活跃的研究社区为中心的开放领域，但随着模型的发展、成本的增加以及开始转化为商业产品，AI 工作开始闭门造车。我们希望通过 OLMo 扭转这一趋势，让研究界能够团结起来，以科学的方式更好地理解和使用语言模型，从而开发出更负责任的 AI 技术，造福于每个人。”

更多详情可查看官方博客。

微信关注我们

原文链接：https://www.oschina.net/news/277402/allenai-olmo-truly-open-llm

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

天津大学发布中国首个脑机接口开源软件平台 MetaBCI 研究成果

近日，天津大学神经工程团队在数学与计算生物学领域SCI一区TOP期刊《Computers in Biology and Medicine》上发表论文，介绍了中国首个脑机接口开源软件平台MetaBCI的技术架构与实现方法。 https://www.sciencedirect.com/science/article/pii/S0010482523012714?via%3Dihub 据介绍，MetaBCI针对BCI领域数据分布散乱、算法复现困难、在线系统效率低的问题，规范了BCI数据结构与预处理流程、开发了通用的算法框架、利用了双进程和双线程提高在线实时效率，有助于降低构建脑-机接口系统的技术门槛，减少研发成本，促进转化落地。 MetaBCI由离线分析模块Brainda、刺激呈现模块Brainstim和在线数据流模块Brainflow三大部分构成，提供了面向BCI软件层面全链条开发的解决方案。面向离线分析需求，Brainda统一了现有公开数据集接口，优化了脑电数据读取、处理流程，复现多种主要BCI数据分析及解码算法，以此提高研究者的算法开发效率；面向刺激呈现需求，Brainstim提供了...

2024-02-02

534

2月1日，面壁智能举办新品发布会，推出了最新的旗舰级多模态大模型“面壁MiniCPM”，参数规模为20亿，使用了1TB精选数据进行训练。面壁智能CEO李大海在发布会上表示，MiniCPM-2B在多项主流评测榜单、中英文平均成绩均超越了开源的Mistral-7B，英文榜单的平均分甚至超越了Falcon-40B、MPT-30B等百亿参数模型。所谓“端侧大模型”，即模型服务部署在手机、电脑、IoT设备等本地终端，直接由终端芯片完成推理过程，无需联网。作为一款端侧大模型，MiniCPM 声称“跑通国际主流手机品牌与终端 CPU 芯片，老手机也无压力”，但从吞吐量来看，实际表现或许有待提升。开源地址（内含技术报告）： MiniCPM GitHub：https://github.com/OpenBMB/MiniCPM OmniLMM GitHub：https://github.com/OpenBMB/OmniLMM

2024-02-02

382

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。