AI21 开源迷你语言模型 Jamba Reasoning3B-低调大师

AI21 开源迷你语言模型 Jamba Reasoning3B

2025-10-09 176

AI21Labs 宣布推出其最新的开源小语言模型 ——Jamba Reasoning3B。这款被称为 “迷你语言模型” 的系统专为在设备上进行人工智能计算而设计。Jamba Reasoning3B 是该公司在特拉维夫开发的 Jamba 系列模型的最新成员，并采用 Apache2.0许可证发布。

与大多数市场上流行的大型语言模型（LLM）不同，Jamba Reasoning3B 建立在 AI21自有的混合状态空间模型(SSM)- 变换器架构之上。状态空间模型是一种用于序列建模的深度学习算法，相比传统变换器在某些任务上更加高效。这类模型通过当前状态预测下一个状态。Mamba 是一种基于 SSM 的神经网络架构，构成了 Jamba 架构的一部分。

这款迷你语言模型的上下文窗口长度达到了 256000 个 token，最多可以处理 1000000 个 token，具备与 Anthropic Claude、Google Gemini 和 Meta Llama 等大型语言模型相似的能力，但却可以在 iPhone、Android 设备、Mac 和 PC 等小型设备上运行。

Futurum Group 的分析师 Brad Shimmin 表示，他一直是状态空间模型的支持者，认为这一理念在行业内已有相当长的历史，但直到现在才有切实可行的实现方式。他指出，随着技术的演进，状态空间模型的使用变得更加可行，因为其扩展性强且速度快。

SSM 类型模型使用绳索缩放技术来扩展模型的注意机制，从而有效优先处理任务，同时所需的计算能力比大型语言模型少。虽然 AI21是一家相对较小的生成 AI 公司，但由于其获得了 Google 和 AI 芯片巨头 Nvidia 的支持，并自2017年成立以来融资超过6亿美元，因此它可以通过建立生态系统来从开放源代码模型 Jamba Reasoning3B 中获利。

在发布会上，AI21展示了 Jamba 模型在广泛使用的基准测试系统如 IFBench、MMLU-Pro 和 Humanity's Last Exam 上的表现，证明其超越了包括阿里巴巴的 Qwen3.4B、谷歌的 Gemma3.4B、Meta 的 Llama3.23B、IBM 的 Granite4.0Micro 和微软的 Phi-4Mini 等多个大型开源 LLM。

Shimmin 认为，这款迷你语言模型在企业市场中有广阔的前景，因其支持检索增强生成技术，企业能够根据自身需求进行定制，同时确保数据的安全性。他提到，一个潜在的应用领域是客户服务中心，通过其推理能力来处理客户投诉，判断问题是否需要升级到人工或其他模型。

微信关注我们

原文链接：https://www.oschina.net/news/376382

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

CNCF 宣布 Knative 毕业

云原生计算基金会（CNCF）宣布 Knative 毕业，Knative 是构建在 Kubernetes 之上的无服务器、事件驱动应用层。 Knative 通过抽象自动扩缩、路由、事件传递和容器构建等基础设施细节，简化开发者构建、部署和运行现代工作负载的流程。它让团队专注于架构和业务逻辑，并能快速启动 Kubernetes 项目，无需深入学习大量 Kubernetes 概念和资源。随着高层管理者寻求优化成本和简化运营，Knative 的零实例自动扩缩功能有效减少资源浪费。 Knative 联合创始人 Evan Anderson 表示：“Knative 填补了云原生生态中多个空白，作为 Kubernetes 的便捷入口，Knative 的事件系统为事件与响应之间提供了缺失的‘骨架’。看到 Knative 的愿景在 CNCF 内被广泛采纳，令人欣慰。” Knative 于 2018 年由 Google 创建，早期贡献者包括 IBM、Red Hat、VMware 和 SAP。2021 年发布 1.0 版本，标志着生产就绪；2022 年加入 CNCF，成为孵化项目。在 CNCF 中立生态系统内...

2025-10-09

206

2025年9月27日，开源鸿蒙技术大会2025“技术俱乐部＆高校社团分论坛”在湖南长沙国际会议中心圆满举行。本次分论坛聚焦“开源鸿蒙高校生态与人才培养”，主题涵盖人才培养、技术创新、安全防护、社团运行、生态建设等多个层面，旨在通过产学研用的深度融合，探索高校社团和开源社区协同发展的新路径，推动开源鸿蒙生态繁荣。分论坛由湖南大学开源鸿蒙技术俱乐部主任、现代工程训练中心（创新创业学院）主任胡玉鹏教授，南方科技大学开源鸿蒙技术俱乐部主任、lEEE Photonics Society全球主席、IEEE＆SPIE＆OSA Fellow沈平教授，华中科技大学开源鸿蒙技术俱乐部主任、国家级青年人才王浩宇教授，吉首大学计算机科学与工程学院副院长覃遵跃教授，深圳技术大学开源鸿蒙高校社团主任、大数据与互联网学院计算机科学与技术系主任李蒙教授共同担任出品人，湖南大学副教授胡桥做分论坛主持人。多位高校专家学者及学生代表齐聚一堂，分享了在开源鸿蒙教育、科研和生态建设中的最新实践与成果。开源鸿蒙技术俱乐部＆高校社团分论坛合影深圳技术大学开源鸿蒙高校社团主任、大数据与互联网学院计算机科学与技术系系主任李蒙教授...

2025-10-09

198

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。