AI21 开源迷你语言模型 Jamba Reasoning3B
AI21Labs 宣布推出其最新的开源小语言模型 ——Jamba Reasoning3B。这款被称为 “迷你语言模型” 的系统专为在设备上进行人工智能计算而设计。Jamba Reasoning3B 是该公司在特拉维夫开发的 Jamba 系列模型的最新成员,并采用 Apache2.0许可证发布。
与大多数市场上流行的大型语言模型(LLM)不同,Jamba Reasoning3B 建立在 AI21自有的混合状态空间模型(SSM)- 变换器架构之上。状态空间模型是一种用于序列建模的深度学习算法,相比传统变换器在某些任务上更加高效。这类模型通过当前状态预测下一个状态。Mamba 是一种基于 SSM 的神经网络架构,构成了 Jamba 架构的一部分。
这款迷你语言模型的上下文窗口长度达到了 256000 个 token,最多可以处理 1000000 个 token,具备与 Anthropic Claude、Google Gemini 和 Meta Llama 等大型语言模型相似的能力,但却可以在 iPhone、Android 设备、Mac 和 PC 等小型设备上运行。
Futurum Group 的分析师 Brad Shimmin 表示,他一直是状态空间模型的支持者,认为这一理念在行业内已有相当长的历史,但直到现在才有切实可行的实现方式。他指出,随着技术的演进,状态空间模型的使用变得更加可行,因为其扩展性强且速度快。
SSM 类型模型使用绳索缩放技术来扩展模型的注意机制,从而有效优先处理任务,同时所需的计算能力比大型语言模型少。虽然 AI21是一家相对较小的生成 AI 公司,但由于其获得了 Google 和 AI 芯片巨头 Nvidia 的支持,并自2017年成立以来融资超过6亿美元,因此它可以通过建立生态系统来从开放源代码模型 Jamba Reasoning3B 中获利。
在发布会上,AI21展示了 Jamba 模型在广泛使用的基准测试系统如 IFBench、MMLU-Pro 和 Humanity's Last Exam 上的表现,证明其超越了包括阿里巴巴的 Qwen3.4B、谷歌的 Gemma3.4B、Meta 的 Llama3.23B、IBM 的 Granite4.0Micro 和微软的 Phi-4Mini 等多个大型开源 LLM。
Shimmin 认为,这款迷你语言模型在企业市场中有广阔的前景,因其支持检索增强生成技术,企业能够根据自身需求进行定制,同时确保数据的安全性。他提到,一个潜在的应用领域是客户服务中心,通过其推理能力来处理客户投诉,判断问题是否需要升级到人工或其他模型。
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
CNCF 宣布 Knative 毕业
云原生计算基金会(CNCF)宣布 Knative 毕业,Knative 是构建在 Kubernetes 之上的无服务器、事件驱动应用层。 Knative 通过抽象自动扩缩、路由、事件传递和容器构建等基础设施细节,简化开发者构建、部署和运行现代工作负载的流程。它让团队专注于架构和业务逻辑,并能快速启动 Kubernetes 项目,无需深入学习大量 Kubernetes 概念和资源。随着高层管理者寻求优化成本和简化运营,Knative 的零实例自动扩缩功能有效减少资源浪费。 Knative 联合创始人 Evan Anderson 表示:“Knative 填补了云原生生态中多个空白,作为 Kubernetes 的便捷入口,Knative 的事件系统为事件与响应之间提供了缺失的‘骨架’。看到 Knative 的愿景在 CNCF 内被广泛采纳,令人欣慰。” Knative 于 2018 年由 Google 创建,早期贡献者包括 IBM、Red Hat、VMware 和 SAP。2021 年发布 1.0 版本,标志着生产就绪;2022 年加入 CNCF,成为孵化项目。 在 CNCF 中立生态系统内...
-
下一篇
开源鸿蒙技术大会2025 | 技术俱乐部&高校社团分论坛圆满举办
2025年9月27日,开源鸿蒙技术大会2025“技术俱乐部&高校社团分论坛”在湖南长沙国际会议中心圆满举行。本次分论坛聚焦“开源鸿蒙高校生态与人才培养”,主题涵盖人才培养、技术创新、安全防护、社团运行、生态建设等多个层面,旨在通过产学研用的深度融合,探索高校社团和开源社区协同发展的新路径,推动开源鸿蒙生态繁荣。分论坛由湖南大学开源鸿蒙技术俱乐部主任、现代工程训练中心(创新创业学院)主任胡玉鹏教授,南方科技大学开源鸿蒙技术俱乐部主任、lEEE Photonics Society全球主席、IEEE&SPIE&OSA Fellow沈平教授,华中科技大学开源鸿蒙技术俱乐部主任、国家级青年人才王浩宇教授,吉首大学计算机科学与工程学院副院长覃遵跃教授,深圳技术大学开源鸿蒙高校社团主任、大数据与互联网学院计算机科学与技术系主任李蒙教授共同担任出品人,湖南大学副教授胡桥做分论坛主持人。多位高校专家学者及学生代表齐聚一堂,分享了在开源鸿蒙教育、科研和生态建设中的最新实践与成果。 开源鸿蒙技术俱乐部&高校社团分论坛合影 深圳技术大学开源鸿蒙高校社团主任、大数据与互联网学院计算机科学与技术系系主任李蒙教授...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- Linux系统CentOS6、CentOS7手动修改IP地址
- 设置Eclipse缩进为4个空格,增强代码规范
- 2048小游戏-低调大师作品
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池


微信收款码
支付宝收款码