IBM 发布 Granite 4.0 Nano 模型
IBM 近日推出了四款新的 Granite4.0Nano 模型,这一系列模型的参数规模从350万到15亿不等。与行业中大型模型普遍依赖云计算的趋势不同,Granite4.0Nano 模型可以在普通的笔记本电脑上运行,甚至可以在浏览器中本地运行。这使得开发者能够在不依赖云服务的情况下,构建适用于消费者硬件或边缘设备的应用。 所有 Granite4.0Nano 模型均在 Apache2.0许可下发布,适合研究人员、企业和独立开发者使用,且支持商业用途。这些模型与各种工具兼容,如 llama.cpp、vLLM 和 MLX,并获得了 ISO42001负责任 AI 开发的认证。 Granite4.0Nano 家族包括四款模型:Granite-4.0-H-1B(约1.5亿参数)、Granite-4.0-H-350M(约350万参数)、Granite-4.0-1B(接近2亿参数的变种)和 Granite-4.0-350M(变种)。其中,H 系列模型采用混合状态空间架构,适用于低延迟的边缘环境,而标准的变压器模型则提供了更广泛的兼容性。 基准测试显示,Granite4.0模型在多个领域的表现优于同类竞...
