AMD 发布完全开源的 3B 参数语言模型 Instella
AMD 今天发布了完全开源的 3B 参数语言模型 Instella。
GitHub:https://github.com/AMD-AIG-AIMA/Instella
AMD 宣称 Instella 代表着"完全开放的最先进的 30 亿参数语言模型 (LM)"。这些模型是在 AMD Instinct MI300X GPU 上训练的。
通过完全开源Instella模型,包括权重、训练超参数、数据集和代码,我们旨在促进人工智能社区内的创新与合作。
我们相信,透明度、可重复性和可访问性是人工智能研究与开发取得进展的关键驱动力。
我们邀请开发人员、研究人员和人工智能爱好者探索 Instella,为其不断改进献计献策,并与我们一起推动语言模型的发展。
根据 AMD 公布的数据,其性能与 Llama 3.2 3B、Gemma-2 2B 和 Qwen 2.5 3B 等同类产品相比具有很强的竞争力。

