AMD 开源首款小语言模型 AMD-135M
AMD 宣布推出 AMD-135M —— Llama 家族的第一个小型语言模型。该模型具有推测解码功能,其训练代码、数据集和权重都是开源的,以便开发人员可以重现该模型并帮助训练其他 SLM 和 LLM。
“大语言模型通常使用自回归方法进行推理。然而,这种方法的一个主要限制是每次前向传递只能生成单个 token,导致内存访问效率低下并影响整体推理速度。
推测解码的出现解决了这个问题。其基本原理是使用小型草稿模型生成一组候选 token,然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个 token,而不会影响性能,从而显著减少内存访问消耗,并实现几个数量级的速度提升。”
公告称,AMD-135M 使用 AMD Instinct MI250 加速器从头开始训练,拥有 6700 亿个 token,包括 AMD-Llama-135M 和 AMD-Llama-135M-code 两个型号。
- 预训练:使用四个 MI250 节点,在六天内用 6700 亿个通用数据 token 从头开始训练 AMD-Llama-135M 模型。
- 代码微调:AMD-Llama-135M 代码变体利用另外 200 亿个代码数据 token 进行了微调,在同一硬件上耗时四天。
更多详情可查看官方公告。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
将 OpenAI 转变为真正的商业公司正在使其分崩离析
今年以来,由于公司价值观的争议和领导层之间的斗争,OpenAI 的高管和研究人员纷纷离职。 不到两年的时间里,OpenAI 从一个鲜为人知的非营利实验室,迅速转型为一个举世闻名的企业,其首席执行官已成为人工智能革命的代表人物。 这种转变正在使公司分崩离析。 周三,OpenAI 的首席技术官成为最新一位宣布离职的备受瞩目的高管,在公司准备转型为营利性企业之际选择了离开。这些离职事件公开爆发了公司内部自 ChatGPT 推出以来日益加剧的紧张关系,而这些紧张在 CEO 山姆·奥特曼去年短暂离职后回归时尤为明显。 部分紧张关系源于 OpenAI 最初致力于为公众利益开发 AI 的使命,与新推出的盈利产品之间的矛盾。而另一些则来自公司内部充满戏剧性的高层斗争。 首席技术官米拉·穆拉蒂是今年以来离职的 20 多位 OpenAI 研究人员和高管之一,其中还包括奥特曼的几位联合创始人。 现任和前任员工认为,OpenAI 过于急于发布产品公告和进行安全测试,并且已经失去了对竞争对手 AI 开发者的领先优势。他们认为 Altman 大多游离于日常事务之外——公司对此表示异议——因为他一直在全球奔走,推广...
- 下一篇
创造历史,阿里通义开源模型Qwen的衍生模型数量超越Llama
9月29日消息,基准测试平台Chatbot Arena日前公布最新大模型盲测榜单,10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强,其大语言模型Qwen2.5-72B-Instruct排名LLM榜单第十,是前十唯一的中国大模型;Qwen系列视觉语言模型Qwen2-VL-72B-Instruct排名Vision榜单第九,是得分最高的开源大模型。 同一时间,全球开源社区基于Qwen系列二次开发的衍生模型数量突破7.43万,超越Llama系列衍生模型的7.28万。通义千问Qwen成长为世界最大的生成式语言模型族群,在Hugging Face社区的开源模型权威榜单Open LLM Leaderboard上,Qwen系列及其衍生模型包揽了前十全部座次。 不论是模型性能还是生态影响力,Qwen都创造了中国开源大模型的历史。 Qwen2.5-72B-Instruct排名Chatbot Arena大语言模型榜单第十 Chatbot Arena是由开放研究机构LMSYS Org推出的大模型性能测试平台,自2023年5月推出以来一直是世界顶级大模型的最重要竞技场。平台目前集成了全球70...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7安装Docker,走上虚拟化容器引擎之路
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS关闭SELinux安全模块
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Linux系统CentOS6、CentOS7手动修改IP地址
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS8安装Docker,最新的服务器搭配容器使用
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2配置默认Tomcat设置,开启更多高级功能