AMD 与 OpenAI 联合发布 AI 芯片:推理性能提升 35 倍
在刚刚结束的2025全球 AI 发展大会上,AMD 与 OpenAI 联合推出了最新的 Instinct MI400和 MI350系列 AI 芯片。这次发布会吸引了众多行业人士的关注,OpenAI 首席执行官 Sam Altman 也亲自出席,分享了与 AMD 在芯片研发过程中的合作经验。
强大的 AI 计算能力
AMD 新发布的 Instinct MI350系列 GPU 基于 CDNA4架构,专为现代 AI 基础设施设计。其中,MI350X 和 MI355X 两款 GPU 显著提升了 AI 计算性能。MI350系列配备288GB HBM3E 内存,内存带宽高达8TB/s,相较于上一代产品,AI 计算能力提升了4倍,推理性能更是提升了35倍。
与竞争对手英伟达的芯片相比,MI355X 每美元能提供多达40% 的额外 tokens,表现出色。MI355X 的 FP4性能可达到161PFLOPS,而 MI350X 在 FP16性能上可达到36.8PFLOPS,确保了在 AI 应用中的高效运行。
灵活的冷却与部署方案
AMD 的 GPU 设计不仅关注性能,还提供多种灵活的冷却配置,支持大规模部署。例如,在风冷机架中最多可以支持64个 GPU,而在直接液体冷却环境中则可支持多达128个 GPU,极大地增强了其应用的灵活性。
开源 AI 加速平台 ROCm7
为进一步提升 GPU 性能,AMD 还推出了开源 AI 加速平台 ROCm7。经过一年的发展,ROCm 现已成熟,并与多个世界领先的 AI 平台深度整合,如 LLaMA 和 DeepSeek。即将发布的 ROCm7版本将提供超过3.5倍的推理性能提升,为 AI 开发者提供了强大的技术支持。
下一代旗舰 AI 芯片 MI400
Instinct MI400系列是 AMD 下一代旗舰 AI 芯片,预计将搭载高达432GB 的 HBM4高速显存,内存带宽可达300GB/s。MI400在 FP4精度下的计算性能可达到40petaflops,专为 AI 训练中的低精度计算进行优化。此外,MI400系列通过 UALink 技术实现72个 GPU 的无缝互联,使其成为一个统一的计算单元,打破传统架构的通信瓶颈。
多家企业的合作前景
目前,Oracle、微软、Meta、xAI 等多家企业正在与 AMD 合作使用其 AI 芯片,Oracle 将在其云基础设施中首批采用 Instinct MI355X 驱动的解决方案。Oracle 云基础设施执行副总裁 Mahesh Thiagarajan 表示,与 AMD 的合作极大提升了其服务的可扩展性和可靠性,未来将继续深化合作。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
清源 SCA 社区版每日漏洞情报、新增 CVE 及投毒情报推送
2025年6月12日新增漏洞情报 CVE暂未收录高危以上漏洞:3 CVE热点漏洞精选:3 投毒情报:2 漏洞感知情报(CVE暂未收录) 1.MinIO未授权访问漏洞致多部分上传元数据泄露 漏洞描述 该漏洞源于S3 API接口list-multipart-uploads缺失资源级权限校验机制,攻击者可构造恶意GET请求遍历检索全实例范围内所有活跃分片上传会话记录。由于无需身份凭证即可直接访问受保护资源,成功利用后能够非法获取包含上传者标识、文件路径等关键元数据信息,进一步形成基于业务上下文的关系推断攻击面。CVSS评分依据显示攻击代价极低且作用域维持不变,仅需单次网络请求即可同步造成机密性与完整性双重破坏。 组件描述 MinIO是兼容Amazon S3协议的分布式对象存储系统,专为云原生环境优化设计其高可用架构提供大规模非结构化数据管理能力。组件通过实现标准RESTful API完成数据生命周期治理,采用分布式存储引擎保障跨节点数据一致性与弹性扩展特性。 漏洞详情 漏洞威胁性评级: 9.1 (超危) 漏洞类型: Broken Access Control (CWE-285) 受影响组件仓...
- 下一篇
陆首群评 DeepSeek
一、DeepSeek获得最大的成功是梁文锋团队以创新的姿态研发出一条“低投资、低成本、有限资源,高效率,高性价比(产出)”发展人工智能的新路径。 二、DeepSeek堪称为当前中国人工智能的代表作,正在改变世界人工智能的发展格局。 *打击美国在人工智能领域的霸权, *为中国发展人工智能开辟了康庄大道, *否定美西方以“巨额投资、高成本、海量资源,低效率,低性价比(产出)”发展人工智能的老路。 三、称梁文锋团队是一群奇才或天才,实现了“国运式”的创新,并不为过! 四、梁文锋团队坚持开源创新,开源有助于人工智能的迭代创新、维稳升级、开拓生态;DeepSeek将大模型C端全开源和B端实行开源商业模式铸成一体,不但有实行开源创新,并可支持开源产业的发展,这也是DeepSeek一大创造。 五、按现行产出产品排行榜排队,有人以此来打压DeepSeek,其实DeepSeek与其他生成式语言大模型的产出性能处于对等状态,不存在过分夸张的你高我低情况,如以更科学的性价比对比,DeepSeek肯定是天下第一。 六、目前DeepSeek的主要技术没有多少秘密可言,国内外一些生成式语言大模型基本上也将Deep...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Hadoop3单机部署,实现最简伪集群
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS关闭SELinux安全模块
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Windows10,CentOS7,CentOS8安装Nodejs环境
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Linux系统CentOS6、CentOS7手动修改IP地址