文章目录[+]
快科技10月11日美国旧金山现场报道:
在Advancing AI 2024大会上,AMD正式发布了新款GPU加速卡“Instinct MI325X”。
它在大获成功的MI300X基础上再进一步,主要是增强了HBM内存部分。
【硬件规格、性能篇】
MI325X配备了多达256GB HBM3E内存,相比于MI300X又增加了64GB,还是八颗,但单颗容量从24GB增至32GB。
同时,带宽从5.3TB/s来到了6TB/s,同样增加了大约13%,Infinity Fabric总线的带宽则还是896GB/s。
性能方面倒是没啥变化,还是FP16 1.3 PFlops(每秒1300万亿次)、FP8 2.6 PFlops。
很自然的,核心规格也是原封不动:5nm XCD模块搭配6nm IOD模块,3.5D封装,1530亿个晶体管,304个计算单元。
不过,AMD透露MI325X的功耗达到了1000W,相比MI320X增加了750W。
MI325X也支持八块并行组成一个平台,这就有多达2TB HBM3E、48TB/s带宽,总的性能高达FP16 10.4 PFlops(每秒1.04亿亿次)、FP8 20.8 PFlops(每秒2.08亿亿次)。
这个规模对比NVIDIA H200 HGX,分别有80%、30%、30%的优势。
对比NVIDIA H200,无论单卡还是八卡平台,不同大模型推理的性能都可以领先20-40%。
训练性能方面,单卡可领先H200 10%,八卡平台则是持平。
MI325X加速卡和平台将在四季度内投产,而合作伙伴的整机系统、基础架构解决方案,将从明年第一季度起连续推出。