AMD首席执行官苏姿丰博士在上个月摩根大通举办的第49届全球技术、媒体和通信大会上,已确认代号为Aldebaran的CDNA 2架构GPU将会在年内推出。这款很可能名为Instinct MI200的计算卡,是专门为计算密集型和HPC工作负载而设计。
今年即将交付的美国能源部Frontier E级超级计算机将会使用这款计算卡,传闻Instinct MI200计算卡拥有128GB的HBM2e显存。此前通过AMD64 EDAC驱动的Linux更新补丁,已确认Instinct MI200计算卡会采用MCM(Multi-Chip-Module)封装技术,在单芯片封装里使用了两颗计算芯片,并通过下一代Infinity Fabric总线技术互连。
近日,推特用户@Locuza_介绍了相关的细节,Instinct MI200计算卡的每个计算芯片支持全速率FP64/FP32和第二代矩阵引擎(用于矩阵乘法的硬件,加速DNN构建、训练和AI推理),拥有128个CU即8192个流处理器,那么一张计算卡就有256个CU即16384个流处理器。不过Instinct MI200计算卡会将部分CU屏蔽,实际上只会用到224个CU即14336个流处理器,数量相比完整核心少了14%左右。
同时每个计算芯片都会支持VCN 2.6和SDMA(系统直接内存访问),配备独立的PCIe接口和XGMI,并配置了4096位的HBM2e显存接口,对应64GB显存。假设AMD使用SK海力士速率为3.6Gbps的最新款HBM2e颗粒,将为GPU提供3.64 TB/s的带宽。由于使用的是带ECC的显存,因此部分带宽和容量会被用于纠错,实际容量并没有128 GB那么多。