AMD首次展示AldebaranCDNA2InstinctMI200系列MCMGPU框图

黎忠慧
导读 AMD对其CDNA2AldebaranGPU驱动的InstinctMI200系列提供了一些进一步的见解,该系列是第一个采用MCM设计的产品。AMD架构师AlanSmith和Norman

AMD对其CDNA2“Aldebaran”GPU驱动的InstinctMI200系列提供了一些进一步的见解,该系列是第一个采用MCM设计的产品。AMD架构师AlanSmith和NormanJames在HotChips34期间详细介绍了InstinctMI200GPU。

AMD正式成为第一个采用MCM技术的公司,他们正在使用代号为Aldebaran的InstinctMI200来实现这一目标。AMDAldebaranGPU将有各种形式和尺寸,但它都基于全新的CDNA2架构,这是Vega最精致的变体。下面列出了我们详细介绍之前的一些主要功能:

AMDCDNA2架构——第二代矩阵核心加速FP64和FP32矩阵运算,与AMD上一代GPU相比,峰值理论FP64性能高达4倍。

领先的封装技术——业界首创的多芯片GPU设计采用2.5D高架扇出桥(EFB)技术,提供比AMD上一代GPU多1.8倍的内核和高2.7倍的内存带宽,提供业界最佳的总峰值理论内存带宽每秒3.2TB。

第三代AMDInfinityFabric技术——多达8个InfinityFabric链路将AMDInstinctMI200与节点中的第三代EPYC(霄龙)CPU和其他GPU连接起来,以实现统一的CPU/GPU内存一致性并最大限度地提高系统吞吐量,从而为CPU代码可利用加速器的功能。

AMDInstinctMI200GPU芯片射击:

AMDInstinctMI200内部是一个AldebaranGPU,具有两个芯片,一个辅助芯片和一个主芯片。它有两个模具,每个模具由8个着色器引擎组成,总共16个SE。每个着色器引擎包含14个CU,具有全速率FP64、打包的FP32和用于FP16和BF16操作的第二代矩阵引擎。整个GPU采用台积电的6nm工艺节点制造,共有580亿个晶体管。

AMDInstinctMI200GPU框图:

因此,每个芯片由112个计算单元或7,168个流处理器组成。整个芯片总共有224个计算单元或14,336个流处理器。AldebaranGPU也由新的XGMI互连提供支持。每个小芯片都具有VCN2.6引擎和主IO控制器。每个GPU小芯片都有四个用于HBM2e内存的1024位内存控制器。

至于缓存,每个GPU小芯片共有8MB的L2容量,被物理划分为32个切片。每个slice提供128B/CLK,具有增强的排队和仲裁以及增强的原子操作。每个GCD内存子系统包括每个小芯片64GB的HBM2e内存,每个GCD的总带宽为1.6TB/s,它被划分为32个通道,具有64B/CLK以实现高效工作电压。封装内互连包括跨两个GCD的400GB/s双向带宽。

共有8个InfinityFabric互连,每个GPU上的一个可用于PCI-Express互连。互连的额定CPU-GPU传输速率为144GB/s。您可以使用带有总共四个MI200系列GPU的外部InfinityFabric链接扩展至500GB/s,或者使用PCIeGen4ESMAIC横向扩展至100GB/s带宽。

AMDInstinctMI200“AldebaranGPU”性能指标:

标签:

免责声明:本文由用户上传,如有侵权请联系删除!