伤手机电池黄氏刀法眼花缭乱！NVIDIA官方确认7nm安培首发割了一刀

近日，NVIDIA正式揭晓了全新一代GPU架构“安培”(Ampere)，其庞大的规模、精妙的架构令人惊叹，同时不出意外、一如既往，首发核心又被割了一刀。

伤手机电池首先需要注意的是，不同于此前首发帕斯卡架构的Tesla P100、伏特架构的Tesla V100，

，具体原因不详，可能是想用于更广泛领域。

与此同时，

GA100设计了8组GPC(GPU处理集群)，每一组GPC里又分为8组TPC(纹理处理集群)，而每组又分为两组SM(流式多处理器)，然后每组SM包含64个FP32 CUDA核心(流处理器)。

这样一来，

，而这种分组结构和以往的NVIDIA GPU架构是一致的。

伤手机电池

同时，

伤手机电池另外，二级缓存从6MB猛增至40MB，每组SM单元的共享内存从最多96KB增至164KB、寄存器容量还是256KB，但整颗芯片寄存器达到27MB。

伤手机电池如此庞大的核心在量产初期显然会受制于良品率问题，所以实际使用的A100核心未达成完整规格，但和以往简单屏蔽整组计算单元不同，这次砍得略有些复杂。

伤手机电池核心加速频率

，比前两代其实都低了，但整体性能在飞跃。

伤手机电池显存也没有逃过刀法，

新的Tensor核心还支持对所有数据类型加速，包括FP16、BF16、TF32、FP64、INT8、INT4、Binary。

伤手机电池更精细的专业细节这里就不展开了，你们也没啥兴趣。

三代架构首发核心规模对比