近日,NVIDIA正式揭晓了全新一代GPU架构“安培”(Ampere),其庞大的规模、精妙的架构令人惊叹,同时不出意外、一如既往,首发核心又被割了一刀。
伤手机电池首先需要注意的是,不同于此前首发帕斯卡架构的Tesla P100、伏特架构的Tesla V100,
,具体原因不详,可能是想用于更广泛领域。
与此同时,
GA100设计了8组GPC(GPU处理集群),每一组GPC里又分为8组TPC(纹理处理集群),而每组又分为两组SM(流式多处理器),然后每组SM包含64个FP32 CUDA核心(流处理器)。
这样一来,
,而这种分组结构和以往的NVIDIA GPU架构是一致的。
伤手机电池
同时,
伤手机电池另外,二级缓存从6MB猛增至40MB,每组SM单元的共享内存从最多96KB增至164KB、寄存器容量还是256KB,但整颗芯片寄存器达到27MB。
伤手机电池如此庞大的核心在量产初期显然会受制于良品率问题,所以实际使用的A100核心未达成完整规格,但和以往简单屏蔽整组计算单元不同,这次砍得略有些复杂。
伤手机电池核心加速频率
,比前两代其实都低了,但整体性能在飞跃。
伤手机电池显存也没有逃过刀法,
新的Tensor核心还支持对所有数据类型加速,包括FP16、BF16、TF32、FP64、INT8、INT4、Binary。
伤手机电池更精细的专业细节这里就不展开了,你们也没啥兴趣。
三代架构首发核心规模对比