NVIDIA久违2年的游戏卡新构架Turing登场,一举发表三款GeForce游戏卡RTX 2070、RX 2080与RTX 2080 Ti,分别使用TU102与TU104 GPU,这代强化GPC构架下的SM核心,并导入RT Core与Tensor Core硬体加速核心,分别加速即时光线追踪与深度学习运算。究竟这一代的更新,可提升多少DirectX 11游戏的性能?下面就来看看这一代Turing构架的创新与改变,以及3A大作的性能测试。
NVIDIA Turing世代,不仅制程升级至12nm FFN,构架上也改变Streaming Multiprocessor(SM)设计,加入独立的INT与FP运算单元,并提升L1与L2缓存性能,让这一代CUDA核心性能比起上一代有着近50%的性能提升。
此外,SM单元内更加入RT Core与Tensor Core硬件加速单元,藉由专属硬件设计,加速Real-Time Ray Tracing与Deep Learning游戏应用,让GeForce RTX游戏显卡走向混合渲染的新领域。这一代Turing构架,最完整的GPU核心代号为TU102,也是GeForce RTX 2080 Ti与Quadro RTX 6000所使用的GPU。
TU102 GPU包含着6组Graphics Processing Clusters(GPCs)与72组Streaming Multiprocessors(SMs)所组成。而每一组GPC当中有着6组TPC单元,在每组TPC之下各有2组SM单元。每一组SM包含着64 CUDA核心、8 Tensor核心、256KB寄存器堆、4组Texture Units与96KB L1/shared Memory。
GeForce RTX 2080 Ti虽使用TU102 GPU,但为了与Quadro RTX 6000绘图卡区隔,因此删减了2组TPC也就是屏蔽4组SM单元,因此RTX 2080 Ti的CUDA核心数为4352,相对的RT Core与Tensor Core也有所不同,下表提供给各位玩家参考。
而RTX 2080所使用的TU104,同样有着6组GPC,但每组GPC之中仅有着8组SM,因此共有着2944 CUDA、368 Tensor Core、46 RT Core,并配置8GB GDDR6內存。
最后RTX 2070使用TU106 GPU,仅有着3组GPC,而每组GPU维持着12组SM,因此有着2304 CUDA、288 Tensor Core、36 RT Core,同样配置8GB GDDR6內存。