INNO3D GeForce RTX 2080 SUPER TWIN X2 OC [N208S2-08D6X-11801167]

NVIDIA Turing - Processore Grafico TU102

Indice

Sono al momento tre le soluzioni consumer in commercio ad essere equipaggiate con il processore grafico di fascia medio alta TU104, vale a dire la GeForce RTX 2070 SUPER, la GeForce RTX 2080 e la GeForce RTX 2080 SUPER. Sebbene, come precisato, in entrambe viene utilizzata apparentemente la medesima GPU, sono ugualmente previste delle differenze a livello architetturale abbastanza significative.

La soluzione top di gamma, infatti, prevede la versione completa del nuovo processore grafico, indicata come TU104-450, e provvista di tutte e 48 le unità SM attive, e di conseguenza di ben 3.072 CUDA Cores, 192 TMU, 384 Tensor Cores e 48 RT Cores, mentre nei modelli inferiori GeForce RTX 2070 SUPER e GeForce RTX 2080 troviamo varianti sensibilmente depotenziate del chip, denominate, rispettivamente, TU104-410, in cui solamente 40 delle 48 unità SM risultano abilitate (prevedendo quindi un totale di 2.560 CUDA Cores, 160 TMU, 320 Tensor Cores, e 40 RT Cores), e TU104-400A, in cui solamente due delle 48 unità SM risultano disattivate (2.944 CUDA Cores, 184 TMU, 368 Tensor Cores e 46 RT Cores).

Osserviamo quindi, nel dettaglio, la struttura interna del nuovo processore grafico di fascia alta TU104, in tutte e tre le varianti consumer proposte da NVIDIA:

Come vediamo dal diagramma, il blocco principale è ancora una volta denominato GPC (Graphics Processing Cluster) ed include un Raster Engine (per la rimozione di tutti i triangoli non visibili dalla scena, al fine di ridurre la banda necessaria) e quattro blocchi TPC (Thread/Texture Processing Clusters), ognuno formato da un PolyMorph Engine e da una coppia di unità Streaming Multiprocessor, comprendenti, come abbiamo osservato, la maggior parte delle unità fondamentali per l’esecuzione dei calcoli grafici.

Esternamente al blocco Graphics Processing Cluster (GPC), troviamo le unità ROPs (Raster Operator), suddivise in otto blocchi separati da 8 unità ciascuno, ognuno connesso ad un Memory Controller con interfaccia a 32 bit, a sua volta in grado di accedere ad una porzione dei 4.096KB di memoria Cache L2 presenti, nello specifico a 512KB. Ne consegue un bus di memoria aggregato pari a 256 bit ed un totale di 64 unità ROPs completamente sfruttabili.

Non manca, inoltre, un potente Giga Thread Engine, responsabile della suddivisione intelligente del carico di lavoro complessivo tra i sei blocchi GPC che compongono il processore grafico.

Nella tabella che segue andiamo a riassumere le caratteristiche tecniche del nuovo processore grafico TU104, ponendolo a confronto con il precedente GP104, basato su architettura Pascal: