INNO3D GeForce RTX 2080 Ti Gaming OC X3: Potenza senza eguali!

NVIDIA Turing - Processore Grafico TU102

Indice

Sono al momento due le soluzioni consumer in commercio ad essere equipaggiate con il processore grafico di fascia altra TU102, vale a dire la GeForce RTX 2080 Ti e la TITAN RTX. Sebbene, come precisato, in entrambe viene utilizzata apparentemente la medesima GPU, sono ugualmente previste delle differenze a livello architetturale abbastanza significative.

La soluzione top di gamma, infatti, prevede la versione completa del nuovo processore grafico, indicata come TU102-400, e provvista di tutte e 72 le unità SM attive, e di conseguenza di ben 4.608 CUDA Cores, 288 TMU, 576 Tensor Cores e 72 RT Cores, mentre nel modello inferiore GeForce RTX 2080 Ti troviamo una variante sensibilmente depotenziata del chip, denominata, rispettivamente TU102-300, in cui solamente 68 delle 72 unità SM risultano abilitate, prevedendo quindi un totale di 4.352 CUDA Cores, 272 TMU, 544 Tensor Cores, e 68 RT Cores.

Osserviamo quindi, nel dettaglio, la struttura interna del nuovo processore grafico di fascia alta TU102, in entrambe le varianti proposte da NVIDIA:

Come vediamo dal diagramma, il blocco principale è ancora una volta denominato GPC (Graphics Processing Cluster) ed include un Raster Engine (per la rimozione di tutti i triangoli non visibili dalla scena, al fine di ridurre la banda necessaria) e sei blocchi TPC (Thread/Texture Processing Clusters), ognuno formato da un PolyMorph Engine e da una coppia di unità Streaming Multiprocessor, comprendenti, come abbiamo osservato, la maggior parte delle unità fondamentali per l’esecuzione dei calcoli grafici.

Esternamente al blocco Graphics Processing Cluster (GPC), troviamo le unità ROPs (Raster Operator), suddivise in dodici blocchi separati da 8 unità ciascuno, ognuno connesso ad un Memory Controller con interfaccia a 32 bit, a sua volta in grado di accedere ad una porzione dei 6.144KB di memoria Cache L2 presenti, nello specifico a 512KB.

Ne consegue un bus di memoria aggregato pari a 384 bit ed un totale di 96 unità ROPs completamente sfruttabili, per lo meno nel modello TITAN RTX, provvisto di processore grafico TU102-400. Nella soluzione GeForce RTX 2080 Ti, infatti, l’utilizzo della variante depotenziata del processore grafico (TU102-300) prevede la disabilitazione di uno dei dodici blocchi ROPs presenti e del relativo Memory Controller associato, con la conseguenza che si potrà contare solamente su 88 unità ROPs attive e su un bus di memoria aggregato pari a 352 bit (con ovvie ripercussioni in termini di banda passante).

Non manca, inoltre, un potente Giga Thread Engine, responsabile della suddivisione intelligente del carico di lavoro complessivo tra i sei blocchi GPC che compongono il processore grafico. Nella tabella che segue andiamo a riassumere le caratteristiche tecniche del nuovo processore grafico TU102, ponendolo a confronto con il precedente GP102, basato su architettura Pascal: