INNO3D GeForce RTX 4090 24GB X3-OC [N40903-246XX-18332989]

NVIDIA Ada Lovelace: Deep Learning Super-Sampling (DLSS) di terza generazione

La tecnologia Deep Learning Super-Sampling (DLSS) di NVIDIA ha aperto la strada al concetto di grafica neurale basata sull’intelligenza artificiale. Ad oggi viene sfruttata in 216 titoli e l’elenco è in continua crescita. Con le ultime soluzioni grafiche basate su architettura Ada Lovelace debutta anche la terza generazione del DLSS, il cui supporto è indicato come esclusivo; ciò significa che tutte le GPU precedenti alla serie RTX 40 continueranno a fare uso del DLSS di prima e seconda generazione.

Anche la nuova tecnologia DLSS 3 si basa sull’AI Super Resolution, che esegue il rendering interno utilizzando pixel a risoluzione inferiore e utilizza algoritmi l’intelligenza artificiale per produrre immagini a risoluzione più elevata e nitide al fine di migliorare notevolmente le prestazioni rispetto al tradizionale rendering grafico basato sulla rasterizzazione, ma presenta delle interessanti novità.

Negli ultimi quattro anni, la divisione Applied Deep Learning Research di NVIDIA ha sviluppato una particolare tecnica di generazione dell’immagine, denominata per l’appunto AI Frame Generation, che combina la stima del flusso ottico (Optical Flow) con il DLSS allo scopo di migliorare l’esperienza di gioco.

In altre parole l’ultima revisione del Deep Learning Super-Sampling sfrutta l’intelligenza artificiale per generare fotogrammi e inserirli con accuratezza tra i frame renderizzati, migliorando il frame rate e offrendo un’esperienza di gioco più fluida.

La stima del flusso ottico è comunemente utilizzata nelle applicazioni di visual-computing per misurare la direzione e l’ampiezza del movimento apparente dei pixel tra immagini grafiche renderizzate consecutivamente oppure tra frame video. Il flusso ottico è genericamente simile alla componente di stima del movimento della codifica video, ma con requisiti molto più impegnativi in ​​termini di accuratezza e coerenza. Di conseguenza, vengono utilizzati diversi algoritmi.

A partire dall’architettura Ampere, i processori grafici NVIDIA implementano un motore dedicato denominato Optical Flow Accelerator (OFA) che utilizza algoritmi all’avanguardia per garantire risultati di alta qualità. L’unità OFA di ultima generazione presente in Ada Lovelace assicura una potenza di calcolo pari a ben 300 TeraOPS (TOPS) di operazioni OF, vale a dire oltre due volte più veloce rispetto all’implementazione di Ampere, ed è in grado di fornire fondamentali informazioni alla rete DLSS 3.

I nuovi algoritmi di analisi del vettore di movimento sono componenti fondamentali che consentono una capacità di generazione di frame accurata e performante all’interno del nuovo framework tecnologico DLSS 3. Il potenziato Optical Flow Accelerator (OFA) calcola il flusso di movimento di ogni pixel in un determinato fotogramma. Questi dati vengono combinati con i tradizionali vettori di movimento già comunemente utilizzati nei giochi e immessi nella rete AI, che quindi genera interi fotogrammi anziché singoli pixel. Questa combinazione tra AI Super Resolution e AI Frame Generation incorpora anche la tecnologia NVIDIA Reflex per garantire la latenza più bassa possibile per i giocatori grazie ad una pipeline grafica ottimizza.

Normalmente, nella pipeline grafica, al fine di evitare stalli ed assicurare che la GPU lavori al massimo è previsto l’invio preventivo delle varie draw call da parte della CPU, creando una “coda di rendering”, ovvero una serie di ordini che verranno evasi man mano dal processore grafico secondo una pianificazione ben precisa, aumentando di conseguenza la latenza. NVIDIA, con la tecnologia proprietaria Reflex va di fatto a rimuovere questa coda, prevedendo che le varie draw call vengano generate dalla CPU appena prima che la GPU ne abbia effettivamente bisogno. Questo va ridurre drasticamente la latenza generale, migliorando l’input lag e di conseguenza rendendo le sessioni di gioco più reattive e fluide.

Il risultato di tutte le novità che vi abbiamo elencato assicura un aumento delle prestazioni fino a due volte rispetto a DLSS 2, pur preservando la straordinaria qualità dell’immagine che ha decretato il successo di questa tecnica. Quando DLSS 3 è combinato con i nuovi RT Cores e altri miglioramenti dell’architettura Ada Lovelace può essere raggiunto un livello di performance fino a quattro volte superiore rispetto alle GPU precedenti.

DLSS 3 può anche migliorare le prestazioni nei casi in cui la CPU rappresenta un “collo di bottiglia”, impedendo quindi al processore grafico di esprimere al massimo il suo potenziale. L’ultimo capitolo dell’apprezzato Microsoft Flight Simulator è un esempio pratico di gioco fortemente “CPU Bound”, a causa della sua fisica e delle gigantesche distanze di visualizzazione. Ciò limita i vantaggi in termini di prestazioni che le tradizionali tecnologie di Super-Sampling possono offrire.

In questo caso, tuttavia, la capacità di DLSS 3 di generare frame è ugualmente in grado di assicurare un miglioramento delle prestazioni fino a due volte.



Newsletter HW Legend


Caricamento