NVIDIA presenta ufficialmente la nuova GPU GA100 Ampere


NVIDIA ha svelato ufficialmente la nuova GPU GA100 Ampere, successore del Tesla V100, in grado di garantire prestazioni 20 volte maggiori, il tutto grazie alla nuovo chipset A100 con architettura Ampere, sviluppato con processo produttivo a 7 nanometri.

Le prestazioni 20 volte superiori alla passata generazione Tesla V100 sono riferite all’intelligenza artificiale delle operazioni a singola precisione, FP32 e operazioni INT8. NVIDIA invece parla di prestazioni 2,5 volte maggiori di Tesla V100 con calcoli a doppia precisione FP64.

Elemento fondamentale al fine di raggiungere tali risultati sono i Tensor core, giunti alla terza generazione e migliorati ulteriormente grazie al supporto del nuovo formato TF32, in grado di garantire un l’accelerazione di operazioni in virgola mobile a singola precisione. I nuovi Tensor core supportano inoltre anche i calcoli a doppia precisione, si avvalgono di nuova tecnica chiamata “structural sparsity” che raddoppia la velocità di esecuzione dei calcoli legati all’IA e supportano i formati TF32, FP16, BFLOAT16, INT8 e INT4.

La GPU GA100 Ampere dispone di un’area di 826 mm2, presenta 54,2 miliardi di transistor e offre 6192 CUDA core FP32 all’interno di 108 SM, affiancati da 432 Tensor core e altrettante unità di texture.

Tali caratteristiche non rispecchiano in pieno tutto il potenziale del GA100, in quanto nella sua massima espressine le GPU dispone di 128 SM per un totale di 8192 CUDA core, 512 Tensor core e altrettante texture unit.

Il nuovo A100 presenta una connettività PCI Express 4.0, dispone sullo stesso package di 40 GB di memoria HBM2 in grado di garantire un bandwidth di 1,6 TB/s su bus a 5120 bit. La massima espressione del GA100 dispone invece di ben 6 stack HBM2 con 12 controller a 512 bit per un totale di 48 GB di memoria con un bus a 6144 bit. Il chipset A100 Ampere dispone inoltre di collegamento NVLink 3.0 con 12 linee bidirezionali a 25 GB/s per un totale di 600 GB/s nella comunicazione tra due GPU uguali.

Un’altra novità dell’architettura Ampere è la possibilità di partizionare la GPU al fine di eseguire in parallelo sette istanze diverse, ognuna con le proprie risorse. Il nuovo NVIDIA A100 è in produzione e arriverà come DGX A100. Al suo interno troveremo otto GPU GA100 per una potenza di calcolo di 5 petaflops o 10 petaflops.

La seconda forma con cui troveremo il nuovo A100 è l’HGX A100, che non è altro che il blocco fondante di DGX destinato ai produttori di server. La terza forma è rappresentato dall’inedito EGX A100, in grado di combinare una NVIDIA A100 con Mellanox SmartNIC, al fine di raggiungere una potenza di calcolo di 700 petaflops.

Atos, Dell Technologies, Fujitsu, Gigabyte, H3C, Hewlett Packard Enterprise, Inspur, Lenovo, Quanta e Supermicro e fornitori di servizi cloud come Alibaba Cloud, Amazon Web Services, Baidu Cloud, Google Cloud e Tencent Cloud, forniranno presto soluzioni basate sul nuovo NVIDIA A100.


HW Legend Staff


Newsletter HW Legend


Caricamento