La CPU Ryzen AI MAX+ 395 di AMD offre prestazioni AI LLM fino a 12 volte superiori rispetto a “Lunar Lake” di Intel


Il nuovo processore di punta di AMD, il Ryzen AI MAX+ 395 “Strix Halo”, mostra vantaggi di prestazioni impressionanti rispetto ai processori Intel “Lunar Lake” nei carichi di lavoro di inferenza dei modelli di linguaggio (LLM), secondo i recenti benchmark pubblicati nel blog di AMD.

Dotato di 16 core CPU Zen 5, 40 unità di calcolo RDNA 3.5 e oltre 50 AI TOPS tramite la sua NPU XDNA 2, il processore raggiunge tempi di risposta fino a 12,2 volte più veloci rispetto al Core Ultra 258V di Intel in scenari specifici di LLM.

È importante notare che il Lunar Lake di Intel ha quattro core E e quattro core P, che complessivamente sono metà del numero di core del Ryzen AI MAX+ 395, ma la differenza di prestazioni è molto più pronunciata rispetto alla differenza di 2x nel numero di core. Il divario di prestazioni diventa ancora più evidente con la complessità dei modelli, in particolare con i modelli a 14 miliardi di parametri che si avvicinano al limite di ciò che i laptop standard con 32 GB di RAM possono gestire.

Nei benchmark di LM Studio utilizzando un ASUS ROG Flow Z13 con 64 GB di memoria unificata, la GPU integrata Radeon 8060S ha ottenuto un throughput dei token 2,2 volte superiore rispetto all’Intel Arc 140V su varie architetture di modelli. Le metriche di “time-to-first-token” hanno rivelato un vantaggio di 4 volte nei modelli più piccoli come Llama 3.2 3B Instruct, che sale a 9,1 volte con modelli da 7-8 miliardi di parametri come le varianti DeepSeek R1 Distill.

L’architettura di AMD eccelle particolarmente nelle attività visive multimodali, dove il Ryzen AI MAX+ 395 ha elaborato input visivi complessi fino a 7 volte più velocemente nell’IBM Granite Vision 3.2 3B e 6 volte più velocemente nel Google Gemma 3 12B rispetto all’offerta di Intel. Il supporto della piattaforma per l’AMD Variable Graphics Memory consente di allocare fino a 96 GB come VRAM da sistemi equipaggiati con 128 GB di memoria unificata, permettendo l’uso di modelli all’avanguardia come il Google Gemma 3 27B Vision.

I vantaggi di prestazioni del processore si estendono anche alle applicazioni pratiche di IA, inclusi l’analisi delle immagini mediche e l’assistenza nella programmazione tramite una quantizzazione di maggiore precisione a 6 bit nel modello DeepSeek R1 Distill Qwen 32B.


HW Legend Staff


Newsletter HW Legend


Caricamento