IBM è il primo provider di servizi cloud a rendere disponibili gli acceleratori AI Intel Gaudi 3 per i clienti, una mossa pensata per rendere le potenti capacità di intelligenza artificiale più accessibili e affrontare direttamente l’alto costo dell’hardware AI specializzato. Per Intel, il lancio su IBM Cloud segna il primo importante dispiegamento commerciale di Gaudi 3, portando maggiore scelta sul mercato. Sfruttando gli acceleratori Intel Gaudi 3 su IBM Cloud, le due aziende mirano ad aiutare i clienti a testare, innovare e distribuire soluzioni GenAI in modo economico.
Secondo una previsione recente dell’azienda di ricerca Gartner, si prevede che la spesa mondiale per l’Intelligenza Artificiale Generativa (GenAI) raggiunga i 644 miliardi di dollari nel 2025, con un incremento del 76,4% rispetto al 2024. La ricerca ha evidenziato che “GenAI avrà un impatto trasformativo su tutti gli aspetti del mercato della spesa IT, suggerendo un futuro in cui le tecnologie AI diventeranno sempre più parte integrante delle operazioni aziendali e dei prodotti di consumo.”
Per molti clienti aziendali, i benefici sono evidenti quando strumenti come GenAI automatizzano compiti, migliorano i flussi di lavoro e favoriscono l’innovazione. Tuttavia, l’implementazione di applicazioni AI richiede una potenza di calcolo significativa, spesso necessitando di processori specializzati costosi che impediscono a molte aziende di beneficiare dell’AI.
Gli acceleratori AI Gaudi 3 sono progettati specificamente per soddisfare le crescenti richieste di GenAI, inferenza di grandi modelli e messa a punto dei modelli, supportando al contempo un framework di sviluppo aperto. Gaudi 3 è inoltre ideale per modelli linguistici di grandi dimensioni multimodali (LLM) e generazione aumentata da recupero (RAG).
“Portando gli acceleratori AI Intel Gaudi 3 su IBM Cloud, stiamo permettendo alle aziende di scalare i carichi di lavoro generativi AI con prestazioni ottimizzate per inferenza e messa a punto,” ha dichiarato Saurabh Kulkarni, vicepresidente della Data Center AI Strategy di Intel. “Questa collaborazione sottolinea il nostro impegno condiviso nel rendere l’AI più accessibile ed economica per le aziende di tutto il mondo.”
Come Usano IBM Cloud i Clienti Aziendali
IBM Cloud serve una vasta gamma di clienti aziendali, in particolare quelli di settori regolamentati, come i servizi finanziari, la sanità e le scienze della vita, e il settore pubblico.
Le banche e le compagnie di assicurazioni utilizzano il cloud per il rilevamento delle frodi o per il servizio clienti personalizzato, mentre i fornitori di servizi sanitari lo usano per accelerare la scoperta e lo sviluppo di farmaci, diagnosi basate su AI, piattaforme di telemedicina e monitoraggio in tempo reale dei pazienti. I rivenditori utilizzano la tecnologia cloud per piattaforme di e-commerce o per la gestione dell’inventario. È anche una scelta per le aziende che cercano di modernizzare vecchi sistemi senza sacrificare il controllo o la sicurezza.
Gaudi 3 è ora disponibile nelle regioni IBM Cloud di Francoforte, Germania; Washington, D.C.; e Dallas, Texas.
Gaudi 3 è anche integrato nelle offerte più ampie di infrastruttura AI di IBM. I clienti possono utilizzare Gaudi 3 tramite IBM Cloud Virtual Servers su IBM Virtual Private Cloud (VPC) già da ora. I clienti potranno anche distribuire su architetture diverse a partire dalla seconda metà del 2025. Il supporto per Red Hat OpenShift e la piattaforma AI watsonx di IBM dovrebbe essere disponibile entro questo trimestre.
“La capacità di gestire più dati e avere prestazioni più elevate, tutto ciò contribuirà a migliorare l’adozione dell’AI da parte dei clienti di tutto il mondo,” afferma Satinder Sethi, direttore generale di IBM Cloud Infrastructure Services. “Intel Gaudi 3 offre ai clienti maggiore scelta, più libertà e una piattaforma più economica per scegliere l’hardware AI che desiderano utilizzare.”
Confronti tra Costo e Prestazioni
Gli acceleratori AI Intel Gaudi 3 sono progettati per affrontare la sfida dei costi bilanciando prestazioni e prezzo. Nuovi test di benchmark sull’inferenza AI condotti dall’azienda di ricerca Signal65, e commissionati da Intel, hanno mostrato che Gaudi 3 è il 92% più conveniente (prestazioni per dollaro) rispetto alla concorrenza quando eseguito sul modello Llama-3.1-405B-Instruct-FP8 di Meta con ampie dimensioni di contesto.
L’efficienza dei costi è una metrica cruciale perché consente alle aziende di eseguire più elaborazione AI con lo stesso investimento o lo stesso ammontare di elaborazione a un costo inferiore. I guadagni in termini di prestazioni mirano a ridurre la barriera dei costi per le aziende che cercano di implementare o affinare modelli, soprattutto con l’aumento dell’adozione di GenAI.
Le misurazioni di throughput o prestazioni si riferiscono alla quantità di elaborazione AI che l’acceleratore può eseguire in un determinato periodo di tempo, anche conosciuto come token per secondo. Gaudi 3 offre prestazioni di elaborazione AI significativamente più rapide rispetto alla concorrenza. Sui modelli IBM Granite-3.1-8B-Instruct, Gaudi 3 ha fornito il 43% in più di token per secondo per carichi di lavoro AI piccoli e il 36% in più di token per secondo con ampie dimensioni di contesto rispetto alla concorrenza quando eseguito sul modello Llama-3.1-405B-Instruct-FP8 di Meta.
HW Legend Staff