Intel e Aible, una soluzione aziendale di intelligenza artificiale generativa (GenAI) serverless end-to-end e di analisi aumentata, offrono ora soluzioni condivise ai clienti per eseguire casi d’uso avanzati di GenAI e RAG (retrieval-augmented generation) su più generazioni di CPU Intel Xeon.
La collaborazione, che include ottimizzazioni ingegneristiche e un programma di benchmarking, migliora la capacità di Aible di fornire risultati GenAI a basso costo per i clienti aziendali e aiuta gli sviluppatori a incorporare l’intelligenza artificiale nelle applicazioni. Insieme, le aziende offrono soluzioni AI scalabili ed efficienti che si basano su hardware ad alte prestazioni per aiutare i clienti a risolvere le sfide con le AI.
“I clienti sono alla ricerca di soluzioni efficienti di livello aziendale per sfruttare la potenza dell’intelligenza artificiale. La nostra collaborazione con Aible mostra come stiamo lavorando a stretto contatto con l’industria per fornire innovazione nell’intelligenza artificiale affinché molti clienti possano utilizzare le ultime novità, ha affermato Mishali Naik, Senior Principal Engineer, Data Center e AI Group di Intel.
Le soluzioni di Aible dimostrano come le CPU possano migliorare significativamente le prestazioni in una gamma dei più recenti carichi di lavoro AI, dall’esecuzione di modelli linguistici a RAG. Ottimizzata per i processori Intel, la tecnologia di Aible utilizza un efficiente approccio end-to-end serverless per l’intelligenza artificiale, consumando risorse solo quando ci sono richieste attive. Ad esempio, il database vettoriale si attiva solo per pochi secondi per recuperare informazioni rilevanti per una query dell’utente e il modello linguistico si attiva allo stesso modo brevemente per elaborare e rispondere alla richiesta.
Mentre RAG viene spesso implementato utilizzando GPU (unità di elaborazione grafica) e acceleratori per sfruttare le capacità di elaborazione parallela, la tecnica serverless di Aible, combinata con i processori scalabili Intel Xeon, consente ai casi d’uso RAG di essere alimentati interamente dalle CPU. I dati sulle prestazioni mostrano che più generazioni di processori Intel Xeon possono eseguire carichi di lavoro RAG in modo efficiente.
Aible consente ai clienti di ridurre i costi operativi dei progetti GenAI utilizzando esclusivamente CPU in formato serverless per condividere le stesse risorse di elaborazione sottostanti in modo più sicuro tra più clienti. Inoltre, con la crescita della domanda di IA generativa, la necessità di ottimizzare sia le prestazioni che il consumo energetico diventa sempre più cruciale. I servizi basati su CPU di Aible offrono ai clienti una soluzione conveniente ed efficiente dal punto di vista energetico.
Secondo l’analisi benchmark di Aible, i clienti possono ottenere un risparmio sui costi fino a 55 volte eseguendo modelli RAG sulle loro soluzioni serverless basate su CPU. Questa riduzione dei costi è una testimonianza dell’efficacia dell’approccio esclusivo della CPU di Aible, che evita la necessità di infrastrutture più costose basate su GPU con servizi condivisi o server dedicati.
Intel, inclusi Intel Labs, ha collaborato con Aible per ottimizzare i carichi di lavoro AI sui processori Xeon. In particolare, ottimizzando il codice di Aible per AVX-512, Aible ha riscontrato miglioramenti significativi delle prestazioni e migliorato il throughput sui processori Xeon, evidenziando l’impatto delle ottimizzazioni strategiche del software sull’efficienza complessiva.
La combinazione dei modelli RAG con i processori Intel Xeon, facilitata da piattaforme come Aible, può abilitare applicazioni come:
- Elaborazione del linguaggio naturale (PNL);
- Sistemi di raccomandazione;
- Sistema di Supporto Decisionale;
- Generazione di contenuti.
La collaborazione di Intel con Aible è iniziata con il lancio dei processori Xeon di quarta generazione. Da allora le due società hanno ottimizzato i carichi di lavoro, il codice e le librerie dell’intelligenza artificiale per i processori Xeon, al fine di per aumentare le prestazioni delle offerte di prodotti Aible.
Intel e Aible presenteranno le loro soluzioni all’Amazon Web Services Summit a Washington, D.C., il 26 e 27 giugno. Le soluzioni di Aible vengono eseguite su AWS Lambda e sono disponibili nell’AWS Marketplace.
HW Legend Staff