Lo scorso giugno Intel AI e Microsoft Research hanno creato BridgeTower, un trasformatore multimodale pre-addestrato per implementare funzioni avanzate di linguaggio visivo. Questo modello è stato recentemente integrato in Hugging Face, la principale library open source di machine learning.
La settimana scorsa Hugging Face ha pubblicato un aggiornamento sul proprio blog che riassume i benchmark di addestramento dell’intelligenza artificiale per gli acceleratori AI Habana Gaudi2 e la GPU H100 di Nvidia. Nel complesso, i risultati mostrano che Gaudi2 supera H100 nell’addestramento di questo modello BridgeTower raggiungendo velocità di 2,5 superiori rispetto all’A100.
I test mostrano come l’acceleratore AI Habana Gaudi2 di Intel consenta di ottenere risultati superiori rispetto agli A100 e H100 di Nvidia sul modello BridgeTower.
Per ulteriore contesto su BridgeTower:
- Il modello fa uso di nuove connessioni a ponte tra strati intermedi di trasformatori unimodali attraverso blocchi di trasformatori intermodali.
- Questo consente un efficace allineamento cross-modale dal basso verso l’alto e la fusione tra rappresentazioni visive e testuali di diversi livelli semantici nel trasformatore crossmodale, fornendo risultati all’avanguardia nella risposta visiva alle domande, nel recupero di immagini-testo e nella visualizzazione implicazione.
- Gli sviluppatori possono iniziare facilmente a utilizzare il modello BridgeTower con una semplice modifica di due righe di codice utilizzando la library Hugging Face Optimum Habana.
- Il documento su BridgeTower è stato discusso in una presentazione orale alla conferenza dell’AAAI (Association for the Advancement of Artificial Intelligence) sull’intelligenza artificiale 2023.
Questa è solo una delle tante entusiasmanti innovazioni relative all’intelligenza artificiale in corso presso Intel e ne avremo altre in arrivo durante il resto dell’anno.
HW Legend Staff