La startup francese LightOn ha integrato con successo una delle sue unità di elaborazione ottica (OPU) nel supercomputer accademico più performante del paese, Jean Zay. Questo lavoro è stato svolto nell'ambito di un programma pilota dell'Agenzia nazionale per l'informatica ad alte prestazioni (GENCI) in collaborazione con l'Istituto per lo sviluppo e le risorse dell'informatica scientifica intensiva (IDRIS).
Lavorando in tandem con CPU server standard e acceleratori NVIDIA A100, il coprocessore ottico dovrebbe aumentare notevolmente la velocità di esecuzione e ridurre il consumo energetico delle attività di machine learning (ML) e AI ad alta intensità di risorse. Alcuni utenti Jean Zay potranno testare OPU nei prossimi mesi.
Secondo gli sviluppatori, i vantaggi dell'OPU sono dovuti all'uso della fotonica per accelerare l'esecuzione di algoritmi probabilistici su compiti su scala ultra-larga. Questo approccio è essenziale quando i calcoli accurati sono estremamente complessi e costosi. Ad esempio, l'addestramento del modello GPT-3 richiede circa 3 milioni di ore GPU sugli acceleratori NVIDIA V100. I metodi probabilistici (RandNLA) consentono di ottenere risultati approssimativi, ma sufficienti per l'applicazione pratica in minor tempo mediante varie trasformazioni di matrice.
Tuttavia, lavorare con array di grandi dimensioni, che sono esattamente ciò di cui hanno bisogno i moderni modelli di intelligenza artificiale, richiede risorse di elaborazione significative nel caso di CPU o GPU "classiche", nonché enormi array di memoria. I dispositivi LightOn aggirano questo collo di bottiglia utilizzando modulatori di luce spaziali e CCD. Possono già lavorare con array di un trilione di elementi.
A frequenze di aggiornamento della matrice dell'ordine dei kilohertz, le prestazioni equivalenti raggiungono il livello di 1,5 quadrilioni di operazioni al secondo (1,5 Petaops), mentre il consumo energetico è di soli 30 watt. L'OPU esegue le necessarie trasformazioni in modalità passiva dovute alle caratteristiche fisiche del dispositivo stesso, scaricando così le principali risorse del supercomputer (la pre e post-elaborazione dei dati è ancora eseguita dalla CPU/GPU) e aumentando l'energia complessiva efficienza del sistema.
La società affitterà la prima OPU Aurora2 disponibile in commercio in uno chassis 2U da questa primavera. Jean Zay sarà la prima macchina TOP500 ad avere questi coprocessori installati. L'azienda prevede un aumento delle prestazioni AI del sistema di 8-40 volte rispetto ai calcoli solo sulla GPU. Secondo il CEO di LightOn Igor Carron, questa integrazione di acceleratori di intelligenza artificiale nei sistemi HPC rafforzerà la fiducia dei ricercatori che le soluzioni ibride saranno la prossima pietra miliare nell'evoluzione digitale dopo i supercomputer su scala exa.
2021-12-24 22:14:05
Autore: Vitalii Babkin