Gli acceleratori di intelligenza artificiale specializzati non sono una sorpresa ora. Le versioni progettate per addestrare i modelli hanno già raggiunto la complessità e il consumo energetico con le moderne GPU, ma i chip utilizzati per eseguire i modelli addestrati non sono sempre semplici.
Neuchips è andata dall'altra parte con l'annuncio del RecAccel N3000 ASIC, che offre una migliore efficienza e una ridotta generazione di calore ad un alto livello di prestazioni. Ciò lo renderà adatto a piattaforme di edge computing "intelligenti" che sono spesso costrette a operare entro stretti vincoli termici e di alimentazione. In questo caso, stiamo parlando di sistemi di inferenza compatti ma potenti.
Il nuovo prodotto è realizzato utilizzando la tecnologia di processo a 7 nm di TSMC ed è stato originariamente progettato per eseguire modelli di raccomandazione di apprendimento profondo (DLRM). Durante la seconda metà dell'anno, l'azienda intende portare sul mercato moduli OCP per server, in due fattori di forma contemporaneamente: dual M.2 e sotto forma di scheda di espansione con interfaccia PCI Express 5.0.
L'azienda ha testato completamente RecAccel N3000 in MLPerf ed è fiduciosa nel successo del nuovo prodotto. L'acceleratore utilizza algoritmi proprietari di quantizzazione e calibrazione a 8 bit che garantiscono una precisione del 99,95% di FP32, il sistema di caching integrato ridurrà del 50% il traffico verso la memoria LPDDR5 esterna e l'efficienza dell'utilizzo della larghezza di banda della memoria, al contrario , aumenterà del 30%.
L'architettura progettata da Neuchips raggiunge un'efficienza energetica nella regione di 1µJ per risultato, consentendo agli sviluppatori di affermare che la nuova piattaforma ASIC offre prestazioni migliori rispetto alle inferenze di 20 milioni al secondo pianificate in precedenza a 20 W. Al momento, è abbastanza difficile valutare questo indicatore rispetto alle soluzioni esistenti, poiché possiamo parlare di diversi modelli e scenari per la loro applicazione.
Si noti che tali acceleratori esistevano già nel 2020. Tutto ciò che è noto ora è che RecAccel N3000 riceverà RoT hardware e supporterà tutti i modelli di raccomandazione AI più diffusi, inclusi DLRM, WND, DCN e NCF. Tuttavia, c'è motivo di credere che tutto questo non sia una vuota promessa, dal momento che l'azienda è stata creata dall'ex capo della Global Unichip Corporation, una sussidiaria di TSMC, che sviluppa ASIC personalizzati e blocchi IP.
2022-06-09 14:51:53
Autore: Vitalii Babkin