Enflame, che quest'estate ha presentato acceleratori basati sulla seconda generazione dei suoi chip AI DTU, ha rilasciato un nuovo acceleratore di inferenza Cloudblazer Yunsui i20 con un chip Suixi 2.5. È prodotto utilizzando il processo FinFET a 12 nm di GlobalFoundries e ha un'architettura aggiornata ad alte prestazioni dei core di calcolo GCU-CARE 2.0, grazie alla quale, secondo i creatori, è stato possibile ottenere un'efficienza paragonabile alla GPU a 7 nm mainstream.
Tra le caratteristiche chiave del nuovo prodotto, l'azienda nota l'aumento della potenza di calcolo, la capacità di eseguire calcoli tensoriali, vettoriali e scalari, API per C++ e Python, nonché il supporto per i principali framework e formati di modelli (TensorFlow, PyTorch , ONNX). Il software in bundle offre opzioni di migrazione flessibili con supporto per tecnologie di virtualizzazione, nonché ambienti multiutente e multitasking con isolamento sicuro dei processi.
Lo Yunsui i20 è dotato di memoria HBM2e da 16 GB con una larghezza di banda fino a 819 GB / s. Il nuovo prodotto supporta tutti i formati chiave e fornisce una piattaforma di inferenza universale, anche per i cloud. Le prestazioni di picco di calcolo FP32 raggiungono 32 Teraflop, TF32 (non è specificato se si tratta di compatibilità con NVIDIA) - 128 Teraflop, FP16 / BF16 - 128 Teraflop e INT8 raggiunge 256 Top. Rispetto alla prima generazione di prodotti, Yunsui i20 ha aumentato le prestazioni FP di 1,8 volte e il calcolo INT di 3,6 volte.
le prestazioni nei calcoli FP32, TF32, FP16 / BF16 e INT8 sono 19,5, 156, 312 e 624 Teraflops (Top per INT) e il volume di memoria e la larghezza di banda sono rispettivamente di 40/80 GB e 1555/1935 GB/s. AMD MI100 ha 32 GB di memoria HBM2 (1,23 TB/s) e le prestazioni di FP32, FP16 e BF16 sono rispettivamente di 46,1, 184,6 e 92,3 teraflop. Tutti e tre gli acceleratori hanno un'interfaccia PCIe 4.0.
L'ottimizzazione dello stack software proprietario TopsRider ha dato un contributo significativo al miglioramento delle prestazioni, grazie al quale è stato ridotto il carico sul sottosistema di memoria. Di conseguenza, le prestazioni medie dell'esecuzione del modello sono aumentate di 3,5 volte e l'efficienza nell'utilizzo della potenza di calcolo - in media, 2 volte. Inoltre, il nuovo modello di programmazione e le tecnologie di automazione possono accelerare l'efficienza dello sviluppo e ridurre il costo della migrazione del modello. L'azienda è convinta che tutto ciò renderà lo Yunsui i20 una soluzione più competitiva.
Grazie alla tecnologia di virtualizzazione, Yunsui i20 può essere diviso in 6 domini indipendenti isolati l'uno dall'altro - questo era precedentemente offerto solo da NVIDIA. Insieme ad altri prodotti che sono stati completamente migrati alla prossima generazione di acceleratori di intelligenza artificiale, Enflame prevede di guadagnare quote di mercato significative in settori innovativi come le città intelligenti e il governo digitale, nonché nei settori tradizionali come la finanza, i trasporti e l'energia, dove saranno necessarie tecnologie più avanzate Soluzioni AI.
Nonostante gli ovvi successi ottenuti dal team di Enflame e da altri sviluppatori cinesi: YITU Technology SoC per il deep learning, il chip IoT Horizon Robotics Sunrise 2 con funzionalità AI integrate, Hanguang 800 di T-Head Semiconductor (filiale di Alibaba), Huawei serie Ascend e altri - i produttori esteri di chip AI, secondo People's Daily, dominano ancora il mercato cinese con una quota superiore all'80%.
2021-12-14 18:50:40
Autore: Vitalii Babkin