Spezialisierte KI-Beschleuniger sind jetzt keine Überraschung. Versionen, die zum Trainieren von Modellen entwickelt wurden, haben mit modernen GPUs bereits an Komplexität und Stromverbrauch aufgeholt, aber die Chips, die zum Ausführen trainierter Modelle verwendet werden, sind nicht immer einfach.
Neuchips ist mit der Ankündigung des RecAccel N3000 ASIC den anderen Weg gegangen, der sich durch verbesserte Effizienz und reduzierte Wärmeentwicklung bei hoher Leistung auszeichnet. Dadurch eignet es sich für "intelligente" Edge-Computing-Plattformen, die oft gezwungen sind, innerhalb enger thermischer und Energieverbrauchsbeschränkungen zu arbeiten. In diesem Fall sprechen wir von kompakten, aber leistungsstarken Inferenzsystemen.
Das neue Produkt wird mit der 7-nm-Prozesstechnologie von TSMC hergestellt und wurde ursprünglich entwickelt, um Deep-Learning-Empfehlungsmodelle (DLRM) auszuführen. In der zweiten Jahreshälfte will das Unternehmen OCP-Module für Server auf den Markt bringen, und zwar gleich in zwei Formfaktoren: dual M.2 und in Form einer Erweiterungskarte mit PCI-Express-5.0-Schnittstelle.
Das Unternehmen hat den RecAccel N3000 vollständig in MLPerf getestet und ist vom Erfolg des neuen Produkts überzeugt. Der Beschleuniger verwendet proprietäre 8-Bit-Quantisierungs- und Kalibrierungsalgorithmen, die eine Genauigkeit von 99,95 % von FP32 garantieren, das integrierte Caching-System reduziert den Datenverkehr zum externen LPDDR5-Speicher um 50 % und die Effizienz der Nutzung der Speicherbandbreite im Gegenteil , wird um 30 % steigen.
Die von Neuchips entworfene Architektur erreicht eine Energieeffizienz im Bereich von 1 µJ pro Ergebnis, sodass Entwickler behaupten können, dass die neue ASIC-Plattform eine bessere Leistung erbringt als die zuvor geplanten 20 Mio. Inferenzen pro Sekunde bei 20 W. Im Moment ist es ziemlich schwierig, diesen Indikator im Vergleich zu bestehenden Lösungen zu bewerten, da wir über verschiedene Modelle und Szenarien für ihre Anwendung sprechen können.
Beachten Sie, dass es solche Beschleuniger bereits im Jahr 2020 gab. Alles, was jetzt bekannt ist, ist, dass der RecAccel N3000 Hardware-RoT erhalten und alle gängigen KI-Empfehlungsmodelle unterstützen wird, einschließlich DLRM, WND, DCN und NCF. Es gibt jedoch Grund zu der Annahme, dass dies alles keine leeren Versprechungen sind, da das Unternehmen vom ehemaligen Chef der Global Unichip Corporation, einer Tochtergesellschaft von TSMC, gegründet wurde, die kundenspezifische ASICs und IP-Blöcke entwickelt.
2022-06-09 14:51:53
Autor: Vitalii Babkin