Beschleuniger für programmierbare Logikschaltungen (FPGA) besetzen eine Nische zwischen spezialisierten ASICs und universelleren Chips wie GPUs. Dieser Bereich entwickelt sich aktiv weiter. Auf der SC21-Konferenz stellte Xilinx, ein führender Entwickler von FPGA-Chips, seinen leistungsstärksten Beschleuniger, den 4.395 US-Dollar teuren Alveo U55C, vor.
Wenn spezialisiertes Silizium wirtschaftlich, aber extrem unflexibel ist und Lösungen wie NVIDIA A100 aufgrund ihrer Vielseitigkeit nicht in allem effizient sind, bieten FPGAs ein hohes Maß an Flexibilität und sind gleichzeitig wirtschaftlich und energieeffizient genug, um Entwickler zu ermöglichen von Rechenzentren und Supercomputern sowie Cloud-Anbietern bei einer Reihe von Aufgaben. Die Xilinx Alveo-Serie von Beschleunigern in diesen Segmenten erfreut sich großer Beliebtheit, obwohl der „Payback“ für alle FPGA-Vorteile bis vor kurzem ein extrem hoher Entwicklungsaufwand war.
Auf der aktuellen SC21-Konferenz stellte das Unternehmen den stärksten Beschleuniger der Alveo-Serie, den Alveo U55C, vor. Es ist ein kürzeres Single-Slot-Board voller Bauhöhe mit einem TDP-Limit von 150 W, das dem Entwickler über 1,3 Mio. LUTs, über 2,6 Mio. Register und 9024 DSPs sowie 16 GB HBM2-Speicher mit 460 GB / s zur Verfügung stellen kann Bandbreite. Zur Anbindung an das Hostsystem wird eine PCIe x16-Schnittstelle verwendet, die entweder im 3.0- oder 4.0-Modus betrieben werden kann, jedoch als zwei x8-Schnittstellen. Der Netzwerkteil wird durch zwei QSFP28-Ports (100 Gbit/s) repräsentiert.
Die Entwicklung für den neuen Beschleuniger basiert auf der universellen Softwareplattform Xilinx Vitis, die keine tiefen Kenntnisse in Low-Level-Hardwarebeschreibungssprachen erfordert. Die Neuheit richtet sich vor allem an den Rechenzentrums- und HPC-Markt, so dass beispielsweise RoCE und MPI unterstützt werden. Xilinx stellt fest, dass der neue Alveo U55C-Beschleuniger bei Computing-Workloads das beste Preis-Leistungs-Verhältnis bietet. Hinzu kommt, wie bereits erwähnt, ein relativ geringer Stromverbrauch - 115 W unter typischen Bedingungen.
Das Alveo U55C wird bereits von CSIRO-Radioastronomen am Square Kilometre Array eingesetzt, das von 420 dieser Beschleuniger angetrieben wird, die 15 Tbit/s Datenverkehr bewältigen können. Auch Autohersteller sind an der Neuheit interessiert - sie eignet sich hervorragend für die Kollisionssimulation in Ansys LS-DYNA. Und TigerGraph, ein Entwickler von Analytics-Plattformen, verwendet Alveo U55C, um die Ausführung von Anfragen zu beschleunigen – die Antwortzeit hat sich von Minuten (auf der CPU) auf Millisekunden (auf dem FPGA) verringert.
2021-11-16 16:38:46
Autor: Vitalii Babkin