슬로바키아어 회사 Tachyum은 몇 년 동안 작업해 온 Prodigy 서버 프로세서를 공식적으로 발표했습니다. 제작자에 따르면 이들은 CPU, GPU 및 TPU를 동시에 대체할 수 있는 세계 최초의 진정한 범용 칩입니다. 또한 Tachyum은 프로세서가 다른 프로세서보다 빠를 뿐만 아니라 더 저렴하고 에너지 효율적이라고 주장합니다.
Prodigy의 다재다능함은 무엇보다도 x86-64, Arm 및 RISC-V 아키텍처용으로 컴파일된 바이너리 파일과 이 64비트 ISA 고유의 애플리케이션을 실행할 수 있는 능력에 있습니다. Tachyum은 자사 칩이 AI 및 HPC 작업에 적합할 것이며 하이퍼스케일러에게도 매력적일 것이라고 말했습니다. 올해부터 시험용 샘플을 출하하기 시작해 2023년 상반기 양산을 목표로 하고 있다. 또한 IoT/Edge 추론 시스템을 위한 IP TPU를 제공합니다.
8개의 장치를 포함하는 새로운 5nm CPU 제품군에서 가장 오래된 이 모델에는 5.7GHz의 주파수에서 작동하는 128개의 통합 코어가 있습니다. 예비 데이터에 따르면 각 코어에는 데이터 및 명령을 위한 64KB L1 캐시와 128MB L2 + L3이 있습니다. 신제품의 아키텍처와 마이크로아키텍처에 대한 세부 사항은 아직 설명되지 않았지만 비순차적 실행과 클럭당 최대 4개의 명령어를 실행할 수 있는 능력, 가상화 및 고급 RAS 기능에 대한 지원이 언급된다. 각 코어에는 2개의 1024비트 벡터 블록과 1개의 4096비트 매트릭스 블록이 있습니다.
프로세서에는 총 용량이 최대 8TB인 DDR5-7200 모듈을 지원하는 16개의 메모리 컨트롤러가 장착되어 있습니다. 동시에 2 및 4 프로세서 시스템을 만드는 것이 가능합니다. 외부 세계와의 통신은 총 64개의 PCIe 5.0 레인을 제공하는 32개의 PCIe 컨트롤러에 의해 제공됩니다. 이 모델의 TDP는 표시되어 있지 않지만 회사는 공랭식 및 수냉식 사용 가능성에 대해 이야기합니다.
기본 사양은 인상적이지만 더욱 놀라운 것은 곧 출시될 플래그십의 성능 주장입니다. SPECrate 2017 Integer에서는 현재 세대 Intel 및 AMD 프로세서인 Xeon Platinum 8380보다 약 4배, EPYC 7763보다 3배 빠릅니다. 또한 회사는 신제품의 FP64 성능이 곧 출시될 NVIDIA H100 가속기의 3배, 즉 약 180Tflops가 될 것이라고 약속합니다.
그리고 FP8 계산에서 성능은 한 번에 H100보다 6배 높은 24Pflops입니다! 동시에 Tachyum에 따르면 새로운 품목은 이러한 모든 칩보다 에너지 효율이 더 높습니다. Prodigy의 경우 FP64, FP32, TF32, BF16, INT8, FP8 및 일부 TAI 형식을 지원하고 소위 작업합니다. AI 워크로드에 중요한 희소(희소) 계산. 사실, 회사가 칩의 자세한 특성을 제공하지 않고 얼마나 좋은지에 대한 이야기로 제한했기 때문에 지금까지 발표는 "종이"라고 부를 수 있습니다.
그러나 Tachyum은 정기적으로 개발 진행 상황을 보고합니다. 현재 이 회사는 개발자에게 FPGA 기반 하드웨어 에뮬레이터를 제공합니다. 단 8개의 Prodigy 코어이지만 최대 64개의 코어까지 확장할 수 있습니다. 회사 자체에서 소프트웨어 디버깅을 위해 이 에뮬레이터를 사용합니다. 이미 Linux 커널 및 기본 환경, UEFI, KVM/QEMU, GCC를 채택했으며 FreeBSD를 아키텍처에 성공적으로 이식했습니다.
2022-05-11 18:59:32
작가: Vitalii Babkin