英特爾擬推中國版AI晶片

綜合媒體報導,英特爾於近日推出新一代AI加速晶片Gaudi 3,據The register報導,英特爾在Gaudi 3白皮書上表示,正準備面向中國市場推出特供版Gaudi 3,包括名爲HL-328的OAM兼容夾層卡(Mezzanine Card)和名爲HL-388的PCle加速卡兩種硬體形態。其中,HL-328將於6月24日推出,HL-388將於9月24日推出。

具體看規格,中國特供版與原版具有相同的96MB SRAM片上記憶體,128GB HBM2e高頻寬記憶體,頻寬爲每秒3.7TB,擁有PCIe 5.0X16接口和解碼標準。但由於美國對AI晶片的出口限制,這類高性能AI的綜合運算性能(TPP)需要低於4,800才能出口至中國,意味中國特供版的16bit性能不能超過150 TFLOPS(每秒浮點運算次數)。

作爲對比,原版Gaudi 3在FP16/BF16上可達到1,835 TFLOPS,相比輝達H100在大模型訓練快40%、推理能效高50%。

因此中國特供版需要大幅削減核心數量(原版擁有8個矩陣數學引擎和64個張量內核)和工作頻率,最終可能需要將其AI性能降低約92%才能符合美國的出口管制要求。

分析指出,英特爾推出中國特供版的AI性能,將會與輝達針對中國市場推出的AI加速卡H20相當。

英特爾中國特供版具有148 TFLOPS的FP16/BF16性能,略低於150 TFLOPS的限制。但在高頻寬記憶體(HBM)容量及頻寬上,中國特供版Gaudi 3將低於輝達H20,這也使其在與輝達H20的競爭當中或將處於劣勢,不過也需看定價是否具優勢。