NVIDIA乙太網路技術加速全球最大AI超級電腦Colossus建設 助力xAI突破大型模型訓練
Colossus的建設速度令人矚目,僅用122天便完成配套設施及系統建設。從安裝首個機架到啓動模型訓練僅歷時19天,成爲業界速度標竿。作爲全球最大的AI超級電腦,Colossus在運行Grok模型時,展現卓越的網路效能。其三層網路結構中未出現任何流量碰撞、封包遺失或應用程式延遲。憑藉Spectrum-X的壅塞控制功能,Colossus實現高達95%的資料輸送效率,而標準乙太網路僅能提供60%的資料傳輸,且伴隨數千次流量碰撞。
NVIDIA網路事業部資深副總裁Gilad Shainer表示:「AI成爲現今關鍵業務需求,須具備更高效能、增強安全性和擴充能力。NVIDIA Spectrum-X乙太網路平臺爲xAI等創新公司提供前所未有的計算效能,使他們能夠更快速地處理並部署AI解決方案,縮短AI產品上市時間。」
Spectrum-X 平臺的核心爲 Spectrum SN5600 乙太網路交換器,具備高達800Gb/s的連接埠速度,並內建Spectrum-4交換器ASIC。xAI 進一步選用 NVIDIA BlueField-3 SuperNIC,以取得更高效能和可靠性。此乙太網路技術採用先進的自適應性路由、壅塞控制和NVIDIA Direct Data Placement技術,提供低延遲、短尾延遲的高擴充性頻寬,是生成式AI雲端及多租戶環境的理想方案。
xAI創辦人Elon Musk在X平臺讚揚Colossus的建設成就:「Colossus 是世界上最強大的訓練系統,感謝 xAI 團隊、NVIDIA 及衆多合作伙伴的卓越貢獻。」xAI發言人則表示:「這是全球最大、性能最佳的AI超級電腦,NVIDIA Hopper GPU與Spectrum-X技術助力我們實現更大規模的AI訓練速度與效率。」
NVIDIA Spectrum-X不僅提升Colossus的效能,亦展示乙太網路在AI運算領域中的無限潛力,爲AI大規模運算帶來革命性突破。