解析AI算力競賽背後的“冷靜守護者”:液冷技術爲何成數據中心新寵?

近日,英偉達CEO黃仁勳在2024 SIEPR經濟峰會上透露,下一代DGXGPU服務器將採用液冷散熱,並表示即將推出下一代DGX服務器。

目前,數據中心主流仍爲風冷。而隨着生成式AI的火熱,液冷逐漸受到追捧。

近期,A股市場液冷概念股漲勢明顯。比如液冷全鏈條解決方案提供商英維克(002837.SZ,股價32.89元,市值186.97億元),2月6日至3月13日,區間漲幅達83.03%;同期,服務器冷板廠商飛榮達(300602.SZ,股價16.82元,市值97.23億元)漲幅也達76.68%。

下一代AI服務器必須上液冷?

目前,CPU服務器主流使用風冷。而進入AIGC時代,AI服務器功耗劇增。

對於液冷逐漸火熱的原因,3月13日,一名資深業內人士告訴《每日經濟新聞》記者:“從我們自身的經驗看,催生液冷落地的核心需求,就是AI以及GPU。因爲液冷可以給(AI服務器)帶來明顯的投資收益,原來使用液冷更多是環保要求,並非投資收益。”

該人士進一步解釋稱:“一顆CPU大概多少瓦呢?高檔一點的接近300瓦。一臺服務器,配兩顆CPU是比較常見的。正常的CPU服務器就兩顆CPU,當然也有四路和單路服務器,常見的應用場景以兩顆CPU爲主。而GPU服務器(AI服務器)一般都是8顆GPU起。總體來看,CPU服務器超過1KW(千瓦)已經很高,而一臺GPU服務器會達到6KW,英偉達最新一代服務器達到11KW(千瓦)。”

若以英偉達最新一代服務器功耗計算,一臺GPU服務器的功耗約爲CPU服務器的十倍。

開源證券研報認爲,Intel多款CPU TDP(熱設計功耗)已達350W,英偉達的H100 SXM TDP甚至達到700W,B100(英偉達即將推出的GPU)TDP或將達到1000W左右,逼近風冷單點散熱極限。

此外,單機櫃功率不斷增長,逼近風冷散熱極限。英偉達DGX A100服務器單機最大功率約在6.5KW左右,在機櫃上架率不變的情況下,服務器功率上升導致單機櫃功率亦不斷增長,逼近風冷12KW—15KW散熱極限,繼續採用風冷散熱,將導致行間空調需求數量陡增,高密度散熱場景下液冷方案成本和性能優勢顯著。

上述資深人士也表示:“目前GPU最大的是700W,下一代據說將達到1KW至1.4KW。這時候再用風冷散熱,一是效果(不好),二是噪聲(大),就會有各種問題需要解決。簡而言之,算力密度的提升下,風冷已經滿足不了,必須配液冷。”

值得一提的是,除了數據中心,終端PC或將在AIGC時代下,進入AI PC時代。那麼,AI PC是否也將催生液冷需求?

對此,該人士認爲:“現在很多電腦是跑不動本地端大模型、跑不動本地端推理的。能否跑得動,重點看電腦是否有GPU顯卡。比如消費級英偉達4090、3090,或者說至少有這種(高端)獨立顯卡。”

關於終端PC散熱,其表示:“端側其實(應用液冷)更加積極,很多遊戲玩家都用液冷散熱。因爲對遊戲玩家而言,他的改造量很小。而數據中心涉及基礎設施的改造。”

若未來AI PC逐漸普及,該人士判斷:“我覺得液冷的使用率將越來越高。”

液冷技術路線的選擇

據悉,液冷有浸沒式、冷板式等多種技術路線。隨着液冷的火熱,哪些技術路線將會受益呢?

根據賽迪數據,中國液冷數據中心市場規模保守估計將由2019年的260.9億元增至2025年的1283.2億元,其中冷板式數據中心市場規模2025年保守估計可超過750億元,年複合增長率爲22%;浸沒式液冷數據中心市場規模2025年保守估計可超過500億元,年複合增長率達到46%。

開源證券研報認爲,冷板式液冷相對成熟,浸沒式液冷長期發展空間大。冷板式方面,單相冷板式液冷作爲非接觸式液冷的一種,行業內具有10年以上的研究積累,在主流液冷方案中技術成熟度最高,對現有服務器芯片組件及附屬部件改動量較小,過渡平緩,是解決大功耗設備部署、提升能效、降低製冷運行費用、降低TCO(總擁有成本)的有效應用方案。

而浸沒式液冷可完全去除散熱風扇(噪音更低),換熱能力強,節能效果好,數據中心PUE(電能利用效率)值可降至1.1及以下,但一般需要改爲箱式部署,部署密度一般低於冷板式液冷,機房配套和服務器改造難度和成本也較大。

上述資深人士認爲:“個人理解,還是以冷板式爲主。冷板式落地會更快速一點,而浸沒式對現有的設施改造比較多。此外,冷板式也更容易形成專業化分工,浸沒式目前主要還是整體解決方案。”

液冷國內廠商方面,英維克是國內領先的精密溫控節能解決方案和產品提供商,產品廣泛應用於數據中心、算力設備、電化學儲能系統、通信網絡、電力電網、電動汽車充電樁、工業自動化等領域的設備散熱。

據英維克2023年半年報,其機房溫控節能產品、機櫃溫控節能產品營收分別爲4.60億元和6.61億元,佔營收比重分別爲37.15%和53.38%。

而飛榮達主要產品爲電磁屏蔽材料及器件、導熱材料及器件和其他電子器件,是中國領先的、創新型專業電磁屏蔽及導熱解決方案服務商。其熱管理材料及器件包括導熱界面器件、石墨片、導熱石墨膜、散熱模組、風扇、VC均溫板、熱管、壓鑄件及液冷板等。

2023年上半年,飛榮達熱管理材料及器件營收7.04億元,佔營業收入比約爲39.59%。

隨着AI技術的飛速發展和AIGC時代的來臨,液冷技術在數據中心的應用變得日益重要。液冷技術不僅能夠顯著提升數據中心的能效和散熱性能,還能夠降低噪音和運營成本,這對於追求高效率和可持續運營的數據中心來說至關重要。