數據中心深陷能耗與成本困境,原因何在

據 Uptime Institute 所說,抑制能耗——從而降低運營成本——可能就如同在現代系統內置的任何一種性能和電源管理機制上撥動開關那般簡單。

我們所談論的可不是微不足道的電量。

在本週的一篇博客文章中,Uptime 分析師 Daniel Bizo 寫道:僅僅啓用操作系統級別的調控器和電源配置文件,就有可能使能耗降低 25%至 50%。

此外,啓用處理器 C 狀態可以使空閒能耗降低近 20%。簡而言之,C 狀態決定了芯片在空閒時期能夠關閉哪些部分。

據 Bizo 稱,問題在於這些功能在當今大多數服務器平臺上默認是禁用的,而且啓用它們往往會導致性能不穩定和延遲增加。

這是因爲不管您說的是 C 狀態還是 P 狀態

從像 P6 這類低性能狀態過渡到 P0 的全功率狀態是需要時間的

對於某些工作負載而言,這可能會對所觀察到的性能產生負面影響

比佐覺得,除了少數像技術計算、金融交易、高速分析和實時操作系統這類對延遲敏感的工作負載之外

啓用這些功能對性能的影響即便有也是可以忽略不計的,同時還能夠大幅降低功耗

正常運行時間這一論點植根於這樣一種信念

“如果數據庫查詢的一秒仍處於容忍範圍內,那麼按照定義,僅僅因爲服務器在負載較輕時能夠這麼快速地處理查詢,就在十分之一秒內得到響應,其價值是有限的,”比佐寫道。

依據標準性能評估公司和綠色網格所發佈的基準數據,Uptime 報告指出,現代服務器在性能被限制在類似 P2 時通常能達到最佳能效。

更爲棘手的是,過度性能通常不會受到追蹤——儘管有許多工具可用於維護服務級別協議和服務質量。

有一種看法是,計算完成得越快,功耗就越低。例如,在一分鐘內使用 500 瓦完成一項任務,總體上所需的能量要少於在兩分鐘內消耗 300 瓦。

然而,Bizo 指出,收益並非總是如此明確。“半導體的能耗曲線在芯片接近其性能上限的時候會變得更爲陡峭。”

換句話說,通常存在一個收益遞減點,在此之後,您消耗更多功率卻只能獲得微不足道的收益。在這種情況下,芯片以 500 瓦運行相比 450 瓦運行僅能節省額外的兩三秒,這可能不值得。

這有點像在州際公路上用一檔行駛。當然,您到達那裡的速度會比您換到五檔或六檔時慢。

好消息是,多年來,CPU 供應商已經開發出了各種用於管理功率和性能的技術。其中許多都源於移動應用,在那裡,能耗是一個比在數據中心重要得多的指標。

據 Uptime 所說,這些控制能夠對系統功耗產生重大影響,並且不一定得通過限制芯片的峰值性能來削弱它。

據 Uptime 所說,在這些管控方式中,最節能的是基於軟件的控制,它有可能把系統功耗降低 25%到 50%——具體得看操作系統管理器和電源計劃的複雜情況。

然而,這些軟件級別的控制也有可能導致這些控制對於突發的或者對延遲敏感的工作不太可行。

相比之下,Uptime 發現,旨在設定性能目標的純硬件實現,在狀態之間進行切換時往往會快很多——這意味着延遲影響更低。但權衡起來,節能的效果就沒那麼好了,最多約爲 10%。

軟件和硬件相結合提供了一種折中的辦法,允許軟件向底層硬件提供提示,告訴它應該怎樣去響應不斷變化的需求。Bizo 指出,利用這種性質的性能管理功能,性能節省能夠達到 15%至 20%。

雖然這些工具仍存在性能方面的問題,但實際影響可能並不像您所想象的那麼糟糕。“可以說,對於大多數用例,主要關注的應該是功耗,而不是性能,”比佐稱。 ®