GPU租賃,生意火爆
GPU租賃是一種經濟高效的方式,可以訪問高性能芯片。
隨着 OpenAI 和 Meta 等科技巨頭大量採購圖形處理器(GPU)來驅動人工智能模型,GPU 的獲取難度日益增大。在芯片持續短缺的形勢下,一批初創公司開始通過出租芯片來增加人們獲得這些備受青睞的人工智能芯片的機會。
GPU 租賃市場是 GPU 即服務這一現有小衆行業的一部分,芯片所有者藉助在線市場,通過雲在固定時間段向客戶出售計算能力。通常,公司會選擇亞馬遜網絡服務、微軟 Azure 和 Google Cloud 等主要雲服務提供商,它們佔據了全球雲計算市場 63% 的份額,在其內部部署的數據中心運行人工智能工作負載。
然而,GPU 即服務提供了一種更爲分散的方式。該領域的提供商與全球的數據中心和 GPU 所有者合作,在客戶有需求時將芯片集羣出租給他們。新澤西理工學院數據科學研究所主任大衛・貝德(David Bader)表示,租用計算機能力能讓預算有限的組織,如初創企業和學術機構,爲特定項目獲得高性能的 GPU。
"GPU as a service 極大地平衡了人工智能和高性能計算領域的競爭環境," 貝德說,"企業如今可以按需獲取 GPU 計算能力,無需在快速貶值和易過時的硬件上進行大量前期投資。"
儘管 GPU 的供應鏈限制開始有所緩解,但租賃市場仍在增長。Grand View Research 的數據顯示,隨着對高級數據分析(如運行機器學習算法)需求的增加,預計到 2030 年,2023 年價值 37.9 億美元的 GPU 即服務市場將以每年 21.5% 的速度增長,達到 122.6 億美元。
生成式 AI 激發了人們對 GPU 租賃的興趣
自 2022 年 11 月 ChatGPT 問世以來,一些 GPU 租賃領域的初創公司發現需求急劇上升,因爲企業需要計算能力來構建人工智能。
Vast.ai 創始人兼首席執行官傑克・卡內爾(Jake Cannell)表示,在生成式人工智能受到熱捧之前,他的公司主要客戶是加密貨幣礦工。如今,在 Vast.ai 的 GPU 租賃服務中,超過一半的項目與人工智能相關。卡內爾稱,客戶包括人工智能企業家、初創公司和學者,他們使用 OpenAI 的 GPT 等基礎模型構建自定義大型語言模型,並將大型語言模型(LLM)應用於人工智能圖像生成器 Stable Diffusion 等人工智能相關工作負載。據卡內爾介紹,ChatGPT 的發佈,加上主要雲提供商的高需求和 GPU 短缺,促使更多客戶尋找替代方案,這在一定程度上加速了 Vast.ai 的 GPU 租賃需求。這位執行官說:"現在產量已經跟上,情況可能有所緩解,但需求似乎依舊很高且在不斷增長。"
Vast.ai 成立於 2017 年,它將英偉達和 AMD 的 GPU 集羣所有者與尋求租用計算能力的組織聯繫起來。據卡內爾稱,截至 10 月底,市場提供 109 個 GPU 集羣,包括英偉達備受歡迎的 H100 芯片,這些集羣位於數據中心,部分分佈在美國、歐洲、亞洲和澳大利亞的數據庫中。
Vast.ai 通過提供不同容量、速度和系統要求的 GPU 集羣,旨在讓租戶能夠自由選擇特定項目所需的 GPU,並根據需求靈活地擴展或縮小規模。例如,開發人工智能聊天機器人的客戶最初可能租用 100 個 GPU 來訓練模型,後續可以通過租用數千個 GPU 來提升計算能力。該公司稱,在產品開發的不同階段能靈活獲取不同數量的計算能力,這使得 GPU 租賃比購買芯片更具吸引力。
"只有當對 GPU 存在更可預測且長期穩定的需求時,購買纔是有意義的," 卡內爾說。
雖然像 Vast.ai 這類在 ChatGPT 發佈前就已成立的初創公司發現市場對其服務的興趣有所增加,但在聊天機器人發佈後,也有新的初創公司涌現,以利用日益增長的 GPU 租賃市場。
Foundry 是一家專爲人工智能工作負載打造的 GPU 市場,據其首席執行官賈裡德・昆西・戴維斯(Jared Quincy Davis)稱,自 8 月份推出雲平臺以來,已經吸引了 "數十家" 客戶,並且能夠通過利用現有芯片的閒置算力大幅降低計算成本。
這家初創公司今年 3 月從紅杉資本和光速創投等投資者那裡籌集了 8000 萬美元,通過公司自有的計算集羣以及從數據中心合作伙伴處獲得的 "未充分利用的集羣" 來出租 GPU。
Foundry 的客戶包括技術、電信、媒體和保健行業的公司,基金會和學術實驗室也在使用其服務。常見的應用場景包括對模型(如 Meta 的 Llama)進行微調以呈現所需特性、從零開始構建神經網絡以及執行情緒分析(一種用於分析文本情緒傾向的深度學習技術)。Foundry 甚至允許客戶租用 GPU 來預測蛋白質序列用於藥物研發、訓練模型翻譯稀有語言,以及構建無需人工干預就能控制網站的人工智能代理。
"許多以前只有 OpenAI 和 DeepMind 這類實驗室才能進行的前沿開發,現在其他人也能做到了,因爲 Foundry 讓 GPU 計算更易獲取且成本更低," 戴維斯表示,他曾在 Google DeepMind 擔任工程師。
一些組織已經從 GPU 租用中獲益。新澤西理工學院的教授貝德說,他看到自己所在的大學通過 GPU 租賃爲研發等 "關鍵活動" 釋放資源。他認爲,GPU 租賃模式非常適合有 "臨時性" 或 "季節性計算需求" 的項目,並且 "省去了成本高昂的硬件管理和維護負擔"。貝德還表示,他看到小企業通過與大學合作,獲得了與大企業相同的 GPU 能力。
"我親眼見證了無數初創公司從中受益," 貝德說,"他們不再需要投入數百萬美元的前期資金來購買專用硬件。相反,他們可以使用租來的 GPU 製作原型、測試和迭代算法,確保資金用於開發而非基礎設施。"
長期租用 GPU 可能並不省錢
不過,貝德指出,租用 GPU 與購買 GPU 相比存在一些利弊。
共享基礎設施的性能可能不穩定,一旦出現服務中斷,可能會減慢人工智能模型訓練等任務的執行速度。儘管前期成本能得到節省,但租用 GPU 的費用可能會很高。貝德表示,在雲和公司之間傳輸數據的成本可能會 "快速攀升",對於需要實時處理的工作負載,不斷遭遇延遲問題的客戶最終可能花費比購買 GPU 更多的費用。對於有嚴格安全和合規要求的公司來說,缺乏對基礎設施的控制也可能是個 "問題"。
GPU 租賃市場的未來或許還取決於芯片行業的發展。畢竟,據貝德稱,像亞馬遜網絡服務這樣的主要雲提供商預計會繼續拓展業務範圍,可能會吞併一些小公司,這在短期內可能會使價格降低,但從長遠來看會限制消費者的選擇。此外,供應鏈延遲可能會讓雲巨頭更難獲得 GPU。
儘管存在這些擔憂,初創公司仍然堅信,隨着人工智能的持續發展,未來幾年市場對它們的服務仍有需求。Vast.ai 將繼續優化其 GPU 匹配服務,並更多地直接參與大型語言模型推理等應用場景,特別是針對人工智能代理。Foundry 計劃發佈更多功能,提升平臺的可用性,使其對構建先進模型的人工智能開發人員更有幫助。
Vast.ai 首席執行官卡內爾說:"英偉達目前仍是行業領導者,我認爲這種情況不會在短期內改變,但競爭愈發激烈了。"