重塑全球市場:AI革命推動專用芯片需求一路高漲
自從過去兩年成爲主流以來,AI迅速改變了芯片行業,推動了對專用處理器的需求,加速了設計創新,重塑了全球供應鏈和市場。
從OpenAI在2022年底發佈ChatGPT開始,生成式AI掀起的革命持續突破着AI推理、大型語言模型(LLM)和半導體技術的極限。很快,傳統CPU就無法滿足AI的並行處理需求,於是讓位給專用芯片:GPU、TPU、NPU和AI加速器。
這促使Nvidia、AMD和英特爾等公司擴大自身的產品組合(包括針對AI優化的產品),其中Nvidia在用於AI訓練和推理的GPU方面處於領先地位。而且,由於AI工作負載優先考慮吞吐量、能源效率和可擴展性,大型科技行業在數據中心方面投入了大量資金,Nvidia H100和AMD MI300等專注於AI的芯片,現在已經成爲了AI雲計算的支柱。
與此同時,亞馬遜、微軟和谷歌等公司開發了定製芯片如AWS Graviton和Google TPU,以減少對外部供應商的依賴並提高AI的性能。
特別是,這場AI革命也推動了Nvidia的增長,使其成爲數據中心市場的主導力量。Nvidia曾經專注於生產遊戲系統芯片,而現在Nvidia驅動的硬件和軟件的發展速度超過了遊戲芯片,從而帶來了顯著的財務收益。2023年5月,Nvidia的市值突破1萬億美元,並在2024年6月超過3.3萬億美元,成爲當時全球最有價值的公司。
然而,AI芯片行業即將發生巨大的變化。在過去幾年中,半導體開發商和製造商一直專注於滿足超大規模雲服務提供商(如AWS、Google Cloud Platform和微軟Azure)的數據中心需求;企業組織在內部AI開發方面嚴重依賴這些行業巨頭。
現在,人們開始轉向僅使用內部公司數據的小型AI模型,從而實現更安全、更可定製的生成式AI應用和AI代理。與此同時,邊緣AI正在佔據主導地位,因爲它允許在設備(包括PC、智能手機、車輛和物聯網設備)上進行AI處理,從而減少對雲基礎設施的依賴,刺激對高效、低功耗芯片的需求。
市場研究公司IDC副總裁Mario Morales表示:“挑戰在於,如果你要將AI帶給大衆,你就必須改變構建解決方案的方式;我認爲這就是Nvidia面臨的挑戰,因爲你不能使用大型的、複雜的GPU來解決端點問題。因此,那些新公司將有機會進入這個市場,包括高通、意法半導體、瑞薩電子、安霸等公司都擁有大量技術,但現在的問題是如何使用這些技術。”
“這就是AI的下一個前沿——邊緣,”Morales說。
一些芯片製造商面對的市場動盪
儘管2023年全球半導體芯片銷售額下降了約11%,從上一年創紀錄的5741億美元降至約5340億美元,但這種低迷並沒有持續下去。Morales表示,受AI應用、個人電腦和智能手機銷售穩定推動,預計到2025年銷售額將增長22%。
Morales表示:“如果你正在製造內存或者AI加速器,比如Nvidia、Broadcom、AMD甚至Marvel,那麼你的表現非常好。但如果你是一家半導體公司,比如ST Micro、Infinium、Renesas或者Texas Instruments,那麼你就會受到庫存過剩和工業和汽車行業宏觀經濟不確定性的嚴重打擊。去年這兩個市場表現優異,但今年受到的打擊非常嚴重。”
Morales表示,目前大多數大型語言模型都依賴於公共數據,但全球80%以上的數據由不會與OpenAI或Anthropic等平臺共享數據的企業持有。這一趨勢有利於處理器公司,尤其是Nvidia、高通和AMD。隨着組織將這項技術引入內部,價格更低、能效更高、高度專業化的片上系統(SoC)技術將開始佔據市場的主導地位。
“我認爲這肯定會改變市場的動態,這就是爲什麼你會看到有很多公司聯合起來,用他們的技術解決邊緣和終端問題。我認爲,這就是未來你將和企業一起看到的下一波增長;企業正在採用自己的數據中心方法。”
英特爾將繼續在個人電腦領域爲自己的處理器尋找避風港,而把製造外包給臺積電的決定,使保持了相對於競爭對手AMD的競爭力。但英特爾很可能難以跟上新興市場其他芯片製造商的步伐。
“除此之外,如果你看看他們的數據中心業務,會發現他們的市場份額仍在輸給AMD,而且他們對Nvidia束手無策,”Morales說。
雖然英特爾最新的x86和Gaudi AI加速器系列旨在與Nvidia H100和Blackwell GPU競爭,但Morales認爲,它們更像是一種“權宜之計”——而不是市場所尋求的。
“我確實相信,在客戶端,隨着AI逐漸進入個人電腦領域,英特爾有機會把更新週期利用起來,他們剛剛獲得來自微軟Copilot的背書,這爲他們的x86產品線提供了一個機會;英特爾可以繼續戰鬥,直到他們從轉型和企業發生的所有變化中恢復過來。”
標普全球評級技術總監Andrew Chang表示,爲了在現代數據中心保持相關性——Nvidia的芯片正在推動增長——英特爾和AMD將需要投資GPU。
Change說:“雖然CPU仍然必不可少,但Nvidia主導着AI芯片市場,讓AMD和英特爾難以競爭。AMD的目標是到2025年實現50億美元的AI芯片銷售額,而英特爾以Gaudi平臺爲中心的AI策略微乎其微。兩家公司將繼續投資GPU和AI加速器,實現一些增量的收入增長,但在數據中心市場的份額可能會繼續下降。”
政治因素、《芯片法案》以及1月20日之後會發生什麼
出口限制、供應鏈中斷和政府政策等地緣政治和經濟因素也可能重塑芯片行業。1月20日就職的當選總統的特朗普已表示計劃對芯片進口徵收高額關稅。
《CHIPS and Science Act》還承諾向在美國開展業務的半導體開發商和製造商提供數十億美元的資金。根據該法案,已經爲包括臺積電、英特爾、三星和美光在內的多家公司撥出390億美元的資金,所有這些公司都已經制定計劃或者正在建設新的製造或研究設施。
但爲了分配稅款,每家公司都必須達到特定的里程碑;在此之前,這些資金仍未動用。雖然數十億美元的激勵措施無疑有助於美國芯片生產迴流,但Morales指出,《芯片法案》的25%稅收減免是更大的好處。
“即使是像英特爾這樣的公司……也能獲得約500億美元的稅收減免,這是聞所未聞的。這就是回報,”他說。
儘管特朗普已經暗示政府資助鼓勵迴流是錯誤的策略,但業內專家並不認爲他重新上任後《芯片法案》會被大幅削減。“我們預計《芯片法案》將進行適度修改,但不會像削減尚未分配的資金那樣大刀闊斧,”莫拉萊斯說。“《芯片法案》得到了兩黨的支持,任何修改該法案的嘗試都會遭到亞利桑那州和俄亥俄州等受益州的反對。”
迄今爲止,爲耗能型雲數據中心供電的高端處理器佔據了市場主導地位,但用於邊緣設備的節能AI處理器可能會繼續受到青睞。
Morales說:“想想今年的AI PC或集成AI的智能手機,甚至可穿戴設備,它擁有更小、更優化的模型,都可以利用AI推理。這是我們下一步要做的事情,我認爲未來幾年它會變得非常重要。
“而且,我認爲AI推理在公司中所佔的比例將與我們目前在數據中心看到的一樣大,甚至更大,”他補充道。
從LLM到SLM和邊緣設備
企業和其他組織也在把重點從單一AI模型轉移到多模態AI,或能夠處理和集成多種類型數據或“模態”的大型語言模型,例如文本、圖像、音頻、視頻和感官輸入。來自不同資源的輸入可以更全面地理解這些數據,提高跨任務的性能。
根據標普全球的一份報告,超過80%的組織預計他們的AI工作流程將在未來兩年內增加,而約三分之二的組織預計將面臨升級IT基礎設施的壓力。
標普全球評級首席創新官Sudeep Kesh指出,AI正在向更小型、特定任務的模型發展,但更大型的通用模型仍將必不可少。“兩種類型將共存,在每個領域創造機會,”他說。
一個關鍵挑戰將是開發計算和節能模型,影響芯片的設計和實現。Kesh表示,芯片製造商還需要解決可擴展性、互操作性和系統集成問題——所有這些都有望推動整個行業的技術進步,改進自主系統,實現邊緣AI等未來發展。
特別是,隨着很多公司放棄了基於雲的大型語言模型,轉而採用可以部署在邊緣設備和端點上的更小型的語言模型,行業對AI推理的興趣將日益增加。
Morales說:“對於行業來說,這是一個盛宴或饑荒的環境,來年會發生什麼?我認爲我們在數據中心看到的增長是驚人的,而且這種增長將持續到2025年。令我興奮的是,企業開始考慮優先在AI方面投入IT資金,這將引發對處理器的第二波需求。”