華泰證券:大模型頭部格局基本確定 AI Agent將加速AGI進程

智通財經APP獲悉,華泰證券發佈研報稱,海外閉源大模型已經形成OpenAI爲首,Google、Anthropic等緊隨的格局。在頭部閉源模型之下,Meta引領開源模型生態,開源閉源模型差距逐步縮小。爲了適配端側需求,小參數模型也在快速發展。國內看,模型百花齊放,但技術辨識度不高,23年頭部互聯網廠商和科技企業進展較快,24年以來初創公司開始發力長文本、MoE等領域。展望後續,ScalingLaw+Transformer仍將長期有效,合成數據或逐漸成爲關鍵數據來源。此外,AI Agent能夠極大提高現有模型的表現,是實現AGI的重要推力。

華泰證券主要觀點如下:

多模態+長文本+MoE 已成共識,大模型與小模型路線並駕齊驅頭部

GPT、Gemini、Claude模型先後支持了多模態推理;Claude較早實現了200K長文本,Gemini將長文本推到2M tokens;GPT-4、Mistral 展現了MoE 架構的優勢,Gemini也在短期內更改爲MoE 架構。共識已經形成,國內大模型廠商均在跟進,Kimi 引領長文本趨勢,MiniMax、階躍星辰較早實踐MoE模型。Mistral、微軟、Meta、Google的小模型性能不斷突破,爲端側AI 打下良好基礎,成爲與大模型並駕齊驅的另一條重要發展路線。

Scaling Law未達邊界,算力換智能仍然成立

OpenAI 在Scaling Law 論文中,從理論上預測了邊界遞減的存在。但實際上,OpenAI、Google和Anthropic仍在踐行大參數等於高智能的路線。清華唐傑教授在24年2月北京人工智能產業創新發展大會上指出,ScalingLaw盡頭遠未到來,算力換智能繼續成立。在參數持續變大的情況下,訓練數據的需求量進一步提升,據Epoch 預測,2030 年到2050 年,將耗盡低質量語言數據的庫存,未來訓練數據的缺乏將可能減緩機器學習模型的規模擴展。因此,合成數據或成爲關鍵。

AI Agent是AGI的關鍵範式,具身智能是大模型重要落地場景

華泰證券認爲,AI Agent能夠自主、全流程、多步驟的執行任務,大幅延展了大模型的能力範圍,被認爲是實現AGI的關鍵範式。斯坦福大學吳恩達教授在24年3月的紅杉美國AI 峰會上指出,如果用戶圍繞GPT-3.5 使用一個Agent 工作流程,其實際表現甚至好於GPT-4。並且AI Agent的能力能夠充分受益於大模型的演進。此外,大模型與機器人具身智能的結合(如OpenAI 與Figure),也有望隨着模型能力的迭代快速發展。24年AI Agent和具身智能將成爲新一代大模型的重要落地場景。

GPT-5 有望推動全球算力和應用的下一階段發展

華泰證券預期,GPT-5:1)MoE 架構將延續,專家參數和數量或變大;2)GPT-5及之後模型的訓練數據集質量更高、規模更大;3)在思維鏈CoT 的基礎上,再加一層AI監督;4)支持更多外部工具調用的端到端模型;5)多種大小不同的參數,不排除推出端側小模型;6)從普通操作系統到LLM 操作系統;7)端側AI Agent將更加實用和智能。

華泰證券認爲,GPT-5 的發佈有望推動全球算力和應用的下一階段發展,建議關注:海外標的,AI應用:微軟、Adobe等。國內標的,1)AI 服務器:浪潮信息(000977.SZ)等;2)AI 應用:金山辦公(000977.SZ)、福昕軟件(688095.SH)、泛微網絡(603039.SH)等;3)端側:中科創達(300496.SZ)、網宿科技(300017.SZ)。

風險提示:宏觀經濟波動,技術進步不及預期,中美競爭加劇。本研報中涉及到未上市公司或未覆蓋個股內容,均系對其客觀公開信息的整理,並不代表本研究團隊對該公司、該股票的推薦或覆蓋。