大模型入秋

到2024年的最後一個月,大模型依然是最熱鬧的賽道,沒有之一。

12月,智譜AI與階躍星辰相繼完成新一輪融資,OpenAI以直播的形式舉辦了一場長達12天的馬拉松式新品發佈會。

但對從業者肖琳(化名)來說,年底的任何融資事件和新產品發佈都已經很難讓她眼前一亮,反倒是幾個月前的一張網傳圖片成了她的"年度記憶"。

這張圖片顯示,騰訊、字節、百度、科大訊飛和月之暗面旗下大模型的新增用戶留存率,在30天后均會降至1%以下。9月,它一度在社交媒體和從業者交流羣中瘋傳。

假,是肖琳對這張圖片的第一印象,"圖片裡的數據沒有任何可靠來源"。她不屑於去認真討論它的可信度。

不過這並沒有阻止它的廣泛流傳,甚至肖琳自己也是傳播者之一。有人感嘆大模型任重道遠,有人預測未來有多少玩家能活下來,也有人批評圖片中的大模型不好用。

"(這張圖)之所以能引發這麼大的波瀾,是契合了大家的情緒。"

寒風

2024年,寒風幾乎吹進過大模型的每一個角落,連象牙塔裡的人們也感受到了氣溫的降低。

張楠楠(化名)是一名人工智能方向的在讀碩士。過去兩年間,他時刻關注大模型的動態,這個行業的起伏一定程度上影響着他畢業後的工作前景。

6月,他在與學長學姐的交流中,得知在大模型"六小龍"中已經有公司放棄了預訓練。

"六小龍"是指月之暗面、MiniMax、零一萬物、百川智能、智譜AI和階躍星辰這六家公司,它們是國內大模型的頭部初創公司。此前有媒體報道稱,六小龍中有兩家停止了預訓練。

投資機構分析師陳琳(化名)告訴雪豹財經社,"絕對不止兩家。"

預訓練減少,讓張楠楠開始擔心,未來幾年大模型公司的數量會變少、相關崗位的薪資會降低,這可能會波及他未來的就業和薪資。

張楠楠的部分擔憂已經變爲現實。

凱文(化名)是一位服務於大廠和"六小龍"的大模型獵頭。他發現,從4月起,不管是大廠還是六小龍,招聘需求都在顯著減少。今年,他手中大模型崗位比去年同期減少了30%~40%。

求職者的漲薪訴求也越來越難談。去年,凱文推薦的候選人,薪資翻倍的多到他記不清。今年,漲薪一倍的候選人只有一位,準確地說,還只是接近翻倍。

一家招聘方爲頻繁跳槽的求職者畫了一條紅線:五年跳三次。如果候選人的跳槽頻率高於這條線,"連面試機會都沒有"。

與崗位一起收縮的,還有投資人的決心。

陳琳在與投資人溝通中發現,原本懷着FOMO(Fear of Missing Out)情緒的投資人,開始擔心頭部大模型創企估值過高。智譜AI、月之暗面和百川智能等幾家公司的估值已經快速上升至約200億元人民幣的門檻。

陳琳的感知與知名投資人朱嘯虎一致。6月,朱嘯虎表示,"去年大模型非常火,今年機構都不敢投大模型。"

大洋彼岸,同此涼熱。

"我們感覺到,華爾街對AI越來越持懷疑態度。"巴克萊銀行在9月的一份研報中表達了自己的擔憂。該行測算,2026年大型科技公司在開發模型上的花費約爲600億美元,但從AI中獲得的收入僅約爲200億美元。這400億美元的差額,幾乎是特斯拉去年淨利潤的2.7倍。

技術和產品體驗的進步也在放緩。

11月,有外媒報道稱,OpenAI的下一代旗艦模型(測試代號爲Orion)雖然在性能上已經超越了現有模型,但可能不會像前面幾代產品那樣帶來巨大飛躍。

消息一出,著名的AI悲觀主義者、紐約大學名譽教授Gary Marcus在社交媒體上"慶祝"起了自己的勝利:"夥計們,遊戲結束,我贏了。GPT大模型正在進入收益遞減期。"

暗淡的白月光

2023年2月,美團聯合創始人王慧文與出門問問CEO李志飛、真格基金合夥人戴雨森和劉元在一家日式餐廳中,探討了中國大模型的未來。

此前4個月,OpenAI在沒有任何預熱,也未舉辦發佈會的情況下,上線了基於大語言模型研發的AI應用程序ChatGPT-3.5,兩個月便吸引來一億月活用戶。與之對比,蘋果iTunes達到一億用戶用了六年半,微信用了一年零兩個月。

飯局結束後不久,王慧文發佈了自己的人工智能宣言:"5000萬美元,帶資入組,不在意崗位、薪資和title,求組隊。"李開復、前京東高級副總裁周伯文、快手前MMU負責人李巖和李志飛等,均投身大模型創業。

大廠們也跑步入場。2023年3月,百度率先發布了文心一言大模型。此後,AI公司、互聯網公司和智能硬件公司們相繼跟進,騰訊、阿里、商湯、快手、美團、京東、阿里、OPPO、理想汽車均發佈了自己的大模型。

一時間,"做中國的OpenAI"成爲行業熱詞,這點燃了一級市場久違的投資熱情。

據創業邦旗下科創數據平臺"睿獸"數據,去年,機構在大模型層的投資事件爲66起,是上一年的投資事件數量的近2.3倍。大廠們自然沒有缺席這場資本盛宴。"六小龍"中,阿里與騰訊均投資了5家。

"當時在深圳的酒吧,人們要麼在討論美股,要麼在討論大模型。"肖琳回憶去年的情景,她並非一個懷有AGI信仰的人,但身處此種環境,她甚至開始幻想自己會不會成爲改變世界的一員。

2023年中旬,國內大模型已成"百模大戰"之勢。可就在此時,先行者的故事戛然而止。

投身大模型創業4個月之後,王慧文確診抑鬱症併入院治療,短期內無法繼續領導團隊。最終,美團以約20.65億元的價格,完成了對光年之外的股權收購。

光年之外前員工賈晨(化名)還記得,王慧文在創業之初精神狀態良好,對公司也很上心,但"公司經營的成本很大,而且技術難題很多"。

一個能拿出5000萬美元的人,因大模型創業得了抑鬱症,這讓賈晨萌生了"大模型究竟是不是一門好生意"的疑問。帶着這個疑問,他選擇更穩妥的探索方式:去大廠。

王慧文病退後,行業中開始出現大模型是否終將淪爲巨頭遊戲的討論。不久後,機構也發出了預警。

2023年10月,科技研究和諮詢公司CCS Insight在一份報告中表示,備受關注的生成式人工智能領域將在2024年接受考驗,這些考驗的具體表現爲:技術炒作逐漸消退,運行成本不斷上升,監管呼聲越來越多,投資人不再像之前那樣興奮和樂觀。

機構的預測,成了肖琳經歷的現實。

2024年初,肖琳看到公司裡來了幾位身穿白色長袍的外籍人士,她猜測這便是傳言中的"來自中東的投資人"。她希望這筆融資能順利到賬,這樣她的工作也會更加穩定。但事與願違,投資人試用大模型後,因功能不及預期而減少了投資金額。

察覺到投資人收緊錢包的不只一家公司。按朱嘯虎上述說法,"機構都不敢投大模型。"

投資機構分析師陳琳認爲,投資人們態度的變化,與大模型應用難以落地不無關係。

出門問問CEO李志飛感嘆,在國內大模型創業浪潮爆發之初,人們曾非常激進。"但是今天再回過來看,可能有些事情是過於樂觀了。"

誰能活下來

李志飛認爲,自己"可能是中國最早一批關注到GPT-3的人"。他將其視爲大模型發展的轉折點,讓他看到實現通用人工智能的希望。

GPT-3是OpenAI在2020年發佈的一款語言模型(Language Models),該模型的參數量達到1750億,是GPT-2的117倍,GPT-1的1496倍。

在李志飛看來,這是一次"暴力美學"的勝利。在此之前,他非常反感這個概念,因爲"沒有什麼深度,研究也沒有美感"。

"暴力美學"的概念並不難理解,它由先進的算法、海量的訓練數據和龐大的參數構成。

而這一切,需要以資金爲後盾。

國盛證券曾測算,GPT-3訓練一次的成本約爲140萬美元。兩年後上線的ChatGPT-3.5單次訓練成本上升到了460萬美元,可以購買一輛博蘭基尼Veneno(全球僅有 14 輛)。

在金錢的助推下,2023年4月上線的GPT-4參數繼續增加至1.8萬億左右。馬斯克曾估算,參數量超百萬億的GPT-5僅芯片成本超過7億美元,高於小鵬汽車在AI領域全年的投入(35億元)。

李志飛認爲,國內公司無法效仿OpenAI這種並不追求ROI的"暴力美學"。傅盛也認同這個看法。他在接受採訪時舉了一個例子:"如果一個谷歌研究員跟老闆說訓練一次2000萬美元,老闆問能不能做成,你說不知道,肯定就很難申請到資源。"

但生意還得繼續做。

目前,國內大模型行業的共識是卷應用,將大規模數據集訓練出來的深度神經網絡模型應用於實際問題中,通過大模型賺到錢。

在7月舉辦的2024年世界人工智能大會上,百度董事長兼CEO李彥宏稱,沒有應用,光有一個基礎模型,不管是開源還是閉源,都一文不值。李開復在11月初的一次分享中表示,當下國內AI行業的發展,已經進入應用"落地爲王"的階段。

另一個共識是,目前大模型行業已進入淘汰賽階段。

多位從業者告訴雪豹財經社,他們認爲字節將成爲贏家之一。創業公司方面,他們普遍認爲目前的"六小龍"將活下來一到兩家。

百川智能CEO王小川預測,未來國內大模型市場第一梯隊或僅有五家,大廠佔據主導地位,小型創業公司能存活的寥寥無幾。

朱嘯虎一度認爲,5年後將沒有獨立的大模型公司存在。2024年8月,他又在一次採訪中,將這一期限縮短至3年之內,稱大模型創企"最好的結果就是賣給大廠"。

李志飛早早嗅到了淘汰賽的氣息。2023年4月,他便預測大模型行業將"卷出天際",投身其中的公司大概率與上一代AI公司一樣,商業化異常艱難。

"一切都是熟悉的配方和味道。"他說。