小紅書要不要做大模型?

小紅書的爆火,再次引發了我們對於小紅書技術問題的討論,也進一步將小紅書與現在最受關注的大模型能力聯繫在了一起。在過去的 2024 年,卷大模型已經成爲了中國互聯網大廠的標配,但是到了 2025 年,對於接下來的 AI 戰略,小紅書仍需抉擇。

小紅書其實一直都在緊跟大模型的浪潮。2023 年初,ChatGPT 3.0 剛剛爆紅不久,小紅書就開始摸排國內相關的創業公司,並很快成爲了 Minimax 在 A2 輪次的投資方之一,這輪同時入資的還有騰訊、小米、金山三家大廠。

這次投資之後,2023 年 9 月,小紅書基於 Minimax 的大語言模型,開始在App中內測 AI 聊天功能的 AI 助手Davinic(達芬奇),之後做出了同樣基於 Minimax 的社交陪伴功能“AI 寵物小夥伴”,用戶可以只能創建自己的寵物角色。

如果說投資 Minimax 只是開胃小菜,那麼追逐月之暗面則是小紅書接下來的重頭大戲。

張宇彤是金沙江在投資小紅書過程中的項目主導人。小紅書要投大模型廠商,月之暗面自然通過張予彤的關係進入了小紅書的視野。

這是月之暗面第三輪融資,總估值高達 9 億美金,最初定下的投資方有三家,分別是小紅書、雲九資本、五源資本,各自有 1000萬 美金的投資額度。小紅書作爲領投方,在金額上有所猶豫,想要增加到兩千萬至三千萬之間,張予彤要求各方先打錢再開放信息,雲九和五源就先以債的方式打過去了錢。

誰知道小紅書這一猶豫,阿里就擠進了投資隊伍,把這一輪估值撐到了 15 億美金,小紅書從領投方變成了跟投方。

除了投資,小紅書也組建了大模型團隊,負責人是前格林深瞳首席科學家、小紅書 AI 創新負責人張德兵。他在 2023 年 10 月份的一次技術分享中說過,小紅書大模型佈局將主要圍繞三個方向:一是多模態技術在小紅書內部應用場景具體的落地,二是針對內容創作者、藉助AIGC工具降本增效,三是更關注成本。

不久之後小紅書自研語言大模型的消息開始傳出,2024 年小紅書開始灰度測試自研通用大模型基座“小地瓜”。

小紅書產品和設計負責人鄧超負責 AI 產品探索。截止到目前爲止,小紅書內部已經推出過多款 AI 產品,除了達芬奇和 AI 寵物外,小紅書還有 AI 繪畫產品“Trik”、文生圖產品“此刻”、AI搜索助手“搜搜薯”。2024 年底,小紅書先後在站外和站內上架了 AI 搜索新產品“點點”和“問點點”。

小紅書既然發力許久,並且在模型層和應用層都小有成績,在接下來的 2025 年,要不要在大模型領域繼續深入呢?如何深入?

能做、要做、就該做

對於這個問題,AI科技評論與多位業內人士交流過,要和不要兩個選項都有不少理由,而且都能言之成理。

支持方普遍認爲,小紅書要繼續發力大模型,既有戰略性的原因,也有產品力的考量。

小紅書想要掙錢,主要有商業化和電商兩條路可走,而在商業化方面,爲了保持住小紅書的內容調性,推薦系統中能夠推送的廣告佔比必然有一個閾值,因此,搜索廣告就是小紅書的重要增長點。

小紅書已經成爲國內最重要的搜索平臺之一,承接了百度和其他搜索平臺的不少需求,目前日均搜索量(qv)已經超百度一半。想要延續搜索份額的增長勢頭,小紅書就一定要在 AI 上持續發力,保證用戶的搜索體驗處於市場領先地位,進而擴大市場份額,最終成功實現商業化收入上的突破。

從戰略上來看,小紅書不僅應該做 AI 搜索,而且要大做特做,最好能夠取代百度,成爲國內最大的搜索流量池。

當前 AI 搜索是大模型應用的當紅產品形態,海內外都有不少明星產品,Perplexity、kimi、夸克乃至豆包都被歸爲該類別。小紅書與抖音是國內當前互聯網流量最集中的兩個社交平臺,不少人認爲 2024 年豆包的崛起是歸功於抖音的流量扶持與字節底層基座模型的能力成長,因此小紅書基於自身強大基座模型開發類 ChatGPT 產品+小紅書平臺的流量密碼,也或有望彎道超車。

從這一角度看,小紅書繼續投入資源升級基座大模型、開發 AI 搜索與聊天產品有天然優勢,還有行業先驗模板豆包。將時間線拉長來看,假如未來五年、十年基於大模型的 AI 應用大爆發,小紅書的 AI 產品也將是未來其穿越行業週期的一道護城河、入場券,即使大模型的投入大也是“一筆劃算的帳”。

另一個關於大模型應用的想象是新型社交,如 MiniMax 開發的產品 Talkie。

新時代一定要設計新的社交產品和社交工具。但目前抖音與小紅書已經能滿足用戶對新型社交的需求,因此社交的本質是在一個高密度社區裡找到自己想找的人與內容,所以新型大模型社交產品的崛起會面臨現有社交平臺的流量圍剿;反之,現有社交平臺基於大模型升級原有平臺的社交功能則有天然優勢。小紅書與其成爲被新生代事物挑戰的被動方,不如成爲發起挑戰的主動方。

第二點原因,則在於小紅書用戶的多元化,以及由此產生的對各類 AI 工具的渴求。

小紅書起身於圖文社區,但是現在已經發展爲一個涵蓋圖文、短視頻、直播、羣聊社交等多種媒介形態的平臺。在內容的創作端和消費端,用戶的需求已經越來越複雜。剪映誕生於輔助抖音的內容創作,即屬於該邏輯。

在小紅書羣聊輸入框的+號裡,隱藏着小紅書AI聲聊的入口。這個產品可以幫助用戶變聲說話,用唱歌的方式聊天等等。

這是小紅書發掘的其中一個社交需求場景。用戶的新需求可能隱藏在各個角落,創作者有 AI 生成文案的需求,有 AI 編輯圖片視頻的需求,有直播間數字化場景的需求,有通過 AI 手段與粉絲互動的需求等等,這種場景小紅書不去發掘,就會被站外工具發掘,甚至會影響到整個平臺社區的氛圍。

比如此前在《“TikTok 難民”大批涌入,小紅書會面臨什麼技術挑戰?》一文中提到的,不少人對跨語種的交流需求催生了一個全新的場景,那麼小紅書就有必要做一個多模態的翻譯產品。

而且根據分析公司 Similarweb的最新數據,小紅書在本週早些時候,一天內就吸引了近 300萬美國用戶,現在美國iOS和Android設備上的每日活躍用戶約爲340萬,是上週同期的十倍有餘。大批量的海外用戶迫切需要小紅書內嵌的翻譯能力。

除了戰略和產品方面的考量外,支持方最重要的觀點還是,小紅書目前是國內最大的用戶原創內容中心之一,圖文質量很高,有效信息含量豐富。在多年來強調社區調性的運營管理中,社區互動氛圍強,用戶中“活人”佔比多,語料庫質量極佳。小紅書擁有國內發展 AI 大模型技術最好的語料庫之一,數據又成爲下一代模型升級的關鍵,多元化多語種數據更是稀缺。

所以小紅書在訓練大模型的時候,先天就有數據上的優勢,不僅遠超六小虎,甚至超過國內絕大部分大廠。訓練基座大模型,可以保證其技術的自主性與模型應用迭代的節奏控制。即使自己不做大模型的預訓練,理論上也可以成爲國內最好的語料庫供應商之一,“小紅書應該接住這潑天的富貴”。

沒人、沒錢、沒必要

當然反駁者的意見也不容小覷。小紅書當然有機會去做大模型,但是機會夠不夠大,值不值得小紅書全力投入呢?

質疑者的第一條理由就是技術人才的問題。

小紅書不是一家以技術見長的公司,強運營、強策劃是小紅書不斷破圈的殺手鐗。但是訓練大模型,是一件技術要求極高的工作。

AI 科技評論與多位業內人士討論過,要想做大模型,最重要的是找到合適的人。甚至於,只要找到了正確的人,一個大模型的訓練團隊,可能只要十來個人就能做起來了。不止一位從業者認爲,上一代所有的AI人才,不論是搞CV的,還是搞 NLP的,看到大模型仍然要從頭學起,之前積累的經驗幾乎是一夜清零。

小紅書目前大模型的帶頭人張德兵,此前的履歷是格靈深瞳的首席科學家,博士畢業於浙江大學,師從著名的計算機視覺與機器學習專家何曉飛教授。

張德兵是一位在學術屆和在產業界成果突出、經驗豐富的計算機視覺專家,但他此前也沒有訓練過超大規模集羣下的大語言模型,並沒有相關的經驗。

至於小紅書另外的三個算法團隊,核心人物中的風笛原是阿里算法策略專家,凱奇是原鳳巢首席架構師,吳毅是百度搜索算法專家,更不瞭解大模型。

除了算法人才,訓練基座大模型也需要優秀的 Infra 人才搭建萬卡集羣。相比算法人才,國內優秀的底層基礎設施與系統人才更加鳳毛棱角,少數的幾個人才也已經被字節、阿里等大廠與頭部大模型獨角獸公司瓜分。小紅書要吸引這些人才,難度非同小可。

缺人,這是小紅書訓練大模型面臨的第一個問題。

第二個問題是,大模型實在太花錢了。

一個通用大模型進行一次預訓練的費用,就要千萬美金以上,這還不包含人力成本、算力成本、後續的優化、模型的更新和部署等費用。大大小小的費用相加,等到模型真的能用,至少要五千萬美金起步了。

大模型已經成爲一個比拼財力的賽道。字節過去一年在 AI 研發上的投入超過百度阿里騰訊三者的總和 1000 億元人民幣。在六小虎中融資額相對較少、只有數億美金的零一萬物,現在也已經放棄了預訓練。

根據公開報道,小紅書在 2023 年才首次實現歷史性突破扭虧爲盈,當年營收 37 億美元,淨利潤 5 億美元。到現在剛盈利兩年的小紅書,能在大模型上投入多少錢?

更何況,小紅書的大模型能力,在同行之間不具備競爭力,也沒有云業務的加持,就沒辦法成爲一個賺錢的業務,純屬燒錢的行爲,小紅書應該既不願、也不能長期支撐這樣的投資行爲。

至於不支持小紅書做大模型的最後一個理由,則是目前業界的共識:模型無關論(Model-Agnostic)。

在 Scaling Law見底,Transformer 架構仍然一統天下的今天,市面上的諸多大模型從能力上來講沒有本質的差別,用戶的使用體感上各有千秋,但整體而言,沒有代際差異。

多個 AI 應用團隊告訴 AI 科技評論,從 2024 年年中 Claude Sonnet 3.5 發佈後開始,他們在開發大模型應用時就是普遍接入 4、5 個不同的基座大模型,因爲多家基座模型的性能都已能媲美 OpenAI,“大模型就像電源一樣即插即用”,所以不同基座模型的迭代速度不再影響上層應用的開發。

在當前第一梯隊的大模型中,現在的 AI 產品無論選擇使用哪一個,只要經過合理的fine tune,最終結果也都大差不差。更何況,AI產品可以選擇多個大模型,可以隨着產品特徵,或者是用戶需求主動切換大模型。小紅書做 AI 產品的時候,也可以走這樣的路線。以現在的 API 價格之低,用基座模型廠商的模型,還是一種省錢行爲呢。

結語:

在多方討論之後,AI 科技評論認爲,小紅書接下來,應該全力以赴去做AI產品,不要投入精力去做大模型。

AI 搜索的產品特點,既契合小紅書自然生長的搜索流量,也能利用好小紅書上規模龐大的優質語料庫。這是小紅書應該抓住的戰略級機會。

雷峰網認爲,在現有條件下,小紅書可能還缺乏做大模型的能力,與其勉強自己,不如使用開源模型,或者只需要接入 API,先解決平臺上的 AI 產品問題,將小紅書打造成引領 AI 時代的社區平臺。

大家怎麼看?

雷峰網稿件,請勿轉載