爆火出圈、阿里站臺的Kimi,真的強嗎?

出品|派財經

文|羅莉

近日,Kimi智能助手火了。

一個明顯的感知是,最近身邊的大學生、職場人士都開始談論起了Kimi。一位職場寶媽告訴派財經,她最近在嘗試用Kimi輔導娃寫作業,“真的很方便,都不用下載APP小程序和網頁就能打開。”

根據AI產品榜aicpb.com統計,目前國內訪問量前十的產品中,Kimi在3月以12.61M的訪問量、環比321.58%的增長排在第二,僅次於文心一言。

成立近一年,短短五個月內Kmi的“長文本”輸入量提升了10倍。

3月18日下午,月之暗面曾宣佈在大模型長上下文窗口技術上取得新的突破,Kimi智能助手支持無損上下文長度從最初的20多萬字,擴容到200萬字。該消息公佈後,Kimi關注度一路走高,一度擠爆了服務器。3月22日,月之暗面迴應稱,觀測到Kimi系統流量持續異常增高,流量增加的趨勢遠超對資源的預期規劃,並表示已經有多項應急措施正在實施,包括已經進行了5次擴容工作。

此前,月之暗面副總裁許欣然在會議室展示了幾份用於測試的文件。幾十萬字的《甄嬛傳》劇本,Kimi不僅能夠一口氣讀完,而且還能根據情節準確回答出細節問題,解析人物劇情走向;在迅速學習完頭部醫學書籍《中醫內科學》和《中醫診斷學》後,便可化身“老中醫”進行在線問診。

Kimi的成功破圈,讓國內一衆大模型廠商感到措手不及。

1、Kimi,真的強嗎?

Kimi用戶體驗如何?派財經對Kimi、文心一言、通義千問和豆包做了系列小測試。分別對其資料總結能力、檢索能力和創作能力進行了測驗。

首先是對資料總結、財報解讀能力測試:

派財經隨機上傳了一份阿里2024財年中期報告pdf,輸入解讀指令。根據生成內容來看,Kimi和通義千問給出的回答,羅列較爲清晰,而文心一言則給出了概況,具體需要進一步指令才能繼續解讀,豆包給出了核心數據提煉回答。

其次是對用戶常用的資料檢索和整理功能測試:

派財經以“幫我閱讀馬斯克最新演講”爲指令,分別詢問。根據生成內容來看,Kimi通過對7篇資料檢索解讀,給出了邏輯明確且詳細的觀點總結,豆包則直接搜索出了多個相關報道鏈接,文心一言和通義千問則給出了比較框架性的總結。

值得注意的是,派財經發現在已經創建的Kimi窗口上傳完本地文件和網之後,智能助手會自動關閉聯網模式,這一功能在其它三個智能助手界面尚未發現。

再是對創作能力,生成腳本等創作力測試:

派財經以“圍繞北京文旅爲主題,寫一個短劇劇本”爲指令,分別測試其創作能力。按照給出的基礎大綱來看,通義千問、Kimi和豆包給出了較爲規範的劇本大綱框架,其中Kimi給出的最爲規範且細節,提到角色、場景、地點相對較詳細,在取名上也較爲文藝。相較之下,文心一言給出的標題則較爲直接,未交待劇本角色設定,但在場景、對話和獨白上更有“人味”。

綜上,在文生文應用上,Kimi的效果確實是看起來更有特色。

2、誰在爲Kimi站臺?

Kimi智能助手是國內大模型獨角獸公司月之暗面面向C端用戶推出的一項產品。

月之暗面公司成立於2023年3月,創始人楊植麟畢業於清華,博士畢業於卡內基梅隆大學計算機專業,曾就職於Google Brain和美國初創公司FAIR,師從蘋果公司人工智能負責人Ruslan Salakhutdinov,有多年創業經驗。

從技術能力上看,Kimi的強大基因最初就已經在創始人身上顯現。楊植麟是業內公認的長文本領域專家,在近五年的自研語言處理(NLP)領域影響力頗大。

在讀博士期間,楊植麟就以第一作者身份發表 Transformer-XL 和 XLNet 兩項工作,在谷歌學術上被引用近兩萬次,並在多個NLP任務上取得了當時的最佳效果。而Transformer-XL成爲首個全面超越 RNN 的注意力語言模型,XLNet則在20項頂級會議中獲得最佳論文提名。在華人學者引用排名中,楊植麟的學術論文位居前10,在40歲以下排名第一。

楊植麟的學術研究能力,助力其團隊創造了Kimi獨特且表現優秀的無損壓縮技術。

這種技術可減少參數對存儲的需求、推理的算力,以及數據傳輸的帶寬佔用,從而高效率無損處理百萬級的長Token。而爲了快速趕上長文本熱潮,其他大廠只能退而求其次,選擇檢索增強生成RAG技術。

Kimi的無損長上下文窗口的方案,是在逐字閱讀全文後給出答案。RAG技術是對全文關鍵信息進行檢索生成答案,但可能會丟失掉部分關鍵的信息。

這也就解釋了爲何Kimi的長文本對話回答更準確,在用戶體驗度上美譽頗多。

但也有小紅書博主發筆記表示,在對Kimi的測試中發現,Kimi有一股RAG味。

“月之暗面”這個名字,來源於英國著名搖滾樂隊Pink Floyd的專輯《The Dark Side of the Moon》,在科研之外,楊植麟也是一名搖滾發燒友,他曾在樂隊中擔任鼓手角色。

資本市場衆星捧月。創業一年之內,月之暗面就已經完成了兩筆融資。最新一輪融資是在今年2月19日,融資額度超10億美金,投資方包括紅杉中國、小紅書、美團、阿里,老股東跟投。該筆融資成爲國內AI大模型迄今爲止單輪融資最高的金額。早在2023年6月,月之暗面就曾獲得來自包括紅杉中國、真格基金等頭部投資公司的3億美金融資。在兩輪融資之後,當前月之暗面估值達到了25億美元。

Kimi的走火,離不開阿里在底層的算力支持。有消息稱,最新10億美金融資中有8億美金來自阿里,部分資金以阿里提供的算力折算。當前,Kimi借調了阿里的英偉達(NVDA.O)A800以及A100 GPU處理器的機型進行擴容,未來Kimi算力側的支持,也將主要來自於阿里。

3、Kimi搶了文心一言和豆包們的故事

在對AI長文本探索上,Kimi絕對不是第一家,國內大模型頭部大廠,百度文心一言、阿里通義千問和360AI早已在做長文本的探索,抖音也在去年年底發力AI工具豆包。

在其他大模型大廠還在卷參數、開源和榜單的時候,Kimi切中了一個更貼近市場剛需的應用場景。將長文本作爲標籤,通過大量的廣告營銷和用戶口碑,以“長文本”概念迅速佔領用戶心智。上線之初,就通過突出文本處理字數,爲自己貼上了“超大內存”的標籤,在PC硬件時代,不少C端用戶的認知是,內存越大,處理能力就越強。

在Kimi出圈之前,行業內在C端用戶市場教育上,百度的文心一言一家獨大,文心一言是大模型廠商中率先向社會全面開放的平臺。據相關數據統計,截至2023年9月,百度文心一言App的月活量達到最高峰值710萬。不過與Kimi不同的是除了2C之外,文心一言更大的精力放在研發行業大模型,垂直B端應用上。

其次是抖音的豆包在年初的初露頭角。依託於抖音的流量轉化池,字節跳動旗下的豆包APP在2024年1月活翻了一倍達到了400萬。

而新晉“網紅”Kimi的走紅要更快,據Similarweb數據,Kimi Chat網頁端數據最新峰值達34.6萬人次。根據AI產品榜,Kimi Chat的2月訪問量在國內榜排名第三,2月平均日活同比上升101.9%,全球增速榜排名第一,3月前二週繼續攀升。

Kimi上線的時間是2023年10月,當時可以支持無損上下文長度最多爲20萬漢字。在5個月的時間內,月之暗面直接將長文本能力提高10倍。按照AI領域的計算標準,200萬漢字的長度大約爲400萬token,在全球範圍內也屬於領先的標準。3月18日,月之暗面宣佈在大模型長上下文窗口技術上取得新的突破,其自研的Kimi智能助手已支持200萬字超長無損上下文,並於今日開啓產品內測。

月之暗面方面表示,如今Kimi能夠一口氣精讀500個甚至數量更多的文件,幫助用戶快速分析所有文件的內容,並且支持通過自然語言進行信息查詢和篩選,大大提高信息處理效率。

在產品定位上,Kimi足夠堅定,面向C端用戶,主打長文本。AI搜索+文檔總結功能。

Kimi開始就爲用戶敞開了大門,不僅能從網頁端入口進入,還能在APP和小程序端口打開,降低了使用大模型的門檻,這是業內B端大模型廠商無法匹敵的。

在選擇早期產品使用者集中在科研、法律、金融、媒體等垂直領域,而這部分垂直領域的KOL爲Kimi帶來了自然流量與口碑積累。

Kimi在發力營銷同時,也有一部分“自來水”自發爲Kimi站臺推廣。

將互聯網營銷公式帶入到了硬科技領域,Kimi的營銷開局頗爲高調。在月之暗面發佈的Kimi上線官宣文標題中提到,“歡迎與Moonshot AI共同開啓Looooooooooong LLM時代”,其中英文“long”用了接連十個“o”將Kimi的“長文本能力”直觀呈現出來。

Kimi提供的長文本閱讀能力和概括能力是兩大功能,面向C端用戶,致力於爲用戶打造一個高學習力的免費私人助手。

一份上萬字的文獻,投餵給Kimi,只需要幾分鐘就能讀完全文並歸納總結出核心論點,極大程度爲用戶提升了閱讀效率。

用戶投喂的各種資料又能反哺Kimi的語意語境學習理解能力,從而在不斷打磨中提高準確性。值得一提的是,在此類專業語料處理上的進步速度,Kimi甚至快於Open AI。主要由於當前Open AI對於C端用戶上傳文件仍然有所限制。

如果把Kimi智能助手類比做人類,它的突出之處在於具備較長時間段的記憶力,是一個記性超好的學霸,可以一次記住20萬字的上下文,一口氣讀完一本書或者一系列文章。相較國外綜合能力最強的學霸GPT4(可以記住2.5萬字)。Kimi的記憶力是GPT4的8倍。

有小紅書博主試着通過Kimi智能助手,訓練出在自媒體領域現象級創作者咪蒙,將50個文檔投餵給Kimi之後,一步步引導其分析咪蒙寫作的核心特點以及對待感情態度後,下指令讓其生成一篇關於“彩禮”的文章,成稿雖然簡短但頗具“咪蒙味”。

在Kimi走火之後,各大模型廠商紛紛“秀肌肉”。

據第三方機構的最新統計數據顯示,目前國內已經發布的大型語言模型數量已經超過了300個。這些大型模型的發佈主體涵蓋了科技巨頭、國內頂尖的高等學府、以及各類科研機構,他們在資金投入、資源配置、人才聚集等方面都擁有絕對的優勢。

國內互聯網大廠火速將相關功能進行了升級,捲起了長文本“長度”。

2023年10月30日,Kimi首發不到一個月,同爲清華系校友的王小川的百川智能就推出了單次處理35萬漢字的Baichuan2-192K,打破了Kimi的20萬字記錄,隨後,李開復也發佈了能夠處理40萬字的Yi-34B。

在Kimi宣佈更新200萬字長文檔處理能力後,阿里宣佈通義千問升級,免費開放1000萬字的長文檔處理功能,成爲全球文檔處理容量第一的AI應用;隨後,百度文心一言、360智腦也都把500萬字長文本提上了日程。

目前,大模型最強王者OpenAI的GPT-4 Turbo-128k可處理文本能力約爲10萬漢字,專攻長本文的Claude3-200K上下文處理能力約爲16萬漢字。

一時間,各大模型廠商比起了誰更“長”,而文本處理能力越長就能代表能力強嗎?

此前,對於文本窗口的長度,楊植麟曾表示,不能只提升窗口,不能只看數字,要看它在這個窗口下能實現的推理能力、the faithfulness的能力(對原始信息的忠實度)、the instruction following的能力(遵循指令的能力)。

4、長文本能力能幫Kimi造血嗎?

Kimi火爆的表象之下,一個更爲現實的問題暴露無遺,長文本能力能爲Kimi造血嗎?

根據新浪科技提供的數據,考慮到廣告投放和算力成本,Kimi每個獲客用戶的成本達到12-13元,而按照近一個月將近18000的日均下載量計算,Kimi每日的獲客成本高達20萬元。而除了每日20萬的獲客成本外,Kimi需要燒錢的地方還有很多,比如不斷提升信息檢索能力、遵循複雜指令的能力,推動多模態模型研發,以及實現音頻處理等其他需求。

接下來,付出了高額成本,能否將現有用戶留住,持續轉化將是對Kimi產品的一大考驗。爲龐大的用戶羣體提供穩定的服務,同樣是一筆不小開支。

長文本能力短期內幫助Kimi出圈,但很難成爲其獨家技術壁壘。Kimi的長文本處理能力與通義千問、360智腦等AI產品相比,並沒有非常明顯的優勢。

雖然實現造血能力難,但Kimi的C端策略也有一定意義,通過長文本先征服用戶,進而讓更多B端客戶看到大模型底層應用能力的真正價值。

但從整體盈利角度來看,Kimi靠燒錢摸索出的獲客模式很容易被複制,對於將業務重心放在B端服務的大廠們來說,獲客成本反而是更低的。

行業內多數大模型公司均採取的是2B和2C兩條腿走路,通過推出行業大模型直接售賣B端解決方案,或是向公司、開發者售賣API,按照調用次數收費。此外,以文心一言爲代表的一種C端打法是,面向C端用戶,爲會員增值服務,在應用端按月/年向用戶收費,當前文心一言扔在試水階段,而後起之秀Kimi則仍然處於免費模式階段。

不過,有聲音認爲,Kimi的出現對於國內大模型市場提供了新的思路,從基礎大模型的訓練和競爭逐步向更貼近客戶的產品功能和細節需求轉變。

有業內人士表示,當下這一輪人工智能革命本質上是自然語言處理(NLP)的技術革命,更是一次交互方式的革命。從文本向多模態發展是大模型必經之路。而視頻處理需要更大的參數量和存儲容量,對算力和算法的要求也更高。接下來Kimi的應用將從單模態,向多模態化發展,即從單一的文本處理基礎上,增添聲音、圖像等信息處理技術。

亦有觀點認爲,Kimi的出圈意味着在中文領域開啓了AI大模型應用元年,長文本時代已至。大模型在實現通往AGI(通用人工智能)路上又近了一步。然而需要釐清的是,長文本能力並非唯一標準,多模態學習、神經網絡架構創新、應用落地與生態建設、倫理與道德框架構建等各個維度都不可或缺。

一位初入職場的金融分析師向派財經感嘆道,Kimi的強大學習理解能力讓人感到威脅,“可能過不了多久,向我這樣的初級分析師就要被AI智能助手替代了。”這一擔憂並非空穴來鳳,在效率至上的資本市場,華爾街有個說法叫“20美金實習生”,時薪20美金的實習生工作未來一段時間大概率會被AI替代。

AI是否會替代職場人?在《所羅門的密碼:AI時代的價值、權力與信任》中,作者奧拉夫·格羅思、馬克·尼茲伯格曾給出過解釋,“最終,問題不在於工作是否會改變,工人是否會被取代。這甚至不需要超級智能就會實現。問題是這些轉變將會以多快的速度發生,我們能否跟上它們的步伐,特別是在教育和勞動力培訓方面。正如奧萊利媒體公司的創始人兼首席執行官蒂姆·奧萊利(Tim O’Reilly),在他的視頻《我們爲什麼永遠不會失業》中所說的那樣,我們的辦法總比困難多。但是,適應新的工作性質需要發揮想象力並做好準備。”