☰

融資超10億美金，AI公司「月之暗面」獲紅杉、小紅書、美團、阿里新一輪投資 | 36氪獨家

36氪獨家獲悉，AI創業公司「月之暗面」近期已完成新一輪超10億美金融資，投資方包括紅杉中國、小紅書、美團、阿里，老股東跟投。

月之暗面的上一輪融資爲2023年獲得的超2億美金融資，投資方包括紅杉中國、真格基金等。本輪融資後，月之暗面估值已達約25億美金，爲國內大模型領域的頭部企業之一。

自ChatGPT掀起全球浪潮以來，這也是國內AI大模型公司迄今獲得的單輪最大金額融資。

36氪就上述消息向月之暗面求證，月之暗面表示，對具體融資消息暫不方便評論。

月之暗面（Moonshot AI）成立於2023年3月，是國內大模型領域的關鍵玩家。其核心團隊曾參與到Google Gemini、Google Bard、盤古NLP、悟道等多個大模型的研發中——這是一支在大模型道路上已探索多年的隊伍。36氪瞭解到，目前月之暗麪糰隊人數已超80人。

月之暗面的創始人楊植麟，爲中國35歲以下NLP領域引用最高的研究者，Transformer-XL和XLNet兩篇論文的第一作者——兩者均爲大語言模型領域的核心技術；另外兩位聯合創始人周昕宇和吳育昕，則有超過10000+的Google Scholar引用。

自2023年成立以來，月之暗面在不到一年的時間裡，完成了從通用大模型到上層應用的佈局。在大模型層，月之暗面已訓練了千億級別的自研通用大模型。

而在應用層，2023年10月，月之暗面正式推出首個面向C端的產品“Kimi智能助手”，這是月之暗面做To C超級應用的第一次嘗試。Kimi智能助手支持20萬漢字的長文本輸入，主打無損記憶。

“長文本（Long Context）”是月之暗面當前主打的技術之一，這來源於團隊希望突破大模型的落地瓶頸——大模型的智慧之所以能“涌現”，主要是因爲通過擴大參數規模，突破到了千億級別。

但當前大模型落地的瓶頸，不僅有參數規模大小（即模型計算能力），還有模型的“內存”大小，即記憶力。每輪對話能處理多少上下文信息，決定着AI應用的體驗好壞。

值得一提的是，推出Kimi智能助手後，月之暗面可以說引起了一場關於“長文本技術”的小競賽——隨後，國內衆多創業公司也相繼推出了長文本相關的技術更新，而OpenAI和Anthropic在2023年11月也發佈了長文本相關的新進展。

從國內的AI競賽來看，通用大模型領域的第一梯隊也已經清晰展現。據當前公開信息，除月之暗面以外，包括智譜AI、MiniMax、百川智能、零一萬物在內的創業公司，估值都已達10億美金後。

而月之暗面本輪融資，以及近期大模型公司的融資情況也顯示出，國內通用大模型層的下注者有所變化——相較2023年，通用大模型層尚有VC的活躍身影，到了今年，大廠戰略投資開始頻頻現身。

各個大廠都採取廣投賽道，而非站隊策略——阿里已投資包括智譜AI、百川智能、零一萬物在內的創業公司；騰訊也投資了智譜AI、百川智能、MiniMax等公司。

儘管過去一年大模型的算法優化、模型訓練成本有大幅下降，但大模型依然是極其昂貴的遊戲。據36氪瞭解，當前頭部的大模型公司的融資窗口仍在開放，“軍備競賽”還未告一段落。

大模型創業公司的估值水漲船高，迅速將參與門檻推到極高。一位投資人對36氪表示：“現階段，通用大模型領域當前已經不是大多數VC的遊戲，往後的投資人更多是政府和戰投。”

另一方面，對現在的大模型創業公司而言，多模態模型是近期的核心競爭點。就在北京時間2月16日凌晨，谷歌重磅發佈了最新的多模態模型Gemini Pro 1.5。幾個小時後，OpenAI馬上發佈了首個AI視頻模型Sora，可以生成超過60秒的視頻，再次引發全球轟動。

比起以文本爲主的大語言模型，以圖像、視頻爲主的多模態模型，訓練成本更高，未來將會需要更巨量的資金和人才——國內大模型公司當前爭取更多融資，也意在爲此做準備。

36氪也瞭解到，月之暗面當前已經在秘密研發通用多模態模型，預計今年內將推出。月之暗面在多模態相關技術上多有儲備，團隊成員曾發明了包括基於對比學習的視覺預訓練範式MoCo、最高效的視覺網絡結構之一ShuffleNet等，也有團隊成員主導開發了detectron2，後者是一個被廣泛使用的視覺開源項目，曾被集成到Meta全線VR/AR產品中。

融資超10億美金，AI公司「月之暗面」獲紅杉、小紅書、美團、阿里新一輪投資 | 36氪獨家

相關資訊