團隊15人,估值80億
根據外媒消息,成立不到1年的日本人工智能初創公司SakanaAI,即將斬獲超1億美元融資,估值飈至1800億日元(約合人民幣82億,11.5億美元),即將躋身AI獨角獸行列。
年初,Sakana已獲Lux Capital、Khosla Ventures及多家日本巨頭聯合注資,政府亦提供了關鍵算力支持。本輪融資中,上述投資方Lux Capital、Khosla Ventures 將再度加碼,顯示出對該項目信心。
儘管融資規模非行業之最,但這背後恰恰是其差異點所在。Sakana憑小團隊脫穎而出,年初融資時團隊僅3人,目前也僅有15名員工,若論人均估值,與OpenAI不相上下。
更引人注目的是其低成本創新路徑。Sakana顛覆當前AI生成範式,憑藉獨創算法自主工作,節省人力,也無需使用耗電量巨大的大型計算機,號稱數據學習週期將縮短數百倍。
Sakana的策略也另闢蹊徑,拒絕盲目追求大數據模型,擁抱“小模型”戰略,“以小博大”,通過模型間相互協作,針對性解決問題。
此番“小步快跑”模式,與朱嘯虎的觀點頗有幾分相似,其看淡大模型,力挺小模型商業化應用,與Sakana實踐不謀而合。
Sakana 的崛起,不僅是日本AI領域的突破,更是地域化AI創新趨勢的有力註腳。全球範圍內,小模型勢力崛起,資本“狩獵”的新圖景也正徐徐展開。
“日本OpenAI”
避開硅谷,落腳東京,Sakana 選擇了一條不同尋常的發展道路。
“如果我們在灣區創辦 Sakana AI,那將是一個戰略失誤,因爲我們看起來會更像其他人,很難與衆不同”,CEO David Ha 曾如此表示。在他看來,硅谷雖然科技氛圍濃厚,但過度的同質化使得新創企業難以在其中脫穎而出。
Sakana 另一層面的野心在於,追求跨文化技術突破,開發非西方AI模型。此外,Sakana 東京的選址,也是創始團隊背景的自然延伸。
David Ha曾任谷歌大腦 Google Brains 日本分部的研究負責人。在這之後,David Ha 曾在 Stability AI 擔任研究主管。據日媒報道,其退出 Stability 可能是因爲工作內容與研究存在距離,而他本人對於神經網絡、創意AI和進化計算等多個領域有着廣泛的興趣和深入研究。
CTOLlion Jones同樣來自谷歌,在谷歌人工智能研究室擔任技術主管多年,是Transformer架構的提出者之一,該架構後來成爲 ChatGPT 等生成 AI 驅動產品的基礎。Llion Jones對於大型科技公司在創新速度上的不滿促使他離開谷歌,爲 Sakana 帶來技術積澱。
後期加入的另一位聯創 Ren Ito,則憑藉其在推進 Mercari 全球化和 IPO 的經驗,以及在投資領域的人脈,爲 Sakana 帶來了豐富的運營策略和國際視角。Ren Ito曾投資過獨角獸初創企業Stability AI,並曾擔任過 Stability 的研究負責人和首席運營官COO。
另一位聯創Ren Ito則憑藉在推進Mercari全球化和IPO的經驗,以及在投資領域的人脈,爲Sakana帶來運營策略和國際視角。他曾投資過獨角獸初創企業Stability AI,並曾擔任過其研究負責人和首席運營官。此外,Ren Ito在日本外交部的背景也爲公司的國際合作與市場擴展提供了優勢。
Sakana的核心團隊匯聚了來自Google Brain、DeepMind等機構的專家,其中不乏多位亞裔成員。2023年7月成立以來,不僅挑戰硅谷模式,還力求在亞洲建立AI新標杆,目標趕超OpenAI和DeepMind。
年初融資時,公司僅三名創始人,平均每人估值達6670萬美元,超越OpenAI的員工平均估值約800多萬美元,根據CB Insights,其時團隊成員平均估值位居榜首。
可自動“繁衍”的AI模型
技術層面,Sakana 同樣試圖顛覆AI生成範式。
這一變革的靈感來自自然界,Sakana 通過模擬進化過程,使AI模型適應環境變化,克服傳統大語言模型的脆弱性和不可變性,同時極大降低開發成本並提升安全性。
核心亮點是“模型合併”技術,Sakana將多個現有開源AI模型融合,催生出新一代模型,這一過程循環往復,歷經數百代演變。再從每一代中選出最成功的模型,成爲下一代的“父母”。
雖然該方法以前也存在,但它需要開發人員手動合併模型。Sakana開發的自動化“進化”算法無需人工干預,自主識別併合並每代中最優秀的模型,以實現預設目標。
這一自動化流程加速了模型的進化速度,據 Sakana 宣稱,如果能夠在短時間內反覆“繁衍”促進AI進化,將有可能把AI學習海量數據的週期壓縮至現有水平的幾百分之一。
生成式AI需要海量數據以及巨量的算力成本,這使得研究先進基礎技術的能力僅限於少數資金雄厚的科技企業。Sakana 採用的方法,號稱對算力資源的需求極小,幾乎不增加額外成本,就能獲得高性能的模型。
目前,Sakana 已基於其“自然啓發”的機制,推出了涵蓋語言、圖像轉換和圖像生成三大領域的AI模型,其中兩款開源。這些模型若按常規方式開發,成本或以百萬美元計,並需數月時間。
不過,目前 Sakana 尚未推出直接面向消費者的應用,如何將這一革命性的技術轉化爲商業成果,是市場關注的焦點。
區域化大模型頻現
Sakana成功融資,恰逢衆多AI初創企業深耕本土模型開發之際,全球資本也開始熱捧地域化AI新星,戰略落子頻繁。
六月間兩起融資案即爲例證。加拿大 Cohere 以 50億美元估值攬獲 4.5億美元融資,英偉達、思科助力;法國Mistral AI喜提6億歐元,General Catalyst領投。國際資本追逐各地“OpenAI”的勢頭愈發兇猛。
然而,誕生於各地的本土企業,亦須直面“初代”大模型的“入侵”威脅。如美國的人工智能開發商已經在日本建立了業務。今年4月,OpenAI在東京設立辦事處,正式拓展亞洲業務。它還聘請了長崎忠雄擔任 OpenAI 日本公司的總裁,併爲當地企業提供了針對日語優化的模型。
區域競爭日漸白熱化,創新與堅守並行成爲新命題。儘管盈利模式尚不明朗,Sakana的創新在一定層面爲AI領域的可持續發展提供了新思路,預示着一個低成本、高效率AI開發時代的到來。
無獨有偶。法國的 Mistral 同樣追求“性價比”,也是最爲投資人稱道的一點。去年發佈的Mistral 7B,以70億參數打敗了數百億參數的開源大語言模型霸主Llama 2;另一款模型Mistral Large開發成本低於2000萬歐元(約2200萬美元),GPT-4的開發成本可能要超過1億美元。
Sakana 和 Mistral 的實踐,爲中小企業和開源社區打開了低成本創新的大門,有望終結大公司在AI技術上的壟斷。
法國、加拿大、日本等地新秀頻現,也勾勒出非硅谷獨角獸的勃興。
CB Insights 數據顯示,截至今年 4 月底,生成式AI領域獨角獸企業激增至37家,較去年同期近乎翻倍。新增17家中,10家植根海外,美國雖仍佔九成份額,但全球分佈趨勢顯著。
與此同時,各地政府力量參與濃度提高,投資生態不再專屬巨頭。
如Sakana在開始時,就獲得了政府提供的算力支持。正如Khosla Ventures的創始人Vinod Khosla曾強調的那樣,本土基礎模型關乎國家安全與文化互動,各國渴求自主掌控。