MiniMax邁出AI 商業化關鍵一步
作者 | 劉寶丹
編輯 | 黃昱
在經過兩年的技術迭代後,2025年將是AI商業化落地的決勝之年。作爲國內AI獨角獸,MiniMax也開始發起衝刺了。
1月15日,MiniMax發佈並開源新一代01系列模型,包含基礎語言大模型MiniMax-Text-01和視覺多模態大模型MiniMax-VL-01。該系列模型能夠高效處理高達400萬token的輸入,可輸入長度是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。
這是全球首個大規模應用線性注意力機制架構的開源模型,背後承載的是MiniMax在技術和商業化應用方面的野心。
MiniMax成立於2021年,目前完成四輪融資,最近一次是2024年3月,由阿里領投,估值25億美元,成爲國內AI“六小龍”之一。從模型來看,MiniMax自主研發了多模態的通用大模型,其中包括萬億參數的MoE文本大模型、語音&音樂大模型等系列模型。
四個月前,在成立996天的夥伴日上,MiniMax創始人閆俊傑透露了公司商業化方面的考量。他表示,整個公司的商業化基本上分成兩個形式,一個是開放平臺,現在已經有兩千多家的客戶;第二點,在公司產品裡面也有廣告的機制。
彼時,MiniMax國際業務總經理盛靜遠表示,MiniMax現在是所有中國大模型公司裡面,少數幾個能講商業化變現,能講產品跟模型驅動,甚至很有可能能在比較短的時間內實現自負盈虧及盈利的公司。
如今,隨着01系列模型的發佈,MiniMax在AI大模型的商業化變現方面有望提速。
一方面,這主要是因爲,新模型在輸入長度方面取得了新的突破。
MiniMax-01系列模型首次將線性注意力機制(Linear Attention)擴展到商用模型的級別,這意味着,線性注意力機制從學術理論成功落地到模型應用層面。受益於此次架構創新,該系列模型在處理長輸入的時候具有非常高的效率,接近線性複雜度。
從ScalingLaw、與MoE的結合、結構設計、訓練優化和推理優化等層面綜合考慮,MiniMax選擇模型參數量爲4560億,其中每次激活459億,能夠高效處理高達400萬token的上下文,將有效替代Transformer傳統架構並開啓超長文本輸入時代。
而長文本能力是制約AI大模型商業化落地的核心元素,尤其AI Agent階段正在加速到來,包含長文本在內的大模型性能將在市場中接受真正的考驗。
2025年,AI將迎來至關重要的發展節點,AI Agent有望成爲新一年最重要的產品形態,由於AI Agent處理任務變得越來越複雜,涉及的數據量也越來越大,單個智能體的記憶以及多個智能體協作間的上下文都會變得越來越長。
在這種背景下,長上下文能力與多模態處理能力的提升,是AI Agent爲各行業帶來更爲豐富、高效、智能的解決方案的必要條件,這也是MiniMax 01系列模型的最大亮點。
價格也是影響AI大模型落地的重要因素。華爾街見聞獲悉,受益於Linear Attention層面的架構創新、算力層面的優化,以及集羣上的訓推一體的設計,MiniMax API服務的標準定價是輸入token 1元/百萬token,輸出token 8元/百萬token。
值得一提的是,MiniMax在Github上開源了Text-01模型、VL-01模型的完整權重,以便於更多開發者做有價值、突破性的研究。
MiniMax表示,“我們認爲這有可能啓發更多長上下文的研究和應用,從而更快促進Agent時代的到來,二是開源也能促使我們努力做更多創新,更高質量地開展後續的模型研發工作。”
不過,MiniMax要想在商業落地上取得更大的成績,還面臨AI技術迭代帶來的不確定性,作爲創業公司在應用生態上的不足,以及激烈的市場競爭,這些都會給公司帶來壓力。
以市場競爭爲例,MiniMax想要打造出AI時代的殺手級APP。根據Sensor Tower數據,截至2024年8月,Talkie在全球AI應用下載榜上位居第12位,海螺AI在國內AI應用榜單也能排到TOP10。
雖然兩款產品的成績不錯,但距離遙遙領先的ChatGPT和迅速躥升的豆包,依然有不小差距.這背後可能反應了MiniMax在產品和市場方面的能力差距。
早在ChatGPT火爆出圈之前就已成立,MiniMax被認爲是最有AGI願景的創業公司之一。過去一年,MiniMax持續深耕技術和產品,並在2025年開年放出一枚重磅武器,頗有厚積薄發之勢。
接下來就看MiniMax能否在商業化這條路上開花結果,這注定是一場極爲艱難的硬仗。