字節系大模型比同行便宜八成?火山引擎總裁:市場需要充分競爭,做得最好才能活下來

“市場需要充分競爭,降低成本是技術優化的結果,做得最好才能活下來。”

12月18日,字節跳動旗下火山引擎總裁譚待在接受澎湃新聞等媒體採訪時,提到大模型行業的現狀。

在當天舉辦的火山引擎Force大會上,字節跳動再次掀起價格戰:發佈豆包視覺理解模型,每千tokens輸入價格僅爲3釐,一元錢就可處理284張720P的圖片,比行業價格便宜85%。

此前5月,字節也是首先推出低價,引發全行業跟進:豆包主力模型在企業市場的定價只有0.0008元/千Tokens,比行業便宜99.3%。

豆包大模型多款產品也同時迎來更新:通用模型Pro已全面對齊GPT-4o,使用價格僅爲後者的1/8;音樂模型從生成60秒的簡單結構,升級到生成3分鐘的完整作品;文生圖模型2.1版本,更是在業界首次實現生成漢字和一句話P圖的產品化能力,該模型已接入即夢AI和豆包App。

豆包日均使用量增長33倍

“豆包不看帶動多少雲收入,而是看有多少客戶使用我們的大模型產品,目前我們在整個市場份額上都做到了較大領先。”譚待告訴記者。

目前大模型混戰已進入深水階段,除了字節跳動、騰訊、百度等大廠參與,月之暗面、Minimax、智譜、百川智能等AI獨角獸也有很強的競爭力。不過,在業界看來,目前字節跳動旗下豆包發展尤爲迅速。

數據顯示,在11月的全球月活躍排行榜上,豆包APP的MAU(月活)達到5998萬,僅次於OpenAI的ChatGPT,位列全球第二。

不過,對於相關MAU數據的準確性,譚待在採訪中未予以迴應。談及市場競爭,他坦言,“企業之所以用豆包更多,還是因爲使用體驗較好,而不是沒有嘗試過其他的產品。這個市場就是要充分競爭,最關鍵的是能不能把自己的東西做好,能不能把成本做低,能不能把方案的落地應用性做好。”

據譚待介紹,豆包視覺理解模型不僅能識別視覺內容,還具備理解和推理能力,可根據圖像信息進行復雜的邏輯計算,完成分析圖表、處理代碼、解答學科問題等任務。此外,該模型有着細膩的視覺描述和創作能力。此前,豆包視覺理解模型已經接入豆包App和PC端產品。

數據顯示,截至12月中旬,豆包通用模型的日均tokens使用量已超過4萬億,較七個月前首次發佈時增長33倍。

此外,澎湃新聞記者獲悉,2025年春季將推出具備更長視頻生成能力的豆包視頻生成模型1.5版,豆包端到端實時語音模型也即將上線,提供多角色演繹、方言轉換等新功能。

字節強攻AI

在大模型賽道上,字節跳動攻勢迅猛。

市場研究機構Quest Mobile數據顯示,截至2024年1月,豆包的安裝量已經飆升至2500萬,最高訪問量超1700萬,成爲最頭部的大模型產品之一。

國泰君安證券研報指出,未來字節跳動可能形成以豆包AI爲核心的硬件產品矩陣,包括辦公、教育、陪伴等多類產品。隨着豆包模型的持續進步與迭代,若字節跳動進一步拓展以豆包爲核心的產品矩陣,相關豆包產業鏈公司將持續受益,端側AI或驅動NOR Flash用量提升。

豆包的表現在股市上也掀起一股熱潮。12月18日,A股抖音豆包概念股集體大漲,視覺中國(000681)、博瑞傳播(600880)、天娛數科(002354)、遙望科技(002291)等漲停,不過12月19日開盤迴調明顯。

在具體落地和應用方面,據譚待披露,目前國內安卓手機大部分都在和豆包合作,對手機廠商來說,會在某些場景用豆包,某些場景用其他的大模型,或者某一個場景混合使用,對企業用戶來說,肯定也需要一個多雲或者多模型的策略,“最終還是能力更好、成本更低,就會用誰,這筆賬就很好算。”

字節跳動正在AI方面形成軟硬件一體的多元化生態。當天,火山引擎還宣佈旗下兩款AI應用開發平臺——HiAgent、釦子全面升級。兩個平臺均給開發者提供了提示詞模板、插件和知識庫等一系列智能體開發元素。數據顯示,釦子平臺上已超過100萬活躍開發者,發佈超過200萬個智能體。

澎湃新聞記者從多位業內人士處獲悉,目前豆包確實在國內大模型領域位於第一梯隊,不過,強有力的增長部分源於投流。

據第三方平臺數據,截至11月15日,Kimi、豆包、星野、元寶等國內十款大模型產品今年合計投放超625萬條廣告,投放金額達15億元。