階躍星辰CEO 姜大昕:多模態大模型是通向 AGI 的必經之路

7月5日消息,2024世界人工智能大會暨人工智能全球治理高級別會議(簡稱“WAIC 2024”)上,階躍星辰首發了三款 Step 系列通用大模型新品:Step-2萬億參數語言大模型正式版、Step-1.5V 多模態大模型、Step-1X 圖像生成大模型。

據悉,自今年三月正式公佈以來,Step 系列通用大模型在短短100天左右實現了從千億參數到萬億參數,從語言模型到多模態模型,從理解到生成的全面進步。

具體來說,最新發布的 Step-2萬億參數語言大模型正式版,採用了MoE 混合專家模型架構。同時,基於階躍星辰的系統能力,Step-2大幅提升了訓練效率,在數學、邏輯、編程、知識、創作、多輪對話等方面體感全面逼近 GPT-4,企業和開發者可以通過階躍星辰開放平臺申請體驗。

與此同時,新升級的 Step-1.5V 千億參數多模態大模型,在圖像感知和理解能力上全面提升,並具備出色的視頻理解能力。它能準確地識別視頻中的物體、人物和環境,並理解視頻的整體氛圍與人物情緒。在 Step-2萬億參數大模型的加持下,Step-1.5V 推理能力大幅增強,能根據圖像內容進行解答數學題、編寫代碼、創作詩歌等高級推理任務。

新發布的 Step-1X 圖像生成大模型,則代表了階躍星辰在推動多模態理解和生成統一的技術路線上取得重要進展。它採用全鏈路自研的 DiT(Diffusion Models with transformer)模型架構,支持600M、2B、8B 三種不同的參數量,能夠滿足不同場景的需求。Step-1X 具備更加強大的語義對齊和指令跟隨能力,還針對中國元素和文化進行了深度優化,更具中國風格。

階躍星辰創始人、CEO 姜大昕博士表示:“攀登 AGI 山峰,‘萬億參數’和‘多模融合’缺一不可。萬億參數規模,是實現 AGI 的基礎門檻;多模態大模型,是通向 AGI 的必經之路。面向未來,我們會繼續將模型做大做強,打造超級模型,同時讓模型服務於工作和生活,十倍每個人的可能。”

現場,階躍星辰還在 WAIC 展示了面向 C 端用戶的自研產品,以及與行業頭部公司在促進大模型生態應用方面的最新成果與計劃。(定西)

本文來自本站科技報道,更多資訊和深度內容,關注我們。