通義千問2.5版問市 阿里雲自信:全面趕超GPT-4Turbo

阿里雲9日發佈通義千問2.5版本,並稱第三方平臺評測分數顯示其已追平GPT-4 Turbo。(取材自澎湃號)

阿里巴巴旗下阿里雲通義家族再添新成員,9日,阿里雲正式發佈「通義千問2.5版」,並稱該模型的性能將全面趕超GPT-4 Turbo。

綜合上海證券報、新華財經指出,9日,「通義千問2.5」版本在阿里雲AI高峰會上正式發佈。同時,阿里雲公佈最新數據顯示,通義大模型透過阿里雲服務企業已超過9萬家、透過釘釘服務企業超過220萬家,且截至目前通義開源模型累計下載量突破700萬。

阿里雲指出,相比「通義千問2.1」版本,「通義千問2.5」的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%。其中,在權威基準OpenCompass上,「通義千問2.5」的得分追平GPT-4 Turbo,是該基準首次錄得中國國產大模型取得該成績。

阿里雲強調,「模型效能全面追趕GPT-4 Turbo,在中文大模型方面領先業界」。同時,通義千問最新開源的1100億參數模型在多個基準評估中收穫最高得分,超越Meta的Llama-3-70B,成爲開源領域中表現最佳的模型之一。

同日,在阿里雲峰會上還透露,小米旗下人工智慧助理「小愛同學」已與阿里雲通義大模型達成合作,要強化其在圖片生成、圖片理解等方面的多模態AI生成能力,並在小米汽車、手機等多類設備落實。

另外,在微博、完美世界遊戲、衆安保險等企業也宣佈接入通義大模型,將大模型應用於社羣媒體、保險、遊戲等領域。據悉,此前新東方、同程旅行、長安汽車、西部機場集團、親寶寶等企業也都與通義大模型合作。這也顯示通義落實應用的進程加速,現已進入PC、手機、汽車、航空、天文、礦業、教育、醫療、餐飲、遊戲、文旅等領域。

公開資料顯示,通義大模型問世一年多以來,目前發展出文生圖、智慧編碼、文件解析、音視頻理解等能力,企業客戶和開發者可以透過API呼叫、模型下載等方式接入義,個人用戶可從通義APP、官網和小程式免費使用通義家族全端服務。