AI「百模大戰」帶新風向 陸企先後出招視覺大模型

AI熱潮下各國企業加速建置AI大模型,但近期新風向吹往「視覺大模型」,也有多家陸企先後出招。(shutterstock)

隨着AI大模型研發應用熱潮持續高漲,據《華夏時報》報導,競逐賽道內的企業也開始將重心從語言大模型轉向視覺大模型。近期如Adobe、Meta、360、美圖等多家大型網路企業紛紛發表成果。例如日前美圖就發佈AI視覺大模型MiracleVision與AI視覺創作工具WHEE等7款產品,爲本就火熱的AI市場再添一把新火苗。

同時值得注意的是,近日在華爲開發者聯創日的深圳首站上,華爲AI技術規劃專家王琛表示,當前正處於第二代AI朝向第三代AI交替的階段,現在的AI是「知識+數據驅動」,意味將使AI的系統具有常識經驗推理等人類思考的能力。而從華爲開發者聯創日上了解到,在接下來的7月,華爲雲盤古大模型將有重大升級。

據《中國人工智慧大模型地圖研究報告》顯示,從全球已發佈的大模型數量及分佈來看,大陸和美國大幅領先,超過全球總數的80%。同時歐洲、俄羅斯、以色列等越來越多研發團隊也投入研發。但大陸在電腦視覺等領域的大模型還較少。

目前除了美圖跨入視覺大模型之外,另一家陸企360日前也正式發佈「360智腦-視覺大模型」。360創始人周鴻禕表示,大語言模型是構建視覺大模型的基礎,多模態能力增強的核心是藉助大語言模型的認知、推理、決策能力。同時視覺大模型也是「360智腦」的重要能力組成,能夠看懂圖片,未來還能看懂影片、聽懂聲音。

競逐該賽道更不光只有大陸內部,跨國企業也同樣進行佈局。日前,社交媒體巨頭Meta宣佈,將向研究人員開放一個名爲I-JEPA的「類人」AI模型的部分元件,可比現有模型更準確地分析與完成未完成的圖像,而非像其他生成式AI模型只根據附近的圖元進行推斷。