DeepSeek引發人工智能領域大戰 阿里巴巴應戰 發佈最新模型版本

FX168財經報社(北美)訊 中國科技巨頭阿里巴巴週三(1月29日)發佈了其Qwen 2.5人工智能模型的新版本,它聲稱該模型超過了廣受好評的DeepSeek-V3。

Qwen 2.5-Max在農曆新年的第一天發佈,這表明中國人工智能初創公司DeepSeek在過去三週的飛速崛起不僅給海外競爭對手帶來了壓力,也給國內競爭對手帶來了壓力。

阿里巴巴的雲部門在其官方微信帳戶上發佈的公告中表示,Qwen 2.5-Max的性能幾乎優於GPT-4o、DeepSeek-V3和Llama-3.1-405B。

1月10日發佈的由DeepSeek-V3模型提供支持的DeepSeek人工智能助手,以及1月20日發佈的R1模型,震驚了硅谷,導致科技股暴跌,這家中國初創公司的低開發和使用成本促使投資者質疑美國領先的人工智能公司的鉅額支出計劃。

但DeepSeek的成功也導致其國內競爭對手爭相升級自己的人工智能模型。

在DeepSeek-R1發佈兩天後,抖音所有者字節跳動發佈了其旗艦AI模型的更新,它聲稱該模型在AIME中的性能優於微軟支持的OpenAI的o1,這是一個基準測試,用於衡量人工智能模型對複雜指令的理解和響應程度。

這呼應了DeepSeek的說法,即其R1模型在幾個性能基準上與OpenAI的o1相媲美。

DeepSeek與國內競爭對手

DeepSeek的V3型號的前身DeepSeek-V2在去年5月發佈後,在中國引發了一場人工智能價格戰。

事實上,DeepSeek-V2是開源的,而且價格空前便宜,每100萬個代幣(或由人工智能模型處理的數據單位)只需1元人民幣(0.14美元),這導致阿里巴巴的雲單位宣佈在一系列型號上降價高達97%。

其他中國科技公司也開始效仿,包括百度。

DeepSeek的神秘創始人樑文峰在7月接受中國媒體Waves的罕見採訪時表示,這家初創公司“不關心”價格戰,實現AGI(人工智能)是其主要目標。

OpenAI將AGI定義爲在最具經濟價值的任務中超越人類的自主系統。

雖然像阿里巴巴這樣的中國大型科技公司擁有數十萬員工,但DeepSeek的運作就像一個研究實驗室,主要由來自中國頂尖大學的年輕畢業生和博士生組成。

樑文峰在7月的採訪中表示,他認爲中國最大的科技公司可能不太適合人工智能行業的未來,將其高成本和自上而下的結構與DeepSeek的精益運營和鬆散的管理風格形成對比。

他說,大型基礎模型需要持續創新,科技巨頭的能力是有限的。