法媒:“深度求索衝擊波”帶來三點啓示
參考消息網3月4日報道 中國初創企業深度求索(DeepSeek)引發的衝擊波尚未消散。
“不久前,深度求索還默默無聞。如今是抱抱臉平臺上全球關注度最高的。”美國抱抱臉公司產品經理傑夫·布迪耶指出,“關注深度求索的用戶比微軟、開放人工智能研究中心(OpenAI)和谷歌加在一起還要多。這是一場真正的地震,一場海嘯。”
我們能從這個顛覆人工智能的中國模型中獲得怎樣的啓示?
第一,美國巨頭並非不可戰勝。
就在幾個月前,美國科技公司的霸主地位似乎還不可動搖,但現在不再那麼明顯。這種至高無上似乎基於一個無法替代的優勢:它們有能力投資數百億甚至數千億美元,哪怕會虧損。深度求索無疑以較小的投資取得了成功,並讓人對美國模式產生疑問。
自聊天生成預訓練轉換器(ChatGPT)推出以來,谷歌、元宇宙平臺公司、微軟和亞馬遜這些大型科技公司參與了一場巨頭競賽,計算能力被視爲提高人工智能模型性能的最可靠手段之一。
初創企業也非常需要資金。開放人工智能研究中心於去年10月融資66億美元之後,目前正與軟銀商談再融資數百億美元。
但深度求索的成功證明,模型的規模並不代表一切。這給中國和歐洲企業都帶來了希望。“深度求索的成功表明,所有國家都能在人工智能領域發揮自己的作用,此前這一點並不明顯。”抱抱臉公司聯合創始人兼首席執行官克萊芒·德朗格強調說,“全世界都在努力追趕。”
第二,美國的制裁政策失敗。
通過禁止英偉達向中國出口最先進的芯片,美國政府希望能長久遏制中國人工智能的崛起。深度求索的成功證明,這一戰略並不正確。
美國的技術限制措施可能激發了中國工程師的創造力。爲了在節省芯片成本和時間的同時達到最佳效果,深度求索的研究人員用了很多辦法。值得一提的是,他們在訓練模型時儘量避免人爲干預。這家中國公司還決定將最大的模型“蒸餾”成幾個較小的模型,這樣所需的計算能力就更低。
第三,硅谷缺乏競爭。
在人工智能競賽中,建立先進的模型需要具備三個要素:獲得最優秀的人才、用於訓練模型的圖形芯片以及大量數據。美國科技巨頭似乎掌握着拓展技術邊界的所有手段。
但市場過於集中可能會讓新參與者望而卻步,而且擁有數萬名員工的美國科技公司有時過於官僚,不敢嘗試建立人工智能模型的新方法。
深度求索借鑑了美國人建立模型的精神,同時避免了某些與規模相關的陷阱。“爲什麼硅谷那麼有創新精神?首先是敢。”深度求索創始人樑文鋒去年曾說,“聊天生成預訓練轉換器問世之初,中國科技界對前沿創新缺乏信心。”
一年後,中國在創新方面給美國上了一課。通過將DeepSeek-R1模型開源,中國也爲研究人員、公司甚至個人提供了在其基礎上建立自己的人工智能模型的機會。
對於美國科技巨頭來說,一切都還沒有結束,遠遠沒有。爲了在人工智能模型普及的大潮中生存下來,它們可以提供儘可能貼近消費者需求的服務,而這就意味着要利用深度求索這樣的模型來構建應用。(編譯/趙可心)
本文由法國《回聲報》網站2月27日發表,原題爲《深度求索海嘯帶來的三點啓示》,作者是奧爾唐絲·古拉爾。