追趕與超越(觀象臺)

■ 宋海濤

在日前法國巴黎舉行的人工智能行動峰會上,中國人工智能大模型深度求索(DeepSeek)備受關注。

DeepSeek之所以“走紅”國際,主要是因爲它驗證了一種低成本、高效率的大模型開發路徑。其核心價值在於通過算法創新突破算力瓶頸,成功打破了“算力崇拜”“製程優勢等於技術霸權”的固有觀念,大大增強了業界對於開源道路探索的信心。同時,DeepSeek鼓勵更多AI企業和科研機構迴歸基礎研究,推動全球AI行業向更加多元化的方向發展。

從AI技術層面來看,其顯著優勢體現在幾個方面:一是在基座模型和推理模型上,DeepSeek通過硬件資源、模型架構和算法的協同設計與優化,打造了性能接近全球領先水平的基座模型。其創新推理模型顯著降低了推理時的硬件需求,使模型能夠更好地適應不同的任務和使用場景。二是在訓練和硬件設施上,DeepSeek訓練效率顯著提升,這些技術優化使得模型在有限資源下能夠快速迭代,提升研發效率。三是在高質量數據獲取和處理上,DeepSeek通過知識蒸餾和精細的數據清洗與合成等方式,顯著提升了模型性能。

DeepSeek的成功,是中國AI科創“新勢力”崛起的一個縮影。當前,中國在計算機視覺、中文自然語言處理、自動駕駛與智能交通、通用智能機器人等領域已具備較強國際競爭力。如今日漸家喻戶曉的杭州“六小龍”以及擁有領先計算機視覺技術的商湯科技、激光雷達領域堪當“龍頭”的禾賽科技、開啓人形機器人商業化量產的智元機器人等紮根上海的企業,都展現出強大的創新動能。

中國人工智能創新技術持續出現,得益於多方面因素支撐。一方面,中國前瞻性部署以及不斷完善的頂層設計和產業佈局,爲推動人工智能技術和產業蓬勃發展提供重要保障。另一方面,龐大的互聯網用戶羣體爲中國技術創新提供全球領先的數據資源,超過10億的互聯網用戶創造了海量用戶行爲數據,不僅爲大模型的訓練優化提供基礎,也爲多元化的應用場景落地提供肥沃土壤。此外,中國人工智能高水平教育全面開展、高素質人才迅速回流,爲中國AI創新提供源源不斷的人才支持。國內頂尖高校和科研機構大力推進人工智能學科建設,培養大量AI青年才俊,政府、高校、企業多方主體共建人工智能聯合實驗室、新型研發機構等創新主體,進一步推動產學研用一體化發展。另外,國產深度學習框架以及開源生態的積累和沉澱正在加速國產AI技術實現自主可控的進程。

當前,從全球範圍來看,美國和中國無疑是AI發展的兩大主力。得益於強大的科研基礎、人才資源聚集和資本市場支持,美國依舊處於技術創新的領先地位,特別是在大模型和高端芯片方面。中國憑藉豐富的數據資源、多樣化應用場景,在智能製造、智慧城市、智慧金融等應用落地以及計算機視覺、語音識別等基礎研究方面取得了一定進展。近年來,中國在人工智能技術創新方面取得顯著突破,尤其是像DeepSeek這樣的國內AI初創企業,提高了中國企業在基礎大模型領域的話語權,標誌着中國人工智能產業逐漸從“規模追趕”邁向“效率超越”。

以DeepSeek爲代表的AI初創型企業的“成功秘訣”,也再次提示一個AI領域發展的獨特規律:在要求“深度求索”的AI領域,不設包袱、極致熱情、鼓勵探索的創新企業會更容易成爲“黑馬”。注重創新驅動的發展模式、鼓勵員工自主探索和動態協作等AI創新發展的經驗,也將鼓舞更多科技創新企業突破發展瓶頸、在創新之路上馬不停蹄,共同探索前沿科技的“深海區”。

(作者爲上海交通大學上海人工智能研究院院長、聯合國工業發展組織全球工業人工智能聯盟卓越中心總幹事,本報記者高喬整理)