DeepSeek爲何能震撼全球?
在AI領域存在着“規模定律”,即模型性能會隨着模型參數、訓練數據和算力的指數級增長而線性提高。過去幾年,AI模型主要通過預訓練階段的規模堆積來提升能力,但這一路徑逐漸因數據耗盡和合成數據質量問題而放緩,讓市場一度陷入了大模型發展滯緩、陷入瓶頸的懷疑。
在這一關鍵時刻,DeepSeek-R1橫空出世,通過精心設計訓練流程和應用新算法,極大地提高了算力使用效率,有效解決了產業發展的痛點,僅投入557.6萬美元,藉助2048塊英偉達H800GPU,就完成了性能可對標GPT-4o的模型訓練,成本僅爲OpenAI同類模型的十分之一,推理成本更是低至每百萬Token0.14美元,而OpenAI則高達7.5美元每百萬Token,讓用戶能用更低成本享受到近乎頭部模型的體驗。
DeepSeek的顛覆性意義深遠:它打破了以往算力和芯片投資“大力出奇跡”的固有觀念,告訴市場:AI競賽不只是芯片納米級技術的比拼,而是算法效率、生態活力與政策彈性的多維度較量。同時,通過成本優勢和開源策略,實現了一定程度的AI平權:在OpenAI等閉源模型禁止用戶蒸餾模型時,DeepSeek成功追趕,並將創新成果全部開源、鼓勵業界基於其成果進行蒸餾,或許這纔是真正的“OpenAI”。
其創始人樑文鋒曾表示:“我們希望更多人,哪怕一個小app都可以低成本去用上大模型,而不是技術只掌握在一部分人和公司手中,形成壟斷”。
在“規模定律”放緩的大背景下,DeepSeek成功追趕OpenAI等全球領先的模型,讓中美之間的大模型技術差距進一步縮小,也得以讓外資重視起處於估值窪地的中國資產,前期因中美芯片限售估值承壓的中國互聯網資產價值得到顯著提升。高盛發佈研報稱:DeepSeek的崛起,爲中概科技股帶來了中長期價值重估的機會;德意志銀行表示,2025年將是中國企業在全球崛起的一年,中國股票估值折價的現象將消失。
大多數全球AI從業者對於DeepSeek低價策略和開源的反應是:興奮、激動,因爲它大幅降低了AI技術的應用門檻,讓下游企業和開發者能夠以低成本使用先進的AI技術,將AI行業推動進入了一個更加開放、低成本、高普及率的新階段。早在之前,其創始人樑文鋒就曾表示:“希望構建一種生態,由DeepSeek負責基礎模型和前沿創新,其他公司在此基礎上開展toB、toC業務”。
DeepSeek通過“低成本+高性能+開源”組合,將推動各行業AI應用的快速滲透與商業化落地:主要體現在技術普惠(降低門檻)、效率提升(開發與運營優化)和生態共建(開源社區繁榮)三方面,同時重構全球AI競爭格局,加速端側智能與行業數字化轉型進程。