☰

DeepSeek，做AI競爭的破局者

中美大模型的差距在1-2年。起碼在今年春節之前，這還是一個獲得普遍認同的觀點。

直到中國科技公司深度求索發佈了推理模型DeepSeek-R1，用不到GPT二十分之一的成本，獲得了和OpenAI的頂尖推理模型o1相當的能力。

DeepSeek的影響很快擴散到大洋彼岸。

1月27日，美國科技股遭遇“黑色風暴”，費城半導體指數（SOX）狂瀉9.2%，創下2020年3月以來的最大單日跌幅。英偉達股價重挫近17%，市值一夜之間蒸發近6000億美元，創下美股歷史上最大的單日市值縮水規模。博通、臺積電、ASML、Google和微軟等科技巨頭也未能倖免，股價分別下跌17.4%、13%、7%、4%和2.14% 。

與此同時，歐洲科技股市場同樣哀鴻遍野，各類科技股慘遭拋售。

引發全球資本市場“強烈地震”的幕後主角——DeepSeek，不是任何發力大模型的大廠，或者創業明星，而是一家此前名聲不顯的小型科技初創公司。它由幻方量化創始人樑文鋒一手創辦，成立僅一年多。

最能喚醒讀者記憶的，可能是去年8月，DeepSeek率先宣佈其API價格大幅下調，輸入費用調整爲0.1元/百萬tokens，輸出費用爲2元/百萬tokens，隨後各家大廠紛紛跟進。大模型價格戰也就此打響。

實際上，DeepSeek的創始人樑文鋒或許是最早把目光投向AI的那批人。不僅僅是他創立了量化基金，更有意思的例證是，在算力緊缺的2023年，國內只有五家公司擁有萬塊規模的顯卡，前四位是阿里巴巴、騰訊、百度和字節跳動，剩下的那個就是幻方量化。

開源、創新、成本。在硅谷，DeepSeek被稱作“來自東方的神秘力量”。他們一面跟隨，推出類似的推理模型，一面攻擊，要求對其進行封殺甚至算力封鎖。

1月28日，DeepSeek曾連續發佈兩條公告稱，DeepSeek線上服務受到大規模惡意攻擊。

客觀來講，從產品實際表現來看，DeepSeek目前只是躋身行業第一梯隊，尚未實現對市面上現有產品的全面超越，也並非在技術底層實現了範式創新。

但DeepSeek確實爲全球AI行業的長期發展探索出了新的模式，也讓長期被硅谷霸佔話語權的AI行業出現了一些不一樣的聲音。正如AI領域泰斗吳恩達所言：“DeepSeek的創新表明，中美在生成式AI領域的差距正在迅速縮小，在某些領域中國已現領先跡象。”

01 DeepSeek，破了誰的金身？

去年12月，36氪旗下的暗涌賬號採訪了DeepSeek。採訪中提到了去年8月由DeepSeek發起的價格戰，原因指向了一個事實——與很多大廠燒錢補貼不同，DeepSeek是有利潤的。

早在去年5月，DeepSeek發佈的DeepSeekV2模型，就展現了他們非凡的效率：推理成本被降到每百萬token僅1塊錢，約等於Llama370B的七分之一，GPT-4Turbo的七十分之一。

並且相較於OpenAI公司來自全球頂尖學府幾千人的大公司人力成本，DeepSeek公司只有寥寥幾百人，也沒有全球前50的人才密度，聚集的是國內一衆大學相關學科的博碩精英人才。

更加難能可貴的是，DeepSeek-V3在訓練時使用的GPU是英偉達的H800，一款在性能上被閹割的特供AI芯片。相比之下，GPT-4o使用的是上萬塊英偉達H100芯片（性能優於H800）。

這和我們過去的認知是不同的。

英偉達及美股大跌的原因直指DeepSeek，原因在於DeepSeek的成功打破了AI大模型領域“拼投入”的慣常邏輯。AI大模型只有砸錢、砸算力才能做出來的觀念在行業中深入人心。

2023年，OpenAI的CEO奧特曼（SamAltman）曾經訪問印度，他對印度團隊能否憑藉僅 1000 萬美元的預算，在AI領域構建出具有實質性成果的模型表示懷疑。

在他看來，如果沒有上億美元的訓練成本，是煉不出好的大模型的。畢竟作爲AI行業的領軍企業OpenAI至今都尚未實現盈利，很大一部分原因在於尖端AI模型的訓練耗資驚人，運行成本也十分高昂。據測算，僅維持ChatGPT的運營，每天成本就高達70萬美元。奧特曼則表示，未來的AI模型成本預計將超過10億美元。

高昂的成本也讓後來者紛紛以OpenAI爲標杆加大投入。馬斯克旗下的xAI，其超級計算數據中心裝配了10萬顆英偉達H100 GPU芯片，成爲全球最強大的AI訓練集羣之一。特朗普上臺後，宣佈投資5000億美元啓動“星際之門”項目，試圖憑藉鉅額資金與強大算力，鞏固美國在AI領域的霸權地位。

其他科技巨頭們也在積極佈局。過去一年，微軟和谷歌的資本支出均超過 500 億美元，其中大部分資金用於AI相關的基礎設施建設，並且計劃在2025財年將這一投入提升至700 - 800億美元。國內方面，根據浙商證券的分析，2024年字節跳動的資本開支約爲800億元，預計2025年將達到1600億元，其中約900億元將用於AI算力的採購，700億元用於 IDC 基建以及網絡設備。

DeepSeek並非是擁有什麼降本魔法，而是摸索出了一條不一樣的道路。DeepSeek的研究員提出了一種新的MLA（一種新的多頭潛在注意力機制）架構，與 DeepSeek MoESparse (混合專家結構)結合，這種架構的優勢是顯存佔用僅爲常用MHA架構的5%-13%。

與此同時，和行業慣常的用數萬億token（文本單位）訓練模型不同，而是選擇通過“數據蒸餾”，降低了數據計算程度，從而實現降本。

正因爲如此，DeepSeek也有了“AI屆的拼多多”之稱，儘管這種表述可能並不完全準確，但也基本表達了DeepSeek對當前主流AI的衝擊。通過這一低成本模式使得DeepSeek能夠更快速地推出新產品和服務，並極大地降低了其市場進入門檻，可以吸引了更多企業和機構參與到AI研發中來。

02 開源會是更好的選擇？

當然，DeepSeek對AI的衝擊還不止於此。

作爲一家中國公司，DeepSeek表現出了前所未有的自信，對產品實施開源策略，也就是公開模型的代碼和架構等等，允許公衆查看、使用和修改。這就意味着，很多中小企業可以直接使用其模型，極大降低了很多企業的研發成本。

相比之下，OpenAI和谷歌等旗下的AI產品都是閉源，DeepSeek的開源和低價策略，對於國際上那些依靠高收費的主流AI工具，也將帶來巨大沖擊。

DeepSeek並不是個例，在開源浪潮席捲全球的時代，Meta的LLaMA、阿里的通義千問，都在試圖證明“開放才能贏未來”。甚至就連馬斯克也是開源技術的支持者，此前曾批評OpenAI走向閉源，稱其爲“CloseAI”，並指責其違背了最初的開源初衷而奧特曼則是埋頭向前，繼續閉源。這個爭議還不僅是打口水仗，還曾對薄公庭。

但儘管如此，依然也有不少業內人士對此嗤之以鼻。

去年，有行業人士表示：閉源大模型，纔是AI商業化的最優解。

究其原因，開源模型仍有致命傷：“所謂模型開源，往往只提供了模型的大量參數。但想要有效應用這些模型，還需要進行很多後續工作。”即便公佈參數，開發者仍難窺見參數的生成過程和數據源等核心“配方”。這種半透明狀態，導致二次開發如同盲人摸象。

“由於不瞭解這些參數的生成過程和數據源，難以直接實現‘衆人拾柴火焰高’的協同效應。即使獲取了模型源代碼，也可能不清楚訓練這些參數所使用的具體數量和比例。因此，拿到這些開源資料，並不足以讓人直接站在巨人的肩膀上輕鬆進行迭代與開發。

這也是爲什麼OpenAI能夠通過閉源在一定時間內保持了技術的領先性和獨特性，構建了自己的商業生態的原因之一。

另外，在醫療、金融等高敏感領域，閉源優勢還可以在保護技術和商業利益方面有其獨特作用，能保障知識產權安全，防止技術濫用。

但不可否認的是，DeepSeek的確迎來了填補生態位的絕佳機會。

在和暗涌的採訪裡，樑文鋒就表示，長遠來說，我們希望形成一種生態，就是業界直接使用我們的技術和產出，我們只負責基礎模型和前沿的創新，然後其它公司在DeepSeek的基礎上構建toB、toC的業務。

用戶無需付費即可享受強大AI推理能力，推動AI技術普及，讓普通用戶在日常工作生活中體驗前沿科技的便利。在開源生態上，它已吸引大量開發者，形成了蓬勃發展的社區。隨着越來越多的開發者和企業認可開源模式，DeepSeek有望進一步擴大其影響力，重塑AI產業格局。

03 一場DeepSeek風暴，揭開中美AI敘事重心的搖擺

實際上，在全球矚目的目光聚焦於DeepSeek出圈的背後，從技術領域、產業範疇到資本市場，DeepSeek都以非凡之勢打破了人們對AI發展的固有認知，掀起了一場前所未有的技術變革浪潮，在某種程度上預示着算力軍備競賽的終結。

長期以來，AI行業形成了一種依賴大規模算力與鉅額資金投入的研發模式。以OpenAI等公司爲例，它們在模型訓練上動輒投入數億美元，大規模採購英偉達最頂尖的GPU芯片，致力於構建龐大的數據中心。英偉達憑藉早期賣顯卡的業務基礎，順勢踏上AI算力的發展大潮，締造了算力芯片領域的商業神話。一時間，谷歌、OpenAI、蘋果等各路科技巨頭紛紛排隊向英偉達輸送資金，使其在AI算力市場佔據了主導地位。

然而，DeepSeek卻以顛覆性的創新打破了這一格局。它僅使用2000塊芯片，投入不到600萬美元，就實現了與行業巨頭相媲美的性能。這一成果引發了行業的深刻反思：“如果DeepSeek的創新是真實有效的，那AI公司真的還需要如此大量的顯卡嗎？”當英偉達還在爲每秒200TB的顯存帶寬而自鳴得意時，DeepSeek用一行開源代碼有力地證明了：真正的人工智能不應被算力所束縛。

根據全球半導體觀察的不完全統計，目前已有包括英偉達、AMD、微軟、亞馬遜雲科技、英特爾等國外巨頭，沐曦、天數智芯、摩爾線程、海光信息等國內GPU企業，華爲雲、騰訊雲、天翼雲、阿里雲、百度智能雲、火山引擎等雲計算大廠，以及無問芯穹、壁仞科技、硅基流動、PPIO派歐雲、雲軸科技等共計20家企業宣佈適配及上架DeepSeek模型服務。隨着多家國內外知名雲平臺和科技企業相繼上線DeepSeek大模型，AI市場迎來了新一輪的變革浪潮。

從另一方面看，英偉達股價的大幅下跌恰恰而言折射出的是在經受DeepSeek風暴衝擊下其AI芯片霸權的逐漸被終結。正如塔勒布現任對衝基金Universa Investments的顧問的警告，當英偉達把一切都建立在人們會使用你的芯片的希望之上，希望需求持續增加，同時假設不會出現軟件上的革命性改進或其他創新方法。而現在，這些假設受到挑戰，未來或將出現數倍於當前跌幅的回調。

值得關注的是，DeepSeek帶來的這種技術路徑的轉變，不僅是對美國科技霸權的有力回擊，也讓全球開發者重新認識到中國AI的巨大潛力。在美國不斷通過各種限令限制中國AI和芯片發展的背景下，這場由中國團隊發起的“效率革命”，或許將重現電動車顛覆燃油車的精彩歷程——以更低的成本、更開放的生態，讓AI從“美國巨頭的專屬玩具”轉變爲“全民普惠的實用工具”。

正如DeepSeek技術白皮書扉頁所寫：“我們並非在追趕GPT，而是在證明：通向AGI的道路，絕不止硅谷這一種走法。”從產業發展的角度來看，隨着DeepSeek不斷髮展壯大，未來將逐步採用更多國產芯片，有效降低產業鏈風險。在DeepSeek的引領下，國產芯片有望逐步從中低端邁向高端，最終擺脫對美國芯片的依賴，在全球AI產業中佔據更爲重要的地位。

DeepSeek，做AI競爭的破局者

相關資訊