經濟日報:DeepSeek能否開啓全民AI時代
近來,中國人工智能(AI)公司深度求索(DeepSeek)發佈的開源大模型DeepSeek-R1火遍全球,引發業內熱議:全民AI時代是否已經到來?
過去兩年多,以OpenAI爲代表的美國公司開啓並引領了人工智能大模型投資熱潮,因爲不缺芯片和算力,其主流思路是“越大越好”——以更強算力、更多數據訓練更大的模型,來獲得更高性能。這讓大模型能源消耗巨大,訓練成本驚人,也帶來了商業推廣難題:大模型投不起,小模型不好用。
DeepSeek改變了這一格局。他們在模型架構和訓練過程中進行深度優化,在大幅降低計算資源消耗的同時,躋身世界頂級AI大模型之列,實現了“低成本”與“高性能”的兼得。同時,與OpenAI的閉源策略相反,DeepSeek免費開源其大模型,明示全部技術路線,更加推動了大模型技術從“奢侈品”向“日用品”的轉變。
從技術進步角度看,低成本開源大模型開啓競爭新賽道,AI的未來更值得期待。
低成本是技術普及的基本要求,買得起才能讓千家萬戶用得上。小汽車、個人電腦、手機的普及都是如此,人工智能產業大概也不會例外。這幾年,企業界和科技界已經爲降低大模型成本作出了大量努力,DeepSeek模型正是其中的傑出成果,證明“此路可通”。
但大模型價格還沒有降到底。在降本增效這條路上,DeepSeek並非終點,而是一個新的起點。開源代碼、開放API(應用程序編程接口)及訓練方法,吸引全球開發者參與技術迭代。1月20日R1推出後,各國AI技術人員掀起“DeepSeek復現熱潮”。有美國科研團隊聲稱,僅用幾十美元成本租用雲計算資源,便復現了模型。
DeepSeek使用專家混合架構MoE實現了更高的成本效益。而就在2月12日,字節跳動豆包大模型團隊宣佈推出全新的稀疏模型架構UltraMem,優化了推理性能,使得推理速度較MoE架構提升了2倍至6倍,推理成本最高可降低83%。
從商業應用角度看,DeepSeek重塑AI生態鏈,大模型展現了巨大商業潛力。
美國的AI龍頭公司一方面誇大開源AI的安全風險,力圖通過監管抑制開源AI,另一方面又用巨大投入擡高大模型准入門檻。這就形成了“金字塔”生態,科技巨頭壟斷大模型,中小企業依賴API。
而開源模型對於全球AI供應鏈至關重要,廣大發展中國家尤其需要開源AI技術。開源模型讓每個開發者都能輕鬆調用強大的AI工具,不再受大公司的約束,AI的進化速度和普及程度都明顯提升。
連日來,上市公司接入DeepSeek模型的公告刷屏,令人驚呼“所有上市公司都在接入DeepSeek”。這體現了市場對於低成本、高性能開源大模型的渴求。當各行各業的開發者在開源框架上搭建文本創作、智能客服、醫學影像診斷等各類應用時,新的生態系統已應運而生。
當然,開啓全民AI時代,還面臨許多挑戰。開源模式依賴社區貢獻,需建立激勵機制避免碎片化,也要在開源與商業化之間取得平衡,以利於生態系統的可持續發展。讓AI適配智能眼鏡、手機等邊緣計算設備,要有更好的模型壓縮技術。通用模型在垂直場景易“水土不服”,需結合行業知識庫定製化開發,要抓緊制定行業數據共享與安全標準。防範算法歧視與就業衝擊,還要加強AI倫理教育,構建“技術—法律—社會”協同治理框架。
人工智能是引領未來產業的科技。我們不僅要做技術突破者,更要做規則重構者,要讓人工智能大模型從“精英遊戲”變成“全民紅利”。
(經濟日報)