中國的AI時代,不能沒有“根”

(原標題:中國的AI時代,不能沒有“根”)

1973年,中國電子工業部發動大學和相關研發機構一起,首次聯合設計了中國自主的、擁有一致指令系統、看齊美國計算機標準的全新“1000系列機”。最終在衆多科研人員的共同努力下,只花了一年2個月,看起來就像是三臺冰箱並排放的DJS-130計算機橫空出世。

作爲中國第一個形成產業規模的系列機,它在日後足足生產了2000多臺,並且被應用到國民經濟和國防的多個領域,是中國計算機發展史上重要的里程碑

就在中國的科研人員還在熟悉這臺用各種電子元件組件起來、只有13條引導程序的計算機,用極爲傳統的穿孔帶來輸入和輸出結果的同時。大洋對岸的美國,卻已經半步跨進了“PC時代”。

包括惠普、IBM在內的公司已經用上了微型化的電腦處理器,將電腦縮小爲電視大小,同時在原有代碼系統的基礎上引入圖形化接口概念,由針對私人公司設計轉向個人使用的電腦概念。在個人電腦的龐大需求下,越來越多新技術和新產品橫空出世,其中就包括了英特爾1978年推出的第一款X86處理器8086,以及微軟1981年推出的第一代Windows系統MS-DOS。

因爲在技術積累的投入上的巨大差別,中國最終還是“錯過”了PC時代的浪潮。之後引領整個PC行業發展的,一直是美國和歐洲的企業。哪怕聯想最終憑藉“貿工技”路線走上全球PC銷量冠軍,但相當一部分利潤仍要被歐美的處理器公司拿去。

這種情況,進入了以智能手機和平板電腦爲代表的“後PC時代”才發生了一定程度的轉變。因爲“(前)PC時代”的深厚積累,以美國、歐洲爲主的一批企業依舊主導了消費電子產品的早期發展。

但這一次我們有了3個重要籌碼:第一個是領先全球的消費電子代工能力;第二個是全球最大、最普及的移動通信網絡;第三個是全球最爲集中、消費意願最強烈的客戶

最終讓中國的消費電子產業在3G、4G、5G的推動下獲得了長足的發展。最典型的例子莫過於華爲,短短20餘年間,從一家生產電話交換機的小廠,最終成爲了全球IT通信製造業的巨頭,同時在手機、手機SoC處理器、4G/5G技術、通信基站等多個領域完全不弱於甚至超過發達國家公司的存在。

雖然我們最終在“後PC時代”的尾聲追上了技術發展的浪潮,但隨着“人工智能時代”這一全新階段的出現,新挑戰也已經出現——中國應如何保證在“人工智能時代”不落後,甚至領先全世界。

答案在我看來就是3個字:根技術。

顛覆的人工智能

無論是“PC時代”還是“後PC時代”也好,其最底層核心,依舊是通用計算能力,也就是CPU(中央處理器)在支撐。相比之下,人工智能時代因爲算法上的整體改變,在整個技術體系上發生了重大的改變。

這其實要從原理上說起,CPU的核心是根據半導體特性打造的邏輯和計算電路,人類編程員根據CPU的二進制算法特性,寫出CPU可以高效邏輯判斷和計算的程序。

相比之下,人工智能則是建立在對人類的算法“模擬”上,準確地說是對人類大腦工作模式的模擬。在這個基礎上結合人類自我對於不同任務的邏輯判斷思路,構建神經模型,然後利用大量的現實數據訓練神經模型,最終得到一個可以用來應用、推斷的神經模型。

是不是有點抽象?我們不妨結合通用計算和人工智能的兩個重要里程碑來對比一下。

1992年IBM斥巨資打造了超級計算機“深藍”,利用數個機櫃以及多達480顆特製的“象棋處理器”戰勝了人類國際象棋大師。但在原理上,“深藍”所做的事情並不複雜,依舊是窮舉,而且不是無限窮舉。

在當時,人類的象棋大師大概能夠算到之後10步棋的所有情況,而深藍則能夠算到12步棋的所有情況。理論上能看到更多未來棋局可能性以及對應優劣,並且更不容易犯錯的深藍肯定會獲勝,但在其第一次挑戰中實際上輸給了人類國際象棋大師。後來又調整優化了一年以後,終於雪恥。

2015年,Google旗下AI創業公司DeepMind發佈了圍棋人工智能AlphaGo,並且直接約戰當時的世界圍棋冠軍。作爲人類迄今爲止最爲複雜的棋盤類遊戲,圍棋理論上走法更是達到10的171次方。每一步棋都有多種下法,並且都會對整盤棋最終結果產生影響。這也是爲什麼人類一直堅信:機器無法通過簡單窮舉運算,在圍棋上打敗人類。

但用深度學習能力“武裝”了自己的人工智能還是出乎了人們的意料,直接以4:1擊敗了人類世界冠軍李世石。更關鍵的是,在這次比賽中,人工智能展現出了與人類過去3000年圍棋歷史完全不一樣的下法策略。你也可以說,人工智能遠不只是擊敗了人類,反而是在不斷對圍棋的學習中,開闢出了一整套全新的、勝率更高的走法。

從這次比賽開始,一股新潮流開始在世界最頂尖的圍棋圈開始蔓延,這些頂尖棋手們在研究學習了人工智能的下法之後,紛紛採用了其中的一些思考和招式。以中國圍棋選手柯潔爲例,就曾專門表示“感謝AlphaGo給我們棋界帶來的震撼”。

就核心能力而言,通用計算可能是“替代+加速”,人工智能則是“擬人+創新”。這顯然不在一個維度上。

更重要的是,在AlphaGo之後,越來越多的企業開始將人工智能應用在各行各業上。在翻譯、語音識別、大數據、自動駕駛、目標識別等多個應用場景中都表現出了充足的顛覆性,只要有足夠龐大的數據集,就能生成遠超人類編程水平的神經模型和算法,最終實現遠超人類編程的計算效果。

顯而易見,人工智能一直都是中國不能錯過的浪潮。

紮根,中國迎接人工智能時代的重要保障

事實上,儘管中國在人工智能產業的發展上取得了一定的成績,但隱憂同樣存在:相比美歐這樣人工智能底蘊更充實的“老玩家”,中國在人工智能根技術上的積累薄弱不少。

根據頭豹研究院的《2020年中國人工智能產業投融資報告》統計,截至2019年2月,中國AI相關企業數量爲745家,約佔全球21.7%,其中67.3%創立於2010-2016年間。 “年輕”的中國AI企業們,多數是在2015年標誌性AlphaGo圍棋人工智能事件之後成立的。

AI企業整體偏年輕,對應的結果是這類企業更多專注在AI應用層,極少企業涉足底層的AI根技術。在上方統計的745家AI相關企業中,75.2%爲應用層企業,22%爲技術層企業,僅2.8%的企業位於基礎層。

而就重要性而言,人工智能時代“根技術”的影響力將會遠超PC時代和消費電子時代。所謂“根技術”是指那些能夠衍生出並支撐着一個或多個技術簇的技術。根技術是技術樹之根,爲整個技術樹持續提供滋養,很大程度上決定着技術樹的榮枯。

雖然同樣是由計算機硬件軟件完成整個過程,但是因爲從整個計算邏輯上不同於傳統的CPU和人工編程,所以人工智能的技術棧與以PC爲代表的通用計算產生了許多差異。

從整體上來說,人工智能的技術棧主要分爲四部分,最底層的硬件基礎設施、中層的軟件基礎設施、更上層的技術層、以及最上層的應用層。其中應用和技術層因爲更偏向應用和解決方案,合起來一起作爲應用與技術層。其中硬件基礎設施部分還可以分爲AI處理器和AI硬件設備;軟件基礎設施則可以再分爲處理器使能、AI框架以及開發使能平臺

而“根技術”最核心的存在就在於“軟件基礎設施”和“硬件基礎設施”這兩部分。這一點我們也可以從英偉達、谷歌這類更早進入人工智能的巨頭的佈局中看出。

以英偉達爲例,其GPU產品最早被AI研發用於深度學習訓練和推理,英偉達在不斷優化自己產品AI運行效率的同時,也進一步深化到設備層,除了各種規格尺寸的人工智能GPU之外,還專門針對不同的場景應用打造成不同的解決方案,有名片大小的Jetson、也有專門針對自動駕駛場景的Drive系列產品,更有直接用超高速網絡將數顆GPU聯合成“超大”GPU的DGX。

在軟件基礎設施上,英偉達推出的CUDA解決方案更是影響深遠,而在AI框架上,英偉達直接採用了谷歌的TensorFlow和Facebook打造的PyTorch。這是因爲英偉達選擇將更多的精力放在了技術層上,通過應用SDK深入行業深入應用。

其次是谷歌,谷歌不但鼓勵子公司DeepMind推進AlphaGo項目。同時爲了給AlphaGo提供充足的算力,谷歌還研發了專用於人工智能的TPU處理器。並且將TPU主機服務器化,放入了自己的雲服務體系中。在後續的幾年中不斷更新TPU處理器版本和其解決方案,最終更將TPU作爲一種雲服務業務內容,向廣大的客戶開放。

除了兩家在“根技術”上的發力,還有一點尤爲值得關注,就是人工智能全棧路的技術佈局協作:英偉達用CUDA串起了自己最擅長的GPU硬件和之上的整個軟件架構生態,谷歌則根據自己人工智能技術的豐厚積累,做出了行業內最受歡迎的AI框架TensorFlow。

縱觀谷歌和英偉達這兩家全球人工智能產業最領先的公司,它們都不約而同地選擇了同時佈局AI根技術的關鍵節點,通過關鍵節點之間的協作,進而讓自己的人工智能生態能力和效率最大。

最重要的是,核心公司的人工智能生態,還會隨着時間的推移,輻射到整個國家,乃至全球的人工智能產業,形成公司、國家在人工智能產業中的潛在話語權。

中國發展人工智能產業依然需要“彎道超車”乃至“後發制人”,而接下來唯一的關鍵——發展自己的人工智能。

破局人工智能,中國企業該做些什麼?

最首要的,也是中國企業目前最大的短板,就是人工智能的基礎硬件。更具體的說,包括了AI處理器以及利用處理器打造的各種解決方案。

原因主要有三點,一是AI硬件是AI應用推廣的主要邊界,尤其是像智能手機、物聯網、智慧城市等強調端側數據採集和處理的場景,需要的往往是量身定製的AI計算能力和緊湊的解決方案;其次是處理器架構和開發方式上要實現高度統一;最後是基礎硬件的自主創新問題。

除此之外,爲了把這些基礎硬件發揮出最大價值,還必須爲其配套高效軟件基礎設施,主要包括“芯片使能”、“AI框架”、“開發使能平臺”。

要一口氣在這麼多環節取得進展乃至突破,顯然不是易事,但中國的許多企業們在這些年裡還是交出了不少成績。一大批AI處理器、AI算法公司應運而生,紛紛開始填補AI根技術的空白,例如現在不少造車新勢力就正在將國外的AI處理器換成國內創業公司的產品。

在AI框架和開發端取得進展的就更多了,不僅有百度騰訊這樣的互聯網巨頭長期重金佈局,在細分的應用場景中,例如語音語義中的科大訊飛,又例如智慧城市應用領域中的“AI四小龍”。

從追求佈局整體性和前瞻性出發,目前進展最大的是華爲。華爲的人工智能是一條以“根技術”爲核心抓手的發展之路。目前,昇騰計算產業從基礎硬件到基礎軟件層已形成了全棧全場景的“根技術”佈局,且在雲、邊、端側都部署了統一架構的昇騰系列解決方案,其基礎軟件層的異構計算架構CANN和AI開發框架MindSpore不僅能優化流程,也能與昇騰硬件基礎進行深度的優化整合,進行全棧調優。在這些根技術之上,AI開發平臺MindX也進一步加快了AI應用的開發部署。

中國的AI時代,不能沒有“根”。隨着中國人工智能產業建設的深入,我們也將看到會有越來越多的中國AI企業,深耕於人工智能“根技術”的產品與業務。發展具有自主創新“根技術”一定是中國建設人工智能產業的共識。儘管在破局人工智能發展上,我們依然會面臨挑戰,但中國AI公司已經用過去數十年的努力證明了一點:在全球AI根技術競賽中,中國同樣有機會實現追趕乃至超越。