智見|黃鐵軍:未來的大模型生態中將會只有少數贏家
2023智源大會可謂羣星璀璨。中外200餘位人工智能頂級專家參會,人工智能領域最關鍵的人物、機構悉數亮相。
全面、專業、前沿,會場上大咖們觀點激盪、多元碰撞,會場下觀衆們興奮異常、座無虛席。
會上,北京智源人工智能研究院院長黃鐵軍作報告,發佈悟道3.0大模型系列,並宣佈進入全面開源的新階段。
作爲智源研究院院長,中國大模型推行第一人,黃鐵軍的看法令人期待。他是如何看待通用人工智能發展現狀與未來趨勢的?開源開放創新生態如何建設?安全倫理問題和風險又將如何防範?本站科技與黃鐵軍進行了深入交流。
以下爲採訪全文:
提問:最新發布的“悟道3.0”特點是什麼?其過人之處在哪?
黃鐵軍:首先,視覺模型目前仍處於解決問題的過程中,與語言模型相比,它的發展和應用還不如後者那麼廣泛。但是,我們在視覺模型方面的目標是保持領先地位,以及在算法、架構和性能等方面始終保持最前沿。我們發佈的視覺模型都是爲實現這個目標而設計的。
另外,我們是開源開放的,所有人都可以測試、對比我們的模型。雖然我們無法排除某些公司有更大、更好的模型的可能性,但從我們的定位來看,我們的算法背後的模型處於前沿位置,這一點是毋庸置疑的。
談過人之處,其實不同的大型模型訓練的基本思想和思路是相似的。過人之處往往體現在細節上面。比如通過避免問題陷阱,以更小的代價訓練出性能更好的模型。在這方面,我們和其他視覺模型機構一樣,都處於一個發展前期的階段。
ChatGPT已經成爲語言模型的一個里程碑,視覺模型的相應時刻也已經接近。但是,要真正引爆視覺模型的發展,可能需要一種殺手級應用來激發人們的熱情,並展示模型背後的能力。
從現在看,未來自動駕駛可能成爲這樣的應用。即使在技術上有多少先進性,只有在自動駕駛汽車真正滿街跑起來,駕駛員下崗下車,AI的視覺和感知能力比人更強時,所有人才會像對待語言模型一樣心服口服,視覺模型也才真正能夠引爆。
這個時刻的出現其實並不會太長,大概也就1-3年。達到能力是前提,但產業成熟還需要一定的時間。我相信大多數人都認爲語言模型已經通過了圖靈測試,無法分辨是人還是AI。如果視覺模型也能夠通過類似於自動駕駛的圖靈測試,明顯優於人類的感知和安全能力,那個真正的時刻就到來了。
提問:從算法、算力和數據三個維度來看,目前大模型發展的制約點在哪裡?我們發展大模型還應該在哪個方面發力?
黃鐵軍:如果從算法、算力、數據三個維度來看,目前最主要的制約點是中國訓練大模型都還是太小。雖然已經出現了百億級別的涌現能力,但仍然不到萬億級別,因此大模型的智能水平仍有差距。
太熱就是制約點。當然國際上也很熱,但與國際上不同的是,國際上已經有很多頂尖、領先和開源的技術和資源,而我們雖然也有很多技術和資源,但尚缺乏頂尖的。
那麼業界應該在哪些方面發力呢?我認爲,應該集中力量辦大事,在大模型方面集中資源,致力於訓練更大、更智能的模型,從而縮小與國際水平的差距。過多地重複發力反而會導致資源的分散。
提問:您剛纔說中國大模型太小,什麼樣的大模型叫大?ChatGPT大嗎?GPT4.0大嗎?能夠把全世界的東西都包括進來嗎?
黃鐵軍:從技術的角度來看,目前大模型的“大”還遠遠沒有達到天花板,也不可能把所有東西都包括進來。各家都在不斷髮展和探索。要實現包羅萬象可能還需要三年左右的時間,因此未來三年,規模和能力肯定還會繼續提升,這是基本的趨勢。
大模型的發展不僅僅侷限於“大”這個維度,還包括優化技術,提升訓練效率,以及讓其在更小的平臺上也能運行等。但從基本的發展趨勢來看,提升模型的智能水平和規模仍然是人工智能領域發展的主要方向。
提問:在您看來,爲什麼現在這個時間點出現這麼多人工智能大模型?您覺得現在行業需要這麼多大模型嗎?未來的格局是什麼樣的?
黃鐵軍:有技術原因,也有外部原因。技術進步是基礎先決條件,大數據和大算力只是必要條件,但不是最重要的條件。最重要的條件是新的學習方法和算法的出現,尤其是自監督或無監督學習。這種學習方法不再需要人來手動標註數據,而是直接從原始數據中提取規律,不斷迭代學習,從而實現學習的自動化。
大模型之所以能夠變得如此之大,是因爲有足夠的數據可以進行訓練。現在的自監督學習方法使得數據不再受制於成本和人力等問題,而是可以直接從原始數據中獲取,從中提取隱藏的規律,進而實現智能化的問題解決。
未來的大模型生態只會有很少的幾個,數量可以用屈指可數來形容,比如只有三個。無論是幾十個還是幾百個大模型,這都只是技術迭代過程中的中間產物。每個企業將來都會在大模型生態中找到自己的位置,這個位置不一定是訓練和銷售大模型,而是在整個生態系統的某個環節上做得最出色,從而獲得盈利。
大模型本身就是一個大體系,是由千千萬萬企業共同構建的生態系統。在互聯網發展初期,人們也曾認爲賣鏟子的最賺錢,而大家都在做路由器,但最終只有幾個企業能夠做出好的路由器產品。這也提示每個企業,都需要在大模型生態系統中,找到自己的定位和優勢,並在自己的領域做到最好,只有這樣才能融入整個體系並獲得盈利。
提問:目前有很多聲音說中國創業公司更適合發展垂類大模型,通用大模型和垂類大模型是怎樣一個關係?
黃鐵軍:基本的邏輯應該是以通用爲基礎,再通過專門領域的數據支持,進一步進行專門化。但如果要創業,在現有條件下,使用通用基礎去做一個垂類的模型,也未嘗不可。這是一個可以選擇的方案。
隨着通用模型逐漸變得越來越強大,未來幾年內可能會出現像電網一樣無處不在的服務。這時,真正利用大模型做產品和服務的企業將會大幅增加,幾乎所有企業都將使用這個技術。這將是一個新的階段,類似互聯網和移動互聯網發展到一定規模時,除了幾家提供路由器和其他設備的企業外,大多數企業都是互聯網應用型企業。這時,“基礎模型+專業”將成爲最典型的模式。
雖然目前我們還處於初期階段,但選擇垂類模型也是一個可以考慮的選擇。
提問:如果大模型走向應用的話,您覺得在哪些領域會率先出現殺手級的應用?現在國內大模型很多,對應用開發者來講,他怎樣選擇自己應用所根植的這個大模型平臺?
黃鐵軍:其實對於一個劃時代的技術來說,當前談論這個是較爲短視的看法,確實很影響技術的發展。
市場競爭和盈利等經濟行爲,都是自然而然的事情,不需要我們這些所謂的專家提出意見。市場人士比我們更敏感,更清楚市場的情況。我們應該關注的是,現在就是這個時代塑造的時候,只有塑造好了這個時代,纔會有很多應用和機會出現。
以互聯網時代和移動互聯網時代爲例,如果沒有互聯網,談哪個應用能在互聯網上賺錢都沒有意義;如果移動互聯網平臺和手機普及性不到那種程度,打車和外賣等應用也是不可能的。我們必須有基礎設施條件,才能讓後面的應用和平臺公司等出現。
在大模型人工智能時代,建設生態纔剛剛開始。我們應該更多地關注和投入這個方向,只有這樣,千行百業熱鬧的應用和機會纔會出現。
提問:智源未來的發展戰略是怎麼樣的?與當前互聯網大廠的商業化落地目標有什麼不一樣?
黃鐵軍:作爲一個非營利機構,我們的任務是爲整個社會和生態系統提供更基礎的貢獻,更多的是以開源開放的方式實現,這也是我們的性質所決定的。例如Linux操作系統,它不是誰的操作系統,而是大家的、社區的操作系統。當然,Linux可以開發成不同的產品來應用,但同時還需要會員提供一定的經濟支持,否則社區無法運行。Linux是一個開源的例子,它不是某個企業的開源,而是大家的開源。
另一個例子是安卓操作系統,它是Google的開源,也形成了一個生態系統。但是,我們認爲這個生態系統與Linux開源有很大的差別,因爲它是Google左右下的開源。如果你想改變它,那是不可能的。我們都知道,如果你不符合主導者的意志,是不能發行版本的。
作爲一個非營利機構,我們期望並相信,在未來人工智能開源開放的方向,應該像Linux一樣。
提問:AI倫理問題現在越來越受到關注,您對AI監管有哪些思考或者建議?
黃鐵軍:幾年前,甚至更早,我們就一直在討論人工智能的倫理問題。今天,當我們談到倫理安全時,我們一方面感到興奮——人工智能能力的涌現帶來了新的可能性,但另一方面,這也是一個巨大的挑戰。
與傳統的核武器、化學武器等系統的管理挑戰不同,它們的監管是可預測的。我們可以通過嚴格的技術措施來確定應該使用什麼樣的手段來管理什麼樣的系統。雖然這種管理方法不是絕對可靠,但方案本身在某種程度上確定了它的可靠性。
與傳統的技術系統相比,人工智能帶來了各種各樣預料之外的可能性,這是一個巨大的挑戰。但這種東西是否無法管理呢?並不是,因爲人也是這樣的,每個人都是不可預測的。人們可能會靈感一閃,產生各種新想法,甚至做出各種各樣的行爲。
既然人工智能是智能系統,人和動物也是智能系統,它們都具有類似的不可預測性。因此,我們可以將人類社會的倫理、社會歸制以及法律等方式應用到人工智能系統服務的管理上。社會學、文化和歷史等方面也提供了大量的經驗,可以用來探索如何管理一個無窮無盡豐富的創造性系統。
提問:現在談到AI對產業的影響,大家已經非常明確的是對於內容生成領域短期內產生的巨大影響。在您看來,未來還會對製造業這種傳統行業產生哪些影響?
黃鐵軍:判斷一個行業會不會受到影響,基本邏輯很簡單,就是人工智能是否會替換掉行業中的智力要素。針對不同的行業,我們需要對其進行深入的分析和評估。
如果一個行業純粹機械化,不涉及智力要素,那麼它可能不需要治理,因爲它受到的影響相對較小。但是,如果一個行業涉及到智力要素,那麼它就一定會受到影響。
例如,在製造業中,如果該行業完全是黑燈工廠,僅使用自動設備和機器人,那麼人工智能的應用只是爲了提高效率和質量,此時人工智能並不會帶來顛覆性的影響,因爲機器人已經在那裡了,只需要優化和升級就可以了。但是,如果製造業涉及到人類的智力要素,這個環節就可能被改變,甚至有可能成爲競爭的焦點。每個企業都在做同樣的事情,你使用人工智能還是人力,使用多少人力,都會成爲成本效率方面的考慮因素。
提問:現在大家都在討論人工智能怎樣影響我們的生活?根據您現在的觀察,這個影響以後會有多深?我們應該怎麼跟人工智能相處?
黃鐵軍:我認爲這種影響包括兩個方面。首先,作爲一種技術工具,它可以替代許多之前只有人才能完成的任務。未來,通過使用人工智能來替代這些任務,企業的成本更低,速度更快,質量也更好,他們會更積極地使用這些工具來提升自己的發展。
對於消費者和用戶來說,這意味着更多的實惠,許多以前不是所有人都能享用的產品和服務現在都變得更加普及了。例如信息服務、圖像、視頻、內容生成等,之前需要專業人士完成,現在價格已經降低到許多人都可以接受的程度。
因此,對於企業和消費者來說,能夠使用這些新的治理工具來推動經濟社會發展和提高生活水平,在這個意義上講都是好事。
存在蜜月期的同時,也會伴隨着陣痛。人和AI相融合的蜜月期至少有10年,甚至更長時間。這個蜜月期會帶來新工具帶來的生產效率提升,但也會對一些人的工作產生衝擊。例如許多人的工作可能會被替換掉,原來非常穩定的工作現在可以使用人工智能以更低的成本來完成。整體而言,這個過程有好的一面,也有一些負面的影響。我們不能固守舊有的思維方式,而是需要去尋找那些能夠發揮我們人的能力的新事情去做。
這是人類社會發展的一個常態。我們不可能固定在一個時代的狀態,我們需要適應變化。(袁寧)