看不見的大模型,看得見的生產力
在大模型領域,智源是全球唯一沒有背靠大廠的非企業研究機構,也是國內最早系統佈局大模型技術研發、開源生態建設、人才培養和企業培育的新型研究機構。“過去每次科技平權都能催生重大產業機會”,既有企業從業經驗又有研究機構背景的新任智源院長王仲遠,對科技賦能產業的體會更深。國家對人工智能的定義也更加具體:人工智能是發展新質生產力的重要引擎。
功夫下在風口之前
一次兩次,月之暗面CEO楊植麟在2024北京智源大會現場被參會者圍了至少三次,一年前OpenAI創始人山姆·奧特曼在智源大會視頻發言時,現場的躁動同樣明顯。
2023—2024年,AI科學家、科技大廠CEO、明星初創企業創始人聚在各種場面爲大模型佈道,臺上的不管是不是技術咖,或多或少都聽過智源的名號,不少還直接參與過智源當年的大模型研究項目。百度CTO王海峰曾擔任智源理事、智譜AI創始人唐傑曾任智源副院長、楊植麟參與過悟道的研發。
這些AI弄潮兒不是當下才與智源結緣,智源也不是在大模型風起後才投身其中。
2019年,智源開始佈局大模型,2020年組建悟道攻關團隊、啓動大模型研發。2021年3月首發悟道1.0大模型,6月又拿出了悟道2.0,智源用1.75萬億的參數創造了當時“世界最大”大模型紀錄,是OpenAI彼時最先進的大模型GPT-3參數量的10倍。
科研講究體感,要提出問題,作出判斷。“人工智能大模型時代即將到來”的判斷,給了智源毫無保留的勇氣,就連“大模型”這個中文詞彙,都是智源最先提出的。
何爲大模型?智源研究院理事長黃鐵軍認爲要具備三個條件:規模要大,參數達百億規模以上;涌現性,能夠產生預料之外的新能力;通用性,不限於專門問題或領域,能夠處理多種不同的任務。
2023年大模型進入公衆視野,悟道系列模型已升級到3.0版本,涵蓋語言、視覺、多模態等基礎大模型,並全面開源。當時斯坦福大學關於基礎模型的討論中,智源與Google、微軟、Facebook(現Meta)等科技巨頭並列,成爲世界大模型研究的代表性機構。
“歷史上多數研究成果的出現是偶然事件,沒人能規劃出來,所有努力都是爲了提升概率——匯聚優秀的研究人員,爲他們提供能夠碰撞思想、發現問題、尋找協作夥伴的社區環境。”智源研究院創始理事長張宏江給圖靈獎獲得者Yann LeCun自傳寫的序言,更像智源後發先至的原因。
要做系統工程
2018年初,北京市出臺《北京市支持建設世界一流新型研發機構實施辦法》,進行科技體制的飛躍式改革。12月,在科技部和北京市委市政府的指導和支持下,智源正式成立。
此前,科研管理流程複雜,從立項建議到指南發佈再到經費申請、評審通過,週期漫長,難以適應強競爭環境下日新月異的科研需求。按照這種體制,研究機構2020年10月提出立項建議,最快2022年才能正式展開大模型研究。智源模式從立項到推出大模型,只用了不到5個月。
這是一種介於大學和企業的新型研發機構。新在不以論文爲最終評價指標,不以產品爲評價指標,而是要做創新性系統;新在把清華、北大、Facebook人工智能實驗室、百度等不同機構以及企業的學者聚在一起辦大事;新在瞄向大問題,保持對重大科學問題的敏銳眼光,進行前瞻佈局。
“高校模式已經運行了幾十年,較難有組織、有規模、跨團隊地做系統性研發。企業也會投入做研發,但更傾向於研發與業務強相關的。智源會做3—5年甚至更長時間才能看到成果的研究項目。”王仲遠在接受北京商報記者專訪時表示。
當下,智源的信心還在於國家對人工智能的篤定。2024年3月,中共中央政治局常委、國務院總理李強在北京調研時明確:人工智能是發展新質生產力的重要引擎。
新質生產力是創新起主導作用,擺脫傳統經濟增長方式、生產力發展路徑,具有高科技、高效能、高質量特徵,符合新發展理念的先進生產力質態。它由技術革命性突破、生產要素創新性配置、產業深度轉型升級而催生。“過去每次科技平權都能夠催生重大產業機會,大模型可以帶來新的科技平權。”王仲遠堅信。
打個比方,大模型是“智力”的載體,以AI爲中心的浪潮是智力運營,最底層是技術軟硬件系統,最上層是AI應用,大模型處於兩者中間,扮演“樹幹”的角色。大模型的意義是將“智力”變成像水、電、網一樣的公共服務,通過雲計算向大量企業或個人提供AI服務。
這是一個系統工程,“需要集中投入資源、集中人力,不能很多人在做但各做一攤,而是要形成一個技術體系”。黃鐵軍舉例。“發展人工智能就如同鍊鋼和發電,需要一整套技術體系來保證生產出高質量的鋼、以比較低的成本穩定地發電等。”黃鐵軍說。
要比產業走得更超前
智源搭建的技術體系包括:大模型全家桶、大模型操作系統、數據集、訓練框架、算子庫等。這些成績和智源的願景目標等一起掛在智源大廈一樓的牆上。
願景目標分成機制體制、產業發展等五大板塊,總結起來就是創新。“智源要做最前沿的人工智能技術的研發,去引領和預判人工智能的發展,要比產業走得更超前。”王仲遠詳細解釋,“智源會做高校做不了、企業不願做的研發,做3—5年甚至更長時間才能看到成果的研究項目。”在他看來,當大模型技術能力達到一定程度後,會分出兩大方向,“一個方向去跟產品結合,推動應用,發揮商業化價值。另一方面,有少量的幾家機構持續做最頂尖的大模型的迭代和優化。不管企業還是研究機構,應該繼續去攻堅技術”。
比如多模態,國內絕大部分的企業都選擇DiT架構進行研發。“這是因爲DiT是已經被驗證的路線,智源希望把不同模態的信息,比如文字、圖像、視頻、語音,從一開始就放在一個模型裡訓練。”王仲遠用人腦比喻,“這種多模態大模型能夠看到世界、理解和推理。未來,大模型跟硬件結合,也就是具身智能,能夠進入物理世界服務人類。”
企業貼近市場,向上找場景,研發機構聚焦核心技術突破,向下做加持,智源屬於第二種,和應用與場景離得較遠,卻用開源的方式做產業界的後盾。
“人工智能不等同於大模型,它只是人工智能的一個流派。”王仲遠向北京商報記者解釋。當下的智源也對類腦研究、數字心臟等其他人工智能技術全力以赴,這意味着人工智能在其他產業的想象空間沒有上限。
北京商報記者 魏蔚