智見|專訪智譜AI CEO張鵬: 國產ChatGPT的春天來了嗎?

出品|本站科技《智見訪談》

採訪|丁廣勝

撰文|袁寧

風暴自ChatGPT 震撼亮相起。

國外,一路狂飆,其背後的GPT大模型全方位秀肌肉,不斷展現其驚人能力。又迅速演化,完成迭代,僅四個月後就發佈GPT4,引發連連驚歎。

國內,百花齊放,你方唱罷我登臺。百度、阿里等互聯網大廠紛紛亮相對標產品,試與ChatGPT比高。然而與此同時,對於國產對標產品的質疑聲也愈發響亮。

新一輪技術革命已然來襲,我們距離ChatGPT有多遠?本站科技與北京智譜華章科技有限公司(下稱“智譜AI”) CEO張鵬進行了對談。

談差距:國內起步略晚,但持續革新

智譜AI在大模型領域深耕多年,其研究出的GLM-130B是國內唯一一個入選斯坦福大學基礎模型研究中心測評,能跟頂尖模型一較高下的基座模型。自2022年8月發佈以來,已收到55個國家989個研究機構的使用需求。

談到國內外的差距,張鵬表示,雖然國外在人工智能領域的佈局更早,但國內很多大廠和研究機構也一直保持着很高的關注度。

大模型技術具有高投入、高要求的特點,團隊、算法等方面也是一個系統性的工程,因此大家對此的投入都比較謹慎。中國起步時間可能會比國外晚一些,但並不代表國內沒有做這些事情。比如智譜團隊2020年就參與研發 GLM 預訓練架構和訓練百億參數模型,2021年參與訓練萬億級別稀疏模型,2022年主導推出高精度開源千億模型 GLM-130B(https://github.com/THUDM/GLM-130B),2023年2月,團隊推出ChatGLM,公開評測性能還不錯,其開源的 ChatGLM-6B 模型全球下載超過70萬(https://huggingface.co/THUDM/chatglm-6b),持續兩週位列 Huggingface 全球模型趨勢榜榜首。

ChatGLM-6B可以幫助更多人瞭解和參與到大模型的開發和使用中來,共同推進技術的發展和創新。他支持在單張消費級顯卡上進行推理使用,甚至還有網友把模型進一步壓縮到只需要2G內存就可以運行,大模型研究進入普及階段。這是繼此前開源GLM-130B千億基座模型之後,智譜再次推出大模型方向的研究成果。

談落地:基座的能力很關鍵

張鵬介紹,目前在生成式AI領域,主要可以分爲三類角色。第一類是關注於底層模型和基礎能力的建設,目標是以通用模型爲目標,提高模型的通用能力、方法能力、多任務能力和跨模態能力等。第二類是基於基礎模型的泛化能力去做上層應用開發,結合場景和行業的深入知識和積累,去快速地幫助行業用戶解決實際問題。第三類是作爲輔助性技術的供應商,幫助解決工具提效等方面的輔助性問題。

智譜作爲專注於底層模型的一類,張鵬強調,基座的能力是非常關鍵的。ChatGPT正是摸索出了一套方法來更好地發揮能力上限,而落地的動作也能對技術本身的能力進行驗證,在不同場景下實現與用戶的觸達,獲得用戶的反饋,幫助對大模型的進一步優化。

智譜AI很早便提出了Model as a Service的理念,主張提供從預訓練大模型到API到應用多層級以及從雲端到私有化到一體機部署的靈活部署方式。

他認爲這種模型與服務的融合可以爲傳統軟件工具驅動的IT系統注入智能驅動的能力,從而重塑整個IT系統的架構。這種重塑將使得IT系統更高效、更智能,進而降低開發成本,提升用戶和應用者的收益。因此,Model as a Service的價值會超過過去每一層形成的時候所帶來的價值。

談風險:馬斯克們的AI倫理與風險觀

3月末,包括特斯拉CEO埃隆·馬斯克等在內的數千名AI領域企業家、學者、高管發出了一封題爲《暫停大型人工智能研究》公開信。他們在信中強烈呼籲:所有AI研究室立刻暫停訓練比GPT-4更加強大的AI系統,爲期至少6個月。人們對於人工智能發展的恐慌盡顯。

對此,張鵬認爲,馬斯克等也不算極端,他們只是提出了暫停六個月來降低風險的建議,並沒有真正要求封禁人工智能技術。相對以往對於克隆技術、基因編輯等的罵聲,還相對溫和,有助於防止技術發展過快而導致失控的風險。

對於中國來說,我們一直在技術發展過程中進行跟進,這件事情也是給我們很多啓發,在重視人工智能的發展和應用的同時,也不能忽視了其可能帶來的影響。隨着相關法律法規的出臺,生成式人工智能技術將進一步實現健康發展和規範應用。

安全性和倫理問題是自AI技術誕生以來,學界、社會和產業界共同關注的問題。然而,在技術發展的同時,解決這些問題還需要考慮到各個方面和羣體的利益。技術發展的同時必然會產生新的問題,然而技術本身是可控的。世界不斷進步,我們也不需要太過擔心。