Meta繼續押寶開源大模型 Llama 3拿下“賽點”?

每經記者:可楊 每經編輯:董興生

開源與閉源之爭延續到大模型時代。在尋找“新大陸”的路上,開源與閉源的辯論,就像是一場關於AI未來的“航海策略”討論。

開源一派認爲,開源能夠促進全球科研人員和開發者的協作,加速AI技術的迭代與創新。同時,開源讓更多人蔘與到模型的改進和優化中,通過集體智慧解決複雜的技術難題。

閉源的倡導者則看重其在商業化、技術保護和產品差異化方面的優勢。閉源模型使得企業能夠控制產品的開發節奏和市場策略,保護其商業利益。此外,閉源也有助於企業維護其技術優勢,避免競爭對手模仿或超越。

Llama 3的發佈讓開源大模型在與閉源的競爭中再度“扳回一城”。從測試結果來看,Llama 3的成績大幅超越了Llama 2,也勝過了GPT-3.5。

視覺中國圖

在AI這場沒有硝煙的“航海競賽”中,大模型已然成爲眼前的燈塔。未知的是,這座燈塔究竟是向所有航海者開放其光芒,還是僅爲特定的船隻照亮前行的航道。

開源在開發者和研究人員中極受歡迎

Meta正沿着開源路徑繼續前進。

近日,Meta推出開源大模型Llama 3系列,發佈8B和70B兩個版本。Meta創始人兼首席執行官扎克伯格在同一天宣佈,基於Llama 3,Meta的AI助手現在已經覆蓋Instagram、WhatsApp、Facebook等全系應用,並單獨開啓了網站。

與Llama 2相比,Llama 3進行了幾項關鍵的改進:使用具128K token(輸入數據的最小單元)詞彙表的tokenizer(編譯器),可以更有效地編碼語言,從而顯著提升模型性能;在8B和70B模型中都採用分組查詢注意力(GQA),以提高Llama 3模型的推理效率;在8192個token的序列上訓練模型,使用掩碼來確保自注意力(Self-Attention)不會跨越文檔邊界。

據Meta介紹,Llama 3已經在多種行業基準測試上展現了最先進的性能,提供了包括改進的推理能力在內的新功能,是目前市場上最好的開源大模型。

此外,Llama 3發佈後,微軟Azure、谷歌雲、百度智能雲等陸續宣佈其平臺上線Llama 3。百度方面此前對《每日經濟新聞》記者表示,百度智能雲千帆大模型平臺在國內首家推出針對Llama 3全系列版本的訓練推理方案,便於開發者進行再訓練,搭建專屬大模型。

工業和信息化部工業文化發展中心AI應用工作組執行組長、行行AI董事長李明順在接受《每日經濟新聞》記者採訪時表示,Meta的Llama 3發佈可能會帶來更多AI應用落地機會和場景,它通過提供更大詞彙量的Token詞典、更長的輸入上下文長度以及優化的模型結構,增強了模型的編碼效率和推理效率。“現在,比起Llama 2,Llama 3在代碼能力和邏輯推理能力上有顯著提升,這可能會促進相關AI應用的性能(提升),尤其是在需要複雜邏輯和代碼理解的場景中去落地。”

OpenAI在GPT-2之後調轉船頭走向閉源,Meta則成爲開源界的引領者之一。

從2020年發佈GPT-3,到引發轟動的GPT-3.5,以及2023年3月發佈的GPT-4,都是閉源模型。此前,馬斯克起訴OpenAI時曾直言:“如果OpenAI改名爲ClosedAI,我就撤銷訴訟。”

李明順認爲,OpenAI的轉變可能與其商業戰略和市場定位有關。“初期開源有助於快速吸引關注和社區參與,但隨着公司的發展,我估計阿爾特曼(Sam Altman)的野心和商業夢想越來越膨脹了,閉源可以更好地讓它融資,包括和微軟合作,保護領先的技術優勢。”他表示,從OpenAI的轉變中可以看出,開源與閉源的選擇並非固定不變,而是需要根據公司戰略目標、市場環境和產品發展階段靈活調整。天下沒什麼事情是絕對的,很多開源公司也是拿着次優代碼開源,獨家秘方閉源。

在追逐AGI(通用人工智能)這顆明珠的道路上,迄今爲止,Meta依舊持續沿着開源的路徑前行。

2024年初,扎克伯格在Meta第四季度及2023全年財報電話會議上表示:“長期以來,我們的策略是構建並開放源代碼通用基礎設施,同時保留我們的具體產品實現爲專有技術。”

他認爲,開源帶來了幾個戰略好處。首先,開源軟件通常更加安全可靠,並且因爲社區的持續反饋、審查和開發,更加高效。其次,開源軟件經常成爲行業標準,“當企業開始基於我們的技術棧建立標準時,這使得將創新融入我們的產品變得更加容易。這種微妙的優勢,能夠迅速學習和改進,是巨大的競爭優勢,而成爲行業標準正是這一能力的關鍵”。第三,開源在開發者和研究人員中極受歡迎。

開源與閉源並不矛盾

開源還是閉源,也許是全球人工智能信徒長久的辯題。在Llama 3誕生前幾天,國內同樣在進行一場“辯論”。

4月11日,百度董事長兼首席執行官李彥宏在其內部講話中直言,大模型開源的意義不大,閉源模型在能力上會持續領先,而不是一時領先,做模型的創業公司既做模型又做應用的“雙輪驅動”不是一個好的模式。在一週後的Create 2024百度AI開發者大會上,李彥宏再度提到,大家以前用開源覺得開源便宜,其實在大模型場景下,開源是最貴的,所以開源模型會越來越落後。

360公司創始人周鴻禕則持不同的觀點。他表示:“網上有些名人胡說八道,大家也別被他們忽悠,說開源不如閉源好。一句話,今天沒有開源就沒有Linux(操作系統內核),沒有Linux就沒有互聯網,就連說這話的公司自己都藉助了開源的力量才成長到今天。”

這段發言被解讀爲對李彥宏觀點的回懟,周鴻禕隨後澄清道:“我一直是開源的信徒,但是我說開源好,是(4月)13日在哈佛講的,李廠長(指李彥宏)說閉源好,是(4月)16日在北京講的。”

生數科技聯合創始人兼CEO唐家渝站在閉源的一邊。在4月18日舉行的“2024中國生成式AI大會”上,唐家渝表示:“在我們看來,開源、閉源都有各自可以做的商業生態,但是從模型能力的提升來說,或者持續走到前列來說,閉源還是會走到開源的前面。”

崑崙萬維董事長方漢的觀點是,開源模型與閉源模型之間的差距正在不斷縮小。4月16日,方漢在接受《每日經濟新聞》記者在內的媒體採訪時表示,閉源模型的確是第一,但是開源大模型在2023年到今年這一年間,從落後兩年以上,已經進化到落後4~6個月以上。

此外,方漢認爲,在應用側,閉源對於產品特性和長尾需求的滿足都落後於開源大模型,開源大模型是一種生態構建器,更利於滿足用戶的長尾需求。開源大模型和閉源大模型是一個生態的組成部分,不是誰壓倒誰,大家都有自己的生存空間,也都有更好的明天。

不過,從商業化上來講,閉源和開源也許並不矛盾。啓明創投合夥人周志峰就認爲,開源閉源在過去幾個大浪潮當中沒有很大的衝突,不太理解爲什麼很多人把閉源、開源在AI時代看成對立的。

李明順的觀點則是,在當前強應用導向的背景下,開源模式具有顯著優勢,能夠吸引全球範圍內最廣泛的人蔘與,從而使其創新性保持在較高水平。

相較之下,儘管一些閉源大模型在技術上具有領先地位,但其成本太高。不過他也強調,開源與閉源在不同公司和應用場景中可以相互轉換。一些基於開源的產品在發掘到獨特優勢後,可能會通過閉源策略建立競爭壁壘。同時,一些閉源公司也會不斷將其部分產品開源。這兩個應該是共存的,未來開源可能用戶量級上更大,但是行業內,商業化做得比較好的公司,往往還是閉源的多一點。

在開源與閉源的辯論中,也許答案並非非此即彼。AI的未來可能既不是完全開放的“自由港”,也不是徹底封閉的“孤島”,而是一個既包含開放協作也包含封閉競爭的混合生態。在這個生態系統中,開放與封閉不是對立的兩極,而是一枚硬幣的兩面。