☰

Meta繼續押寶開源大模型 Llama 3拿下“賽點”？

每經記者：可楊每經編輯：董興生

開源與閉源之爭延續到大模型時代。在尋找“新大陸”的路上，開源與閉源的辯論，就像是一場關於AI未來的“航海策略”討論。

開源一派認爲，開源能夠促進全球科研人員和開發者的協作，加速AI技術的迭代與創新。同時，開源讓更多人蔘與到模型的改進和優化中，通過集體智慧解決複雜的技術難題。

閉源的倡導者則看重其在商業化、技術保護和產品差異化方面的優勢。閉源模型使得企業能夠控制產品的開發節奏和市場策略，保護其商業利益。此外，閉源也有助於企業維護其技術優勢，避免競爭對手模仿或超越。

Llama 3的發佈讓開源大模型在與閉源的競爭中再度“扳回一城”。從測試結果來看，Llama 3的成績大幅超越了Llama 2，也勝過了GPT-3.5。

視覺中國圖

在AI這場沒有硝煙的“航海競賽”中，大模型已然成爲眼前的燈塔。未知的是，這座燈塔究竟是向所有航海者開放其光芒，還是僅爲特定的船隻照亮前行的航道。

開源在開發者和研究人員中極受歡迎

Meta正沿着開源路徑繼續前進。

近日，Meta推出開源大模型Llama 3系列，發佈8B和70B兩個版本。Meta創始人兼首席執行官扎克伯格在同一天宣佈，基於Llama 3，Meta的AI助手現在已經覆蓋Instagram、WhatsApp、Facebook等全系應用，並單獨開啓了網站。

與Llama 2相比，Llama 3進行了幾項關鍵的改進：使用具128K token（輸入數據的最小單元）詞彙表的tokenizer（編譯器），可以更有效地編碼語言，從而顯著提升模型性能；在8B和70B模型中都採用分組查詢注意力（GQA），以提高Llama 3模型的推理效率；在8192個token的序列上訓練模型，使用掩碼來確保自注意力（Self-Attention）不會跨越文檔邊界。

據Meta介紹，Llama 3已經在多種行業基準測試上展現了最先進的性能，提供了包括改進的推理能力在內的新功能，是目前市場上最好的開源大模型。

此外，Llama 3發佈後，微軟Azure、谷歌雲、百度智能雲等陸續宣佈其平臺上線Llama 3。百度方面此前對《每日經濟新聞》記者表示，百度智能雲千帆大模型平臺在國內首家推出針對Llama 3全系列版本的訓練推理方案，便於開發者進行再訓練，搭建專屬大模型。

工業和信息化部工業文化發展中心AI應用工作組執行組長、行行AI董事長李明順在接受《每日經濟新聞》記者採訪時表示，Meta的Llama 3發佈可能會帶來更多AI應用落地機會和場景，它通過提供更大詞彙量的Token詞典、更長的輸入上下文長度以及優化的模型結構，增強了模型的編碼效率和推理效率。“現在，比起Llama 2，Llama 3在代碼能力和邏輯推理能力上有顯著提升，這可能會促進相關AI應用的性能（提升），尤其是在需要複雜邏輯和代碼理解的場景中去落地。”

OpenAI在GPT-2之後調轉船頭走向閉源，Meta則成爲開源界的引領者之一。

從2020年發佈GPT-3，到引發轟動的GPT-3.5，以及2023年3月發佈的GPT-4，都是閉源模型。此前，馬斯克起訴OpenAI時曾直言：“如果OpenAI改名爲ClosedAI，我就撤銷訴訟。”

李明順認爲，OpenAI的轉變可能與其商業戰略和市場定位有關。“初期開源有助於快速吸引關注和社區參與，但隨着公司的發展，我估計阿爾特曼（Sam Altman）的野心和商業夢想越來越膨脹了，閉源可以更好地讓它融資，包括和微軟合作，保護領先的技術優勢。”他表示，從OpenAI的轉變中可以看出，開源與閉源的選擇並非固定不變，而是需要根據公司戰略目標、市場環境和產品發展階段靈活調整。天下沒什麼事情是絕對的，很多開源公司也是拿着次優代碼開源，獨家秘方閉源。

在追逐AGI（通用人工智能）這顆明珠的道路上，迄今爲止，Meta依舊持續沿着開源的路徑前行。

2024年初，扎克伯格在Meta第四季度及2023全年財報電話會議上表示：“長期以來，我們的策略是構建並開放源代碼通用基礎設施，同時保留我們的具體產品實現爲專有技術。”

他認爲，開源帶來了幾個戰略好處。首先，開源軟件通常更加安全可靠，並且因爲社區的持續反饋、審查和開發，更加高效。其次，開源軟件經常成爲行業標準，“當企業開始基於我們的技術棧建立標準時，這使得將創新融入我們的產品變得更加容易。這種微妙的優勢，能夠迅速學習和改進，是巨大的競爭優勢，而成爲行業標準正是這一能力的關鍵”。第三，開源在開發者和研究人員中極受歡迎。

開源與閉源並不矛盾

開源還是閉源，也許是全球人工智能信徒長久的辯題。在Llama 3誕生前幾天，國內同樣在進行一場“辯論”。

4月11日，百度董事長兼首席執行官李彥宏在其內部講話中直言，大模型開源的意義不大，閉源模型在能力上會持續領先，而不是一時領先，做模型的創業公司既做模型又做應用的“雙輪驅動”不是一個好的模式。在一週後的Create 2024百度AI開發者大會上，李彥宏再度提到，大家以前用開源覺得開源便宜，其實在大模型場景下，開源是最貴的，所以開源模型會越來越落後。

360公司創始人周鴻禕則持不同的觀點。他表示：“網上有些名人胡說八道，大家也別被他們忽悠，說開源不如閉源好。一句話，今天沒有開源就沒有Linux（操作系統內核），沒有Linux就沒有互聯網，就連說這話的公司自己都藉助了開源的力量才成長到今天。”

這段發言被解讀爲對李彥宏觀點的回懟，周鴻禕隨後澄清道：“我一直是開源的信徒，但是我說開源好，是（4月）13日在哈佛講的，李廠長（指李彥宏）說閉源好，是（4月）16日在北京講的。”

生數科技聯合創始人兼CEO唐家渝站在閉源的一邊。在4月18日舉行的“2024中國生成式AI大會”上，唐家渝表示：“在我們看來，開源、閉源都有各自可以做的商業生態，但是從模型能力的提升來說，或者持續走到前列來說，閉源還是會走到開源的前面。”

崑崙萬維董事長方漢的觀點是，開源模型與閉源模型之間的差距正在不斷縮小。4月16日，方漢在接受《每日經濟新聞》記者在內的媒體採訪時表示，閉源模型的確是第一，但是開源大模型在2023年到今年這一年間，從落後兩年以上，已經進化到落後4~6個月以上。

此外，方漢認爲，在應用側，閉源對於產品特性和長尾需求的滿足都落後於開源大模型，開源大模型是一種生態構建器，更利於滿足用戶的長尾需求。開源大模型和閉源大模型是一個生態的組成部分，不是誰壓倒誰，大家都有自己的生存空間，也都有更好的明天。

不過，從商業化上來講，閉源和開源也許並不矛盾。啓明創投合夥人周志峰就認爲，開源閉源在過去幾個大浪潮當中沒有很大的衝突，不太理解爲什麼很多人把閉源、開源在AI時代看成對立的。

李明順的觀點則是，在當前強應用導向的背景下，開源模式具有顯著優勢，能夠吸引全球範圍內最廣泛的人蔘與，從而使其創新性保持在較高水平。

相較之下，儘管一些閉源大模型在技術上具有領先地位，但其成本太高。不過他也強調，開源與閉源在不同公司和應用場景中可以相互轉換。一些基於開源的產品在發掘到獨特優勢後，可能會通過閉源策略建立競爭壁壘。同時，一些閉源公司也會不斷將其部分產品開源。這兩個應該是共存的，未來開源可能用戶量級上更大，但是行業內，商業化做得比較好的公司，往往還是閉源的多一點。

在開源與閉源的辯論中，也許答案並非非此即彼。AI的未來可能既不是完全開放的“自由港”，也不是徹底封閉的“孤島”，而是一個既包含開放協作也包含封閉競爭的混合生態。在這個生態系統中，開放與封閉不是對立的兩極，而是一枚硬幣的兩面。

Meta繼續押寶開源大模型 Llama 3拿下“賽點”？

相關資訊