Meta發佈Llama 3,高管:最智能開源大模型,最強版還在路上

4月19日消息,美國時間週四,Facebook的母公司Meta發佈了其開源大語言模型的最新版本——Llama 3。凸顯了目前硅谷人工智能之戰日益激烈。

Meta此次推出了兩個版本的Llama 3模型:一個版本擁有80億參數,另一個則有700億參數。參數數量是衡量人工智能系統模型大小和性能的關鍵指標,它直接反映了模型的複雜性和計算能力。Meta指出,即使是參數較少的Llama 3版本,其性能也足以與去年發佈的擁有700億參數的Llama 2的最大版本相匹敵。

Meta CEO馬克·扎克伯格(Mark Zuckerberg)透露,即將推出的Llama 3的大型版本將擁有超過4000億參數,遠超之前的版本。Llama 2在訓練過程中使用了2萬億個token,而Llama 3的大型版本使用的token超過了15萬億,這表明其具有更廣泛的數據處理能力。儘管OpenAI尚未公開確認GPT-4的參數或token數量,業界估計其參數可能達到1.5萬億。Meta首席產品官克里斯·考克斯(Chris Cox)表示,這款大型模型待訓練完成後將正式發佈。他補充道:“根據我們目前看到的基準測試結果,Llama 3無疑是市場上目前免費提供的同類產品中最智能、性能最出色的大模型。”

Meta還計劃在未來幾個月陸續推出更多功能豐富的Llama 3模型,包括支持更多語種的版本。這一舉措顯示了Meta在激烈的人工智能市場中,爲了與包括OpenAI在內的競爭對手抗衡而持續加大的投入。

Meta計劃利用Llama 3模型升級其Meta AI助理聊天機器人,後者將在Meta的多個應用中扮演更加顯著的角色。此外,Llama 3還將被深度整合到Meta主要平臺的搜索功能中,包括Facebook、Instagram、WhatsApp和Messenger。升級後的Meta AI還將能夠對鏈接內容進行簡單總結。

回顧過去,OpenAI在2022年底推出了ChatGPT人工智能聊天機器人,從此拉開了硅谷人工智能競賽的序幕。從那以後,越來越多的公司,無論是初創企業還是老牌科技巨頭,都紛紛投入到這場競爭中。

去年7月,Meta首次公開推出了Llama 2模型,並在9月將其用於支持Instagram、WhatsApp和Messenger上的Meta AI聊天機器人。與業界其他公司不同,Meta選擇以開源軟件的形式發佈自己的模型,這意味着全球的開發者都可以免費使用並改進Llama 2。

Sonata Insights的首席分析師黛布拉·阿霍·威廉姆森(Debra Aho Williamson)指出,如果Meta能吸引億萬用戶使用其人工智能產品,該公司可能會在模型中植入廣告,並可能拓展其他付費服務。她認爲:“大多數面向消費者的人工智能體驗最終都可能融入某種形式的付費廣告,例如聊天機器人對話中的定向廣告結果。”

隨着Llama 3的發佈,Meta AI的功能將進一步擴展,覆蓋包括澳大利亞和加拿大在內的13個英語市場。然而,值得注意的是,這項服務在初期不會在歐盟推出。

考克斯補充說:“Meta AI將變得更加強大和智能,特別是對企業用戶來說,在處理長篇內容時,鏈接摘要功能將極具價值。”

此外,Meta AI的圖像生成功能Emu也將迎來升級,不僅將提高生成結果的速度和質量,還能在用戶輸入查詢時即時顯示預覽結果。

考克斯表示:“在生成式人工智能領域,Meta始終致力於將這些先進技術免費普及給廣大用戶。”他還強調,隨着更大版本的Llama模型的推出,公司可能會考慮採用與OpenAI的ChatGPT Plus及Google One AI Premium相似的月度訂閱模式。

值得注意的是,Meta在訓練Llama 3時採用了合成數據,即利用其他人工智能模型生成的文本。隨着科技公司用於訓練人工智能模型的數據日益匱乏,它們不得不尋找新的解決方案來獲取或創造更多數據。(小小)