Llama 3每秒輸出800個token逼宮openAI!下週奧特曼生日或放出GPT-5?

新智元報道

編輯:桃子 Lumina

【新智元導讀】Llama 3的開源,或將催生數十億美元新產業。發佈不到一週的時間,全網各種測試微調都開啓了。甚至,Llama 3在Groq上的輸出速度實現了每秒800個token。

Llama 3誕生之後便豔壓羣雄,開源界已無「模」能敵。

甚至,讓網友爲OpenAI捏了一把汗!

現在的Llama 3-70B已經一路攀升到大模型排行榜前列,僅次於GPT-4,打敗了Claude 3 Opus。

沒想到,70B都這麼能打,400B簡直不敢想象。

英偉達高級科學家Jim Fan預言,「GPT-5一定會在Llama 3 400B發佈之前出世」!

還有網友認爲,「我們現在有了一個頂級的開源競爭者,OpenAI的巨大優勢已經不復存在」。

從Llama 1,到Llama 2、代碼版Code Llama高調開源,顛覆了整個大模型圈,掀起新模型構建狂瀾。

如今的Llama 3,對全世界意味着什麼?

數十億美元新產業將涌現

Hugging Face創始人Clement Delangue稱,目前基於Llama 1和2構建的開源模型已有30000多個。

目前,Llama 3是最強大的開源模型,肯定會對生態系統產生重大影響。

在一個總榜上,Llama 3超越了許多的開源、閉源模型。

發佈不到一週,AI社區研究者們已經瘋狂開啓了對Llama 3的測試、微調。

Reddit網友使用Llama 3 70B,非常輕易地製作了一個完美的「貪吃蛇」遊戲,並且在蘋果測試中表現優秀。

但最令人振奮的是,這個模型可以進行微調。

它絕對會瘋狂發展。任何中小型公司都可以利用Llama 3 400B將生產力提升到空前水平。

還有人通過HF Chat使用葡萄牙語測試LLaMA 3,結果發現其超出預期,通過了推理測試。

僅用一張英偉達2070顯卡,開發者使用Llama 3 8B升級了本地離線AI。

竟發現,與這個AI助手AniyaAI的對話更有人情味兒了。

目前,一個全新的微調新模型dolphin-2.9-llama3-8b誕生了,已在Huggingface上發佈。

還有網友在M1 MacBook上使用mlx框架,測試發現llama 3 8b的速度約爲95 token/秒。

對於Meta來說,Llama 3不僅僅是一個研究項目。

它更是Meta將AI接入其龐大的應用和服務生態系統戰略的關鍵部分。

小紮在最新採訪中透露,Llama 3停止訓練後,仍在學習。Meta之所以停止訓練,是因爲需要GPU來開始測試 Llama 4。

值得一提的是,Llama 3的貢獻者名單中也有小扎。

AI創業公司Abacus AI的首席執行官表示:

「Llama 3 400B將徹底改變世界,成爲一個巨大的加速器!你可以使用GPT 4-5級別的模型做非常強大的事情。

想象一下,將模型微調爲AI醫生、AI經理,或AI女友。未來,基於這個基礎模型,將會涌現價值數十億美元的初創公司」!

每秒輸出800個token,Llama3驚呆網友

另一邊,Groq也第一時間提供了對Llama3 8B和70B的支持。

網址:https://console.groq.com/docs/models

Groq Cloud提供的支持,可以讓大家在沒有GPU的情況下使用這兩個大模型。

這無疑是對硬件資源不足、難以運行模型的微小企業與個人的巨大利好!

並且,Llama3在Groq上的表現也尤爲驚豔:模型能以每秒超過800個token的速度運行!‍

而一直以來的大模型王者GPT-4和新晉之秀Claude 3 Opus,其生成速度也僅有每秒36 token和18 token!

這幾乎是革命性的飛躍!

Clamath與Groq的 CEO認爲:接下來,Groq將擁有比所有大型科技公司的總和還要多的AI生成能力!

800 token/每秒的速度,意味着大模型將更具成本效益,並能在更廣泛的範圍內應用、落地。

而Llama3媲美GPT-4級別的實力,打開了未來AI的無數種可能性。

網友們的親身體驗更是力證了這一點!

首先是簡單的從1到500的計數:

GPT-4還在卡頓時,Groq上的Llama3剛一接收指令就已經完成了任務。

當Llama3已經完成任務半天了,GPT-4連100以內都沒計數完。

然後任務難度升級,要求模型用Python編寫貪吃蛇遊戲:

Groq上的Llama3不到3秒就結束了戰鬥,而GPT-4卻用了半分多鐘才搞定。

接着另一個程序員網友試着讓Llama3創建一個用PHP編寫的待辦事項列表。

指令剛發出就得到了結果,網友大爲震撼,評價這次的使用體驗:

「就像光速一樣。」

同時,在調用多個工具完成任務方面,Llama3的表現依舊驚豔!

調用工具所用時間小於4秒,面對複雜的財務問題,回答也僅用了2.9秒。

就連抓取整個網站提供給Llama3,它也可以在短短几秒內就完成響應。

甚至Llama3的8B模型2秒就能讓完整的文件從λ-Calculus 轉換爲慣用的JS......

體驗過的網友直接驚呼:「這是什麼魔法?」

最讓人震撼的是,Groq上的模型還都是免費開放的,團隊甚至沒有製作付費選項!

在如此優秀的性能和強大免費的攻勢下,已經有人宣佈

「我不會再用GPT-4 Turbo了。」

與Groq上的Llama3的光速響應相比,ChatGPT的緩慢已經引起了大多數用戶的不滿。

有人制作了使用了Groq上的Llama3後,再切換到ChatGPT上的GPT-4體驗的表情包:

更有網友銳評:

「就連Claude都比ChatGPT快!它的緩慢有時讓我昏昏欲睡。」

雖然有人厭倦了ChatGPT的緩慢,但也有人認爲GPT較慢的生成反而增加了內容的可讀性,也更適合人機交互。

「快速獲取數據的確非常棒!

但較慢的生成有利於內容的可讀性和對任務流程的理解,這對用戶體驗來說更友好。」

此外,也有人認爲Llama3的回答準確率不怎麼高,不能只看速度不看質量。

OpenAI優勢將不復存在?

從Gemini到Claude 3接連叫板,再到類GPT-4級別的開源400B模型預告,GPT-4真的危了!

許多網友紛紛在線催更GPT-5。

據傳言,OpenAI有可能在22日(當地時間週一)有大動作。

因爲那天,正好是奧特曼的生日。

與此同時,OpenAI官方賬號還發了一個有着數字「22」標誌的王座。

不過近來,奧特曼在採訪中曾表示,OpenAI有改進模型的使命,所以我們會把所有初創公司幹掉。

但在還沒有發佈GPT-5之前,初創公司需要有危機感了。

參考資料:

https://x.com/op7418/status/1781602335619494239

https://x.com/verysmallwoods/status/1781479061144940736

https://x.com/svpino/status/1781362565786075525

https://x.com/DrJimFan/status/1781386105734185309