☰

Llama 3每秒輸出800個token逼宮openAI！下週奧特曼生日或放出GPT-5？

新智元報道

編輯：桃子 Lumina

【新智元導讀】Llama 3的開源，或將催生數十億美元新產業。發佈不到一週的時間，全網各種測試微調都開啓了。甚至，Llama 3在Groq上的輸出速度實現了每秒800個token。

Llama 3誕生之後便豔壓羣雄，開源界已無「模」能敵。

甚至，讓網友爲OpenAI捏了一把汗！

現在的Llama 3-70B已經一路攀升到大模型排行榜前列，僅次於GPT-4，打敗了Claude 3 Opus。

沒想到，70B都這麼能打，400B簡直不敢想象。

英偉達高級科學家Jim Fan預言，「GPT-5一定會在Llama 3 400B發佈之前出世」！

還有網友認爲，「我們現在有了一個頂級的開源競爭者，OpenAI的巨大優勢已經不復存在」。

從Llama 1，到Llama 2、代碼版Code Llama高調開源，顛覆了整個大模型圈，掀起新模型構建狂瀾。

如今的Llama 3，對全世界意味着什麼？

數十億美元新產業將涌現

Hugging Face創始人Clement Delangue稱，目前基於Llama 1和2構建的開源模型已有30000多個。

目前，Llama 3是最強大的開源模型，肯定會對生態系統產生重大影響。

在一個總榜上，Llama 3超越了許多的開源、閉源模型。

發佈不到一週，AI社區研究者們已經瘋狂開啓了對Llama 3的測試、微調。

Reddit網友使用Llama 3 70B，非常輕易地製作了一個完美的「貪吃蛇」遊戲，並且在蘋果測試中表現優秀。

但最令人振奮的是，這個模型可以進行微調。

它絕對會瘋狂發展。任何中小型公司都可以利用Llama 3 400B將生產力提升到空前水平。

還有人通過HF Chat使用葡萄牙語測試LLaMA 3，結果發現其超出預期，通過了推理測試。

僅用一張英偉達2070顯卡，開發者使用Llama 3 8B升級了本地離線AI。

竟發現，與這個AI助手AniyaAI的對話更有人情味兒了。

目前，一個全新的微調新模型dolphin-2.9-llama3-8b誕生了，已在Huggingface上發佈。

還有網友在M1 MacBook上使用mlx框架，測試發現llama 3 8b的速度約爲95 token/秒。

對於Meta來說，Llama 3不僅僅是一個研究項目。

它更是Meta將AI接入其龐大的應用和服務生態系統戰略的關鍵部分。

小紮在最新採訪中透露，Llama 3停止訓練後，仍在學習。Meta之所以停止訓練，是因爲需要GPU來開始測試 Llama 4。

值得一提的是，Llama 3的貢獻者名單中也有小扎。

AI創業公司Abacus AI的首席執行官表示：

「Llama 3 400B將徹底改變世界，成爲一個巨大的加速器！你可以使用GPT 4-5級別的模型做非常強大的事情。

想象一下，將模型微調爲AI醫生、AI經理，或AI女友。未來，基於這個基礎模型，將會涌現價值數十億美元的初創公司」！

每秒輸出800個token，Llama3驚呆網友

另一邊，Groq也第一時間提供了對Llama3 8B和70B的支持。

網址：https://console.groq.com/docs/models

Groq Cloud提供的支持，可以讓大家在沒有GPU的情況下使用這兩個大模型。

這無疑是對硬件資源不足、難以運行模型的微小企業與個人的巨大利好！

並且，Llama3在Groq上的表現也尤爲驚豔：模型能以每秒超過800個token的速度運行！‍

而一直以來的大模型王者GPT-4和新晉之秀Claude 3 Opus，其生成速度也僅有每秒36 token和18 token!

這幾乎是革命性的飛躍！

Clamath與Groq的 CEO認爲：接下來，Groq將擁有比所有大型科技公司的總和還要多的AI生成能力！

800 token/每秒的速度，意味着大模型將更具成本效益，並能在更廣泛的範圍內應用、落地。

而Llama3媲美GPT-4級別的實力，打開了未來AI的無數種可能性。

網友們的親身體驗更是力證了這一點！

首先是簡單的從1到500的計數：

GPT-4還在卡頓時，Groq上的Llama3剛一接收指令就已經完成了任務。

當Llama3已經完成任務半天了，GPT-4連100以內都沒計數完。

然後任務難度升級，要求模型用Python編寫貪吃蛇遊戲：

Groq上的Llama3不到3秒就結束了戰鬥，而GPT-4卻用了半分多鐘才搞定。

接着另一個程序員網友試着讓Llama3創建一個用PHP編寫的待辦事項列表。

指令剛發出就得到了結果，網友大爲震撼，評價這次的使用體驗：

「就像光速一樣。」

同時，在調用多個工具完成任務方面，Llama3的表現依舊驚豔！

調用工具所用時間小於4秒，面對複雜的財務問題，回答也僅用了2.9秒。

就連抓取整個網站提供給Llama3，它也可以在短短几秒內就完成響應。

甚至Llama3的8B模型2秒就能讓完整的文件從λ-Calculus 轉換爲慣用的JS......

體驗過的網友直接驚呼：「這是什麼魔法？」

最讓人震撼的是，Groq上的模型還都是免費開放的，團隊甚至沒有製作付費選項！

在如此優秀的性能和強大免費的攻勢下，已經有人宣佈

「我不會再用GPT-4 Turbo了。」

與Groq上的Llama3的光速響應相比，ChatGPT的緩慢已經引起了大多數用戶的不滿。

有人制作了使用了Groq上的Llama3後，再切換到ChatGPT上的GPT-4體驗的表情包：

更有網友銳評：

「就連Claude都比ChatGPT快！它的緩慢有時讓我昏昏欲睡。」

雖然有人厭倦了ChatGPT的緩慢，但也有人認爲GPT較慢的生成反而增加了內容的可讀性，也更適合人機交互。

「快速獲取數據的確非常棒！

但較慢的生成有利於內容的可讀性和對任務流程的理解，這對用戶體驗來說更友好。」

此外，也有人認爲Llama3的回答準確率不怎麼高，不能只看速度不看質量。

OpenAI優勢將不復存在？

從Gemini到Claude 3接連叫板，再到類GPT-4級別的開源400B模型預告，GPT-4真的危了！

許多網友紛紛在線催更GPT-5。

據傳言，OpenAI有可能在22日（當地時間週一）有大動作。

因爲那天，正好是奧特曼的生日。

與此同時，OpenAI官方賬號還發了一個有着數字「22」標誌的王座。

不過近來，奧特曼在採訪中曾表示，OpenAI有改進模型的使命，所以我們會把所有初創公司幹掉。

但在還沒有發佈GPT-5之前，初創公司需要有危機感了。

參考資料：

https://x.com/op7418/status/1781602335619494239

https://x.com/verysmallwoods/status/1781479061144940736

https://x.com/svpino/status/1781362565786075525

https://x.com/DrJimFan/status/1781386105734185309

Llama 3每秒輸出800個token逼宮openAI！下週奧特曼生日或放出GPT-5？

相關資訊