☰

Meta Llama 3基礎模型已在亞馬遜雲科技可用

4月19日消息，亞馬遜雲科技宣佈，Meta剛剛發佈的兩款Llama 3基礎模型Llama 3 8B和Llama 3 70B現已在Amazon SageMaker JumpStart中提供。這兩款模型是一系列經過預訓練和微調的生成文本模型，上下文長度爲8k，能夠支持廣泛的用例，並在推理、代碼生成和指令跟隨等方面有所改進。客戶可以在Amazon SageMaker JumpStart中輕鬆發現、部署Llama 3基礎模型，並運行推理。

據悉，Llama 3提供兩種參數大小的模型——8B和70B，上下文長度爲8k，能夠支持廣泛的用例。Llama 3使用了僅含解碼器的Transformer架構，以及高達128k規模的新型分詞器，極大提升了模型的性能。此外，Meta改進的訓練後處理程序大幅降低了誤拒率，提高了模型響應的一致性和多樣性。

據介紹，Amazon SageMaker JumpStart提供預訓練的模型、內置算法和預構建的解決方案，幫助客戶快速開始機器學習項目。Amazon SageMaker JumpStart能夠幫助客戶從廣泛的公開可用基礎模型中進行選擇，並將基礎模型部署到專用的SageMaker實例中，這些實例置於網絡隔離的環境，並可以使用SageMaker進行模型訓練和部署。

目前，Meta Llama 3基礎模型現已在Amazon SageMaker Studio的美東（北弗吉尼亞州）、美東（俄亥俄州）、美西（俄勒岡州）、歐洲（愛爾蘭）和亞太（東京）區域提供部署和推理服務。

隨着大模型的發展迭代和人工智能的火熱，近日，亞馬遜雲科技首席執行官Adam Selipsky談到，亞馬遜雲科技希望佔領99%的AI市場，他表示，能夠幫助客戶解決“最後三公里”的難題也是亞馬遜雲科技的優勢之一。

在Adam Selipsky看來，未來是定製化AI模型的時代。“客戶對模型的選擇越來越明智。小模型速度快、成本低，客戶會用他們處理一些低風險、精確度要求沒那麼高的任務。如果客戶對準確性要求很高，他們會更傾向於選擇大模型，或者用像檢索增強生成（RAG）等技術來增強模型。”讓還指出，模型不在大小，應用是關鍵所在。

據悉，亞馬遜雲科技奉行“爲客戶提供模型的選擇”這樣的理念。前段時間來自AI初創公司Anthropic的Claude 3模型上架Amazon Bedrock。此前，亞馬遜宣佈再向Anthropic注資27.5億美元，加上此前12.5億美元的首輪投資，對Anthropic的總投資達到40億美元。（定西）

本文系本站科技報道，更多新聞資訊和深度解析，關注我們。

Meta Llama 3基礎模型已在亞馬遜雲科技可用

相關資訊