Meta Llama 3基礎模型已在亞馬遜雲科技可用

4月19日消息,亞馬遜雲科技宣佈,Meta剛剛發佈的兩款Llama 3基礎模型Llama 3 8B和Llama 3 70B現已在Amazon SageMaker JumpStart中提供。這兩款模型是一系列經過預訓練和微調的生成文本模型,上下文長度爲8k,能夠支持廣泛的用例,並在推理、代碼生成和指令跟隨等方面有所改進。客戶可以在Amazon SageMaker JumpStart中輕鬆發現、部署Llama 3基礎模型,並運行推理。

據悉,Llama 3提供兩種參數大小的模型——8B和70B,上下文長度爲8k,能夠支持廣泛的用例。Llama 3使用了僅含解碼器的Transformer架構,以及高達128k規模的新型分詞器,極大提升了模型的性能。此外,Meta改進的訓練後處理程序大幅降低了誤拒率,提高了模型響應的一致性和多樣性。

據介紹,Amazon SageMaker JumpStart提供預訓練的模型、內置算法和預構建的解決方案,幫助客戶快速開始機器學習項目。Amazon SageMaker JumpStart能夠幫助客戶從廣泛的公開可用基礎模型中進行選擇,並將基礎模型部署到專用的SageMaker實例中,這些實例置於網絡隔離的環境,並可以使用SageMaker進行模型訓練和部署。

目前,Meta Llama 3基礎模型現已在Amazon SageMaker Studio的美東(北弗吉尼亞州)、美東(俄亥俄州)、美西(俄勒岡州)、歐洲(愛爾蘭)和亞太(東京)區域提供部署和推理服務。

隨着大模型的發展迭代和人工智能的火熱,近日,亞馬遜雲科技首席執行官Adam Selipsky談到,亞馬遜雲科技希望佔領99%的AI市場,他表示,能夠幫助客戶解決“最後三公里”的難題也是亞馬遜雲科技的優勢之一。

在Adam Selipsky看來,未來是定製化AI模型的時代。“客戶對模型的選擇越來越明智。小模型速度快、成本低,客戶會用他們處理一些低風險、精確度要求沒那麼高的任務。如果客戶對準確性要求很高,他們會更傾向於選擇大模型,或者用像檢索增強生成(RAG)等技術來增強模型。”讓還指出,模型不在大小,應用是關鍵所在。

據悉,亞馬遜雲科技奉行“爲客戶提供模型的選擇”這樣的理念。前段時間來自AI初創公司Anthropic的Claude 3模型上架Amazon Bedrock。此前,亞馬遜宣佈再向Anthropic注資27.5億美元,加上此前12.5億美元的首輪投資,對Anthropic的總投資達到40億美元。(定西)

本文系本站科技報道,更多新聞資訊和深度解析,關注我們。