亞馬遜在大模型上還有更大野心

在2024 re:Invent全球大會上,亞馬遜一口氣發佈了6款大模型。

這些大模型都依託於其發佈的推出新一代基礎模型Amazon Nova,並集成在Amazon Bedrock中提供服務。

其中,Amazon Nova系列基礎模型包括Micro、Lite、Pro、Premier四款:Amazon Nova Micro爲純文本生成模型,每秒可輸出210個token;Amazon Nova Lite和Amazon Nova Pro爲多模態模型,分別對標OpenAI的GPT-4o mini和GPT-4o,且多項能力在基準測試中表現更優;Amazon Nova Premier同樣是多模態大模型,專爲複雜推理任務而生。

目前,Amazon Nova系列Micro、Lite、Pro模型已全部正式可用,Amazon Nova Premier預計將在2025年第一季度可用。

同時,亞馬遜還推出了兩個全新模型。Amazon Nova Canvas是圖像生成模型,性能上優於OpenAI的DALL-E 3和Stable Diffusion,還內置的安全控制措施確保能夠追溯每張圖像的來源;Amazon Nova Reel是視頻生成模型,支持生成六秒的視頻,未來幾個月將支持最長爲兩分鐘的視頻生成。

亞馬遜雲科技新任CEO馬特・加曼(Matt Garman)在演講中表示,大模型是一個創新速度極快的領域,幾乎每週都會有新版本、新功能、新模型、新更新以及新的成本變化。儘管有這麼多創新和衆多模型,可實際上要找到一個完全契合自身用例的完美模型依舊十分困難。

正是基於這樣的市場洞察,亞馬遜雲科技試圖打造一個專業知識與延遲、成本等因素進行合理組合的大模型服務。其最近兩年在大模型上的動作也均以此爲出發點。

Amazon Bedrock去年的使用量已增長5倍

面對市場對大模型的需求痛點,亞馬遜在2023年4月推出一項完全託管的服務Amazon Bedrock,來滿足市場需要考量模型專業能力、成本等因素的需求。

通過API集合,Amazon Bedrock提供來自AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI 以及亞馬遜自身等多家公司的基礎模型。這些基礎模型涵蓋了文本生成、圖像生成等多種類型,爲開發者提供了豐富的選擇,以滿足不同的應用場景和需求。

馬特・加曼(Matt Garman)透露,每天都有數以萬計的客戶在生產應用中使用Amazon Bedrock,其使用量在去年就增長了近5倍。

快速增長的使用量證明了市場對於Amazon Bedrock這種服務模式的認可。背後的原因也不難理解,大模型在快速迭代升級,很多企業並非是想使用一款基礎模型,而是針對不用需求選擇更合適的模型。Amazon Bedrock集成了越來越多模型,其帶來的便捷性不僅吸引了很多企業客戶使用,還吸引了Salesforce、SAP和Workday等獨立軟件供應商(ISV)集成到他們自己的系統上,爲下游客戶提供生成式AI服務。

Amazon Nova系列模型也是在平衡專業能力、成本和延遲等多方面基礎之上推出的。同時,亞馬遜還在Amazon Bedrock中推出模型蒸餾功能,幫助企業進一步降低大模型的使用成本。根據馬特・加曼(Matt Garman)在演講中透露的信息,經過蒸餾的模型相比被蒸餾的模型,運行速度能夠快500%,成本還能降低75%,而且Amazon Bedrock可一站式完成所有相關工作。

亞馬遜自研的Nova系列模型還能夠與蒸餾功能整合在一起,把大模型的智能“轉移”到更小的模型中,這些小模型成本效益更高,延遲更低。

亞馬遜在2024 re:Invent全球大會上發佈的6款模型並不是全部。根據馬特・加曼(Matt Garman)的介紹,亞馬遜還將在2025年推出語音到語音模型以及多模態到多模態模型。

其中,語音到語音模型計劃在2025年第一季度推出,該模型旨在通過理解自然語言的流式語音輸入,解釋語言和非語言信號(如語調和節奏),提供流暢的類人交互,徹底改變對話式AI應用,確保低延遲的雙向交流。

多模態到多模態模型是亞馬遜在大模型上的一個全新嘗試,能夠接受文本、圖像、音頻和視頻作爲輸入,並以任意模態生成輸出。該模型預計在2025年中旬推出,將簡化應用開發,使同一模型能夠執行多種任務,如內容模態轉換、內容編輯,以及驅動能夠理解和生成所有模態的AI代理。

數十萬枚自研芯片落地Anthropic,亞馬遜要向微軟+OpenAI發起新挑戰

在2024 re:Invent全球大會上,AI初創公司Anthropic的聯合創始人兼首席計算官Tom Brown宣佈了“雷尼爾計劃”(Project Rainier),該計劃也是一個有戰略意義的佈局。

“雷尼爾計劃”的核心內容是,Anthropic未來將使用一個擁有數十萬枚亞馬遜自研芯片的算力集羣。其芯片數量將是Anthropic現有算力集羣的五倍以上。

Anthropic是亞馬遜投資的AI初創公司。2023年9月,亞馬遜向Anthropic投資40億美元。今年11月,亞馬遜再次向Anthropic追加40億美元投資。這是亞馬遜近30年最大的一筆對外投資。投資之後,Anthropic必須使用亞馬遜AWS的雲計算服務,其推出的Claude系列模型也已集成在Amazon Bedrock上。

從模型能力上看,Claude系列模型是目前市面上幾乎少數可以和OpenAI旗下GPT-4對標的模型。如果“雷尼爾計劃”能夠順利落地,Anthropic將用上全球規模最大的AI算力集羣之一,這對後續模型能力的進一步提升也有積極的幫助。

此舉背後,我們可以看到亞馬遜雲在大模型上更大的野心。一方面,亞馬遜雲科技聯合Anthropic對標微軟+OpenAI的模式,和其爭奪更多有大模型和雲計算使用需求的客戶。

此前,微軟CEO薩提亞·納德拉在電話財報會中曾表示,超過1.8萬家公司正在使用微軟的Azure OpenAI服務,這裡面有很多是Azure的新客戶。並且,其雲計算產品Azure的收入增長,也有不少是來自微軟提供的GPT-4入口。

這意味着OpenAI走紅後,其爲微軟的雲服務Azure帶來了更多新增客戶,亞馬遜也可以複製這種已經被驗證過的打法。

另一方面,亞馬遜通過投資的方式將自研芯片和Anthropic深度綁定,既能夠降低自己的算力成本,也能減少其對英偉達、英特爾等芯片供應商的依賴。節省下來的算力成本可以讓亞馬遜的雲計算服務以及生成式AI服務在價格上更有競爭力。

據Synergy Research Group最新公佈的數據估算,2024 年第三季度,亞馬遜在全球雲基礎設施市場的市場份額達到31%,領先於微軟 Azure平臺的 20%和谷歌雲的11%。

顯然,亞馬遜雲科技並未滿足於此,還在試圖通過AI大模型帶來的增量尋求更多的市場份額。