☰

亞馬遜在大模型上還有更大野心

在2024 re:Invent全球大會上，亞馬遜一口氣發佈了6款大模型。

這些大模型都依託於其發佈的推出新一代基礎模型Amazon Nova，並集成在Amazon Bedrock中提供服務。

其中，Amazon Nova系列基礎模型包括Micro、Lite、Pro、Premier四款：Amazon Nova Micro爲純文本生成模型，每秒可輸出210個token；Amazon Nova Lite和Amazon Nova Pro爲多模態模型，分別對標OpenAI的GPT-4o mini和GPT-4o，且多項能力在基準測試中表現更優；Amazon Nova Premier同樣是多模態大模型，專爲複雜推理任務而生。

目前，Amazon Nova系列Micro、Lite、Pro模型已全部正式可用，Amazon Nova Premier預計將在2025年第一季度可用。

同時，亞馬遜還推出了兩個全新模型。Amazon Nova Canvas是圖像生成模型，性能上優於OpenAI的DALL-E 3和Stable Diffusion，還內置的安全控制措施確保能夠追溯每張圖像的來源；Amazon Nova Reel是視頻生成模型，支持生成六秒的視頻，未來幾個月將支持最長爲兩分鐘的視頻生成。

亞馬遜雲科技新任CEO馬特・加曼（Matt Garman）在演講中表示，大模型是一個創新速度極快的領域，幾乎每週都會有新版本、新功能、新模型、新更新以及新的成本變化。儘管有這麼多創新和衆多模型，可實際上要找到一個完全契合自身用例的完美模型依舊十分困難。

正是基於這樣的市場洞察，亞馬遜雲科技試圖打造一個專業知識與延遲、成本等因素進行合理組合的大模型服務。其最近兩年在大模型上的動作也均以此爲出發點。

Amazon Bedrock去年的使用量已增長5倍

面對市場對大模型的需求痛點，亞馬遜在2023年4月推出一項完全託管的服務Amazon Bedrock，來滿足市場需要考量模型專業能力、成本等因素的需求。

通過API集合，Amazon Bedrock提供來自AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI 以及亞馬遜自身等多家公司的基礎模型。這些基礎模型涵蓋了文本生成、圖像生成等多種類型，爲開發者提供了豐富的選擇，以滿足不同的應用場景和需求。

馬特・加曼（Matt Garman）透露，每天都有數以萬計的客戶在生產應用中使用Amazon Bedrock，其使用量在去年就增長了近5倍。

快速增長的使用量證明了市場對於Amazon Bedrock這種服務模式的認可。背後的原因也不難理解，大模型在快速迭代升級，很多企業並非是想使用一款基礎模型，而是針對不用需求選擇更合適的模型。Amazon Bedrock集成了越來越多模型，其帶來的便捷性不僅吸引了很多企業客戶使用，還吸引了Salesforce、SAP和Workday等獨立軟件供應商（ISV）集成到他們自己的系統上，爲下游客戶提供生成式AI服務。

Amazon Nova系列模型也是在平衡專業能力、成本和延遲等多方面基礎之上推出的。同時，亞馬遜還在Amazon Bedrock中推出模型蒸餾功能，幫助企業進一步降低大模型的使用成本。根據馬特・加曼（Matt Garman）在演講中透露的信息，經過蒸餾的模型相比被蒸餾的模型，運行速度能夠快500%，成本還能降低75%，而且Amazon Bedrock可一站式完成所有相關工作。

亞馬遜自研的Nova系列模型還能夠與蒸餾功能整合在一起，把大模型的智能“轉移”到更小的模型中，這些小模型成本效益更高，延遲更低。

亞馬遜在2024 re:Invent全球大會上發佈的6款模型並不是全部。根據馬特・加曼（Matt Garman）的介紹，亞馬遜還將在2025年推出語音到語音模型以及多模態到多模態模型。

其中，語音到語音模型計劃在2025年第一季度推出，該模型旨在通過理解自然語言的流式語音輸入，解釋語言和非語言信號（如語調和節奏），提供流暢的類人交互，徹底改變對話式AI應用，確保低延遲的雙向交流。

多模態到多模態模型是亞馬遜在大模型上的一個全新嘗試，能夠接受文本、圖像、音頻和視頻作爲輸入，並以任意模態生成輸出。該模型預計在2025年中旬推出，將簡化應用開發，使同一模型能夠執行多種任務，如內容模態轉換、內容編輯，以及驅動能夠理解和生成所有模態的AI代理。

數十萬枚自研芯片落地Anthropic，亞馬遜要向微軟+OpenAI發起新挑戰

在2024 re:Invent全球大會上，AI初創公司Anthropic的聯合創始人兼首席計算官Tom Brown宣佈了“雷尼爾計劃”（Project Rainier），該計劃也是一個有戰略意義的佈局。

“雷尼爾計劃”的核心內容是，Anthropic未來將使用一個擁有數十萬枚亞馬遜自研芯片的算力集羣。其芯片數量將是Anthropic現有算力集羣的五倍以上。

Anthropic是亞馬遜投資的AI初創公司。2023年9月，亞馬遜向Anthropic投資40億美元。今年11月，亞馬遜再次向Anthropic追加40億美元投資。這是亞馬遜近30年最大的一筆對外投資。投資之後，Anthropic必須使用亞馬遜AWS的雲計算服務，其推出的Claude系列模型也已集成在Amazon Bedrock上。

從模型能力上看，Claude系列模型是目前市面上幾乎少數可以和OpenAI旗下GPT-4對標的模型。如果“雷尼爾計劃”能夠順利落地，Anthropic將用上全球規模最大的AI算力集羣之一，這對後續模型能力的進一步提升也有積極的幫助。

此舉背後，我們可以看到亞馬遜雲在大模型上更大的野心。一方面，亞馬遜雲科技聯合Anthropic對標微軟+OpenAI的模式，和其爭奪更多有大模型和雲計算使用需求的客戶。

此前，微軟CEO薩提亞·納德拉在電話財報會中曾表示，超過1.8萬家公司正在使用微軟的Azure OpenAI服務，這裡面有很多是Azure的新客戶。並且，其雲計算產品Azure的收入增長，也有不少是來自微軟提供的GPT-4入口。

這意味着OpenAI走紅後，其爲微軟的雲服務Azure帶來了更多新增客戶，亞馬遜也可以複製這種已經被驗證過的打法。

另一方面，亞馬遜通過投資的方式將自研芯片和Anthropic深度綁定，既能夠降低自己的算力成本，也能減少其對英偉達、英特爾等芯片供應商的依賴。節省下來的算力成本可以讓亞馬遜的雲計算服務以及生成式AI服務在價格上更有競爭力。

據Synergy Research Group最新公佈的數據估算，2024 年第三季度，亞馬遜在全球雲基礎設施市場的市場份額達到31%，領先於微軟 Azure平臺的 20%和谷歌雲的11%。

顯然，亞馬遜雲科技並未滿足於此，還在試圖通過AI大模型帶來的增量尋求更多的市場份額。

亞馬遜在大模型上還有更大野心

相關資訊