超越GPT-4,OpenAI前高管發佈"最強"大模型

3月5日消息,美國時間週一,人工智能初創公司Anthropic發佈了其最新的人工智能模型Claude3。該公司聲稱,Claude 3是迄今爲止他們推出的速度最快、性能最強的模型。Claude 3分爲三個不同的版本:Opus、Sonnet和Haiku。

據Anthropic介紹,三個版本中,Opus的能力最爲出色,它在多項行業基準測試中的表現超越了OpenAI的GPT-4和谷歌的Gemini Ultra。這些測試覆蓋了從本科生知識水平到研究生推理能力和基礎數學等領域。

Claude 3首次引入了多模態支持功能,用戶現在能夠直接上傳照片、圖表、文檔等各種非結構化數據,由Claude 3進行分析並給出相應的答案。

此外,與Opus相比,Sonnet和Haiku兩個版本雖然參數規模更小,但相應的使用成本也更低。從本週一起,Opus和Sonnet兩個版本將在159個國家上線,而Haiku版本也將很快推出。儘管Anthropic沒有公開Claude 3的具體訓練時間和成本,但已經有包括Airtable和Asana在內的多家企業參與了對這些模型的A/B測試。

僅一年前,Anthropic還是一家由前OpenAI研究高管創立的新興人工智能初創企業,儘管完成了A輪和B輪融資,但其產品尚未引起市場廣泛關注。然而,短短一年內,Anthropic已經成爲業界最受矚目的人工智能初創企業之一,得到了包括谷歌、Salesforce和亞馬遜等科技巨頭的支持。

該公司的產品不僅在企業領域與ChatGPT等生成式人工智能模型展開了激烈競爭,而且也逐漸滲透到消費者市場。在過去一年裡,這家初創企業完成了五筆不同的融資,總額約爲73億美元。

根據PitchBook的數據,生成式人工智能領域在過去一年中實現了爆炸式增長,2023年的投資額達到了創紀錄的291億美元,涉及近700筆交易,同比增長超過260%。同時,生成式人工智能已成爲各大公司財報電話會議中的熱門話題。儘管學者和倫理學家對這項技術可能帶來的偏見傳播趨勢表示擔憂,但生成式人工智能仍然迅速滲透到學校、在線旅遊、醫療行業、在線廣告等各個領域。

在一次採訪中,Anthropic的聯合創始人丹妮拉·阿莫代伊(Daniela Amodei)透露了公司內部的團隊規模和工作分配情況。她表示,大約60至80人致力於核心人工智能模型的研發工作,而120至150人從事相關的技術工作。在今年7月的一份聲明中,阿莫代伊還提到,在Claude 3模型的最後一輪迭代中,由30至35人組成的團隊直接參與了研發,而總共約150人提供了支持。

Anthropic表示,Claude 3模型具有強大的處理能力,每次可處理多達約15萬個單詞,相當於一本長篇小說的長度,例如《白

鯨記》(Moby Dick)或《哈利·波特與死亡聖器》(Harry Potter and the DeathlyHallows)。與此相比,先前版本的模型僅能處理7.5萬個單詞。用戶可以將大型數據集輸入模型,並請求以備忘錄、信件或故事的形式提供摘要。而與之相比,ChatGPT模型的單次處理能力大約爲3000個單詞。

在風險應對方面,阿莫代伊表示,Claude 3相較於先前版本有了顯著進步。她解釋說:“在努力打造一種高度無害的模型時,Claude 2在某些情況下會避免給出回答,尤其是當有人提起敏感或具有爭議性的話題時,Claude 2的回答可能會更爲保守。”

Anthropic還指出,Claude 3對用戶的提示有着更深入的理解。多模態功能——即爲生成式人工智能添加照片、視頻等輸入選項——無論是用戶自行上傳還是通過人工智能模型創建,都迅速成爲行業內的一大熱點。

OpenAI首席運營官布拉德·萊特卡普(Brad Lightcap)在去年的一次採訪中表示:“現實世界是多模態的。考慮到我們人類如何處理信息、與世界互動,比如我們所看到、聽到以及談論的內容,可以發現,這個世界遠比單純的文字要豐富得多。因此,僅僅依靠文本和代碼作爲單一界面展示模型的功能和作用是遠遠不夠的。”

然而,隨着多模態技術和人工智能模型的複雜性不斷增加,潛在的風險也在逐漸增加。谷歌最近不得不暫停其Gemini聊天機器人的圖像生成功能,原因是用戶發現了歷史錯誤和令人不安的回答,這些問題在社交媒體上迅速傳播開來。

不同於此,Anthropic的Claude3模型並不生成圖像,而是允許用戶上傳圖像和其他文件進行分析。阿莫代伊表示:“沒有任何模型是完美的。我們始終在努力確保模型在功能和安全性方面達到最佳平衡。儘管如此,模型在某些情況下仍可能產生不準確的輸出。”(小小)