AI週報 | Anthropic發佈Claude 3.5力壓OpenAI;英偉達市值一度登美股之巔

Anthropic發佈Claude 3.5模型力壓OpenAI

當地時間6月20日,OpenAI的“勁敵”Anthropic公司發佈了最新模型Claude 3.5 Sonnet。據Anthropic介紹,該模型是Claude 3.5系列模型中的首個版本,也是Anthropic迄今爲止發佈的“最強大、最智能”的模型。它不僅在性能上超越了競爭對手和自家此前最先進的Claude 3 Opus模型,還主打高性價比。

具體來看,Claude 3.5 Sonnet在研究生水平推理 (GPQA)、編碼能力 (HumanEval) 、文本推理(DROP)等方面的成績均好於GPT-4o,但在數學問題解決能力上稍遜於後者。成本方面,該模型的每百萬輸入token收費3美元,每百萬輸出token收費15美元,上下文窗口爲20萬token。

點評:AI技術的不斷演進中,Anthropic的Claude 3.5 Sonnet模型雖未帶來翻天覆地的變化,卻代表了AI模型發展的現階段現實:在期待重大科研突破的同時,實現逐步的性能提升,即在等待重大研究突破的同時,持續進行小步快跑。近幾個月,包括谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o在內的旗艦產品,僅在基準測試和性能上實現了小幅提升。由於現有模型架構的侷限性和訓練所需的巨大計算資源,業界尚未再次見證類似從GPT-3到GPT-4的巨大飛躍。

英偉達市值登上美股之巔

美股6月18日,英偉達盤中漲幅接近4%,市值超過3.4萬億美元,一夜暴增超過1000億美元,超過微軟首次成爲全球市值最大公司。美股6月20日盤中,英偉達、微軟、蘋果三家科技巨頭市值合計達10萬億美元,不過,截至收盤,三家科技巨頭股價跳水,英偉達跌3.54%,蘋果跌2.15%,微軟跌0.14%,市值分別爲3.22萬億美元、3.22萬億美元、3.31萬億美元。美股6月21日收盤,英偉達市值又跌至3.11萬億美元,兩日市值蒸發超2000億美元,美股市值第一爲微軟。

點評:三大科技巨頭你方唱罷我登場,坐席並不穩固。這意味着市場對哪家公司最有價值的共識未達成。三大科技巨頭都涉及AI,但佈局內容不同:微軟握有OpenAI股份並佈局雲計算,蘋果終端設備被認爲是適合AI落地的場景,英偉達也是當前最重要的AI基礎設施供應商。三家市值波動引發市場關注,有分析人士認爲,現在美股幾乎一切都依賴於英偉達和蘋果,不用怎麼大動干戈就能讓市場下跌。

黃仁勳套現超6000萬美元

英偉達參與美股市值前三的市值"爭奪戰"之際,英偉達正在增強自身在產業鏈中的影響力,同時面臨訴訟以及高管減持。英偉達CEO黃仁勳於6月18日、6月17日、6月14日和6月13日每日減持12萬股公司股票,這四日減持股票對應總市值約6308萬美元。黃仁勳還計劃於6月20日減持12萬股公司股票,對應總市值1630.49萬美元。美國聯邦最高法院週一則決定,同意審理一樁有關投資者起訴英偉達及管理層誤導市場的案件。

點評:據英偉達5月底發佈的10-Q文件,今年3月14日,黃仁勳通過了10b5-1規則交易安排,將在2025年3月31日前出售最多60萬股普通股。但這些股票佔黃仁勳總持有股票的比例較小,截至今年3月25日,黃仁勳累計持有超9000萬股的英偉達股票。英偉達股價水漲船高,是持股員工和高管致富的機會。

華爲鴻蒙NEXT首次將AI能力融入系統

在6月21日的華爲開發者大會(HDC2024)上,華爲發佈了HarmonyOS NEXT 全場景智能操作系統。據華爲相關負責人介紹,鴻蒙NEXT首次將AI能力融入系統。華爲表示,將帶有表格的圖片交給智能助手小藝,可以轉化爲一張表格;收到一個團建郵件後,說導航去這個地方,小藝可規劃路線;跟小藝說將某日的日程安排短信發給某人,小藝就會從日曆中調取相應安排併發送短信。

點評:華爲小藝的AI功能與蘋果有一定相似性,都能進行手機應用間的協作且交互自然。此前蘋果在WWDC大會上介紹,接入AI能力後,自然且貼合語境,如Siri可理解上下文,當用戶詢問某地天氣後,便可要求Siri爲在當地的活動設置日程,而無需再強調地點。AI讓手機智能助手減少了此前交互時的機械化。

朱嘯虎:五年後不會再有獨立的大模型公司存在

在6月21日的創投十年高峰論壇上,金沙江創投主管合夥人朱嘯虎發表演講時表示,五年以後不會再有獨立的大模型公司存在,要麼是AI應用公司,要麼是雲服務。今天的大模型公司很難單獨存在,因爲沒有自己單獨的商業模式,在成本線以下了。

今天很多大模型公司都在做C端應用,雖然C端應用確實能夠創造很多的價值,但朱嘯虎認爲,今天的C端應用明顯不夠成熟,還沒有到時機點,到明年的時機纔可以探討應用。“在B端上首先採用的都是企業服務端,只要能夠給企業創造價值,即使價格貴一點,企業也是願意用的。”

點評:在B端應用上,朱嘯虎還提到一個觀點是,AI取代摸魚的白領很容易。他表示,OFFICE的用戶約爲10億白領,平均產值4萬美金,而AIGC提高20%效率是近期就比較容易實現,“大部分白領上班是摸魚的,用AI取代那些白領就能創造40萬億的20%——8萬美金。”在談及這點時朱嘯虎分享了一個北歐的案例Klarnr,“它就套個殼,輕而易舉就優化掉700個客服人員,差不多每年增加4000萬美金的利潤。”

首個AI高考全卷評測結果發佈,數學全不及格

在前不久高考結束後,上海人工智能實驗室旗下司南評測體系OpenCompass選取了7個大模型進行高考“語數外”全卷能力測試。6月19日, OpenCompass發佈了首個大模型高考全卷評測結果。

語數外三科加起來的滿分爲420分,此次高考測試結果顯示,阿里通義千問2-72B排名第一,爲303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能實驗室的書生·浦語2.0排名第三,三個大模型的得分率均超過70%。從結果來看,大模型的語文、英語考試水平普遍不錯,但數學都不及格,最高分也只有75分,來自書生·浦語2.0,其次是GPT-4o,得分73分。語文最高分是通義千問,英語最高分是GPT-4o。

點評:在數學方面大模型還有很大的提升空間。數學關乎複雜推理相關能力,這是大模型普遍面臨的難題,也是大模型在金融、工業等要求可靠的場景落地需要的關鍵能力。上海人工智能實驗室領軍科學家林達華此前在採訪中對第一財經介紹,複雜推理關係到落地應用時大模型的可靠性,例如在金融這樣的場景下不能在數字上有差錯,會對數學上的可靠性有較高的要求。

OpenAI收購數據庫分析公司Rockset

6月22日,OpenAI發佈公告稱完成了對數據庫檢索和分析公司Rockset的收購。公司將整合Rockset的技術和人員,強化各項產品的檢索基礎設施。OpenAI並沒有透露交易的具體金額。Rockset去年8月時曾透露,公司創立以來一共籌集到了超過1億美元的資金。

OpenAI在公告中表示,AI有機會轉變消費者和機構利用自己數據的方式,Rockset是處於市場領先地位的實時數據庫分析供應商,提供世界一流的數據索引和查詢能力。這些技術能夠使用戶、開發人員和企業更好地利用自己的數據、訪問實時信息,以便提高使用AI產品和構建更智能應用程序時的效率。

點評:Rockset提供一種名爲“向量搜索”(vector search)的關鍵技術,能幫助OpenAI增強快速訪問和分析大量信息的能力。據公開信息,Rockset成立於2016年,由前Facebook工程師和架構師創立,他們開發的工具,旨在幫助客戶自動從各類本地、雲端數據庫中獲取數據,併爲後續的檢索和分析應用建立索引。隨着越來越多公司使用人工智能驅動推薦引擎、語音助手、聊天機器人等應用,這項技術的應用場景也變得越來越寬廣。

OpenAI 前首席科學家 Ilya 宣佈成立新公司

6月20日,OpenAI聯合創始人、前首席科學家伊利亞·蘇茨克維(Ilya Sutskever)在社交平臺X上發文,宣佈成立新公司SSI(safe superintelligence,安全超級智能)。他表示新公司將致力於追求安全超級智能,“只有一個重點、一個目標和一個產品。我們將通過一支精幹的小團隊取得革命性的突破,從而實現這一目標。”

Ilya Sutskever對媒體表示,“這家公司的特殊之處在於,它的第一個產品將是安全的超級智能。在此之前,它不會做任何其他事情。它將完全不受外界壓力的影響,不必處理龐大而複雜的產品,也不必陷入競爭激烈的賽跑中。”

點評:某種程度上,這是伊利亞對老東家OpenAI關於安全主義和加速主義之爭的迴應。OpenAI在創立初期的主要目標是研發能夠達到甚至超越人類智能的通用人工智能(AGI),確保它能夠造福人類並規避潛在的安全風險。但龐大的研發資金需求讓OpenAI開始與科技巨頭微軟進行合作,轉向商業化的道路,偏離了最初的目標,也遭受了發起人之一馬斯克的猛烈抨擊。

黃仁勳稱痛苦折磨、長時間工作、應對挫折和機遇是他的能力

當地時間6月15日,英偉達CEO黃仁勳站上美國加州理工學院的講臺,面向畢業生髮表演講。黃仁勳回顧了GPU的誕生和對AI的推動,以及英偉達避開競爭對手發掘新市場的過程。“重要的是,我們培養了敏捷性和韌性文化。遇到一次又一次挫折,又擺脫挫折,滑向下一個機會。在我所看重的能力中,智力不在首位。我忍受痛苦和折磨的能力、長時間工作的能力、應對挫折和看到眼前機遇的能力,這些都是我的超能力,希望你也有。”黃仁勳向畢業生說。

點評:人們願意窺見英偉達成功的秘密,也願意聽黃仁勳分享他的見解。英偉達曾想進入移動市場,受挫之後才決定製造當時幾乎沒有客戶的產品——機器人,以便處理深度學習算法。歷史證明英偉達的選擇是正確的。正確地應對挫折併發掘機遇,是企業家走向成功幾乎不可少的能力。

阿里雲推出首個AI程序員

6 月 21 日,在阿里雲上海 AI 峰會上,阿里雲推出首個“AI 程序員”,它具備架構師、開發工程師、測試工程師等多種崗位的技能,能一站式自主完成任務分解、代碼編寫、測試、問題修復、代碼提交整個過程,最快分鐘級即可完成應用開發,大幅提升研發效率。

據介紹,該AI程序員是基於通義大模型構建的多智能體,每個智能體分別負責具體的軟件開發任務並互相協作,可端到端實現一個產品功能的研發,這極大地簡化了軟件開發的流程。例如,在編碼智能體中,AI程序員首創了代碼倉庫知識圖結構,不僅能理解用戶的需求,還能精準定位代碼對應的修改位置並自動給出修改方案。

點評:AI代碼正在成爲越來越多公司的佈局方向。阿里雲通義大模型業務負責人徐棟表示,軟件應用的開發範式正在發生改變,未來用戶只需定義問題、提出需求,分鐘級完成一個應用開發將成爲常態。通過AI編程助手和AI程序員的共同加持,每個人類程序員都將成爲超級個體。”

黃仁勳推動英偉達進軍軟件和雲服務領域

近日消息稱,去年底英偉達CEO黃仁勳與高管召開了一系列會議,討論一個日益令人擔憂的問題,即英偉達最大的客戶是否會耗盡數據中心的空間以安裝英偉達芯片,這或將影響英偉達的銷售。黃仁勳不希望公司有一天可能會像思科等曾經的硬件巨頭一般走向衰落,他正推動公司進軍軟件和雲服務領域,與其最大的客戶展開競爭。

點評:近一年多來,華爾街總愛拿英偉達與思科作對比。兩家公司頗有相似之處。思科在本世紀初互聯網泡沫時期市值一路飆升,2000年3月登上美股市值之巔,隨着互聯網泡沫破裂,市值經歷暴跌。英偉達近一年多市值也在飆升。此外,兩家公司都是硬件廠商。英偉達無疑希望鞏固自身在AI領域的地位以避免衰落。在近一年多時間裡,英偉達的軟件佈局確乎加快了,2023年,英偉達推出了NVDIA DGX Cloud人工智能即服務平臺。黃仁勳給英偉達留的另"一手"則可能是"主權AI"。這個概念是指一個國家利用自己的基礎設施、數據、勞動力和商業網絡建造AI的能力,當前各國正在投資"主權AI”。