Manus的發佈,是Agent大戰的一次搶跑
這是窄播Weekly的第48期,本週我們關注的商業動態是:Manus發佈的節點性意義。我們認爲,Manus的發佈不是又一個DeepSeek時刻,而是對即將到來的AI Agent之爭的一次搶跑——雖然一時成爲全場焦點,卻還沒展現出成爲冠軍的實力。
3月6日凌晨,Manus頭頂「全球首款通用型AI Agent產品」的稱號登上舞臺。在前排觀衆的高度讚譽和諸多官方案例效果的雙重加持下,Manus迅速成爲營銷號和媒體的寵兒。隨後,由於邀請碼一碼難求,用戶測試中出現了卡頓、遲緩、未完成任務,使其口碑迅速兩極化,陷入「套殼」質疑中。
與此同時,國內的MetaGPT和開源社區CAMEL-AI兩個團隊在很短時間裡推出了開源的Manus復刻項目。MetaGPT的Open Manus在GitHub上收穫了7000多顆星星,CAMEL-AI打造的OWL在智能體測試基準GAIA開源榜單上的得分爲57.7%。借勢Manus,兩個團隊各自收穫了一次破圈效果。
拋開流量層面的造勢、營銷、蹭熱點等行爲不談,也不在沒有邀請碼的條件下圍繞評判Manus的實際效果,僅從產品思路及影響來看,Manus的這次搶跑會激化AI Agent的競爭,並且讓「GPTs類」智能體開始退出歷史舞臺。
一方面,AI Agent在2024年就已經被公認會成爲2025年AI競爭的重頭戲。知名投行巴克萊在最新的研報中,將「推理模型」和「Agent」推爲新時代的弄潮兒。Manus作爲投入這波趨勢中的一條鮎魚,大概率會刺激巨頭加速佈局AI Agent。
進入2025年,OpenAI已經先後拋出了Operator和Deep Research兩個 AI Agent。就在Manus走紅的這一週,微軟也發佈了兩個新的AI Agent。Meta也在爲Facebook和Instagram推出客服領域的AI Agent。亞馬遜的 AWS 被曝組建了一個致力於Agent開發的新團隊,旨在幫助人們自動化生活中的部分事務。
另一方面,人們對AI Agent的定位越來越清晰,無論是開發者還是用戶,都更加強調AI Agent的任務執行能力,而不是定製化的聊天能力。這也意味着,包括始作俑者OpenAI在內,都會逐漸放棄GPTs類智能體,去探索如何提升AI Agent的執行效率。Manus會讓文小言和豆包中的「周易大師」們更快謝幕。
新的AI Agent競爭階段會呈現出四個趨勢:
1、從與AI合作,到監督Agent工作;
2、好的Agent一定是合格的終端消費品;
3、編程平權會帶來更靈活的執行;
4、圍繞Agent開始建設「統一市場」。
從與AI合作,到監督Agent工作
在2023年,人們還會將GPTs那樣的,被高級Prompt搭建起來的,具備專業背景的聊天機器人稱作智能體。人人都可以開發的智能體,其實是人人爲不同場景定製化不同的聊天機器人,是人與AI合作完成對話任務。當時的OpenAI和百度都希望這些智能體可以成爲增加ChatGPT和文心一言使用市場的工具。
事實是,低頻的聊天需求聚合,根本帶不來用戶時長的增長。甚至,用戶選擇智能體也不是因爲它多麼有趣,而是希望它能提升自己的效率。當大模型變得足夠聰明時,人們召喚算命大師可能只需要一句話,沒有人會再去從衆多智能體中挑選出最順眼的算命大師。
GPTs們是在基於技術現狀思考產品形態,而Manus是在打造一個載體去承載技術的未來——這也是Manus團隊給到的一個避坑指南。
開發AI產品不同於開發互聯網產品,後者面對的技術與平臺相對穩定,搭建起更好的產品體驗,類似有了智能手機,在上面去開發微信,前者強調對技術的預見性,據此來開發產品,是要設計能夠讓汽油更充分燃燒的發動機。
Manus之所以能夠給到很多人震撼的感覺,是因爲Manus展現出了人發出命令,不要對話引導,只用監督Agent執行的未來雛形,比Auto-GPT展現的自我思考、自我規劃能力要更能發揮未來AI的能力。
而且,Manus也不需要像AI Agent程序員Devin一樣,針對不同場景進行鍼對性設定,而是說一句話就能啓動不同領域的任務,讓人們使用AI的效率得到了提升。
當然,這樣做的風險就在於,面向未來技術能力的載體,往往會在當下露怯。Devin發佈後,也遭受過質疑,因爲技術需要進一步迭代。而本就是要搶跑Agent比賽的Manus,既沒有做好全面開放給用戶使用的準備,也缺少讓通用AI Agent完美無缺的技術支持。
半黑半紅是他們自己早就做出了選擇的結果。
好的Agent一定是合格的消費品
Manus的成功之處在於,從C端用戶的需求出發,搭建起了一種高度靈活且低門檻的Agent服務模式。
在B端市場,客戶只會爲好的消費品買單。而且,B端客戶對Agent的可靠性有更高的要求。也因此,AI Agent在B端的探索往往都是從某個垂直業務場景的優化切入,所以會有Salesforce旗下Agentforce這樣的平臺,爲企業提供按需搭建AI Agent的服務。
在C端市場,好的消費品不只要好用,還要簡單。首先,絕大部分用戶甚至對自己的需求都沒有一個清晰的認知,腦子裡只有一個模糊想法的時候,就會去尋求AI的幫助。其次,用戶即便有清晰的需求清單,知道如何分步完成,也很大概率不精通實現任務的工具。
這就導致,像字節釦子、騰訊元器這樣需要用戶自己搭建工作流的平臺,更像是一個服務開發者的平臺,而不是解決C端用戶需求的平臺。豆包+釦子、元器+元寶的組合也一直沒能打出這套「需求對話+Agent執行」的組合拳。在OpenAI、Google、Meta的Agent嘗試中,我們也還沒有看到統一需求入口+多Agent能力的低門檻產品組合。
復旦大學的技術團隊推出過一個名爲AI2Apps的一站式AI員工開發與端側服務平臺。這個平臺有一套基於瀏覽器的Agent操作系統,提供全套開發工具,能像Devin一樣編寫代碼,是一種高階版的扣子。開發者能在「建築師Agent」的主導下完成某個崗位AI員工構建與組合。但這依然沒有解決C端用戶的簡單使用痛點。
但在Manus,用戶說出一個需求,就會有Agent先進行分析拆解,然後分配不同的Agent去執行不同的工作,調用不同API完成任務,還會有Agent負責反思和挑錯。而且整個過程清晰可見,用戶可以介入調整。
這是一個合格的消費品應該具備的素養,把所有用戶看做小白,讓他們在不懂如何編寫網頁,如何調用API的情況下,也能高效完成任務。
但是,Manus欠缺的是,執行具體任務的準確度與精細度。這是一個打磨不同能力Agent的過程。
OpenAI也有類似Manus的想法。Deep Research的團隊成員Josh Tobin就認爲,雖然這些Agent現在是獨立的,但人們日後能夠使用的終極Agent,不會僅侷限於網頁搜索、操作電腦或執行人類助手的常規任務,而是能夠以更自然的方式融合所有這些功能。
但Open AI選擇的是先通過定製化模型,訓練出比大語言模型更適合執行具體任務的Agent。其中,Operator是一個偏重執行與操作的Agent,Deep Research更偏重信息的收集、整理、歸納。未來可能還會有其它的Agent出現,但他們最終可能會成爲ChatGPT手下的員工。
編程平權會帶來更靈活的執行
如果說大模型帶來的是在交互靈活性上的提升,那麼AI推動的編程平權,會給Agent執行任務帶來更靈活的手段。
Deep Research的團隊成員Josh Tobin表示,一些公司構建Agent時,會選擇由人來搭建整個工作流,而工作流中的重要節點,會由大語言模型掌控,由其來決定下一步的行動。但這種方式構建出來的Agent會比較死板,難以靈活應付可能出現的所有場景。應該是,利用先進的推理模型,賦予它人類工作生活中使用的工具,直接針對期望Agent達成的結果進行優化。
所以Manus會強調「Less structure, more intelligence」,減少對AI的結構化限制,選擇了依賴大模型能力來組建工作流。在大模型的指揮下,Agent會在自己的虛擬電腦上使用瀏覽器、編程工具等完成任務。這樣的好處是隨着大模型能力的增強,對任務的理解和拆分就會越準確。
在大模型做總指揮的基礎上,對編程能力的調用,會帶來解決複雜問題的更好方案。在Manus的演示案例中,可以看到根據蒐集到的信息創作儀表盤的操作是通過編程解決的,有用戶生成PPT也會先依靠編程能力寫出H5頁面,再把頁面轉存成圖片。編程平權帶來了執行任務的更高可控性。
在本週,前谷歌 DeepMind 研究人員Misha Laskin和Ioannis Antonoglou創立的Reflection AI獲得1.3 億美元融資,要開發超級智能。他們的第一步就是構建一個自主編程工具,用於掃描代碼漏洞和優化應用程序內存使用等場景。具備自主編程能力的Agent是他們構建AI工作團隊的重要技術基座。
Agent需要「統一市場」建設
Manus的一個侷限是,可以選擇使用API調用不同的信息源和能力,但是API無法幫助Agent克服移動互聯網的孤島效應。在一些測試中,Manus能夠繞過一部分平臺的人機驗證機制,但也會在調用其他平臺的API時報錯,在一些平臺上收集信息時也需要人類接管進行登陸。
Agent需要一次「統一市場」的建設。
簡單來看,用戶在登錄了Manus之後,如果想要發揮更好的效用,需要有一個連接範圍極廣的基於一個賬號的聯合登陸機制。在國外來看,能夠做到這一點的是Google,即便是Meta也還差點兒意思;在國內來看,微信的連接範圍廣,但也不如Google賬號。
即便是在互聯互通的口號下,國內的互聯網產品想要實現聯合登陸機制,也是一個很困難的任務。所以就出現了GUI(圖形用戶接口)Agent,希望通過讓AI讀取屏幕信息,在更底層繞過App之間的牆。AutoGLM、computer use等能力的推出,都是在這個方向上做的準備。
與之相比,Manus的AI+虛擬機方案雖然更安全、更易實現,但侷限多,不夠底層。
一個更長遠的目標是,基於GUI Agent形成一套以Agent爲核心搭建的操作系統。就像Meta的首席AI專家楊立昆(Yann Lecun)所言,短期內需要讓AI系統能夠執行一系列行動,長期來看則需要下一代AI系統的支持。
這個操作系統,本質上就是一個融合軟硬件能力,能協作不同模型的「大腦」。