蘋果AI高考最後交卷,用戶:就這?
繼OpenAI、微軟、谷歌、Meta相繼奔赴“AI高考”,掀起了一波波熱浪後,蘋果作爲最後一個被萬衆期待的優等生,磨蹭許久,也終於交卷了。
6月11日凌晨,蘋果2024年全球開發者大會(WWDC24)如約而至。不出所料,發佈會上對AI功能的介紹吸引了最多目光,佔據了多達一半的演講時間。
此前,圍繞着蘋果與OpenAI的合作落地,蘋果會不會藉此改造一言難盡的Siri,蘋果的AI命名(Apple Intelligence)問題,輪番上陣的預熱和討論,已經在互聯網上持續了不短的時間。
最意味深長的部分則是,向來崇尚自有生態的蘋果,雖然屢屢傳出將允許OpenAI深度介入,但或出於“掙扎”,傳言也數次被“闢謠”。發佈會讓猜測的靴子落地——蘋果與OpenAI達成的,幾乎是“顆粒度級”的合作。
很難說這樣的升級,對於蘋果究竟是喜是憂。最直觀的是,市場反應慘淡:發佈會進行同時,蘋果股價便不斷下跌,最終每股報收193.12美元,跌1.91%,市值縮水578億美元至2.96萬億美元。
微博上有用戶表示:比起AI能力,發佈會最大亮點是——電話通話終於允許錄音了。
大會開始,OpenAI創始人山姆·奧特曼(Sam Altman)被安排到了前排就座。這是他自2008年後第二次於公衆視野亮相WWDC,似乎也預示着,蘋果這次與OpenAI的合作,絕不尋常。
雖然5月以來,OpenAI、微軟、谷歌、Meta已密集地上演了一場場“AI春晚”,展示了不少精彩技術;但AI距離普通人的理解,以及真實的場景落地還有不小距離。而蘋果看起來,纔是最有希望將“AI”拉入凡間的公司:可以用更貼近用戶的手機AI功能,通過OS和各種App與生活交融。
這也是蘋果在這次發佈會上希望傳達的調性,庫克將蘋果的升級概括爲個人智能(personal intellegence)。他表示:“我們希望產品強大、易用、符合直覺、能和現有的產品集成、個人化。”
作爲預熱過場,蘋果先用了一個多小時介紹了MR頭顯VisionPro、iOS、Watch OS、iPad OS、Mac OS乃至於Apple TV的一系列更新。這些“點綴前菜”讓觀衆們聽得不勝其煩,直到進度條拉到1小時後,Apple Intelligence才姍姍來遲——把One more thing放在最後,也是蘋果的傳統藝能。
很難講蘋果的AI升級究竟有多少震撼驚喜。其展示的各類功能,比如人工助手回答問題、修改圖片、自動翻譯、郵件摘要、潤色文章等,在近期AI廠商和國內的AI手機發布上都“似曾相識”。但蘋果的整合能力,還是能讓人看到AI可能帶來的深刻改變。
能顯現出蘋果最大決心的,無疑是爲Siri引用了GPT-4o,讓它變得更聰明。
回頭看去,誕生於2011年的Siri,着實是起了大早趕了晚集。在ChatGPT橫空出世前,Siri十幾年來從智能助手,淪爲了只會講笑話和被“調戲”的對象,難用程度已“槽多無口”。
發佈會前,外媒曾劇透,蘋果對於是否要幫Siri全面接入ChatGPT,有過兩極分化的“撕裂”討論。從結果看,不論是在AI大潮中感到了沉重危機,還是對OpenAI最終認栽,蘋果都痛下了決心,讓Siri活成它該有的樣子。
Siri的升級不可謂不多:蘋果爲其在主屏上設計了一個大光圈;基於Apple Intelligence能力,Siri具備了豐富的語義和大模型上下文理解能力,能理解用戶對“那次”“那時”“那裡”等代詞的具體描述。在原本的語音交互外,Siri還將增加文字交互功能、跨App執行操作等新玩法。
現在,用戶可以用文字、語音與Siri交流,它可以讀懂用戶說話間的猶豫——當遇到困難問題時,比如用戶詢問某道複雜菜式的做法時,Siri會提示是否需要喚起ChatGPT,並由後者詳細作答。
有了GPT-4o的能力墊底,用戶可以用文檔、圖片、PDF多模態對Siri提問,它也可以基於iPhone內的應用和數據庫,做出反應。
比如,一個朋友在短信中提到新地址,用戶可以讓Siri把地址添加到聯繫人卡片上。用戶也可以直接對Siri說:找到某張圖片,並進行修圖。或者在填表時,提示“幫我找到駕駛證號碼”,並填到表格內。
蘋果還在發佈會上展示了一個智能示例,對Siri說,“我要去機場接媽媽了”,蘋果便會讀取媽媽的航班信息、時刻延誤、機場交通,接着智能生成好時間表,填入日程中。
爲了表達對AI智能化的誠意,蘋果着實一股腦拿出了“全家桶”的選擇。從通話、語音轉文字、智能對話助手、圖片處理,到訪問第三方應用,蘋果幾乎對每項核心功能都進行了智能優化。
例如,Apple Intelligence支持智能回覆郵件。面對長篇的郵件線程,用戶僅需輕觸屏幕,就可獲取關鍵信息。iPhone可以對郵件快速總結提要,進行簡單回覆,同步翻譯。
基於蘋果內置芯片的強大算力,Apple Intelligence也把生成式模型部署在了iPhone、iPad和Mac本地,讓蘋果的原生系統多了不少新功能。
例如iPhone始終被詬病的無法通話錄音,也終於做出了改變,更新後不僅能夠錄音,在AI加持下還能夠提供文字轉錄、要點提取等服務。不過,使用通話錄音時,考慮到隱私保護,對方將會收到相應通知。
針對無邊記等寫作應用,Apple Intelligence會幫助用戶提供寫作優化建議、內容校對等,用戶可以從多個版本中挑選,調整文風以適應不同的讀者和場合。例如,用戶撰寫郵件時,寫作工具菜單會彈出潤色選項,並提供智能回覆郵件等功能。
最能讓用戶發揮個人想象力的功能還包括“智能圖像生成”。蘋果推出了Genmoji(表情生成)功能,支持用戶通過自然語言描述生成表情符號;並進一步推出了Image Playground(圖像遊樂場),能夠讓用戶自選服裝、地點、配飾等關鍵詞,在幾秒鐘內創造出有趣的圖像。
種種Apple Intelligence的功能更新,背後少不了和各家大模型,特別是OpenAI達成的顆粒級合作。如AI從業者“歸藏”所說:“連文字改寫都用的ChatGPT,圖像看起來用的是DALL-E(OpenAI於2021年發佈的圖像生成模型)。”
而對於以上的大模型調取,蘋果宣佈都將完全免費。用戶不必創建賬戶,就可以免費使用ChatGPT,ChatGPT訂閱用戶也能關聯自己的賬戶,並在蘋果設備中接入付費功能。
包含上述功能的“英語試用版”系統將於今年夏天推出,並於今秋落地在iOS 18、iPadOS 18及macOS Sequoia中。但考慮到GPT-4o對大陸的訪問限制,本次iPhone和Mac功能更新,可能基本與國行版本無緣。
按照官方說法,蘋果還計劃於明年推出更多AI功能。但由於以上功能需要A17 Pro芯片支持,用戶必須要購買iPhone 15 Pro以上級別產品,纔可以使用。
實際上,這是一場並無多少秘密的發佈會。幾乎提前一星期,WWDC24的核心信息就被路透殆盡。可以預見的是,蘋果發佈的諸多功能,將很快引來友商跟隨。而在大模型和AIGC時代,作爲智能手機市場的“舊王”,蘋果將如何捍衛鐵王座,也將成爲重要命題。
但某種程度上,對自有生態護城河格外重視的蘋果,選擇對OpenAI敞開大門,已經站在了被動的身位。雖然在大模型橫空出世後,蘋果一度也躬身入局嘗試自研,但結果並不盡如人意。
去年,市場一度傳出蘋果正在積極自研大模型“Ajax”。今年3月蘋果曾公佈自研的MM1多態大語言模型,但後來並未對該模型開啓公測,也未發佈上線時間規劃。
同月,在發佈新款Macbook Air時,蘋果也在宣傳文案中首次強調了“AI”。4月,曾有媒體爆料稱蘋果正在研發一種運行於設備端的大型語言模型,該模型將優先保證響應速度和隱私保護能力。
不過這些,顯然都未幫助蘋果放大出強勁勢能,挽救AI頹勢。而友商們,還在不斷通過各種合作,跑步入場AI硬件。
早在2023年,華爲、小米、vivo、OPPO、榮耀等國產手機廠商,就已開始大模型試水,自研亦或接入外部大模型的努力,頻頻見於報端。
2023年7月,華爲在開發者大會HDC上發佈了盤古大模型3.0,官宣新一代智能操作系統HarmonyOS 4已接入了盤古大模型。一個月後,在年度演講上,雷軍透露小米的13億參數版本自研大模型已經成功在手機端側跑通。11月,vivo、OPPO先後推出藍心大模型矩陣(BlueLM)和安第斯大模型(AndesGPT),同期搭載於手機亮相。
兜兜轉轉,蘋果在手機大模型賽道的進度條顯然落後了。而這在本已紅海廝殺的智能手機市場中,無疑是極大劣勢。
有開發者指出,目前還未有一家智能手機企業如蘋果這樣,如此大範圍、細顆粒度地引入了AI大模型的嵌入。隨之而來地,頻繁端側推理帶來的高耗電問題能否解決?還要等蘋果全面開放使用後,纔有論斷。
值得一提的是,2008年,年僅23歲的山姆·奧特曼曾來WWDC演講,推廣自己的首個創業項目,並於Apple Store上架了好友定位應用Loopt。16年後,憑藉蘋果與OpenAI的深度合作,山姆不僅再次成爲WWDC座上賓,更搖身變爲最大的隱形Boss,堪稱最大贏家。
在大會結束後,山姆通過個人社交媒體發帖稱:“非常開心與蘋果達成夥伴關係,並將在今年晚些時候將ChatGPT嵌入他們的設備中。”
對於OpenAI而言,在微軟之後又收穫了蘋果這個重大的合作伙伴,意味着在大模型的浪潮裡,又多了一塊最重磅級別的壓艙石。
不過蘋果的合作,也未必代表着甘願長期與OpenAI綁定,或許也只是在爲自研進程爭取時間。近期,Siri聯合創始人達格·基特勞斯 (Dag Kittlaus) 預測:OpenAI 的合作對蘋果來說可能只是短期到中期的關係。
(文中插圖如無特別說明,均來自於蘋果)
作者 | 董溫淑
編輯 | 李 原
運營 | 劉 珊