騰訊和字節的幽靈在中國AI的上空徘徊
作者 | Yoky郵箱 | yokyliu@pingwest.com
2023年4月,產品經理鬆鵝(化名)從騰訊離職兩天後,就從深圳來到北京,加入一家基座大模型的初創公司。彼時,這家公司還沒什麼資本追捧和用戶聲量,只有一個聽起來挺拗口的中文名字:月之暗面。
那時候這家公司的產品團隊,只有鬆鵝一個人。
同月,曾經在字節跳動全程參與搭建抖音和TikTok等產品的王長虎,在中美都狂“卷”文生圖時,,創業成立一家文生視頻公司:愛詩科技。
幾乎也是同一時間,在嘗試了AI口語軟件、AI換臉、AI心理諮詢等多個AI項目之後,用戶量的激增、投資人的熱情讓身在騰訊的萬磊發現:屬於AI的風口真的到了。
大模型最終要靠產品來落地,這是這些嗅覺靈敏的產品經理們看到的機會。而故事也就此開始。
鬆鵝來到月暗6個月後,他們做出了Kimi,又過了6個月,Kimi在全網爆了;在Sora沒火之前,愛詩的產品團隊已經開始重點突破“一致性”的難題,反覆進行迭代優化;萬磊被投資人質疑多次“AIGC應用沒有核心技術壁壘,很容易被模仿”之後,在藍馳的閉門會上遇到了剛剛從蘇黎世聯邦理工大學畢業,帶着大模型技術的姜昱辰。一個懂產品,一個有技術,他們組成了波形智能。
如果拿移動互聯網的歷史來對照,一個技術滲透到普通人生活的必經之路,就是應用的井噴。大模型領域今天似乎正在經歷相似的事情。每天都能看到一兩個新的產品誕生,走紅,被廣泛討論,它們的目標都是成爲一款“AI Native”的超級應用。
而在這些看似新生的AI明星產品背後,一個有意思的現象越來越明顯:
在它們身上你總能找到上個時代的影子,更確切一些,是騰訊和字節的影子——這兩個中國移動互聯網時期產品最強的公司,正像幽靈一樣,在中國大模型產品的上空徘徊。
1
騰訊的“門徒”
騰訊的人出來,總是很“騰訊”。他們做產品,也是忠誠的門徒。
鬆鵝的個人欄目叫《鵝庫》,而萬磊存着一堆張小龍的表情包。
鵝和張小龍,都是騰訊的“圖騰”。
在產品風格上,騰訊的產品經理們深受張小龍這位“微信之父”的影響。產品,是馬化騰一直強調的“連接器”,它是技術和用戶之間的連接,在騰訊的產品體系中,2C產品就是要把使用體驗做到“極致”。
2023剛開年,鬆鵝還在騰訊會議團隊待的好好的,用他自己的話甚至可以說是“很開心”。
它是目前最可用的會議工具之一,甚至一度可以說是騰訊繼微信之後的下一個明星產品。在其他所有廠商將IM、會議、文檔、OA都打包整合成一個軟件的時候,騰訊把它們拆開了。
極簡,是張小龍時代提出的“少即是多”的理念,而鬆鵝離開騰訊會議後繼續執行着這樣的理念。
鬆鵝曾在社交平臺上分享道:“做一個產品,添加一個功能很容易,不添加功能迭代用戶體驗很難,減少一個功能最難。大部分產品都是因爲不停地加功能而變的臃腫。”簡直是張小龍產品語錄的翻譯版。
而Kimi身上確實也能找到對應的烙印。
早期打開Kimi,除了對話框,幾乎什麼都沒有。在不斷更新的版本中,它“長”出了幾個按鈕。
這些按鈕包括了“首頁”、“新會話”、“歷史會話”和“Kimi+”,和Kimi的特色能力“網頁鏈接”、“文件上傳”,將核心功能凝聚成一個個按鈕,是騰訊的另一個傳統。
爲了讓用戶能夠了解按鈕的作用,Kimi中也存在着大量的“氣泡”,來進行進一步解釋。不僅如此,在Logo的下方,具有文藝感的文案,句句不同。
根據鬆鵝分享的一個有意思的例子,也能看出這種騰訊的烙印並非所有做產品的人都默認的原則。尤其是,當你的團隊也有了字節系的人——4月18號,在一次需求會中,鬆鵝提出在產品的某個位置需要一個文案。而“一位來自字節的同事當即反駁:在字節做產品從來不會有這種要求,這不會提升轉化。”他分享到。
“但這裡確實得有個文案,還得是比較有功底的文案。嗯,現在差點意思。”頓了頓,鬆鵝講道:“我們在騰訊做產品是這樣。”
把用戶的需求一個個拆到“事無鉅細”,以人爲本是騰訊做產品的靈魂。目前Kimi是唯一一個國內大模型,兼具了網頁版、App小程序形態的大模型產品,一位獨立開發者對我們反饋道:“表面上Kimi設置的網頁版、APP版和小程序版和其他同類產品沒有太大的差別,但當其作爲插件在網頁中使用時,Kimi的呈現效果要更好。”
右側爲Kimi插件
靈活的產品形態讓Kimi更具有大衆性和普遍性,Kimi插件可以直接翻譯+整理重要信息,同時還可以進行自定義調整需求,進行個性化設置。鬆鵝告訴我們,網頁插件版本是開發者自發調用API生成的,並不出自月暗團隊。
同樣由騰訊系產品經理打磨的蛙蛙寫作,產品形態上和Kimi有很多風格相似的地方。對於不同場景的拆解和功能介紹、教程導覽,在很多細節上的“較真”和“死磕”。
比如,對於一款生成文本內容的AI產品,萬磊的團隊發現,目前的模型生成能力往往並不能夠直接生成整篇可用的內容,往往部分可用需要進行二次甚至三次調整。他們給出的答案很騰訊——在大模型的生成結果中,添加了“滑詞”功能,以便於AI生產後的二次優化。
與此同時,騰訊的另一個靈魂“社交”,也快速展示在這些產品身上。
大學畢業之後,萬磊進入了騰訊,在全民K歌中負責社交關係鏈的部分,後又轉到“創新項目”部門,不斷追趕互聯網風口,做過數字人、元宇宙遊戲,陌生人交友,也做了一堆和AI相關的小項目,在不斷的探索中,他對於產品的思考越來越寬。
全民K歌推出之前,K歌已經有了標杆產品“唱吧”。那時的唱吧已經吸引和培養了一大批KOL,也在產品細節比如調音、製作MV上下足了功夫。
這盤逆風局,怎麼打?參考了以前微信借勢QQ、企業微信借勢微信的套路,全民K歌更加強調“誰在聽”而不是“誰在唱”。和微信打通之後,社交關係鏈自然而然的轉移到了K歌平臺,也爲後續的發展創造了土壤。
當你打開蛙蛙寫作就會發現,和其他產品不同的是,它更強調社交傳播,“邀請送會員”、“進羣有禮”讓人夢迴2018年全網都在“裂變”拉新之際。
我們曾與多位Agent創業者聊過當下的創業環境,他們的反饋往往是,“如今面臨的不是做不出來,而是做出來給誰用的問題”。
“找用戶”,無論是在移動互聯網時代還是AI時代,都是第一個核心問題。對於文案寫作工具而言,寫出來是一方面,給誰看是另一方面。在羣裡,用戶可以溝通和交流經驗,互相分享成果,甚至通過蛙蛙寫作的渠道報名參加小說比賽。
萬磊分享道:“我們光電話訪談的用戶累計有上百個了,有時候我們會把關鍵用戶叫到辦公室,當着我們的面使用產品,發現問題後產品團隊立刻進行調整,我們希望藉助自研模型把工具做細膩做透,和市面上其他套殼的寫作工具拉開差距。”
這些產品風格上的“路徑依賴”正隨着產品的長大而凸顯,這些主觀、細碎甚至有些執念的做法,很騰訊。
1
字節的“繼承者”
但字節的風格幾乎是光譜的另一端。體現在新的一批AI產品上,則是它不以人爲載體傳承,而強調一種產品邏輯上徹底的創新。
字節的人出來創業,帶着的是一種做產品的方法,而不是產品的風格。
“19年的時候我們組裡來了一個字節的小女生,感覺很不一樣。雖然我們平時也會看數據,但明顯她對數據和AB test更加敏感,所有的需求根據數據結果進行推演,包括好與不好,都是通過數據來評判。”萬磊回憶道。
字節系的產品跑得比較好的,產品模型基本長得很相似且粗暴簡單,推薦系統中臺+足夠規模化的數據input,從內涵段子到頭條到抖音到後來小一點的懂車帝,番茄小說都一樣,而騰訊產品做得好的產品基本離不開社交關係鏈。
騰訊像文科生,做產品的都是人類社會學研究學者;而字節是理科生,灌數據、做AB測試,然後跑數據,出結果。愛詩科技產品負責人牧之這樣總結。
算法是整個“字節系”產品的靈魂,公開資料顯示,王長虎在字節跳動負責了視覺算法平臺和業務中臺的搭建,用算法爲代表的方法論來決定產品的樣貌,這種方式同樣帶到了他的愛詩科技。
“推薦算法技術中臺的打造是最困難的,他需要給足夠的空間和自由度,讓產品能夠在短時間內完成更多需求測試,同時他也需要足夠開放,對未來產品發展空間的承壓能力和適應空間。”牧之說道。
參考移動互聯網時代的抖音,幾百萬視頻播放量時搭出的推薦算法框架,到了幾百億觀看的規模,算法是不是仍然適用,仍然能夠高效的分析每個用戶的喜好。
這裡我們舉個簡單例子,用雙向標籤對照的體系,爲用戶打標籤,也爲內容打標籤,進行雙向匹配,這樣無論內容體量多龐大,用戶體量如何增長,這樣的機制能夠保證實現“千人千面”。
字節系信奉這套方法論,在不同的場景、不同的行業這套方法論會出現不同的結果,也會遇到不同的難題。比如,對於愛詩來說,產品經理想設計一套機制,跑一個推薦模型,怎麼讓你的Tranformer或者Diffusion模型,通過產品能夠拿到足夠多的前期數據?
“第一重要的仍然是需要知道用戶到底要什麼,他要這個視頻來做什麼,對應到我需要什麼楊的數據,第二是設計一套機制,無論是自己生產數據,採買或者爬取數據,還是強化學習來回收數據也好,input到你的模型。”牧之講道。
所以在推出PixVerse之前,愛詩產品團隊做了很長時間的時間用戶調研,爲了完成第一步。
通過對國內外比較核心的專業視頻生產者的前期調查,愛詩發現,清晰度是用戶的一個核心剛需,一致性是對視頻生成模型能否成爲生產力的一個更高標準,產品通過市場調查反哺技術,技術團隊對此進行模型突破。
對於AIGC的使用場景,在早期根據歷史軌跡的推演下,只能替代現有的一部分而很難開發新場景,且在技術發展的早期,比如文生視頻的時間只能有3-4秒的高質量輸出,能夠滿足的需求有限,產品需要找到一個合適的切入點。
有了切入點以後的下一步,是建立一個良性的算法模型。
牧之舉了一個例子,在訓練鏡頭這個事情上,如果產品能明確好當下用戶其實最爲需要的是一些專業性的鏡頭,那麼你在做數據收集和數據標註以及清晰的時候,是會存在很強的傾向性的,就是需要這些專業鏡頭的數據, 有了這樣的判斷,往往能用更少的數據和更低的訓練成本得到一個更好的結果。
隨着用戶量的增長,標註的元數據越來越多,算法也就越來越靈。
目前PixVerse在海外文生視頻產品榜單中下載量連續排名靠前,也通過不停的算法優化和數據積累,形成了產品突破力,滾動的雪球開始有了實體。
1
技術與產品的新羈絆
騰訊和字節的產品風格區別,其實還暗含着一個本質的問題:技術與產品之間的平衡。
騰訊系的產品誕生和成熟於互聯網時期和移動互聯網初期,技術是現成的,需要產品提供的對用戶需求的準確理解,來把它的價值體現出來。字節系的產品在移動互聯網的另一個階段快速成長,這時候以算法爲核心的技術,本身在一種不穩定中快速進步,它帶來的強大能力是頭條和抖音這類產品可以出現的根本,產品經理的“上帝”的角色就讓位給了算法技術。
這種產品與技術之間的牽絆在今天AI大模型時代,換了形式繼續籠罩在各個產品的製造過程中。
“如今做產品和移動互聯網最大的不同是,需要思考技術能解決的問題,和產品能解決的問題”。幾乎我們問到的所有產品經理,都給出了這樣的答案。但同樣的,不同的底色依然決定着問題的答案。
對於視頻生成產品,一方面模型的效果本身就與技術資源密切相關:比如顯卡、顯存的限制或者算力的不足會直接影響效果;另一方面,視頻本身存在着大量的敘事邏輯,和對於劇情的完全可控,這導致了無法滿足理想的產品形態。於是就像字節的產品那樣,愛詩的產品設計也要很大程度從算法技術出發思考。
一開始大多數的視頻生產產品只能生成4s的視頻,但一個電影的平均單個鏡頭都有6秒,技術要進步如何突破時長,而產品則需要思考,即便是4s的視頻,能夠使用在什麼場景。
而即便是在4s的限制下,仍然能解決傳統的影視製作中,補缺一些空鏡頭和漏幀,解決重拍補拍的成本高昂的問題。
而且在底層大模型還在不停迭代的今天,對產品細節的追求,也要建立在技術差異之上,它甚至直接決定了產品的形態。Kimi和蛙蛙寫作看似都是文本生成類的大模型產品,但技術能力完全不同。
衆所周知Kimi擅長的是長文本的輸入,能夠一口氣讀完一本《三體》,但在應用中就會發現,Kimi的長文本輸出能力不夠強,無論給怎樣的提示詞,其輸出的內容經常爲1000字左右,所以Kimi的使用場景經常爲“修改部分論文”、“寫小紅書文案”等等。
而蛙蛙寫作作爲一款在創意文案生成上更垂類的產品,它的核心技術能力是長文本輸出和長期記憶,以小說功能作爲切入點,通過對小說的背景、任務、主線劇情進行設定,蛙蛙寫作往往能夠生成幾千字的小說內容,並能夠完整保存前序劇情。對於企業級的數據庫定製和固定文件的模仿輸出,也更遊刃有餘。
“在所有文本生成中,寫小說其實是最難的。它需要嚴格按照世界觀框架輸出、人物情緒刻畫要到位、人物臺詞要足夠擬人、故事反轉要緊扣設定等等。即便Sora是物理世界的模擬器,它仍然需要文字先將所有的前情全部設定好,再進行生成。未來文字創作內容將作爲底層,各個獨立的多模態技術真正要落地,還是要被底層所調用纔能有更大的價值”萬磊講道。
但相信產品依然是個“手藝活”的人們,並不會就此把一切都交給技術。
你可以看到,國內的通用大模型產品,在生成內容底部,往往會出現一個“點贊”和“點踩”的按鈕,這是人類自主給大模型進行的評價和反饋。
萬磊講道:“如果讓技術自己識別哪些生成內容是好的,哪些是不好的,靠技術實現很困難,但是在產品中加了一些設計,便可以反哺技術,讓生成結果越來越精準。”
更重要的是,在這個階段,產品是扔向市場的一個“鉤子”,只有不斷的使用、不斷反饋才能不斷迭代不斷進化。只有產品鉤得住用戶,之後的一切纔有意義。
“技術的高速發展最終的結果就是越來越同質化,這時候需要產品形成差異性,我認爲那時候產品經理的空間將會更大。”牧之說。
從做產品的方法,到所謂的產品哲學,再到產品與技術的關係,這些決定着中國AI未來走向的問題,某種程度都在延續着騰訊和字節在移動互聯網的故事,這兩個幽靈會繼續遊蕩在中國AI的上空。