年刊節選|小冰CEO李笛:CG建模數字人“唯物”,小冰“唯心”
在元宇宙熱潮的影響下,2022年,數字人領域出現井噴。大到互聯網巨頭,小到創業公司,紛紛入局數字人領域。
不過,在相對高調的數字人領域,有一家公司,技術實力與曝光度遠未成正比,那就是小冰公司。
相比國內數字人公司,小冰公司是爲數不多的願意在“海平面”以下做數字人基礎設施的公司。
小冰公司CEO 李笛
用小冰公司CEO李笛的話說,小冰想做的AI Beings是有靈魂的數字人,而不是隻能簡單交互的數字人外形。
根據小冰官方數據,小冰框架是全球實際落地及完備度最高的AI Being基礎框架,覆蓋中國、日本、印度尼西亞等國6.6億在線用戶、10億臺第三方智能設備和9億內容觀衆,商業客戶覆蓋全球。目前框架內運行着數千萬AI Beings,其中數字員工約有30萬名。
數字員工、虛擬陪伴、遊戲NPC是小冰數字人開發的主要場景和應用。尤其趁着企業數字化轉型的浪潮,小冰框架在數字員工領域大殺四方。
在過去的一兩年中,在小冰框架的基礎上,不斷爲客戶開發出觀君、招小影、崔筱盼、N小黑等一系列專業領域數字員工。在李笛看來,數字員工遠遠不止是一張超寫實的面孔,更重要的是可以完美勝任財務、教練、客服等一系列工作,且比真人做得更好。
(崔筱盼)
從2014年誕生到現在,小冰已經經歷了9代。在“海平面”以下,她究竟打下了怎麼樣的基礎,與市面上的數字人究竟有什麼不同?我們跟小冰公司的CEO李笛聊了聊。
“數字人行業在2022年迅速進入了一個紅海市場”
娛樂資本論:你怎麼看我們這次年度大會的主題——咬定青山?
李笛:人工智能領域需要充足的耐心,沉下心深入研究,也許短期內看不出什麼,但在未來回看,卻發現這些“海平面”以下的事非常重要。就像竹子“咬定青山”地紮下去,把根基打牢,纔有可能勃發。
娛樂資本論:2022年,數字人的製作成本快速降低。你如何看待行業的發展趨勢?
李笛:首先明確,數字人的概念,到底是什麼?現在很明確的一件事是,不同的人對數字人概念的理解大相徑庭。比如,大家在總結數字人技術的時候,會強調他的建模和動捕。這裡面隱含的意思就是,他對數字人的意思是還是基於外觀的理解。
而當我們說數字人的時候,說的是自驅,交互和內容生成。
這是一個比較大的分野。如果只強調外觀,那麼過去一年的時間,這個領域,不是成本在大幅度降低,而是利潤在大幅度降低。這個領域迅速進入了一個紅海的狀態,互相之間殺價殺到利潤非常低。因爲這個領域的技術同質化很嚴重。
第二,這些企業的付費客戶一般是各大品牌的市場部門,因爲,數字人通常被企業當成營銷手段的。但小冰旗下的數字人,是幫助企業做一些真正的事情的,比如財務催款、體育教練、財經新聞撰寫等等。
所以,數字人行業出現一個非常奇特的狀態——如果放在人工智能領域,它有非常大的未來。但如果它的定義還是一個外形,那麼,他的上限不會很高,是因爲,他的市場需求量沒那麼大。
娛樂資本論:很多數字人的公司都在做“海平面”以上的事情,比如打造一個更好看的外表,爲什麼你有勇氣從“海平面”往下做?
李笛:目前市面上很多數字人的嘗試,我們當初在微軟的時候就都嘗試過了,比如智能客服系統、智能操作系統、智能音箱等等,我們平行趟了各種坑。所以在做小冰時候,就已經有了一個完備的技術框架。
我們對小冰的一個基本理念是,完備框架。就是說,小冰不是一個基於問答,或者不是基於單輪交互,而是基於一個交互全場的產品,它要求人工智能程序能夠引導這個交互項目去發展。爲此,她需要有內容生成能力,需要有情感,或者說情商。
小冰當時其實是微軟做的第一個人工智能助理Cortana的Plan B。我們在當年並不是那麼明確的知道,哪個方向纔是未來趨勢。但是在我們做Cortana的時候發現,這種基於問題,或者是從人工智能那裡獲得知識這種模型,可能並不是唯一的答案,於是我們做了小冰。
經過很多年之後,我們發現小冰是符合未來發展趨勢的,她的出現更加符合人工智能的發展上限。
我們認爲這個世界上,不會只有幾個人工智能助理,或者幾個回答你問題的數字人,而是有各種各樣的AI Being。
我們要做的事情是,讓這些AI Being跟人的交互,就像人與人一樣。爲了這些,我們會去讓她擁有“情商”,掌握唱歌、畫畫等內容生成能力。
“我們不做‘替代’人的虛擬人,我們做‘補位’”
娛樂資本論:爲什麼你們每次都從數字員工這個領域切入?而不是虛擬偶像?
李笛:我們會判斷什麼是AI Being需求最大的地方,從而優先篩選具體的賽道。
很遺憾,AI Being需求量最大的地方不是回答問題的知識專家,而主要是三類。一類是企業數字員工,一類是人類周圍的陪伴者,還有一類是遊戲裡面的NPC。這幾類需求很大,所以這些也是我們的主要佈局。
娛樂資本論:聽說小冰框架在金融資訊領域已經有了廣泛地應用,是否可以介紹一下?
李笛:比如每日經濟新聞的虛擬人主播N小黑,已經穩定運行了一年多了,365乘以24小時不間斷播報財經新聞。他的聲音、肢體、面容,以及播報的內容,都是人工智能小冰框架來生成、運行的。因爲如果不是全程都是人工智能的話,就不能保證24小時的連續直播。
像金融摘要,是所有文本里面最難的,因爲它得容錯性非常小。比如上市公司的公告100多頁,你要把它壓縮成一個200多字的資訊。
讓AI Being把幾百頁的招股書寫成新聞稿這件事不是我們今天才開始做的。從5年前開始到目前爲止,國內90%的機構投資人每天看到的財經資訊,都是小冰生成的。我們專門爲這個功能搭建了一個金融知識圖譜,這個圖譜裡包含1000多個影響因子。
娛樂資本論:“觀君”也是小冰框架驅動的數字人,並且是一個人工智能的教練,它真的比真人教練更好麼?怎麼實現?
李笛:在某些方面,他不光是比真人教練要好,更是真人教練沒辦法比的。我們有一個理念,就是我們不做“替代”人的虛擬人,而是要做“補位”,完成真人無法承擔的工作。
先拿金融摘要舉例。我們在推出這個金融摘要之前,絕大多數上市公司公告是沒有摘要的。因爲每天早上有100多個上市公司發公告,每個公告可能都有100多頁,你需要配多少人也來不及做摘要。但是,作爲一個投資者,我需要知道這些信息,卻不可能看完這麼多頁,過去只能挑着看。所以,我們的方案並不是爲了替代人,而是做那些真人他做不到的事情。
同理,體育的訓練系統也一樣,AI可以通過捕捉準確的運動軌跡,對比過往的數據,以及其他運動員的數據,快速做出分析。這一系統的穩定性和準確性會遠遠高於真人教練。
娛樂資本論:做出這樣的一個數字人,貴麼?
李笛:研發成本不一樣。如果做一個垂直領域的專業系統,確實也需要花比較長的時間,但它不難。更難的其實是通用性的開放域問題,開放域的問題解決了,再去解決一些垂直領域的問題就比較容易。
小冰從2020年開始進入汽車的智能座艙領域,到現在兩年時間,滲透率已超過60%。所以,從海平面以下開始做,你會越做越順手。
娛樂資本論:小冰不久前爲招商集團做了一個數字員工叫“招小影”,爲什麼招商集團願意跟小冰合作?
李笛:有幾方面原因,國內不同的人在提到數字人的時候,概念都不一樣,很浮躁。但絕大多數人提到數字人的時候指的都是3D建模,就是創造一個外形,可以念一段文字,或者有動捕的方案做虛擬IP形象。
但我們更關心,如果是一個企業員工的話,他是否能真的能做事情。所以,招小影不光要有外形,她還需要真的出現在招商銀行的ERP系統,真的在做招商集團員工的工作。同時,她的外觀、語言交互等都不輸於3D建模的同行業者。
比如,如果你想做一個數字人,基於神經網絡渲染這樣的方式,能夠做交互的話,那麼,至少讓他的延遲要做到毫秒級。就是你說一句話,數字人能在毫秒內回覆你。但目前行業的水準是在分鐘以內。
“我們不做系統集成和硬件”
娛樂資本論:目前小冰主要的收入來源是哪些?
李笛:我們有幾個要求。第一,我們不做系統集成,第二,我們不做硬件,只做純軟件的收入。我們目前的收入來源是B端。
小冰認爲,未來人類會被AI Being所環繞,形成人與虛擬人共處的社交網絡。這意味着,只要有人的地方,就能有AI Being,它需要是一個“跨空間”的存在。比如,你的家裡、你的車上、你的社交網絡平臺……只有軟件可以實現。而一旦把AI Being實體化(硬件化),它就只能存在於那個實體中。
娛樂資本論:B端的收入是什麼樣的收費模式?
李笛:我們是按照不斷疊加累計的月服務費和年服務費來收入。行業裡面主要是按照AI系統的調用來收費,我們不是。
在某些情況下,我們會按照實現的效果進行分成。我們是按照整個給你包裝出來的AI Being賣,你可以理解爲我們在“買賣人口”,賣出去的是一個服務包的價錢。小冰不賣技術。
娛樂資本論:你說,小冰要做的就是“販賣人口”。這個“人口”的數量,有上限麼?
李笛:數字員工正在跑的已經超過30萬個了。如果再加上to C的虛擬陪伴,那就是幾千萬了。
娛樂資本論:怎麼會有30萬個這麼多?
李笛:在日本大阪試點的老年人家庭,有政府給他們派的數字員工,每個家庭裡數字員工都不一樣。因爲老年人可以通過訓練,使人工智能變成他想要的“樣子”。數字員工承擔的是政府的公共服務。
娛樂資本論:我聽說小冰現在一次對話能達到32次?正常人類一場對話平均下來也只有38次左右。
李笛:目前小冰一次對話最高可以達到39次交互。這個交互技術和對話模型,很多公司都在做。但小冰的對話跟實驗室的研究相比,其實曾踩過很多坑。比如,線上的一些交互特別複雜,2016年的時候,當時美國版小冰上線推特剛滿24小時,就被網友的對話數據教成了種族主義者,然後讓CEO出來道歉。
現在的小冰也是一樣的。你會看到,實驗室中的數字人單就對話質量,以及對話輪次,有很多比小冰更好的,但是大多數都很難落地。因爲落地涉及到兩個問題,一個是成本,一個是安全性。尤其是對話安全性方面,一旦出問題,很難解決。
所以,歸根到底,安全性一定是小冰公司的第一原則,我們寧願犧牲一些文本上的豐富性,也不希望小冰框架在安全性上出問題。