向文傑:人機交互的終極形態是腦機交互
杭州網訊12月18日-20日,2020本站未來大會在杭州盛大舉行。大會以“洞覺 未見”爲主題,匯聚了全球最強大腦,期盼以遠見超越未見,去尋找打開未來的鑰匙。
大會上,Rokid副總裁、產品技術中心總經理向文傑做了《下一代的人機交互》主題演講。
從第一臺PC出現,比爾蓋茨讓每個人辦公桌上有了一臺PC。接下來Smart Phone,喬布斯推動了手機普及,接下來是什麼呢?
向文傑認爲,當手機再往前演進的時候,下一代的產品一定不是一個更大屏幕的手機,這是不可能的。
Rokid公司生產了智能音響的鼻祖,但是當時向文傑並沒有把它理解成是一個音響,因爲它是最簡單、最自然的人機交互的方式。那未來會是智能音箱,還是一個什麼樣的設備呢?向文傑說,這就是他們一直探索的方向,“做出讓更多人更容易使用的東西,我們理解的未來是這樣的”。
向文傑認爲,當人跟機器交互的時候,需要輸入法嗎?需要了解各個應用怎麼用嗎?實際上不需要,只要瞭解它需要聽懂你的話。所以語音能力就要很強,就會變成它基礎的配置。
未來的交互更多是通過語音,通過手勢,更多通過更自然、更直接的方式交互。
帶着自家公司量產的最新款AI眼鏡亮相,向文傑彷彿已經實現了走向未來的基礎操作。
據他介紹,這款AR眼鏡,年初已經量產推向全球。到今天爲止,在全世界50多個國家進行了推廣,並且已經在當地開始售賣。國內各個省份,包括浙江省,包括浙大,包括良渚博物院,包括浙江省公安廳,也都開始推廣。
他說,未來已經開始了,新產品接下來會越來越多的來到我們身邊。
以下爲向文傑演講的部分內容:
大家好!
剛纔聽了一個非常燒腦的演講,雖然沒有太聽懂,但感覺這一定是代表未來的。我接下來跟一個相對簡單,也比較有趣的演講。
大家可以看到我現在戴的這副眼鏡,我其實戴的這副眼鏡是已經量產的AI眼鏡。我們過去這4年時間裡一直在探索AI和AR這兩個方向,並且不斷打磨產品。這4年過程中我們發現一個有意思的事情,接下來我們面臨的新時代快來了。就像今天“洞見”大會上講的一樣,未來十年一定會到來的。今天很多同學,很多行業還對這樣一個新的產品,新的領域,只是聽說過,沒有了解過,所以今天我做一個簡單小小的分享,讓大家對這個行業有所瞭解。
實際上在現階段很多的人對一個概念是分不清楚的,就是什麼叫VR,什麼叫AR,這個東西到底是幹嘛的。我其實在演講之前簡單介紹一下,VR的話,大家現在已經非常普及了,接下來一年的出貨量1千多萬套,在遊戲領域裡、培訓領域裡非常普及。AR剛剛開始,AR已經進入了很長時間,但現在纔剛剛開始。剛剛開始意味着什麼,這個行業還沒有被大衆所普及,也沒有被大衆所認知,但是它現在已經被很多行業裡開始利用起來了。我們現在所瞭解的,很多業內人士瞭解的是微軟的AR,但在國內AR是蓬勃發展。
簡單介紹一下我們這款AR眼鏡,今年年初正式量產推向全球。到今天爲止,它已經在全世界50多個國家都進行了推廣,並且當地渠道商、經銷商已經在當地開始售賣了。然後在我們國內各個省份,包括浙江省,包括浙大,包括良渚博物院,包括浙江省公安廳,其實全面都開始推廣這樣一款眼鏡,它已經開始了,只是它接下來會越來越多的來到我們身邊。
我舉個簡單的例子,我今天帶了這個產品的小配件上來。這是我們獨立研發的一款紅外測溫的模組,今年疫情之年,大家習慣的是用一個很大的設備放在門口來進行防疫測溫。但當我們這個產品剛剛推出時,我們把紅外測溫模組小型化,在全世界範圍內給了很多公司、很多國家帶來很多幫助。包括像新加坡、俄羅斯、德國,他們都大批採購這樣的眼鏡,用來幹什麼?用來在移動場景下實時檢測檢疫,做人體溫度的測試。在我們國家更是,包括良渚博物院都已經大量採購。其實這樣一個AI的時代已經開始了。
我接下來開始演講,好像我們講的是AR產品,Rokid公司追求的是人機交互。
我們擁有很好的技術,當我們拿着這個技術的時候,我們希望給到行業是什麼東西。
今天我從很多大拿的演講當中學到很多點,我們給到行業裡面不止是效率、不止是創新,還有很多人文關懷,這是Rokid公司很大內核的點。我們需要用科技的變革給行業更好的效率,更好的人機交互體驗,所以我們更強調體驗,更強調交互設計。
這張圖大家在無數地方看過,今天我用另外一個方式給大家解讀一下。
當第一臺PC出現的時候,比爾蓋茨講過一句話,讓每個人辦公桌上有一臺PC,他做到了。從我們的角度來看,不僅是科學技術的進步,不僅是通訊的進步,裡面帶來一個點,覆蓋的人羣越來越廣。
一開始的時候,小型機只有少量人用,當有了個人PC的時候,很多家庭裡面有了一臺PC。當它有了最早手機的時候,早期雖然做不到人手一臺,到現在爲止全世界範圍之內,基本上可以做到人手一臺設備。
接下來叫Smart Phone,大家看到的Smart Speaker這是我們公司2016年推出來的,大家可以叫智能音響,也可以叫智能機器人。我們爲什麼做它?我們相當於是一個智能音響的鼻祖,但是我們並沒有把它理解成是一個音響,因爲它是最簡單、最自然的人機交互的方式。就是因爲有了它,我們才能做出來未來讓更多人使用,而且讓更多人更容易使用的東西,這是我們最追求的方向和目標,我們理解的未來是這樣的。
剛纔講演進的趨勢有兩個點,第一個點是獲取信息的效率,移動互聯網一定比互聯網獲取效率高,傳統的PC一定比更產生的電報、電話這種獲取信息效率高,再往前是什麼?手機現在屏幕已經不可能變大了,現在有5G、6G,對應的載體是什麼?有什麼特點?是更大屏幕的手機嗎?還是一個什麼樣的設備?這就是我們一直在探索的方向。
我們認爲未來的設備有一個很大的特點,一定是便攜的,像手機在身上隨時可以用。當便攜再往前一步的時候就是隨身設備,應該沒有一個設備比眼睛是更隨身的設備,可以隨時隨地擴展眼睛的能力,現在很多手環、手錶,便攜式設備可以很快擴展個人的想象和能力,它可以快速獲取信息。相比手機而言,雖然不可能取代手機,這個是不可能的,像手機也取代不了電腦。但是會產生一個情況,極大可能的擴展人類的想象空間和可能性。
第二,更友好的交互。現在講交互相對少一點,可能設計師講的多一些,因爲我們是產品公司,更多會強調交互。剛纔給大家看到的Smart Speaker有什麼好處?在我們整個用戶場景裡面最大的好處是小朋友可以使用,沒有文化的老人也可以使用,所有的人都可以用。爲什麼?因爲它用的是最自然的交互手段,人和人之間肯定用最自然的手段交流,文字可能都不是最自然的,最自然的可能就是講話。人機交互,語音一定是最自然的,手勢一定是最自然的,還有更多自然的交互方式,以前的時候這些都不成熟。
大家知道AR這個行業不是現在產生的,50年已經有了,爲什麼現在越來越成熟了?越來越敢暢想10年以後讓AR普及,就是AI助力。我們結合AI能力、AR能力,打造更好更自然的交互。
我們這裡提出來一個論斷,這是我們公司共同認同的點,當手機再往前演進的時候,下一代的產品一定不是一個更大屏幕的手機,這是不可能的。當到某一天大家戴上這幅眼鏡的時候,今天沒有機會讓每個人體驗一下,但是打個廣告,大家可以去良渚博物院體驗這款眼鏡,我們通過這款眼鏡讓博物院各種各樣的文物有更豐富的體驗。帶來的好處是當人機交互往前走的時候,不是唯一是手機的時候,是什麼?讓視野變得更寬闊,可以讓空間裡面隨時隨地顯示你所需要的信息。當你跟它交互的時候,你需要輸入法嗎?需要了解各個應用怎麼用嗎?實際上不需要,你只要瞭解它需要聽懂你的話,所以語音能力就會很強,就會變成它基礎的配置。未來的交互更多是通過語音,通過手勢,更多通過更自然、更直接的方式交互。這樣的交互纔是小孩子會用的,老人會用的,所有人都會用的,只有這樣纔會不讓科技把任何人拋下,讓每個人享受科技,讓每個人感受科技帶來的樂趣。
今天大會剛開始的時候,我聽到一句話,可能是丁磊講的,我們的科技不僅僅是提升效率,另外更重要的是關注人文。這是我們想做的,希望把更好的科技,AI、AR的科技,這些能力集成到一個更好的產品裡面,但是最終給到用戶的應該是一個最好的交互,關注它,讓他不用避免高科技帶來的不會用,我很慌,我想避開它,這個東西太複雜了,我們希望用最簡單、最自然的交互,讓所有人使用它。
當這點實現的時候,人機交互的終極形態,再往前走一步就是腦機交互了,不是我們今天探討的。從過去探索的4年來,在這個行業裡面,科技的高速進步不斷涌入,未來10年,非常值得期待。
到目前爲止,AR眼鏡在C端大家看到的非常少,這也是經常有人問我,你們說MR、VR、AR是什麼區別。在產業互聯網裡面是非常流行的,包括大家看到的第一個就是良渚博物院。目前我們跟全國100多家博物館開展了讓博物館現在所有展品變成信息化,變成可互動的,變成讓所有小朋友到博物館以後能get更多信息,不需要你有很強的操作能力,不需要有很強的理解能力,因爲AR可以讓你更容易理解它,理解這些沉睡在地下的文物,目前這件事情已經陸續開展了。接下來大家都能看到。
這是兩會報道,現在很多媒體報道還是採用傳統的手機、直播方式,未來的制博會是另外一種主流。在外貿裡面變得越來越流行了。
工業領域,Rokid AR眼鏡現在在德國是最主要的出口地,德國是工業4.0的提出國。AR設備作爲工業4.0產業互聯網核心的器件,現在正在被各個行業所接受,現在我們這款眼鏡在德國出口量最大,因爲他們的工業互聯網需要這樣的終端,需要一個終端,除了能夠讓他實時看到操作過程中的步驟,裡面所具備的AI能夠可以輔助這個工人看看他做的對不對,是不是有更好的策略,並且把整個過程記錄下來進行AI分析,最後反饋給他,你可以做得更好。其實這件事情在德國開始了,在國內也開始了,我們跟中國石油、跟國家電網、跟國內很多大型汽車廠商都已經開始陸續合作了。
接下來在這些產業裡面,AI會成爲一個標配,成爲產業工人的標配,會打造未來工業互聯網時代超級工人必備的武器,這就是接下來這個行業裡面馬上會發生的。
最後就是公共服務。剛纔講到防疫,講到包括大型活動的安保,包括烏鎮互聯網大會,包括阿里巴巴年會,都會採購這樣的眼鏡,作爲現場安保重要的安保工具。爲什麼?它的AI能力讓每一個現場的服務人員火眼金睛,具備識別問題的能力,實時保持前端和後臺通信的能力。遠遠不僅限於上面四個領域,在很多行業都已經迅速普及。
我們爲什麼做AI,Rokid公司在杭州是AI和AR方面的獨角獸,爲什麼會做AI?本質還是回到最早講的交互。因爲AR能很大程度上改善人的交互,讓所有剛纔講的小孩、老人,所有人都可以利用這個科技,而不是對科技產生排斥。
AI在這個裡面幹什麼?降低很多複雜操作,你不需要做了,用最自然的方式跟他交流、溝通就可以了。
分享之前,我看到有一位同學分享數字人,這也是我們在追求的方向。雖然我們還沒有這個技術,但是我們完全可以合作起來,數字人也是基於AI技術實現了,AI技術無所不在。我們會把所有跟交互相關的AI技術整合到我們這個設備裡面,讓全世界所有人,各個語言的人,它可以聽得懂16種語言的,這是因爲AI技術的原因,這就是爲什麼AR發展了40多年沒有落地,現在高速落地了,因爲AI在發展,AI的發賦予它更好的交互能力、更好的體積、更輕便、更強的能力,所以說這就是AI讓AR開始落地了,AI讓AR在未來10年裡面能夠從不能落地,到工業裡面、產業裡面落地,最後再到C端消費者這邊落地,這是接下來的趨勢。
它能夠做到我剛剛講到的,AI更懂你,“懂你”意味着你很多事情不用做了,你講話就好。可以把你流程優化掉,然後顯示在你眼前,你跟它進行實時互動,我們現在做的事情,我們目前爲止把它們兩個結合得還是比較好,未來有很多的挑戰。
這就是我們想要做的事情,很多同學對這個概念不是很瞭解,如果大家關注到普通人在使用高科技產品的時候感受的時候,大家應該能感受的。我們當時在做智能音箱時非常明顯感受到,非常多的人對智能產品不敢用,躲的遠遠的,會對高科技隔離起來,包括電子支付也是一樣。我們能做的事情是讓這些複雜的東西簡單,讓它出現在你的眼前,讓它以最自然的交互進行交互。讓小孩、老人所有人,國內外所有人都可以快速進行交流,快速實現它的功能,這就是我們想通過這個眼鏡來實現的事情。就像剛纔講的,這是我們的使命,這是我們想要做的事情,讓每個人都能享受科技。
謝謝大家!
2020本站未來大會由杭州市人民政府和本站公司聯合主辦,杭州市商務局、杭州市經濟和信息化局、杭州市濱江區人民政府、北京本站傳媒有限公司以及本站(杭州)網絡有限公司承辦,中國移動總冠名。大會將進行三天的頭腦風暴、涵蓋了預見未來、新基建、人工智能、區塊鏈、潮商業、UP生活以及和文化等論壇。