圖文直播:雲上貴州 大數據國際年會主題演講
時間:7月11日14:00-17:30
圖爲:大數據國際年會主題演講現場 張煒攝
梅宏:尊敬的王江平副省長,尊敬的鄔賀銓院士,各位領導、各位來賓,大家下午好!
梅宏:非常高興能夠在這個生態文明的國際研討會非常重要的一個分論壇,也就是我們雲上貴州·大數據國際年會和大家相聚,我個人也感到非常榮幸應邀來擔任這次大會的主席,作爲一個生長在貴州、離開貴州幾十年一個算是省外的遊子,幾乎還沒有機會能夠站在貴州省這麼大的舞臺上主持一場會議,這是我個人的榮幸,也非常感謝在座的來自全國各地的企業家們響應貴州的大數據發展戰略。實際上今年兩會前,3月初的時候我也參加了省裡面在北京舉行的大數據產業推介會,半年多的時間看到了大數據產業在省政府的推動之下取得的長足發展,所以感謝各位企業家對我家鄉的支持。
梅宏:今天我們的大會非常榮幸邀請到了省政府主管領導,貴州省人民政府領導、大數據領域著名專家,還有我們國內知名企業、投資機構和行業高端用戶代表。首先請允許我介紹出席本次大會的嘉賓,他們是:貴州省人民政府副省長王江平先生;同時本次年會也邀請到了若干的專家,中國工程院院士鄔賀銓先生,《大數據時代》作者維克托·邁爾·舍恩伯格,中國普天信息產業股份有限公司董事長嗄煒女士,華大基因創始人汪建先生,賽伯樂集團董事長朱敏先生,浪潮集團首席科學家執行總裁王恩東先生,還有來自華爲、中興、富士康、阿里巴巴、浪潮、惠普、英特爾、思科、億贊普、東方道爾、賽迪等機構企業的領導,讓我們用熱烈掌聲對各位嘉賓的到來表示熱烈的歡迎和誠摯的感謝!
梅宏:正如剛纔短片裡面所介紹的,貴州這幾年已經成爲中國經濟增長最快的省份之一,貴州正在藉助大數據風起雲涌帶動貴州彩雲飛,大數據正在成爲貴州加速發展的引擎。
下面有請貴州省人民政府副省長王江平先生爲本次論壇致歡迎詞,有請王省長。
圖爲貴州省人民政府 副省長王江平先生致歡迎辭 張煒攝
王江平:尊敬的各位領導、各位來賓,女士們、先生們,大家下午好!
王江平:今天在最美多彩的貴州,清風爽爽的貴陽,我們十分榮幸的邀請到各位來參加雲上貴州·大數據國際年會。在此,我謹代表貴州省人民政府對各位嘉賓的到來表示熱烈的歡迎!對大家長期以來對貴州的關心和支持表示衷心的感謝!
王江平:信息技術和互聯網的發展,催生了一座巨大的寶藏——大數據,它蘊含着豐富價值,是大產業、大紅利,也是大變革。正在上升爲重要的國家戰略資源,正在成爲世界各國競爭的前沿,是新時期產業競爭力和商業模式創新的制高點。
王江平:貴陽生態文明國際論壇的重要組成部分,本屆雲上貴州·大數據國際年會將以“融合創新·綠色跨越”爲主題,深入研討全球大數據和雲計算技術的發展趨勢,爲大數據時代的產業變革把脈,着力打造大數據產業發展的前沿高端對話平臺,貴州省政府高度重視大數據產業發展,率先將其作爲貴州經濟社會發展的戰略決策,作爲落實習近平總書記牢牢守住發展和生態兩條底線的具體實踐,作爲貴州轉型發展、跨越發展的重要途徑。同時,貴州也具有生態優勢、能源優勢、區位優勢、政策紅利、產業基礎等多重優勢,發展大數據產業完全有條件,有可能實現後發先行,大數據產業涉及基礎設施、統一系統平臺、雲應用、增值服務、配套端產品五個產業品集成,目前我們正在按照這一思路高位起步,全面推進大數據產業發展要素資源的聚集,初步形成了大數據產業投資的窪地,簽約了項目150多個。大數據產業發展的成效初露端倪,7+N朵雲加快建設,10月份基本能投入使用。中關村貴陽科技園、富士康示範工程、百度示範應用、電子商務物流示範基地、服務外包產業園等項目在加快推進,阿里、百度、騰訊、京東、華爲、浪潮、華大基因、大唐移動、華唐教育等一批領軍已經或者即將進入貴州。一批大數據企業在我省快速成長,發展環境持續改善,我們先後出臺了《貴州省信息基礎設施條例》,這是我們國家第一個地方立法的信息技術設施的條例,《貴州省大數據產業發展應用規劃》以及《加快大數據產業發展若干政策的意見》。
王江平:同志們,朋友們,這次年會我們邀請了國內外頂級的專家學者,業界精英齊聚貴陽,共話大數據,共謀大數據,共營大數據,我們將聆聽到大數據業界前瞻的聲音,共享大數據領域思想的盛宴,將不斷的吸收先進理念和智慧,進一步深化對大數據產業鏈、產業模式、產業成集等方式理解和認識,牢牢把握市場規律和新生事物的發展規律,充分挖掘大數據商業價值和管理價值,推動貴州在大數據領域跨越發展,助發先行。
王江平:朋友們,貴州之貴,貴在生態,貴在環境,貴在全省上下後發爭先的精神和欣欣向榮的氣象,大風氣兮雲飛揚,大數據好戲已開場,機遇總是留給有準備的人,我們相信,在黨中央國務院的正確領導,國家有關部門大力支持,有在座各位專家、各路精英的傾情相謀,多彩貴州一定能揚帆遠翔,抒寫大數據的精彩篇章,藉此機會,真摯的希望朋友們到貴州各地走一走,看一看,切身感受貴州近年來發展變化,親身體驗多彩貴州神奇魅力。我深信貴州這顆雲貴高原上的璀璨明珠一定會給大家留下深刻印象和美好記憶,預祝今天的論壇取得成功,謝謝大家。
梅宏:謝謝王省長的致詞,介紹了貴州的大數據產業戰略,也向在座的企業發出了邀請,希望更多企業能夠投身到貴州大數據技術研發和產業發展中。大家也都知道,我們大數據在互聯網時代是和雲計算、物聯網、移動互聯網等各種熱點概念一塊兒出來的東西,它也是在所有熱點裡面目前處於熱點頂峰的術語,在某種意義上,大數據也寓意了新一代技術可能發生的變革以及可能在大數據驅動之下產業、商業模式所產生的變化,在國際上也是高度重視的一個研究領域以及應用領域,下面我們隆重的請出《大數據時代》的作者維克托·邁爾·舍恩伯格爲我們帶來的主題演講——大數據以及中國願景,有請。
維克托.邁爾.舍恩伯格先生做主題演講:大數據及其中國願望 張煒攝
(維克托.邁爾.舍恩伯格:英國籍著名學者、教授、《大數據時代》)
維克托·邁爾·舍恩伯格:各位下午好!非常非常的高興,也很榮幸能夠參加今天的會議,共同來探討一下大數據方面的內容。我們都關心大數據,但是大數據是從何開始的呢?它將會爲我們帶來什麼呢?如果你想看看它的初始階段,我們可以去看一下自然科學,像這種大數據的搜索我們其實在2000年的時候就開始了,像這樣的一個技術可以讓我們更好的去改善改善運營,而且在整個歷史中有着舉足輕重的意義。我們可以來看一下生物學,非常的不可思議,11年前,人類在慶祝自己很大的成就,人的DNA上面攜帶着大量的數據,但是這樣的努力花去了數十年和數十億美元去取得這樣一點點成績,但是今天的成績,我們可以來對比一下,這就是大數據所能給我們帶來的,我們的數據已經遠遠超過了過去,大數據它是關於無數的數字起因,所以我們想要更好的理解大數據的話,那麼我可以肯定,我們需要來超越大數據本身,超越一些非常淺層表面的東西,一些非常淺層的大數據定義去觀察這個概念。
維克托·邁爾·舍恩伯格:在我的書當中,我曾經提出到底核心是什麼,它不是說非常絕對的數字點,而是一些相對的數字點,這些是對於我們想去理解的東西是密切相關的,我們現在有了比以前更多的數據。作爲一些大數據的公司,他們對於大數據感興趣,這到底又意味着什麼,我想要給大家進行一個分析,如果我想給大家拍張照片的話,我現在就在拍,我需要去選到底把焦點放在誰身上,我到底是把焦點放在坐在第一排穿白衣服的先生身上,還是放在最後一排,當我拍照的時候我同樣要考慮一個重點。同樣,在小數據時代的時候我需要了解我到底分析的問題是什麼,我到底想要研究的現象是什麼,在大數據這個情況發生了變化,考慮一下攝影學,這是一張圖片,這裡是一拍了一支牙刷,在焦點之外是我4歲的兒子,現在他是模糊不清晰的,照片焦點在牙刷上面,我不能把它放在焦點裡面,因爲數據已經不在裡面了。不,不是這樣的,這不是一張普通的照片,它是一個大數據照片,它是由大數據照相機來拍攝的,如果我收集了所有的這些數據,而不是某個焦點範圍內的數據,拍完之後再去做選擇到底把焦點放在誰身上,我只需要拍完之後點一個按紐就可以實現,所以有了這麼多大數據之後我可以隨心所欲的定焦,這就好象我們在大數據照片中有更多細節,更重要的是能讓我們不斷的提一些問題。換句話說,它就給我們有機會讓大數據來向我們說話,這是和之前有根本性的區別,也就是在現實和小數據時代相比的差別,讓我們有更好的理解。
維克托·邁爾·舍恩伯格:同時它和第二個大數據因素相關,就是我們能夠了解或者我們開始去了解不同的相關性,所以我媽媽經常告訴我說,當我小的時候,她說在冬天的時候你要戴上帽子,不然你就感冒了,當然這是不正確的,因爲你從來都不會通過你的頭來感冒,實際上是因爲鼻子才感冒,所以戴不戴帽子根本沒有關係,所以這是一種錯誤的不存在的聯繫,但是對於人類來講,我們喜歡做一些自己幻想的相關性,實際上有些根本不存在,它會給我們一種安慰,就覺得好象我們是理解世界的,但是很多情況下我們並不理解這個世界。在大數據時代我們可以更加謙卑的認識或者認同我們人類對於現實的瞭解比我們想象的要少,相對來說對於現實瞭解較少,也就是說有更多東西我們在未來需要去了解,需要在未來有更多東西要去調研,有更多東西是需要我們去發掘,有了大數據我們可以做到這一點。通常我們不容易理解這種非常虛擬的或者比較飄浮的相關性,但是我們可以知道比較科學的相關性,我們可以想象一下社會在教育這方面我們如何去學習呢,這裡有一個公司。
維克托·邁爾·舍恩伯格:doulingo公司,這個公司有好幾千萬的用戶,它是一個程序公司,可以幫助你去學習語言,有幾千萬人在使用這款應用,這個應用程序也寫得很不錯,用起來很有意思,所以它就收集了大量人們學習的數據,到底他們學習語言中會存在哪些困難,通過去做這種大數據的分析,這個公司發現教西班牙語母語的學習者學習英語的方式是錯誤的,這就是我們從大數據當中獲得的一些知識,而且幫助很多人節省了外語的時間。再舉另外一個例子吧,我們每個人的心情,也就是在健康方面我們的心臟醫療,這是一個早產的嬰兒,早產嬰兒他們是非常脆弱的,他們有可能會受到感染而死去,問題是在於我們意識到他們被感染的時間太晚了,往往我們意識到的時候就已經來不及救他們了,但是在多倫多的一個大數據項目認爲他們可以解決這個問題,他們使用了數字傳感器,並且可以獲得1200多個數字點,其中包含一些早產嬰兒每秒的身體體徵數據,然後對他們進行分析,通過這種方式才能夠找到在數據當中的規律,這種規律可以幫助他們去預測在未來感染的可能性有多大,最後他們終於找到了一個規律。現在無論到底早產兒在最早24小時裡面會不會出現這個症狀他們都可以分析出來,這樣等於是挽救了早產兒的生命,甚至是幾千幾萬個早產兒的生命,非常有意思的是這種模式能夠顯示出這個早產兒有可能出現某種感染的話,實際上他的生命體徵並不是波動非常嚴重,它的體徵非常穩定,所以大多數醫生根本不會注意到,大多數醫生晚上回家了,說所有指標都挺正常的,比如說嬰兒生命體徵很正常,但是大數據的研究分析表示出這個早產兒可能存在很大危險,這時候我們應該提供援助,這就是大數據給我們帶來的優勢,我們應用大量大數據預測之前沒有預測到的現象,通過這種相關性給我們及時的信息。
維克托·邁爾·舍恩伯格:簡單講,大數據甚至是等於現實當中的一種新的距離縮短,就好象科學革新一樣。200多年前的科學革命與它一樣的偉大,這就給我們更好的決策機會,基於更好決策基礎之上,我們可以對未來做更好的預測,同時未來更好的預測就意味着將會帶來新的經濟價值。
維克托·邁爾·舍恩伯格:核心的經濟概念,我怎麼對其強調重要性都不爲過,數據已經變爲了一種資源,這就好象是一種物理資源一樣,就和黃金一樣寶貴,甚至和能源一樣寶貴,但是他們是不一樣的,某種程度上是不同的,因爲黃金或者能源,當你把它消耗完就沒有了,但是大數據當你使用它之後它仍然存在,並且可以進行重新利用。大數據的核心就在於數據可以不斷的重複利用,這就意味着大數據成爲了一個不只是工具這麼簡單了,它可以實現在經濟中的效率,數據還有大數據可以來成爲經濟發展本身的來源,它可以刺激經濟的發展。
維克托·邁爾·舍恩伯格:讓我們看一下大數據如何和其他經濟促進發展,全世界經濟發展情況是這樣,IT行業是5.5%的經濟增長,比經濟增長稍微好一些,中國經濟增長是7.5%的速度,但是大數據的發展數據是怎麼樣的呢?在經濟角度進行一個對比的話是40%每年的增幅,可以看一下這對我們意味着什麼,因爲大數據可以成爲經濟發展的驅動力,可以成爲經濟發展的革新者和更新者,當經濟發展減緩的時候可以做這個觸動。
維克托·邁爾·舍恩伯格:那我們可以做什麼呢,我們需要數據,這是當然的,因爲它是原材料。還有我們需要一種思維,我們需要去理解大數據本身是存在着價值的,我們可以把這個價值給抽取出來,我們可以找到專家,我可以去僱專家,我們可以獲得數據,但是如果我沒有概念,我不知道這個數據可以不斷的進行重複利用從而從中抽取價值的話,這個價值不可能被我們收回,對於專業數據和思維這些都是很重要的。中國實際上是有一系列的條件,可以讓我們進行大數據方面的發展,我們需要對其進行分析。在專業知識方面,我們有非常好的數學和計算機科學的教育,我們全國的數學和計算機教育都很好,甚至包括美國都非常眼羨這一點。我們看一下這一點,特別是在貴陽,你都可以非常好的去理解基礎設施以及雲的基礎設施給我們提供,並且我們在數據方面,中國有一點是其他任何一個國家都沒有的優勢,那就是規模,中國很大。
維克托·邁爾·舍恩伯格:我這裡想給大家提出的問題是,你們到底有沒有足夠的思維和意識,可能往前發展有一點我們要關注的就是現在有很多的人在你組織內部,一些未來企業家、一些年輕人他們大數據的思維,他們能不能理解到在大數據當中是存在着可以不斷重複利用的價值,這裡給大家舉一個例子,這個例子是關於重複利用的,這是漢莎航空公司,德國官方的航空公司,多年的飛行當中他們收集了很多數據,包括溫度、溼度、降水率等等,所有這些數據它都是在駕駛室當中,駕駛員他飛完一程以後這個數據就不用了,在幾年,漢沙決定把這些數據收集起來,把這些數據發給了國家氣象局,這樣300多架飛機的數據改善了國家在天氣預報率提高了8%,可以想像一下這些數據的作用。
維克托·邁爾·舍恩伯格:我想大家可能都看過這樣一張照片,這是Google的無人駕駛汽車,可以讓你這個車輛裡面輸入你的目的地,然後它就可以自動進行駕駛,這是大數據車輛,它可以在駕駛過程中收集數據,並且可以對它進行一秒鐘幾百萬數據的運行處理。但是有一個問題是,他們可以利用這些數據,然後把它放在一個大的項目,等於Google可以收集到地理的一些數據,例如道路的寬度、車流量的情況等等,所以他們最早使用這樣的數據就是爲了製造地圖,現在他們可以再重新利用這些數據,可以讓這些無人駕駛車輛駕駛到目的地去,現在它可以收集125000萬英里距離,這過程只發生了兩次事故,一次是當一個女的,她跟在無人駕駛車後面的時候曾經追尾了,另外一次是坐在無人駕駛車裡面覺得無人駕駛車犯錯誤了他自己操作,發生了事故。這兩次事故都是由於人爲原因造成的。
維克托·邁爾·舍恩伯格:再給大家舉一個例子,就是由微軟、雅虎、斯坦福大學聯合的一個項目,他們收集了人們在英特網上的搜索信息,看一下到底一個藥物是不是有副作用,一個高血壓的藥品和一個頭疼藥是有互相作用,他們原來根本不知道,他們原來沒有對化學物質進行測試,他們只是使用了對英特網搜索數據的分析應用就得出了這樣的結果。
維克托·邁爾·舍恩伯格:如果大數據有這樣大的經濟驅動和這麼大的經濟價值,我們怎麼樣獲得這些大數據,或者使大數據發揮作用,這已經是全世界都提出的問題,在過去3個月裡,在西方一些大的經濟體裡進行了報告。
維克托·邁爾·舍恩伯格:你如果來問我的話,到底你能做什麼讓大數據能在政策角度發揮它的作用,這就是我要給大家提出的一些政策方面的建議。
維克托·邁爾·舍恩伯格:第一就是進行分享,實際上我們對於大數據最大的挑戰就是在一個組織或者公司內部,數據通常都是進行了分離,一個部門它的數據不允許另外一個部門來獲取他們的數據,有的時候,一個部門根本就不知道另外一個部門有他們需要的數據,這點是非常糟糕的,因爲在大數據時代裡面,我們是可以從數據結合當中獲得大量的價值,並且把數據的資源結合在一起來實現這種規模性,所以如果我們能夠鼓勵數據的分享,在所有的組織中都去鼓勵數據的分享,能夠建立強大的規則以及激勵政策讓不同部門實現公司內部或者組織內部合作的話將會更好。
維克托·邁爾·舍恩伯格:第二就是開放性,對於大數據來講,爲了讓它起飛我們需要非常大的潛力,是需要進行數據內部發覺,但是沒有任何人、任何一個組織或者任何一個公司去想象,他們將會把所有好的概念或者關於他們擁有好的數據能夠進行開放,通常都是讓別人進入到你數據當中來使用你數據當中纔會發現在數據中未被發覺出來的價值,但是這是存在挑戰的,因爲如果一個公司花幾百萬去搜集這些數據,它到底在經濟方面如何讓另外一家公司在使用這數據獲得經濟價值的時候怎麼樣對它進行經濟補償,所以我們需要建立數據市場,有可能創建一些數據所有權或者數據產權方面的東西。所以關於開放方面就是公共部門有大量數據,你讓這些數據能夠開放的話,不光能夠給社會帶來更多的知識,同時還可以實現大數據行業的發展,非常準確的數據源正是我們所需要的,數據可以轉爲非常強大的經濟補貼來協助大數據活動的開展,也可以進行法定,要求一些由政府資助的項目的大數據可以向社會和組織開放。
維克托·邁爾·舍恩伯格:第三是信任,不是說所有的,但是很大一部分的數據是關於個人的,很多人有這樣的擔憂,就是他們自己的隱私,他們會擔心這些公司甚至一些國家會隨時的濫用自己的個人數據。如果這個問題沒有得到成功的解決的話,人們肯定就不再相信大數據,會停止提供他們的數據。那麼這就會使得大數據未來的前景堪憂,所以我們需要認真的來對待這個問題,並且在這方面制定非常嚴格的規則來保護隱私,同時也能很好對規則進行執行,讓大家公司會感到數據是安全的,同時我們要對大數據方面有一些限制,使社會的福利得到保持,並且能實現對於社會的一些安全。
維克托·邁爾·舍恩伯格:所以分享、開放和信任是能夠促進大數據未來前景發展的三個關鍵因素,這也是我們的經濟和社會在未來幾年的關鍵,全世界範圍都是如此,有了強大的政策框架,基於這三點基礎的話,大數據將會快速取得成功,並且我也深信將會爲我們帶來強大的新的能夠看到未來的一個遠景,謝謝大家。
主持人:下面有請大數據領域的權威專家——中國工程院鄔賀銓院士,鄔院士將給大家帶來大數據與大產業的主題演講,有請鄔賀銓院士。
中國工程院院士鄔賀銓發表主題演講 :大數據與大產業 張煒攝
鄔賀銓:尊敬的各位領導、各位專家,下午好!很高興在這裡關於大數據與大產業跟大家交換一下看法。
鄔賀銓:首先大數據挖掘,我是這樣看的,大數據涉及到存儲、計算、發覺、安全這樣的過程,往往我們數據來源三個層面,一個是網絡數據,另一個是網絡傳感器上面的數據,當然還有一些既不是網絡也不是傳感器的,比如我們政府以及企業部門所收集的很多數據,這是社會層面的。總的來講,主要是這三源數據。三源數據在數據庫裡面根據我們需要的應用選擇有用的數據,當然在應用的時候還需要選用可用的數據,然後通過變換,把複雜的緯度降下來,以便可以利用,然後抽出我們所需要用的數據,最終融合出來得出關鍵我們需要的東西。數據挖掘涉及到這麼一個過程,實際上大數據的產業涉及到這麼多方面,首先有一個大數據平臺,我們可以看到既然是大數據,它可能是不會停下來的,比如我們傳感器攝像頭收集到的數據,不知道它什麼時候開始,也不可能有什麼時候結束。涉及到大數據平臺,我們需要有寬帶的存儲設施,需要有云計算計算平臺,首先是光纖寬帶系統,80年代以前我們國內主要是在電纜上面的傳輸系統,我們是模擬的,現在我們光纖通信技術進入了市場,在90年代初是一根光纖傳2.5G,實際上一根光纖不僅僅一個波長可以傳輸這麼多,實際可以把很多波長利用起來,我們叫波分複用,進一步在實驗室裡面通過多種技術可以把光纖傳輸能力再進一步提高,現在一對光纖在實驗室可以傳到16TP,當然除了傳輸能力的增加,我們還希望光網絡能力提升,自動交換光網絡要出來了。除了光系統以外,現在移動通信也發展很快,90年代以前我們當時主要是打電話,後來第二代移動通信出現了,現在大家大部分使用的還是第二代移動通信,它是數字的交換,帶寬比較窄,2009年中國發放3家3G牌照。在去年年底國務院批准發放了4G牌照,現在LET在中國很多地方佈網和商用,實際上國際上已經啓動了第五代通信網絡應用,在家裡不用網線可以下載峰值達到50G,實際上光纖的發展爲大數據提供了很好的平臺。
鄔賀銓:除了光纖和通信以外,計算機也是少不了的,50年代大型計算機,60年代小型計算機,80年代個人計算機,90年代筆記本電腦,現在手機就是計算機。我們可以看看,全世界第一臺計算機是1946年出現,當時佔地面積170平方米,那時候計算機的能力相當於會計手上拿的計算機,1975年美國國防部拿了500萬美元買一臺當時最先進的超級計算機,相當於我們現在的蘋果4,1985年美國防部更新了超級計算機,相當於IPAD2,90年代買1G的閃存要1800美元,而現在只要0.25美分,所以隨着計算機能力提升,大數據處理能力也相應提升。
鄔賀銓:另外大數據也離不開軟件,軟件發展從單機到網絡,我們可以看看軟件,軟件的代碼早期的阿波羅登月飛行器軟件整個只有4000行代碼,現在波音飛機的軟件有2萬行,高鐵有上十億的行代碼,我們用的智能手機操作系統也是上百萬行的代碼。隨着軟件能力的提升,也方便了對大數據的挖掘。
鄔賀銓:當然,除了軟件以外,雲計算是我們大數據裡面會用到很重要的一個基礎設施。80年代沒有談雲計算,談數據庫,現在我們談雲計算,實際上我們需要使用的是雲服務,雲計算下面有基礎設施,我們叫基礎設施之服務,提供服務器、存儲器和網絡。我們現在每個單位都可能會有信息化系統,自建信息化系統很不划算,利用率不高,因此委託第三方進行信息化系統,這樣就構成了雲計算的基礎設施之服務,僅僅做這個計劃我把它比喻爲房地產,僅僅這個是不夠的,所以在雲計算上面通常都會增加平臺之服務,裡面提供很多工具,有利於用戶在裡面利用這些工具開發用戶所需要軟件,儘管提供了這些工具,但是對於一些中小企業來講,它仍然沒有這些能力利用這些工具開發軟件,因此在雲計算上面可以向更多公司提供可以租用的軟件,像客戶關係管理、HR人力資源管理等等,對於一些更大企業可以自身在雲計算開發自己事務性企業管理上用的很多軟件。
鄔賀銓:有了前面說的寬帶化、軟件、計算機和雲計算之後,是不是就一定能完全處理大數據呢?大數據比較難處理的是怎麼能實現語義的分析,我們從數據上可以收集很多數據,但是如何讓計算機來理解這些東西還是有一定困難的,比如一個公司做不到每個員工一臺計算機,而有個崗位員工覺得他的崗位很重要,需要一臺單獨計算機,他與老闆發一條短信,我申請一臺獨立電腦,後臺網絡一掃描,“臺獨”,實際上它沒有語義理解,只是簡單根據某個詞的組合,這實際上不是大數據所需要的,我們需要加上理解。更重要的不僅僅是對文字,比較困難的是對圖象,比如說這個圖,當然現在有一定的進展,像Google與斯坦福的合作,就在這上面讓計算機去看貓,用很多張圖讓計算機看,計算機看了10天以後就發現很多圖片裡面都有一隻動物,儘管樣子不一樣,但是基本是一個類型,所以計算機學會了這是貓,然後再把2萬張從來沒有看過照片給它看,它的識別率是15%,如果從應用上來說這還是遠遠不夠的,但是這也表明訓練計算機識別圖象仍然是有可能的,未來大數據分析就是要訓練我們的計算能力能夠代替人去處理有需要理解的一些文字、照片、圖片、視頻。
鄔賀銓:另外,左邊的圖是在古羅馬,拍下來的是古羅馬的移植,我們很希望恢復一張古羅馬當時的場景。右邊這個圖就是通過大數據的信息融合軟件,把古羅馬分散拍出來的城市移植組合出來的古羅馬的城市形象,這是通過孤立的方式通過大數據融合,使得我們很容易增進我們的理解。
鄔賀銓:以下的這個圖情況不一樣,左邊這張圖是一個場景,有幾個人在走。右邊這個圖只突出了其中一個人,這其實是抽取,也就是我從大數據裡面在衆多複雜數據裡面,我可能關心某一項,因此我就突出的去抽取。
鄔賀銓:這是一個大數據的深度學習,這是微軟講的,它利用它積累的一些大數據資料,然後實現語音的翻譯,他一般在講英文,另外一個屏幕打出他說的中文,可惜大家聽不見,實際上認爲打出來的打得對,所以大家在鼓掌。實際上大家還可以知道,等一會兒用它自己的聲音講出聲音來,也就是這是通過大數據的挖掘,基於深度學習,實現一種語言的翻譯,微軟已經在準備開發26種語言翻譯的手機,將來大家假如你這邊打電話講中文,你手機上按一下英文,海外朋友他聽英文,他講英文你聽中文,有26種語音翻譯的,學外語也沒有多少用處了。
鄔賀銓:大數據還有虛擬化和可視化,實際上這張圖來到計算機上也不動了,這裡面不同的顏色顯示交通路況是交通臨時管制、事故等,現在這個時間是到中午,車就少了,一會兒到13點或者14點,車又開始多了,不同顏色顯示馬路交通狀況,成爲一個動態的圖,可以下載、時時廣播到駕駛員的手機裡面,可以看到交通情況,像我們貴陽城市交通也是擁堵的,怎麼能夠讓大家提前知道哪條馬路是暢通、哪條馬路不暢通,因爲你雖然收集了很多數據,只有通過可視化、虛擬化方式才能被大多數人理解。
鄔賀銓:所以大數據的產品包括了這麼幾類,有軟硬件服務,有關係數據庫的軟件,以及一些數據集成、數據資料服務,還有大數據開發平臺,還有數據可視化平臺,還有應用分析和應用視頻服務以及一些視頻軟件和大數據專業諮詢培訓服務。我們可以看,這是大數據提供產品的企業,分爲硬件的,軟件的,服務的,這是我應用的外國數據,所以基本都是外國公司,比如服務器就是英特爾和惠普,各種各樣應用設施以及軟件、服務,這些構成了大數據設施產業基礎。
鄔賀銓:大數據的產業設施有多大呢,我們可以看一下這張圖,可以看到這裡面不同顏色可以表示不同硬件,2017年硬件可能佔1/3,軟件佔1/3,服務佔1/3還多一些,按一些諮詢公司估計,到2017年全世界大數據市場大概超過500億美元。這是中國賽迪的估計,到2016年,中國大數據應用的市場大概是100多億,當然這主要是應用,還沒有完全包括所有的產品設施。
鄔賀銓:下面還要講一下大數據產業,狹義的大數據產業實際上剛纔講到了,主要與大數據分析和建立的設施有關,當然廣義的大數據產業更廣泛,包括大數據硬件,網絡設備、存儲器,關係數據庫、非關係數據庫一些分析軟件,還有跟大數據有關的服務,但是廣義大數據產業裡還要再拓展兩層,一種是傳統的產業,利用了的大數據應用而增值,可以用到工業、農業、商貿、交通、建築,還有用到教育、環保等等,大數據在製造業上,豐田公司利用數據分析車的切線。
鄔賀銓:馬航370到現在已經失聯4個多月了,實際上馬航370從3月8號起飛1小時之後就失去聯繫了,當時是不是一定沒有聯繫呢?也不是的,基本在馬航飛機每個引擎上裝了20個傳感器,每時每刻都在監控引擎的動作,後來發現在失聯以後馬航飛機的引擎每隔一小時通過衛星把數據回傳給引擎製造公司,總共回傳了7次,也就意味着馬航飛機失聯以後還飛了7個小時。原來收集這個數據的目的是爲了當飛機落地的時候知道引擎要不要維修,現在國際民航組織已經決定,由於馬航事件啓發,以後飛機上的引擎數據不是一小時傳一次,而是每15分鐘傳一次。
鄔賀銓:實際上大數據的風電行業也很好的應用,通過風電的檢測很好發現我們的風怎麼樣,怎麼樣很好的利用;另外大數據在零售業很好利用,沃爾瑪通過大數據分析知道買A商品的用戶買B商品的有多少,憑這些大數據開發很好有助於零售業的開發。
鄔賀銓:大數據也可以應用到醫療上面,在醫療研發上可以一年可以減少200億美元的開支,在醫療商業模式上也會節省幾十億美元。總的來講有很大的成本節省。
鄔賀銓:麥肯錫公司總結出來,大數據可以給美國醫療保健每年提供3000億美元的價值,給歐洲公共管理提供2500億美元管理上的價值,給服務提供商帶來6000億美元年度盈餘,零售商帶來60%的利潤增加,給製造業帶來50%成本的下降。所以很多世界經濟論壇在前年就說,大數據是新財富,價值堪比石油。
鄔賀銓:誰將從大數據裡面受益呢,第一位是製造業,因爲企業多;第二位就是政府,實際上剛纔維克托·邁爾·舍恩伯格先生已經講到了,我們大數據的一個特徵就是希望是開放的,如果政府能夠適當開放政府所掌控的數據,全世界都會從政府開放的數據當中受益,麥肯錫公司認爲大概會給全球經濟每年帶來23000億到53000億的紅利。總之我們現在網絡通信發展進入了大數據、智慧城市、物聯網、移動互聯網和雲計算的時代。總之,信息技術應用和發展進入大智物移雲時代,大數據提升了決策智能化水平,大數據成爲兩化融合抓手,大數據用於社會管理和民生服務將創造出顯著社會效應,大數據產生大產業,包括大數據設施產業和傳統產業,因爲大數據挖掘或者變更部分,大數據對中國既是機遇也是挑戰,需要重視和挖掘大數據的應用。
主持人:感謝鄔院士高屋建瓴的描繪,讓我們大數據產業的世界。我們知道,從郵電工業進步,在不同歷史階段爲國家基礎設施產業發展作出了巨大貢獻,近年來,這家企業堅持自主創新,持續拓展產業空間,着力提升產業可持續發展能力,不斷推進企業由製造、服務向整體解決方案提供商轉型,下面有請中國普天信息產業集團公司黨組書記、總經理嗄煒女士給我們分享普天在大數據方面的卓越成就,有請嗄女士。
中國普天戰略投融資管理部總經理陳慶方發表演講 張煒攝
主題爲:大數據開啓行業信息化新時代
陳慶方:各位來賓,各位朋友,大家好!由於嗄煒董事長臨時受陳書記的邀請,臨時委託我代表她與大家做個交流,我是中國普天戰略投融資管理部總經理,我叫陳慶方。
陳慶方:我今天給大家交流的題目是大數據開啓行業信息化新時代,主要是想圍繞中國普天在大數據應用方面我們的一些實踐和體會,我今天主要是講四個部分。
第一,簡要的談一談大數據及其發展趨勢
因爲上午的開幕式和前面兩位專家都對大數據做了非常深入的闡述,我這裡就是一個粗略的概括。大數據已經到來了,這個是我們都親身感受到的。我們每時每刻都在產生大量的各種各樣數據,這些數據又反過來對我們的生產生活、社會發展,對我們的決策都有着重大的影響。大數據的特點就是:數據量大、類型多樣、流動速度快、價值密度低。大數據爲我們解決問題提供了新的思路和新途徑,激發了我們新產品、新服務的開發。
陳慶方:首先談一談大數據的發展數據,由於智能手機、物聯網和移動互聯網的發展,人與人之間通信對象從人與人發展到了人與人、人與物和物與物,通信的內容也從原來單純的語音發展成爲多媒體,包括視頻、聲音、文字、文檔、數據等等,各行各業都在產生大量數據,呈現數據爆炸的趨勢。
第二個特點就是帶來新的商業革命。大數據的發展和應用把很多領域的商業模式給顛覆了,它的影響是非常巨大的。比如說電子商務的出現、還有互聯網金融的出現都是大數據顛覆商業模式的典型例子。
第三個特點是數據挖掘是大數據的重點,這一點是非常清楚的,因爲大數據它本身並沒有很多價值,它是很多雜亂無章大量數據的聚集,必須要經過科學有效的數據分析、提煉和挖掘,才能夠找到裡面真正的金子,因此有效的大數據挖掘技術是促使大數據產生巨大效益的一個根本技術。
陳慶方:大數據要成爲各個國家競爭的焦點,這個也不用說了,歐美髮達國家都把大數據產業提到了國家戰略層面的高度,因此作爲未來的競爭大數據是一個焦點。
陳慶方:安全及個人隱私是目前存在的一個問題,大數據應用怎麼樣能夠在保護個人隱私同時又充分挖掘數據潛力,爲我們生產生活和社會發展服務,這是一個需要解決的問題。
第二,談一談中國普天在大數據基礎設施這方面的一些情況。大數據的基礎設施就是數據處理中心,爲了能夠提供適合雲計算、大數據這種要求的數據中心,普天在這樣的一個發展過程中能夠提供不斷開發數據中心的網絡安全和可靠存儲方面的解決方案,利用持續的存儲技術,爲海量的數據和複雜的業務系統提供全面的保護,數據中心網絡安全的重要性不言而喻。普天的解決方案是在業務系統的邊界建立統一的邊界保護,內部邊界加強接入和授權的控制,外部邊界加強安全防護,這樣就可以實現對未來訪問的統一的安全監控。
第三,談一談中國普天在發展行業信息化方面所做的一些工作。
現在隨着智慧城市的建設,我們城市化的發展速度是非常快的,同時也帶來了城市病,這個問題日益突出,交通的擁堵、環境的污染、耕地的佔用、資源的短缺,這些都是現代面臨的問題。在智慧城市建設當中,大數據可以爲規劃和管理部門提供決策支持,可以爲智慧城市各個組成部分提供優化的解決方案。
陳慶方:下面我舉一個例子,就是中國普天的電動汽車智能化運營服務系統,它是一個大數據應用的典型實例,這個系統它支撐大數據,它自己又產生大數據,又處理大數據,還應用的數據,電動汽車自動運營服務系統它是專門爲電動汽車運營提供服務的。它還有一系列的功能,車輛在運行過程中它在不斷的產生數據,電池的溫度等等數據不斷產生和記錄,而這些數據提供給車的製造商和電池製造商就可以通過這些數據的分析來改善和提高電池和車的質量。這些數據保障了車和駕駛員以及道路的安全。因爲電動汽車開出去要充電,在城市裡面它要分佈很多充電站、充電樁,這個系統可以告訴駕駛員哪裡有充電站,它可以提示駕駛員到離你最近的充電站去充電,而且那個充電站是排隊時間最短的,這樣非常方便駕駛員,同時它還給提供指引的路線圖,根據現在的交通狀況,怎麼走到哪裡是最方便、最簡潔的,這樣的信息提供給電動車駕駛員,就會讓駕駛員感到非常的方便。由於準確的提供充電站、充電樁的位置,同樣使得有效的充電站、充電樁能夠充分發揮作用,不會說不排隊地方很空閒、排隊的地方特別擁堵,這樣能夠充分利用資源,使得少量充電站、充電樁可以起到非常科學合理的分佈,使得資源利用率非常高。
陳慶方:中國普天是電動汽車運營服務提供商,已經爲很多城市都提供服務了,包括深圳、上海、安徽、江蘇、廣州等十多個城市,爲國務院辦公廳、國家發改委、科技部、公信部等28個部委都在使用中國普天這套系統,這在全國也起到了示範作用。
陳慶方:再談一談節能管理系統。使用了能源感知技術和綠色能源分佈系統,基於大數據分析的專家系統、數據庫,能夠分析能耗的需求,比如說通過分析污染物的分佈,就可以揭示和推測這個城市工業和交通的狀況,通過不同區域的能源消耗規律就可以生成節能降耗的優化方案,這就開創了智慧節能新模式,並可以擴展成爲城市共用共享的平臺。
陳慶方:再談談智慧家居,家居是智慧城市最小單元,家居智能化反映一個城市智慧的水平。智能家居主要利用信息化手段對家庭裡面供暖、空調、照明甚至窗簾什麼時候開什麼時候關,以及門和窗的安全保護,還有視頻化的對講系統,甚至家庭裡的背景應用,都可以用智能家居這套系統來解決。
陳慶方:智慧醫療系統,就是通過這樣系統可以爲醫院和養老院提供很好的解決方案。比如說這套系統可以跟蹤患者,比如說患者手上戴的腕錶,這個腕錶可以與通信系統相聯絡,如果病人有各種症狀,比如說他失蹤了,他自己又不清楚自己在哪裡,這時候可以通過定位找到這個病人。再有身份識別,他內嵌的RFID芯片可以唯一確定一個人的身份,不至於搞成醫療的錯誤。再有就是呼叫報警,可以設置爲主動報警,還可以設置爲自動報警,主動報警有是病人自己認爲有問題,可以按腕錶上面一個鍵,這個信號就發出去了,相關負責管理他的護士或者管理人員就可以到這裡來對他進行救護。還有就是可以設置爲自動報警,比如說對特定人員他的血壓、心跳次數設置一個值,如果他的血壓超過這個值就會有問題,就設置成這樣一個值,不管他自己感覺到沒有感覺到,一旦血壓到這個值就自動報警,這時候救護人員就可以趕到這裡對他進行幫助。
陳慶方:再有政務數據中心,還有智慧金融,還有信息安全,中國普天與國家安全部共同成立聯合實驗室,爲安全部,爲很多國家公安、軍工部門提供很多解決方案。
第四,簡單談一談中國普天,中國普天是國務院國資委直管的中央企業,其實中國普天的發展史可以追溯到清朝末年,慈禧太后年間的1906年,那時候是中國清政府的一個電話局。經過百年的發展,中國普天目前的定位是以信息技術、系統集成、系統服務、產品製造、產品銷售、產業投資以及相關商品貿易爲重點的企業,這是我們的主業,現在我們公司最重要的兩大產業領域,一個是信息通信,另一個就是新能源。中國普天在百年發展過程中創造了無數個第一,從第一部電話機到第一部成控交換機,到第一個電動汽車運營快換系統等等。中國普天在貫徹中國的兩化融合信息化帶動工業化發展道路上實現了快速的發展。
陳慶方:展望未來,中國普天將進一步踐行生態文明、綠色發展的理念,積極推動大數據、雲計算、物聯網等信息技術的發展和應用,大力推進新能源和節能減排技術的開發和應用,爲我們擁有一個生態文明的世界,爲了建設人類共同的綠色家園作出更大的貢獻,謝謝大家。
主持人:感謝陳慶方先生的精彩分享,中國有一家默默奉獻的公司,自1999年成立以來,先後完成了國際人類基因組計劃中國部分,水稻基因組計劃等多項具有國際先進水平的基因組科研工作,奠定了中國基因組科學在國際上的領先地位,今天,我們有幸請到該公司創始人汪建先生給大家做精彩的主題演講,有請華大基因創始人汪建先生。
汪建 華大基金創始人 張煒攝
(演講主題:大數據支撐的生物醫藥 跨越趕超、智慧發展)
汪建:我今天講的題目是大數據與醫藥健康產業的智惠發展。
汪建:先科普一下什麼是基因,基因就是生命傳承的唯一物質,當一個受精卵形成的時候就是個新的生命誕生了,這個新生命誕生的時候就是一個基因的傳承過程。基因就有點像元素週期表的108個元素一樣,基因只有4個符號,A、T、C、G,AT是一對,CG是一對,有點像0101一樣。基因決定了你的生老病死還有你的表現性,這都是基因決定的。
汪建: 但是基因的大數據到底有多大,中國所有大數據活動沒有一次邀請過我們參加,我們心裡很不平衡,我們來看看我們的數據有多大。我們一個人的基因在我們細胞裡面的綜合是6×10的23次方,誰還有這樣大的數據?是我們哪個企業有還是哪個國家有呢?都沒有,我們每個人身所攜帶的信息,比現在已知世界上數據的總和還多。一個人的基因組一半基因從父親來的,一半基因從母親來的,一個基因組是3×10的9次方,我們身上有10次次方的細胞,A、T、C、G每三種不同組合變成了我們基因控制生老病死,所有遺傳密碼都在這裡。我們蛋白質,我們身上有20個不同的氨基酸,在組合上有2×10的9次方。我們的小分子有多少,告訴大家,不知道。一個人的數據絕對不會少於Google地圖的數據,可惜的是這樣的大數據沒有被大家意識到,就是中國大數據協會也從來沒有找過我們說過一句話,好象我們是小數據似的。
汪建: 剛纔前面中國普天講到大數據的特點是低價值,我們這個大數據的特點是高價值,是人類最貴的價值,因爲你的生老病死都在這個數據裡面,怎麼會是低價值呢?我們再看看這種數據怎麼獲得,天上掉不下來,互聯網找不到,你得開墾這樣的數據,你得挖掘這樣的數據。基因需要測血,基因需要測定蛋白質,小分子需要讀出來。所有這些數據都要在細胞環境裡面活動,所以一個細胞就是一個基因生命的基本組成。
汪建:我把我們這些年華大做基礎的研究數據不小心做了一個總結,大家看下面這張圖,我們的數據增長,這是我們最著名的摩爾定律,紅色的線就是我們實際的計算機增長量,這上面藍色的線是我們數據產出量,一晃十幾年過去了,我們發現每2年我們的數據增長增加一個0,所以我們把我們自己叫做摩爾定律的變種,這個生物學的數據增長遠遠超過了摩爾定律的增長,它帶來的是什麼?我們自己過去全部是用我們自己的計算機弄,弄到後面扛不住了,大家知道天河一號是曾經引領世界的一號種子,我們在天河一號數據裡面使用率佔有50%,上個禮拜,啓動的天河二號8000個CPU節點,我們預定了3000個,所以我們的佔有率是3/8。
汪建:大數據的目標都太大了,我們的目標很小,我離開國家機構以後到了深圳,與幾位同事創建了華大基因,我們把目標定得非常的小,定到我們個人,以人爲本,從我做起。我們看看我們個人的這種做法與國家和城市發展有沒有什麼聯繫,所以我的目標很簡單,就是健康長壽,不病不傻,當然不差錢,具體目標就是我的健康我作主,我的生老病死我來掌握。
汪建:今天中國工業經濟發展使得環境不可承受,我們的生命也多少不可承受了。中國的心腦血管病死亡每10秒鐘死亡一個人,高學歷、高工資基本上等於高血壓、高血脂。左邊這個圖是中國心腦血管死亡率程序增長,右邊這圖是歐美國家心腦血管死亡率持續下降。這是12年前的我,我的血液離浸後是白顏色的,高血脂、高血壓、冠心病,基本屬於沒戲了,當時要求我住院,我把我的基因分析了一下,我是一個出生缺陷,所以加上現在撐着柺棍,看看能不能爭取混進中國殘疾人協會。還有心腦血管猝死疾病。我的激素水平、維生素水平、氨基酸水平,我定期檢測,從來不吃任何保健品,我看看我缺什麼就補什麼,看看長期維持怎麼樣。我的腸道微生物量,大家看這是同卵雙生,這是我們華大基因發表的論文,證明了我們腸道里面的微生物和基因是我們人的基因的100倍,非常非常複雜,我們曾經用幾十萬個CPU算了幾個月終於搞明白了腸道微生物是什麼樣子。把這兩隻老鼠的腸子洗一洗,互相一換,半個月以後,胖的變瘦,瘦的變胖。我們就創造了一種治療方法,把腸道不好的微生物改一下,變成好的微生物。不同的飲食習慣、不同的基因和腸道微生物不同情況導致健康情況不一樣,這是今天的我,我把腸道微生物換了換,這樣我真正的實現了我的基因我知道,我的健康我作主,生老病死我來掌控。就可以玩很多,我高山速降速度達到每小時60公里,還可以玩風帆,登珠峰。我個人健康數據是4個T,我曾經跟中國最好的醫院院長聊天,他說他是信息化醫院最好的,他有60個T的數據,我想了半天,我還是告訴他吧,我一個人有4個T,什麼叫大數據,就是人人都要關心、天天都要注意的,有這麼大一串,我還希望這樣的中心是放在黔西南這個地方,不要它養老,要老而精彩,有用,不給社會添麻煩。
汪建:我這些大數據怎麼來的,從基因到蛋白質,到小分子,全套做下來。所以我說第一個目標,管控代謝綜合症,減少心腦血管病發生和死亡率,能不能把死亡率降到60秒鐘死一個人,如果我做100萬人的話,我就有10的18次方數據,換句話說這100萬人健康數據就可以約等於2012年、2013年那一年中國全國的數據量,它在科學上的突破是我們腸道微生物的生態和我們代謝、心腦血管疾病,在產業上可能實現10億到100億,這是一個方向。
汪建:我再簡單講一下腫瘤,每10秒鐘死亡一個人。我們在座的每一個人患腫瘤的機會是22%,你別想你逃得過,這個機率蠻大的。我們5年治癒率是25%,歐美國家是65%,美國人是68%,這是2013年年底的統計數據。大家看看這條線。美國肺癌發病率從90年代後期就開始下降,下面藍色的是中國肺癌發病率,持續增長。中國的生產方式到了一個非得轉型提升的階段了,我們的生活方式也到了一個轉型提升的時候了,我們的大數據應該集中在哪裡發力?大家認真考慮。談論太多的工業會給我們國家未來帶來什麼樣的影響,也希望大家認真考慮。一個時代正在發生變化,工業走不下去了,新型的生物經濟正在崛起,癌症是可以早期發展的,一個癌症出現要15年的時間,它是從一個基因發生變化到一個細胞發生變化,從一個壞人變成一堆壞人,最後變成一個“黑社會”,怎麼打掉它,在他基因發生變化的時候就發現它,在他出現壞人的時候就把它抓出來,不要變成“打黑”,“打黑”很麻煩。
汪建:舉一個例子,宮頸癌,HAV是一個病毒,感染了女性宮頸上皮細胞,時間長了就可以變成癌症,這個人很猛,把乳腺卵巢一起切掉了,現在我們提出來,如果我們免費在黔西南免費把HAV檢測了,是不是就能基本控制宮頸癌,是不是可以同時把子宮內膜癌、卵巢癌、乳腺癌同時做了,同樣是這條方法,我們對癌症進行定性、定量和定位分析,我們主要是數字化IPAD,如果這個能夠實現,我們對腫瘤早期出現就可以定性定量和定位進行分析,我們有的要天天關注,有的要月月檢查,有的按季度檢查,有的基因變化按年檢查,同樣這又是一個大數據,我依然拿100萬人做一個基數,依然是10的18次方的數據,這個疾病如果在中國人0.1%人口中做,就是中國最大的數據庫,至少可以使我們癌症早期發現率提早一年以上,如果提早一年以上,我們5年存活率至少可以提高2-3倍,這是不是最大的數據、是不是大科學,是不是大產業?而且都是從我個人出發的,我們是一個民間機構還沒有膽量和膽氣來提國家發展,來提城市發展,所以我們往往從我開始。
汪建:同樣是這套技術平臺,我們技術平臺產生的數據在數學領域在2012年以前佔全球數據的40%,現在2013年、2014年可能降了一點,怎麼也有30%以上。
汪建: 最後我講講出生缺陷,我就是一個出生缺陷,30秒鐘一個,但是我這個出生缺陷直到50幾歲纔給診斷出來,很鬱悶,我國殘疾人8000多萬人,廣東的貧困人口一半因病致貧和因病返頻的。上個月一個報道,濟南棄嬰島11天119個孩子被扔在裡面。地中海貧血,廣西10%的地中海貧血出現,這兒盲人小孩和國家領導人一起合影,他們不知道什麼叫照片,我們需要辦更多盲人學校嗎,所有這些先天性盲人疾病都是基因病,通過基因檢測是可以做到的,怎麼從10的9次方里面怎麼找到一個檢基變化來預測疾病,這是一個大數據的過程。我們前幾天剛剛與301學科啓動了百萬新生兒天力和聯合基因篩選計劃,同樣是一個大數據,終於上到了百萬人,很可惜,這樣的計劃依然是一個民間計劃。
汪建:這個紅色的數字(1263萬人)是我標記的,是通過基因分析方法可以比較準確的預測預防的,肢體殘疾2472萬人,通過超聲波是可以查得出來的。總書記非常關心福利院的孩子們,我們也希望更多的人能關注到這塊。
汪建:我編了個順口溜,選錯基因配錯郎——悲,輸在娘肚子裡——慘,政府控制基因缺陷——牛,人大立法——好,最牛的政府,最善的機構。如果我們對中國每一個新生兒進行這樣的篩選,我們出生缺陷會大大降低,這不光是一個大產業問題,這是一個更大的民生問題,也是一個民心問題。
汪建:同樣是這套技術,同樣是這麼多技術,同樣是這麼大的數據,同樣是這樣的模擬方式,讓我們簡單的回憶一下。天花,曾經有5億人死於天花,它多於歷史上所有的戰爭總和導致的人員死亡;斑疹傷寒最後一次報道是1974年在雲南昭通地區。狂犬病,在歐美國家基本上消滅;口蹄疫在西方國家也基本消滅了;地中海貧血,一個小小的塞浦魯斯全部消滅了,我們這麼大的國家一年居然有幾十萬的新生兒帶有地中海貧血;破傷風也抑制住了。
汪建:我們看看我們的基因能夠幫助我們做多少?我這裡舉一個例子,猶太人TST疾病,這種疾病在猶太人人羣中大概是1%,是其他民族的將近100倍的發法,1970年左右,他們發現了這是一個基因突變引起的疾病,用一個酶的檢測就可以找到這個突變的原因,所以全世界的猶太人聯合起來了,就是由猶太教出面,在科學家配合下,通過媒體的傳播,進行所有婚前、產前檢測,在世界上所有猶太人居住的地方推廣這樣的方法,經過40年的努力,到了2003年,基本消滅了這個疾病,2003年北美出現了10個這樣的患兒,沒有一個來自猶太人家庭。塞浦魯斯能做到,分佈於全世界的猶太人能做到,我們做不到嗎?
汪建:我再說幾句,信不信由你,控制出生缺陷是不是千億萬億的產業?心腦血管病是不是千億萬億的產業?腫瘤個體化治療是不是千億萬億,抗衰老是不是千億,女同胞的美容是不是更大的產業?我們希望在這些發展過程中對中國的科學貢獻應該有標誌性成果,有紅色的地方已經說明我們作出世界上標誌性成果,在社會貢獻上我們希望成爲未來社會發展的行業標準,我們在出生缺陷上已經有幾個項目被公認爲全球臨牀診斷標準,我們希望在其他領域更多作出這樣的貢獻。
汪建:華大是什麼企業,華大在全球科研排名第87名,在中國科研排名第5,第一是中國科學院,第二是中國科大,第三是清華,第四是北大,第五是華大,生命科學排名我們持續排在全國第二,第一仍然是中國科學院。
汪建:很多人不相信我們做的事有什麼用,我們在過去也很難得到科技部門的支持和理解,但是有這麼一個人很喜歡我們,每次都來找我們,第一次來穿着西裝,戴着領帶,我就告訴他,華大基因有個規定,我們是不允許穿西裝,更不允許系領帶的,那是過去的日子,我們不要再跟着洋人跑了。第二次來再也不穿西裝,第三次他也跟我們笑再也不穿西裝了。最短一次跟我們談兩個小時,最長的一次六個小時,我們簽訂了16項重要的合同,我說比爾蓋茨,我們不要你的錢,你提出一個項目,我們拿一半的錢,你拿一半的錢,我們共同爲人類做點事情。我對黔西南提出一個設想,服務民生,建設醫學健康,服務集聚區健康發展配套產業,貴州黔西南是我們國家基因寶庫,大數據、大科學、大產業最重要的資源所在地,它有生物多樣性,民族多樣性,它是疾病研究的寶貴資源,我們能不能做出10的18次方大數據來控制遺傳性疾病,這種山區的遺傳性疾病一定有它多樣性、有它的特殊性,我們能夠控制黔西南遺傳性疾病,我們就能控制中國其他山區的遺傳性疾病,我也相信可以通過比爾蓋茨可以推廣到全世界去控制這些遺傳性疾病。另外它是生態寶地,好山好水好地方,養身養水養健康。我們依靠創新激動,依靠服務民生建立一個新的集聚區,來共同減少出生缺陷,減少腫瘤,減少心腦血管病,這三個病加在一塊兒是影響人類健康和生死的80%。如果在80%上我們有所貢獻,我們就不愧對我們的一生。
汪建:雖然華大做任何事情都是從個人開始的,我想它的結局一定是有利於一個地方的發展,也有利於一個城市的發展,也會有利於一個國家的發展。所以基因科技,造福人類,是我們最大的一個願望。
汪建:最後有一個小故事,大昭寺前面有一個衆渡碑,我去看了那個碑,發現碑上被人挖了很多洞,我半天沒有搞清楚是怎麼回事,其實是紀念何琳的一個碑,何琳帶了天花的夾克弄乾以後磨成粉到那裡去給病人看病,他走以後後人給他立的碑,然後走的時候把石碑上的粉帶走,希望能夠治好天花。假如防天花爲民生,百姓會如何,假如把天花產業當做一個產業推廣,疫苗產業會如何?可惜歷史沒有如果,基因科技造福人類,希望中國的基因發展不留遺憾,謝謝大家。
主持人:感謝汪建先生的精彩演講。下面有請中國大會主席、中國科學院院士梅宏院士。
梅宏:謝謝前面幾位的精彩演講,下面我們進入一個儀式環節,那就是貴州大數據產業聯盟的發起儀式,作爲貴州省發展大數據產業的一個重要載體,貴州大數據產業聯盟將按照自願、平等、合作的原則發起成立,是集專業性、學術性和聯合性於一體的非盈利性服務型鬆散聯合體,聯盟將整合上下游產業鏈,構建產學研用的共享機制,創新政企互動的模式,打造國際合作平臺,爲匯聚各方資源,促進區域經濟發展貢獻力量。
下面我們有請賽伯樂投資集團董事長朱敏,工信部中國電子信息產業發展研究院院長羅文,貴州省經濟與信息化委員會黨組書記、主任李保芳、浪潮集團首席科學家、執行總裁王恩東上臺。
圖爲貴州大數據聯盟啓動儀式 張煒攝
我宣佈貴州大數據聯盟正式發起,請各位回座,請聯盟發起人朱敏董事長留步,請朱董事長宣讀倡議書。
朱敏:尊敬的各位領導,各位企業家同仁,大家下午好!十分榮幸能代表貴州大數據產業聯盟會員做聯盟成立的創立發言。這是我今年第二次來到貴州,此次能在生態國際會議上的雲上貴州·大數據國際年會代表上百家大數據聯盟成員發言,感覺到責任重大,在貴州省經信委大力推動下,有國內知名大數據數據和貴州省本地企業聯合發起成立貴州大數據聯盟,聯盟成員主要由大數據相關行業企業、研發機構、高等院校、投資等領域構成,特別是有一定的規模和行業影響力的單位爲主,按照資源、平等、合作的原則發起成立集專業性、學術性與聯合性爲一體非盈利性服務型鬆散聯合體,目的是推進貴州省大數據產業化目標,建立上下游、產學研、信息、知識產權等資源共享機制,成員單位在聯盟的形成研發企業交流合作平臺,共同解決聯盟內企業面臨的各種技術與資源難題,充分保證大數據的科技成果快速有效轉化,實現聯盟成員的創新資源有效分工,合理銜接,形成公共技術支撐平臺,促進成員單位自身發展,提升貴州省大數據產業的整體競爭力。在這裡,作爲聯盟的發起人之一,我代表聯盟成員向關心大數據產業發展的國家公信部和貴州省委省政府表個態,我們將抓緊推動聯盟後續工作的進程,聯盟正式成立後,將積極發揮各成員單位積極性,聚集大批企業從不同角度促進聯盟發展,同時也希望在座各位專家、企業家、同仁們能加入到聯盟中來,共同爲貴州省大數據產業增光添彩,謝謝大家。
主持人:感謝朱敏董事長的宣讀,近年來,浪潮集團在IT領域成績斐然,在大數據領域上也卓有建樹,2014年已經成爲中國服務器市場的領導者,我們再次請出浪潮集團首席科學家、執行總裁王恩東先生給大家做精彩演講,有請浪潮集團王恩東先生。
圖爲新浪潮集團首席科學家、執行總裁王恩東先生髮表演講 張煒攝
(演講的主題爲:大數據開啓行業化應用新浪潮)
王恩東:尊敬的各位領導、各位專家,大家下午好!我是來自浪潮集團的王恩東,非常高興今天能夠有機會參加我們貴州省組織的這樣一次非常高規格的論壇,我是第二次到貴州來,第一次是到貴州來旅遊,這次是到貴州來參加大數據的論壇,旅遊是綠色產業,現在貴州又選擇了大數據,同樣是綠色產業,我覺得貴州在產業發展方向的選擇上是非常正確的。
王恩東:今天我想跟大家從三個層面來分享大數據的一些情況,首先從行業雲到行業大數據。
王恩東:雲計算和大數據是密不可分的兩個詞,也是最近這幾年炒得最熱的兩個詞彙,前幾年更多說的是雲計算,最近這幾年我們開始說大數據,實際上雲計算和大數據是密不可分的,應當講雲計算是大數據的基礎,大數據是雲計算的目標,只有通過數據分析、挖掘提供服務,雲計算才能體現它的價值。圍繞着雲計算和大數據,應當說各方面的意見也是非常多的,圍繞雲計算前幾年還有一些比較名明確定義,這幾年圍繞什麼是大數據,大家連一個準確的定義都沒有。
王恩東:我們認爲,從雲計算的角度看,我們把雲計算分成三類,一類是公衆雲,一類是私人云,還有一類是行業雲。我們把行業雲定義,是行業內起主導作用或者掌控關鍵資源的建立或者維護的以公開或者半公開方式向行業內部或者相關組織或者公衆提供有償或無償的服務的這樣一個雲計算系統叫做行業雲,它不同於公衆雲,像百度、Google這些雲計算我們叫做公衆雲。行業雲最大不同就在於它核心的能力是在於本身所掌控的數據。尤其從前幾年來看,我們知道,公衆雲的數據都是在網絡上的各種各樣數據,是網絡上自然形成的,或者這說幾年我們每個消費者個人在免費使用行業雲所提供的服務同時,貢獻了我們個人的一些數據。這些數據相對來講它的私密性或者它的保密性不是非常的強,對於我們國家的運行、經濟的運行沒有那麼的關鍵。但是作爲行業組織來講的話,他們的數據是非常非常關鍵的,同樣這種數據一般來講也是不可能隨便拿出去放到一個公衆雲上面去讓大家隨便看的,甚至包括像我們的醫療數據、交通數據,當然包括我們的經濟運行數據等等這一些。
王恩東:當然公衆雲與行業雲之間在基礎上有很大的變化,我們可以看到公衆雲有非常強大的技術能力,像百度、阿里等等,他們核心競爭力就在於技術能力,而行業雲在於它數據是壟斷性的,或者通過一定的授權才能使用的,但是在技術能力上又需要有一些第三方公司給他提供一些標準的支撐,因爲本身不可能每個行業、每個組織都自己開發這樣一套相應的系統來支撐它的運營,它還是要靠第三方的公司或者企業來支撐它的運營。
王恩東:同樣我們可以看到,正是由於這種行業雲本身的特點,隨着這幾年雲計算的發展,數據的積累也越來越多,於是我們就提出來大數據也應當分出行業大數據,剛纔我們聽了汪建先生非常精彩的報告,實際上他講的這樣一個數據,就是基因這樣一個行業或者這樣一個領域的大數據,它的價值、規模比我們在網絡上能夠看到的價值和規模可能大得多。同樣我們在很多其他行業裡面也會有這樣的需求。我們一二十年的基礎設施建設,應當從原來基礎設施的建設,這幾年隨着雲計算的發展,我們在進行業務整合,在進行數據的集中,在這些數據逐步集中起來的時候,應當說對於數據的挖掘和服務集中顯現出來,我們把這種行業的需求叫做行業大數據。
王恩東:講到數據,尤其說到大數據的概念,我認爲還是比較混亂的。我們在維基百科、百度百科上可能都找不到一個能夠讓我們比較信服的對大數據的定義。在日常生活當中我們對大數據的定義和理解是完全不同的。比如說在兩會期間,有一個叫兩會大數據還是訴說來着,實際上那裡面的數據實際上都不是大數據,都是非常簡單的數據統計。
王恩東:在這個地方我們也試着把數據做了一下分類,不是做一個定義。一家之言,也供大家批評。我們認爲,數據是否可以分爲三個階段,第一個階段叫業務驅動階段,第二個階段叫數據融合階段,第三個階段叫數據驅動階段。
王恩東:首先是業務驅動階段,我們在前期最初的信息建設時候,我們所有的數據實際上都是被動產生的,我們是圍繞着某一個任務、某一個業務去建立信息系統,在這個信息系統運行過程當中產生了一些數據形成的結果,我們在這過程當中更多的是關注最終的結果,我們對於過程數據關注非常的少,於是大量的過程數據都丟失掉了,因爲我們認爲它是沒有用處的。當然也是由於在那樣一個階段,我們的存儲容量、存儲能力、存儲水平也滿足不了能夠把那麼多數據都記錄下來。在這個階段來講,應當說信息孤島現象或者數據孤島現象是非常普遍的。我們有的時候也會說,尤其是今天我們在某些場合說的大數據,像剛纔說的兩會大數據,實際上僅僅是一個簡單的數據統計,說我們去年GDP增加了多少,糧食產量又增加了多少,實際上都是一些簡單的數據統計。在這個階段由於我們數據孤島的問題實際也爲我們接下來數據融合埋下了很多積累,因爲數據格式不一樣,數據質量也是比較差的。
王恩東:第二個階段我們叫做數據融合階段。在這個階段,在組織內部或者行業內部開始進行數據的整合,進行數據的共享,尤其是基於這些數據開始初步對數據進行分析挖掘產生一些價值,比如說一些BI系統,就是商業系統,實際上這些商業系統本身並不是做什麼樣的預測,更多是在歷史數據裡面找出它的一些規律來,爲決策提供一些依據而已。像我們很多ERP系統,很多企業價值管理倉,包括初步做的交通系統管理工作,這些都是處在融數據融合階段。我們看到一些大數據的書裡面講到了啤酒和尿布的故事,我認爲啤酒和尿布的故事並不是什麼大數據,它應當是處在第二階段,更多是像BI的系統,這個階段它的數據分析仍然是在本行業、本領域內相關數據綜合的挖掘。在這個階段當然由於要進行綜合的挖掘,實際上我們看到也已經帶來了相關的困惑,帶來了相關技術發展,例如緩和存儲的問題,如何解決共享和隱私的矛盾,由於是處在一個組織內部,共享和隱私矛盾還是比較少的,更重要的是要打破部門利益達成共享,畢竟它不是跨行業跨領域的數據整合。
王恩東:第三個階段我們叫做數據驅動階段,我想這應當是我們大數據最終的階段,在這個階段大數據真正成爲資產。我們信息系統建設應當以數據爲核心來建設我們的系統,而第一個階段我們是以任務爲目標來建設系統,數據是副產品。在最後的數據驅動階段,應當說我們是以數據爲核心來構建我們的系統。系統的設計首先要進行數據結構的設計,跨行業、跨領域的數據融合成爲一種必然。同樣它要產生的結果更多的我們要追求預測性,這種預測也是要超出本組織、本行業的結果。就像我們說天氣預報,它是一種預測,這樣一種數據分析我認爲充其量是在第二個階段,數據融合階段,如果我們能夠把天氣預報、農業生產的數據、工業生產的數據這些相關數據融合起來,我們根據天氣變化能夠預測糧食產量情況,能夠預測今年天氣能夠預測今年旅遊情況,我想這可能就是到了數據驅動階段,到了真正充分利用大數據的階段。當然到這個階段可能更多問題不僅僅是技術問題,有的時候技術問題可能還比較容易解決,到了要解決政策的問題,環境的問題,一些法律法規的問題,我認爲在這個階段可能比較多,比如說隱私保護的問題,我們在這階段可能有大量的數據交易產生,數據交易過程中如何保護它的私密性、保密性,可能都是要通過相關的法律建立才能夠做到的。
王恩東:大數據我們把它分爲這三個階段之後我們來看行業大數據會面臨什麼樣的技術需求。實際上在這個方面,前面幾位專家已經說得比較多了,我就簡單講一下。在這裡面,實際上行業大數據與大數據所面臨的技術挑戰有非常多相通的地方。同樣它也有它特殊的地方,就像剛纔我們看到的汪建先生他說的在基因分析方面,它自然是圍繞這樣一個領域、行業肯定有大量不同的需求。
王恩東:由於時間關係,這些問題我就不講了,接下來我講一下浪潮在大數據的實踐。圍繞大數據我們浪潮也做了很多實踐,我們可以總結爲一個詞,三個字,就是“一體化”。
一是流程與技術的一體化,大數據的分析無論是從採集、存儲、分析、可視化這些階段,都需要不同的技術,不同的產品,如果把這個東西交給用戶自己去做的話,一定是很複雜,很麻煩的事情,所以浪潮在這方面我們做了一體化的工作,把相關的技術與流程結合起來,提供一個一體化的方案。
二是軟件與硬件一體化,我們針對不同大數據應用提供專業計算、存儲和網絡硬件,針對不同的應用進行軟件的挑優,爲用戶提供軟件和硬件的一體化。
三是平臺與應用一體化,我們看到,在大數據的初級階段,我們認爲我們現在這階段還是初級階段,我們很多技術還沒有形成哪一個主流一定是主流解決所有問題的,所以很多問題還面臨着大量技術挑戰,在這種情況下,我們看到,不同的行業的問題有非常多相似性,因此我們面對不同行業提供不同的應用平臺,應當是非常有效的。比如我們圍繞金融、公安,這兩個行業就是不同的,所以我們圍繞這兩個行業也研發出了金融大數據一體機、公安大數據一體機等等。當然在大數據一體機裡面,我們把數據獲取、存儲、管理、分析以及可視化圍繞行業特點進行專門的定製化,使整個系統性能有了很好提升。
王恩東:我講一個案例,山東公安在前年的時候也是一個傳統信息系統,各種業務系統都是獨立的,在去年我們對它這個系統進行了改造。首先形成了一個統一的計算存儲和網絡平臺,然後在不改變它原來的業務運行模式基礎之上對數據進行整合。在數據整合基礎之上,一方面使它原來業務還照常運轉,進行資源共享。同時對業務有了更多的創新,比如說把人口數據、車輛數據進行綜合分析之後,我們就能夠很好提高破案速度,比如說抓捕套牌車輛,這樣的效率有了非常大的提升。同時我們給山東公安開發下一代大數據應用平臺,希望下一代大數據應用平臺不僅僅是把原來的業務、行業內部數據充分利用起來,也能夠把互聯網上的一些數據利用起來,也就是組織內部數據和組織外部數據能夠融合起來,能夠圍繞公安業務有更多的創新。
王恩東:最後,既然到了貴州來參加這樣一個會議,還是想對貴州發展大數據提兩點建議。大家講發展產業更多是講招商引資,尤其是最近雲計算大數據我們比較多的會關注數據中心建設,或者服務器、存儲、網絡、生產基地的建設,在這個地方也建議,作爲貴州省來講一方面要重視這方面的招商引資,同時也要重視對大數據的應用示範,能夠在政策和環境的建設方面做政策和環境的建設者,能夠成爲技術和方案的實踐者,也能夠成爲產品和服務的示範者,種得梧桐樹,自有鳳凰來。
第二個方面建議就是不僅要重視數據中心建設,更要重視數據的挖掘以及數據服務,把大數據服務業發展成爲新興產業,因爲數據本身作爲一種資源,尤其作爲一種特殊資源是取之不盡用之不竭,並且在用過程中還會產生新的更多數據。數據本身價值有限的,只有把它利用好纔會帶來無限增值空間。
雲計算、大數據應當說帶來信息產業發展的機會,技術、產業、商業模式實際上都是在一個探索和發展過程中,所以我們浪潮也會積極的配合貴州在大數據產業方面的發展,爲貴州大數據產業的發展盡我們一綿薄之力,謝謝大家。
主持人:感謝王恩東先生的分享,下面讓我們重磅請出英特爾公司中國研究院院長吳甘沙,讓我們用熱烈掌聲有請吳甘沙先生給大家帶來主題爲大數據的知行合一的演講,有請吳甘沙院長。
圖爲英特爾中國研究院吳甘沙院長髮表演講 張煒攝
(主題爲:大數據的知行合一)
吳甘沙:尊敬的各位來賓,各位朋友,大家下午好!今天我演講的題目是——大數據的知行合一。在座很多可能都能猜到,我這個題目其實是爲了向一位大宗師來致敬,在500年前,這位大宗師在我們貴陽修文縣的龍場悟道,提出了“知行合一”的哲學理念,他就是王陽明傳山先生。所謂知行合一,知是行的主意,而行是知的功夫,知是行之始,行是知之成。
吳甘沙:那麼我們大數據的知、我們大數據的行分別是什麼,他們之間又分別有什麼樣的關係呢?這是認知論與實踐論之間的關係。大數據的認知大家一般都說大數據是一種戰略思維,它是一種管理革命,它上自國家和社會治理,中到我們產業升級,下到我們的數據化運營以及個人數據化生存。
吳甘沙:具體而言,我這裡想採擷幾個廣爲接受的大數據的認知概念。第一個叫做“第四範式”,這是從科學方法角度論去看,在人類歷史上一共有四種,一種叫實驗,第二種叫做理論,牛頓天才大腦被蘋果砸了想出了萬有引力,第三種叫做模擬,基於理論規律做計算模擬的實驗,比如說我們覈實驗現在不真的做,而是在計算機上面做模擬,這是第三種範式,第四種範式就是數據探索,如果說模擬是一種演繹的方法論,而數據探索更傾向於是一種歸納的方法論,它從大量的數據當中歸納出特別的規律出來,這也是我們現在的大數據一個主要的範式。
吳甘沙:大數據有4個V,大家都很熟悉了,其中3個V是描述數據的特徵,界定大數據的,就是大、雜、快。而第4個V是價值,我們大數據可能有兩種價值,一種是我們要化數爲據,從數據當中提取出信息、知識,洞察出來,這是一層價值。第二層價值是數據本身它是一種資產,它本身是具有價值的。
吳甘沙:三大思維,剛纔維克托·邁爾·舍恩伯格先生大致分享了他書裡面講的這三大思維——全局優於採樣、混雜優於精確、相關性優於因果性。當然在我們中國我們有句話說盡信書不如無書,我們更希望用辨證關係去看這三對概念。當然全局很好,它能夠讓我們聽到每個個體的聲音,但是某些場景裡面採樣是很有用的,是在誤差低於10%前提下能夠使成本降低10倍、100倍。我們要擁抱混雜性,這話也沒有錯,但是大數據裡面有很多噪音,如果我們把噪音作爲型號,那很可能我們提取出來的它是過度學習的,它沒有泛化的能夠。相關性確實是很好,如果說針對大量的非關鍵的業務,我們能夠找到相關性,像我們個性化推薦那樣,能夠產生巨大的簡直。但是在某些地方我們還是要問爲什麼,我們要知道因果。如果我們只是停留在相關性,那與迷信沒有差別,因爲迷信本身就是基於相關性的一種判斷。如果我們不追求因果性,有時候會犯錯。比如說Google流感趨勢就是一種典型相關性,但是發現它會過度預測而導致疫苗短缺,所以我們看中相關性,也要重視因果性。還有就是“大”字的解釋,大數據都說它大,它的體量大,但是有時候我們並不一定要拘泥於體量大的數據,而是說數據爲大,像戴明說的,除上帝之外,任何人都要用數據來說話,我們要基於數據這樣的決策來取代我們傳統的經驗主義和自覺主義。大價值,數據並不一定大,我們追求價值的大。
吳甘沙:我們在談大數據的同時也不能忽略小數據,小數據就是我們個人的數字足跡,我們的數字畫像,我們的一舉一動、一言一行現在都進入了數據,我們進入一種數據化生存的時代。未來我們自己的數據是不是應該由我們自己來代言,它能產生的價值是不是應該由我們自己來享受,這是知的一面。
吳甘沙:我們再看行的一面,大數據的行或者大數據的技術很典型是兩大平臺,基於分佈式文件系統以及基於內存計算的。三種數據管理,傳統的交易數據和結構化數據,半結構化數據多結構化數據,大量非結構化數據可以用分佈式文件系統。
吳甘沙:五類計算,首先是批量計算,我們數據非常大,大批量進行計算,數據在這邊不動,計算進來,成果出去。而流計算恰恰相反,我們計算不動,數據是川流不息的流進來,價值再出去。疊帶計算,同一塊計算上面反覆計算,我們現在機器學習就是疊帶計算,圖計算就是典型的疊帶計算,是基於我們生活當中大量出現途結構或者複雜網絡結構,像我們社交網絡、路網、疾病擴散的這樣一種途徑都是塗,所以專門有途計算。還有即興查詢。
吳甘沙:最後是三種分析,一種叫做描述性分析,是說過去發生了什麼,爲什麼會發生第二種是預測性分析,未來會發生什麼,第三種是處方性分析,我如果想要未來這麼發生的話我要做一些什麼樣的事情。
吳甘沙:除了分析之外還要考慮可視化,怎麼能夠讓數據當中提煉出來信息智慧洞察,能夠讓我們終端用戶更容易理解和接受。現在知和行實際上是脫節的。我們做基於數據決策的時候我們並不一定懂技術,我們做業務的人和做數據分析的人他們可能沒有共同的語言,所以這是一種脫節的狀態。所以我今天的主題是希望大數據能夠做到知和行合一。
吳甘沙:知行合一之一:大數據一定要打通六大產業,我們現在信息技術前沿有六大產業,大數據、雲計算、智慧城市,以個性化製造和開放硬件爲基礎的第三次工業革命,移動互聯網和物聯網。在這裡面,我們認爲大數據它是處在一個非常基礎的地位,它是爲體,我們都知道,“中學爲體西學爲用”的說法,體就是基礎,是根本。而云計算它作爲我們信息產業的房地產和基礎設施,它是術,它是一種工具。智慧城市爲綱,綱舉目張,下面有三種用,個性化生產和第三次工業革命是用,移動互聯網是用,物聯網是用所以把這六大支柱產業各取一個字,一大三智雲物。所以這裡面大數據起到非常基礎作用,我們不是把它作爲一種單獨產業與其他產業割裂開來,而是我們希望它能夠與其他的五大產業都能融合起來。
吳甘沙:知行合一之二:大數據與行業關係,尤其是與傳統行業的關係。我們所謂的從比特到原子,從信息世界到物理世界,我們有很多的傳統產業。大數學與它放在一起會產生什麼樣的化學作用。馬化騰說互聯網與傳統產業能夠產生加法效應,我們認爲大數據與傳統產業能夠產生乘法效應,同時不同產業之間融合還能產生數據外部效應,就是我這個產業數據如果用於另外一個產業的時候它能夠迸發出巨大的價值,比如說我們傳統的零售與金融放在一起,就產生了現在的互聯網金融或者大數據金融當中典型的小微貸款、京東這樣的供應鏈金融,傳統的電信產業與我們的社會治理也能夠發生關係,比如說國外的一家電信企業它開放了一些數據,而其他人可以拿這些數據去看加州的公路上面是不是有缺口,是不是有顛簸,而傳統上政府需要花很多錢去鋪設傳感器,而現在通過電信的開放數據就能夠獲得這些價值。與醫學相關的數據,醫學數據或者健康數據有很多種類,比如說剛纔說的生命科學的數據,基因數據,比如說藥理學的數據,比如說臨牀的數據,還有很多與我們病人行爲相關的一些行爲數據,一些報銷的單據,一些與餐飲發生的關係,與藥品發生的關係,而這些可以與金融產生更大價值。金融數據與保險業能夠產生更大價值。交通數據與零售會有什麼樣的關係?他們用交通數據去發現我們零售業、超市選址最好的地點。交通數據跟金融也能發生很大的關係,比如我們能夠去監測駕駛員的駕駛行爲,把它與保險聯繫起來。比如說我們的物流這裡面有物,也有資金流,也有信息流,它可以與供應鏈金融結合起來。農業與金融也能夠發生關係,一個非常典型的案例就是國外一家小公司,它拿美國政府開放的氣象數據能夠算出每個每一塊農田上方的微氣象,它預測惡劣天氣的概率,然後幫助農民去保險,同時如果說真正的災害發生後,它能夠幫助他們去理賠,所以它與金融也發生了關係。現在我們說像新的互聯網教育形式出現,它也能通過大數據帶來個性化更科學的教育。
吳甘沙:知行合一之三:大數據的價值雷達。我們剛纔說這些行業之間通過大數據發生關係關鍵的是維克托·邁爾·舍恩伯格說的我們要有大數據思維,而大數據思維就是要尋找價值,我們一個企業找到了價值,它的IQ就提升了,我們一個社會找到了它的價值,它的EQ可能會提升。如果我們政府能夠把握老百姓情感的趨勢,它的情商可以提升。我們個人利用大數據可以提高我們社交商。它的價值雷達有6個緯度,我把它放到空間和時間二維緯度裡面。一個見微,一個知著,小數據見微,大數據能夠知著。我經常用一部電影裡面的臺詞描述這兩個詞,見微就是見自己,知著就是見衆生、見天地。同時見微是一個時間概念,因爲這個數據剛剛產生的時候它的價值化最大,隨着時間推移慢慢成只有集合價值。第三個價值是當下,第四個價值是未來,當下就是時間的圓點,就是我們現在時時發生的智慧,而在時間的附軸就是過去發生的事情,時間正軸就是預測未來,如果我能夠了解過去,知道當下,預測未來,我能夠做到萬物兼明。第五個是變額,第六個是小易。像我們利用深度學習這樣新的技術,使得機器能夠更好理解人的意圖和訴求。所以這六個緯度會出現在從運營到營銷到決策、產品設計和業務創新每個環節。
吳甘沙:知行合一之四:迴歸數據的雛形。實際上我們回顧做大數據,最開始我們試圖解決數據與機器關係,大數據量非常大,我們需要大量機器去處理,但是一旦機器多了以後就會出現問題,我們一臺服務器可能幾十年不出問題,但是一千臺服務器可能每天都會有機器失敗,我們怎麼去解決。第二種關係是數據和人的關係,我們數據當中怎麼能夠更好提煉出價值出來,我們怎麼能夠更好的幫數據科學家處理更多數據,我們怎麼能夠提供更多的更好的分析的工具,讓我們的領域專家可以去分析數據,我們怎麼能夠提供更好可視化工具,讓終端用戶去理解數據。最後一個就是數據與數據的關係,現在數據經常在孤島裡面,大家知道數據與數據之間可能發生化學作用,兩個數據本來沒有活性,但是碰到一起發生劇烈化學作用,可能有的數據對我來說是毒藥,但對別人來說是蜜糖,所以我們需要通過數據交易和交換使得數據產生價值。現在大家可以看這幅圖,黃色數據是化學級,還沒有上網可能沒有數字化,但是藍色的,我們現在能夠看到公開數據就是在表面,小於15%,更多數據在深海里面,在黑暗空間裡面。我們要形成培育和交換數據資產有利環境,第一個,我們數據社會的參與者,我們要進行數據資產的積累,但同時我們也希望有法律去保障,數據的權利可能有數據的擁有權,數據物權的問題,數據的隱私權,什麼東西不能給你看,數據的許可權,什麼東西我是可以給你看的,但是在什麼時間、什麼範圍、什麼目的約束之下,數據的審計羣我許可了,你是不是按照許可範圍使用我的數據,數據的分紅權,我這數據能反覆產生價值,不是一次性給你,後面產生價值的時候我有沒有可能分紅。
吳甘沙:第二個就是我們要讓數據流動起來,才能滋養數據社會,數據第一要開放,我們政府數據和一部分科研數據要開放,當然開放要做到逆命化。第二個是要做到數據共享,美國國土安全部有恐怖分子的名單,他去問航空公司要乘客登記記錄,航空公司不給,因爲這涉及到乘客隱私問題,但是航空公司又要去問國土部要恐怖分子的名單,這個又是國家的機密,雙方都不願意給出數據,但是雙方都願意發現恐怖分子在什麼地方,這事實上是一個非常經典的問題。比如說兩個垂直店商,一個賣衣服鞋帽,一個賣化妝品,他們只有對客戶片面理解,如果兩方面數據融合起來就能或者對一個客戶全面的畫像。比如說癌症的研究,癌症是過去50年唯一一個種類沒有獲得突破性進展的病,有很多種癌,每個研究機構只有一小部分數據樣本,如果把這些數據樣本融合起來它就能幫助我們解決這個問題。
吳甘沙:還有數據交易問題,通過數據市場進行交易,但是數據交易要解決的問題就是數據定價的問題,數據它的價值密度是不一樣的,有的種類它比較值錢,有的種類不值錢,新鮮的時候值錢,不新鮮的時間就不值錢。像國外有一家公司能夠給每個消費者8美金的錢,你給數據給這家公司,他找廣告公司去價值化。但是它現在也分類,男士8美金,女士給18美金,因爲在女士身說能夠進行促銷機會更大,所以數據定價是一個很困難問題,包括像我們的企業,我們擁有大量數據資產作爲一種無形資產怎麼定價的問題。
吳甘沙:所以通過這些來解決數據民族化的問題。一旦數據民族化以後,我們怎麼樣通過平臺解決常類企業解決價值提煉問題。還有價值提煉工具基礎設施化問題。
吳甘沙:總結來說就是人多未必是優勢,如果你不尊重數據權利,不能夠讓數據從孤島裡面出來進行交換和交易,那未必是優勢。而傳統產業也未必是劣勢,傳統產業擁有大量數據。我很容易華麗轉生爲數據服務的企業。像法國的標緻雪鐵龍把它大量的數據拿出來變成了一個數據服務的企業。
吳甘沙:互聯網是1969年誕生,但是到25年之後,才能夠使美國勞動生產力得到突破性提升,1995年以來,美國生產率提高了80%,其中2/3因爲信息科技的發展。所以我們現在進入大數據時代,21世紀的第二個十年,大數據應該說是在風正其時的時候。
吳甘沙:同時我們再把時間軸拉長,再看更遠,我們發現大數據會出現一種加速性的發展,這可能是因爲一個所謂的傑文斯悖論,技術的進步會導致資源利用率的提升,進而導致價格降低,最終增加資源的使用量,所以我們即將面臨一個大數據與傳統產業加速融合產生價值的這麼一個過程。在這過程當中,英特爾願意與政府、與學術界、與產業界同行者一起去探索,一起做開放式創新,一起釋放大數據的魔力,一起共創大數據黃金時代的未來,謝謝大家。
主持人:感謝吳甘沙院長的精彩演講,在大數據產業不斷繁榮的今天,幕後還有一個很重要的推手在推動大數據的繁榮,基金投資公司就是一股重要的力量,讓我們再次請出賽伯樂集團董事長朱敏先生爲本次論壇做精彩演講,有請朱敏先生。
圖文賽伯樂集團董事長朱敏先生髮表講話 張煒攝
(演講主題:大數據投資價值分析和展望)
朱敏:第一個我想講一下,我站在這個臺上更像一個賣西瓜的老頭,我不像一個投資家。第二個,我聽了英特爾研究院院長的演講,他更多是講的研究方向,我們講的是投資的東西,所以看起來非常笨。
朱敏:我稍微講一下我這個賣西瓜老頭到底哪兒來的,到哪兒去。當年等到改革開放,進到大學已經30歲了,好不容易到美國去已經36歲,總算在美國趕上IT的高潮,看着當年的喬布斯還不到30歲穿着牛仔褲在那邊,覺得這麼牛,我已經36歲,所以我們1997年成立了Webex,2000年上市以後還可以,所以回到國內也投資一些企業,這企業在國內還算比較標杆的。
朱敏:很多人都講大數據,當年實際上我們Webex已經做了一部分大數據。這就是波音公司與2000多個供應商之間怎麼用大數據和互聯網共同聯在一起,我覺得把整個大數據服務做到設計裡面去。通用汽車怎麼把它全球的汽車設計做到大數據裡面去的協同工作。
朱敏:我剛纔聽了維克托·邁爾·舍恩伯格講的話,我認爲他講得很有道理,我認爲很多人忘記了關鍵的一條東西,大數據不是自動產生、自動分析出來的,大數據是需要專家去分析的,爲什麼今天是一個大數據的時代,我認爲因爲它是一個移動互聯網時代,移動互聯網時代才能帶來大數據時代,因爲大數據時代需要一大批專家,能夠架着互聯網,把他們專家資源發揮到全世界最大,我認爲這纔是大數據在今天會爆發的一個非常關鍵的原因,而不是因爲數據太多以後所以變成大數據的時代。
朱敏:我們講大數據時代下面的投資價值,我們2006年我和朱磊回到國內以後非常想看到下一步想做什麼,所以我們從原來硬件世界到軟件世界,最後我們把軟件變成服務,我們在那裡面是第一個做出來的,我們說那是什麼呢,當時我們想出來一個東西叫Inforwell,當時我們的提法就是內容+專家+軟件+硬件的平臺,不幸的是我們沒有用Bigdeta這個詞,但是我們基本上把這個數據說出來了,我們也努力的想實現,可是時代沒有到,實踐也不是很成功,實踐造英雄,所以現在終於等到了大數據的時代,就像當年我們到美國去的時候,我1990年成立了互聯網會議公司,當時我一啓動之後就理解到事實上沒有一個互聯網,做網絡會議是不可行的,最後好不容易等到199年,互聯網起來了,我們公司一夜之間也是從當時價值500萬美金一下子變成1000萬美金。
朱敏:現在也是一個移動互聯網的時代,這個時代裡面是什麼東西呢,所有行業的邊界被大數據打破,新的商業模式會出來,所以這裡面有非常多的機會。這裡面大家非常熟悉的案例就是京東,劉強東他講怎麼把零售行業和互聯網打通,這是非常典型的移動互聯網下大數據的應用。
朱敏:剛纔前面各位專家也舉了很多例子,我們覺得有三點,我們覺得大數據的行業應用,帶動的是大數據基礎設施與大數據的製造業,所以我也非常同意鄔院士講的大數據行業應用是關鍵,有了行業應用以後真正能夠打動製造業與基礎設施的建設。
朱敏:大數據的行業應用有很多,亞馬遜在全世界都是領頭的,還有浪潮等等,都努力提供各方面的服務。我們實際上最關心的就是大數據的服務業,這個案例就是汽車保險的案例。第二個就是旅遊產業,與貴州很有關係,怎麼樣在大數據下面看待旅遊產業,怎麼樣在旅遊產業裡面打造出新的大數據企業出來,我們舉的另外一個案例就是醫療產業,醫療產業裡面我們想講的就是怎麼從海量數據裡面捕捉到有價值東西,完全改變醫療產業。我們也看到,大數據與製造業融合在一起,怎麼把真正變成大數據的服務業,我們舉的案例就是醫療企業製造業與醫療大數據怎麼樣打包在一起,將來提供線上線下的醫療服務,我們覺得做設備的公司都可以考慮將來不僅僅是提供做產品模型,而是做融合服務模型來解決。
朱敏:下面講一下我們賽伯樂在貴州做什麼,我們有幸得到貴州省政府、貴州省經信委的邀請和關心,我們希望賽伯樂大數據的方案就是成立大數據產業聯盟,爲大數據產業發展提供有力支持。我們現在在貴州省第一夠是作爲貴州大數據聯盟發起人,推動大數據聯盟特別是貴州大數據應用。第二是以貴州大數據聯盟發起人希望在全國建立細分產業的大數據聯盟,我們主要幾個案例,一個是智慧網絡,智慧網絡就是能不能把今天的能源網與通訊網融合在一起,做成大數據新一代的智慧網絡出來,這個我們希望落地在貴州。第二個就是整個的健康管理,國外就做HMO,這個產業是非常大的產業,這個產業我們覺得是大數據的一個應用,這個應用我們覺得中國需要這樣一個健康管理產業,我們也希望能夠在全國發起做健康管理的大數據聯盟。第三個是交通管理,大家可能都知道,我們今天的交通,中國的ETC卡還是分割在每個省一段一段的模式,有沒有可能把整個交通管理,特別從公路管理開始,能夠有效的把公路管理、鐵路管理、航空管理等等最和融合成一個大數據的交通管理模型數據。
朱敏:我們第二步的行動就是在我們的專業上面,發起成立貴州省大數據產業基金,以這個產業基金作爲母基金來建立下面細分行業大數據的產業基金。我們希望在貴州投資裡面能夠投資大數據產業配套服務,我們覺得貴州省在投資公路這些基礎設施已經做了非常多工作,但是我們覺得軟服務上面要提上去。這個軟服務我們覺得一個是大數據人才培養,第二個是大數據產業配套服務,我們覺得最重要就是國際大學城、國際醫院,包括國際中學。
朱敏:最後我們要支持賽伯樂的企業在貴州投資,我們創意思訊在貴州有很大投資,所以我們希望在貴州得到貴州省領導和各位同仁的大力支持,能夠對貴州也做一點事情,謝謝大家。
主持人:感謝朱敏董事長精彩的演講,下一位演講嘉賓是來自全球知名科技服務企業,富士康科技集團副總裁吳惠鋒先生,衆所周知,富士康第四代工業園已經落戶貴州,富士康的發展與貴州省已經緊密聯繫到一起,在大數據基礎設施領域中,富士康已經建設了知名的生態數據中心,也是明天各位嘉賓將在參觀活動中能夠直接瞭解的,今天我們有幸請到了吳惠鋒先生爲大家帶來精彩的演講,有請吳惠鋒副總裁。
圖爲富士康科技集團副總裁吳惠鋒發表演講 張煒攝
(演講主題爲:構建大數據時代的綠色數據中心)
吳惠鋒:各位領導及業界先進,大家下午好!我想我應該是最後一位報告,我儘量把時間縮短,但是我想今天我的報告跟各位先進不太一樣的,第一點,我的報告絕對跟貴州有關係,第二點,我的報告是硬件方面的。
吳惠鋒:報告之前我想說兩點。第一,富士康從去年郭臺銘總裁參加論壇之後就宣佈我們在貴州建立富士康第四代工業園區,所以我在去年8月19號第一次來到貴州,這邊氣候非常吸引,我們想在貴州建立一個與別地方不同的數據中心,經過8個月努力我們終於造成了,所以歡迎各位明天有興趣可以去參觀。第二,我們看看數據中心面臨問題,大數據時代下,數據中心越建越大,所以耗費大量電能。有幾個問題我想跟大家交流,左上角圖形就是傳統數據中心使用率不超過50%,就是整個數據中心大樓裡面放的電腦數量不超過50%,整個機櫃也沒有塞滿,所以形成一種浪費,也就是說等到這個數據中心放滿的時候已經過了若干年。現在數據中心的PUE是1.7,就是所有的電到數據中心除以用在服務器上面的電,PUE2.0就是一度電提供給電腦,另外一度電是冷卻、照明和其他用途,所以我們目標是想建立一個數據中心,符合環保、節能、生態文明。所以來到貴州讓我們有機會打造成這樣的數據中心,以下就是我的報告。
吳惠鋒:這是美國去年的報告,我們分析,整個耗電的能量大概50%-55%是用在機器上面,也就是服務器、存儲器,30-35%是冷卻用,因爲電腦會產生熱,需要冷卻。9%-10%是電源轉換消耗,4-5%就是其他,例如照明、安控之類的。各位都知道,貴州最好的就是氣候,我們怎麼利用貴州的這一天然資源打造一個新的數據中心。
吳惠鋒:這是美國LEED的標準算法,我們數據中心打造好了,我們正申請白金級的認證,需要達到80分以上,總分是110分。最重要35分是它的能源與環境。我們相信在這35分裡面我們可以拿到很大的分值,所以有把握申請到白金級的數據中心認證。
吳惠鋒:但是又回來講PUE,大家都講能源的效能,所以很多產生都用太陽能、風力,我們認爲太陽能、風力也是破壞生活的一種,所以我們儘量也不經過再能生源,完全是自然方法產生冷卻數據中心。
吳惠鋒:根據貴州的氣候,我們研究了過去幾十年的貴州氣候,也經過貴州設計院的幫忙,找出在我們第四代園區旁邊的一個埡口,這個埡口四季都能夠產生每秒2-3米的風速,所以我們經過仿真,這個仿真是我們與貴州設計院以及富士康仿真團隊的努力,終於在一個月到兩個月時間證明這可行的,所以我們動工8個月完成一個不破壞生態的數據中心。
吳惠鋒:各位看到,左上角的CIAC,我們完全排除,也就是說我在數據中心裡面完全排除掉我的冷氣,完全沒有冷卻機,也不用水。所以我們數據中心沒有冷氣機,沒有水,沒有水就自然不排水,這是第一個。第二個我們有混風,就是在貴州最熱的33度天氣能夠處理,所以我們的混風機也不會經常全部開,所以我們PUE值現在算下來是1.1,這個數據值變化我們還在收集,到一定的時候纔會公佈,在夏天可能會多一點。第三個我們的散熱方法就是穿堂風,我們把熱氣導向排到山洞外面,這個道理很簡單,但是因爲有貴州天然氣候我們纔有辦法達到這個目的。剛纔有英特爾中國研究院的院長,我們也與英特爾合作了好幾個案子,就是英特爾的CPU能平散的分散到每個機架上面,也達到自然冷卻的目標。所以如果大家去參觀的話,我們每個監控系統可以看到每個CPU的溫度、溼度和適用率。
吳惠鋒:使用大數據的公司很難預料三到五年後使用的大數據有多大,所以我們用集裝箱式的數據中心,這樣的集裝箱式數據中心就包含冷氣,但是在貴州就不包含冷氣,完全是因爲個人需求而打造的數據中心,如果今年他需要用10個集裝箱,我們就用10個集裝箱,明年需要用100個馬上可以加到100個,所以好處就是集裝箱能夠大量生產。所以爲什麼我們能在8個月打造好這個數據中心,因爲貴州政府很快幫我們打了隧道,將來蓋這數據中心就是製造業,不是等建築蓋好了再裝機器。
吳惠鋒:我們這個數據中心是室外用的,我們打造了120公尺長,18公尺寬,6公尺高的山洞,我們可以放12個集裝箱,每個集裝箱以96千瓦的速度來算,就是12個乘滿了,我們需要的量1267KW,建議PUE在1.5或者1.5以下,所以現在1.5應該在今年蠻平常,舊的數據中心大多在2.0,如果2.0的話,一年下來我們可以省900萬度電,換算成二氧化碳的排量,大概400萬公斤,相當於植樹464公頃,就是一個小小的數據中心花8個月打造成功就可以省這麼多能源,加上在山洞裡面,我們不破壞生態。貴州有很多山,將來可以萬很多山洞,貴州的地質很多山洞裡面地下水並不多,所以並沒有潮溼問題,又能天然的排熱,這是我們去年來到貴州以後才發現的,這也算是一種大數據的分析,對過去歷史氣象、地質、地理位置產生出來的大數據。
吳惠鋒:我們富士康是整套系統,我們可以從最小零件一直做到整個數據中心,所以我們的考量絕對不只是數據中心中冷卻考量,我們從零件就開始考量如何最省能源,能能源就是符合環保,所以我們產品從最小零件一直到40尺的集裝箱,甚至20、30個的集裝箱的數據中心,我們都可以打造。
吳惠鋒:我們認爲DataCneter也是我們的一個數據中心,我們會提供所有數據中心的管控、監控、打造與建設,這是我們新服務的一個項目,也是我們在第四代產業園區裡面包括了服務器與數據中心的建設。所以富士康的BigData有11個屏,最後包括汽車與機器人,總共11個屏。所以很多事情因爲數據太大,先在進端處理,然後再後送。
吳惠鋒:最後有幾張照片,是我們前兩天剛剛完成的時候照的,左上角是我們數據中心的入口,各位可能沒有看到數據中心長這個樣子,將來我們在隧道里面完全不破壞生態,用自然風,也沒有人在裡面,這個數據中心完全是遙控的,我們可能三到四個月不打開。我們是用的集裝箱數據中心,在天津、臺北、高雄、深圳我們都是經常幾個月不打開,只有需要服務再打開,裡面沒有燈光,裡面唯一耗電不用在服務器上面就是攝像頭用的電,攝像頭用的電比起服務器是太少了,所以我們可以PUE降得非常低。我們PUE不是用算的,是實際量出來的,所以打算在貴安新區的數據中心在整年的PUE統計時再公佈,最近幾個禮拜下來大概1.04到1.05,可能是全世界最低的,因爲現在很少沒有冷氣的數據中心,我們是整年沒有冷氣,並不是只有冬天沒有冷氣。所以歡迎各位明天有時間去參觀,因爲我們站在數據中心裡面非常的涼快,所以最後變成我們很多員工中午在裡面休息。
吳惠鋒:最後我們希望我們的數據中心與我們第四代園區,我們以科技的方法,能夠環保、節能、生態文明,這也就是我們這次參加生態文明貴陽論壇的目的,以上是我的報告,謝謝。
直播結束!謝謝收看!
更多生態文明貴陽國際論壇的相關報道請登錄本站專題:http://travel.163.com/special/gylt2014/