方濱興:大數據不能包治百病
大數據擅長錦上添花而不是雪中送炭,如果企業該做的事情沒做好,別指望大數據能幫忙。
美國奧巴馬政府發布“大數據研究和發展倡議”,率先在全球啟動了大數據國家戰略。我國擁有不亞于國外數據量的大數據,需求也非常明確和迫切,啟動大數據戰略有良好基矗中國工程院院士、北京郵電大學[微博]校長方濱興在接受《中國經濟和信息化》記者采訪時表示,大數據無所不在,不是幾個大企業就能壟斷得了的,國內大數據公司有良好的產業前景。
CEI:中國的大數據戰略,企業、政府和研究機構該扮演什么角色?
方濱興:大數據戰略在本質上應該是“需求牽引、效益驅動、技術支撐”,是三位一體的戰略。在戰略中,企業、政府和研究機構的定位各有側重。
對于企業而言,已經具備超大數據量的企業和行業,目前是有條件利用大數據資源的,他們需要做的是根據行業需求,真正發掘大數據的增值需求,開發企業、行業大數據產品和應用解決方案,解決自己的實際問題。我國的大型互聯網企業,比如百度[微博]、騰訊、淘寶,大型通信企業,比如中國移動[微博]、中國聯通[微博](3.65,0.01,0.27%)、華為等,都已經開始了這一嘗試。在這個過程中,企業必然會面臨一些技術挑戰、管理問題,可以借助研究機構和政府的作用,企業還可以通過研究院的形式,建立產業聯盟,提升研究能力。騰訊、華為、華大基因、宇龍、金蝶[微博]等16個單位已經發起成立深圳大數據產學研聯盟就是一個例子。
對于政府而言,有兩個方面的作用。第一個方面,與企業類似,可以從社會管理角度,發掘潛在的公共需求并加以推動,利用大數據技術做些實在的事。比如提高政府公共服務質量、疏導城市交通、改善流動人口管理、均衡社會福利分配、突發應急與社會維穩等。同時,政府還可以開放不涉及秘密與個人隱私的社會管理數據和工作數據,一方面增加透明度,另一方面鼓勵社會利用這些資源開展更多增值服務。第二個方面,政府對大數據提供必要的政策保障和政策引導,以政府立項支持的方式,加強大數據共性技術的研發,加強關系國家利益行業的大數據應用研發,尤其是企業不適合應對或不足以應對的行業,如國防安全等。
對于研究機構而言,基本作用也可以歸納為兩個層面。第一個層面,在關鍵技術和應用研發上,發現新理論、新方法,輔助企業、政府探索大數據工程技術應用的方向與途徑。當前的主要方式是參研政府、企業的科研項目和工程應用,科技部、工業和信息化部等部委,以及大型企業的大數據技術課題和項目。第二個層面,是科學研究層面,大數據引起了科技界對科學研究方法論的重新審視,正在引發科學研究思維與方法的一場革命。有科學家把“大數據時代”稱為人類科學研究的“第四范式”時代,基于大數據的分析和挖掘,“讓數據說話,讓各行業、整個社會的大數據說話”,在這個基礎上發現隱藏在大數據背后統一的理論、實驗和模擬規律。
CEI:有人說美國科技發展的動力在大企業,而中國則集中在政府,你認為中國發展大數據戰略的主要動力是什么?
方濱興:必須承認,大公司的確在美國科技發展、文明進步進程中發揮了巨大作用。但是在大數據戰略方面,美國也不僅僅依靠企業。作為大數據戰略的主推國,美國政府積極參與、大力推動大數據發展。奧巴馬政府發布“大數據研究和發展倡議”,聯邦政府的多個部門國家科學基金、國家衛生研究院、能源部、國防部、國防部高級研究計劃局、地質勘探局等都在部署研究項目、加大投資。
對于中國發展大數據戰略,我們認為應該是企業、政府和研究機構的合力行為。大數據戰略需要“數據到位+應用明確+手段成熟”的三位一體的戰略。三個條件缺一不可。在這一戰略中,企業、政府和研究機構的定位各有側重,以企業為主、政府為輔。這是與大數據的應用牽引本質相符的。
CEI:有人說當前大數據市場正在被國外公司搶占,你怎么看?我們怎么培育自己的大數據分析公司?
方濱興:我不完全同意當前大數據市場正在被國外公司搶占的說法,雖然國外的公司,諸如Google、Amazon等公司的大數據技術起步稍早,但總體而言,目前在大數據技術上,國內外基本處于同步啟動的狀況。大數據發展的關鍵要素一是要擁有足夠多的大數據,二是要有迫切且明確的大數據研究需求推動,三是要有一定的技術積累和成熟度。在這三個方面,尤其前兩者,誰擁有主動權,誰在大數據市場就有主動權。
目前,國內像阿里巴巴[微博]、淘寶、百度、新浪、騰訊等互聯網公司,華為、中國移動、中國電信[微博]、中國聯通等通信公司,華大基因等生物公司都擁有不亞于國外企業數據量的大數據,需求也非常明確和迫切,國內的大數據分析有良好的基矗中國科研機構和企業,可借助政府的支持和導向,共同攻克大數據分析關鍵技術的難關,并建立相應實用系統。可以這樣說,在大數據時代,大數據產業特征決定了必須協作共享。大數據無所不在,不是幾個大企業就能壟斷得了的,國內大數據分析公司有良好的發展機遇和前景。
CEI:你認為在中國掀起一場數據開放運動的話,應當從哪些領域切入?
方濱興:2012年在瑞士達沃斯舉行的“世界經濟論壇”上,大數據成為主題之一,數據已經成為一種新的經濟資產類別。論壇上明確指出,通過利用大數據技術,使得美國零售業每年可增加產業價值3000億美元,增加凈利潤60%;在制造業中,可以減少開發和組裝成本50%;在全球個人位置數據中,可增加服務提供者收益1000億美元,歐洲公共部門管理可增加產業價值2.5億歐元。可以看出,大數據會給各行各業帶來極大好處。至于首先從哪些領域發展,我的觀點是,哪個應用領域需求最迫切,積累的大數據最到位,技術積累最成熟,哪個應用領域就會最先發展。
在經濟、物流和信息利用領域,大數據可以分為兩類:一類來自與人類社會有關的數據,特別是互聯網和經濟活動產生的數據,這部分數據與企業經濟活動和信息利用聯系最緊密,增長也最快。互聯網反映的是人的活動,應該首先充分利用該類數據分析挖掘與經濟活動和信息利用領域相關的信息與知識。另一類來自物理世界,通過傳感器、科學觀測獲取,比如生物數據、腦科學數據、氣象數據、野外環境保護數據、衛星遙感數據等。這類數據首先推動科學領域信息利用技術發展,促進科學技術進步,繼而推動經濟的發展。
除了上述兩類數據之外,大數據中還存在著地理信息和位置信息數據,是社會活動和物理世界兩類數據的融合。這種數據的規模是相當大的,是未來一個新的經濟增長點,而且能帶動物理空間和社會網絡領域的數據產業飛速發展。地理信息是國家信息基礎設施的一部分,電子政務、電子商務、智能交通、智能物流等行業應用,都離不開地理信息。政府對地理信息這種公共資源應該分層管理,除了涉及國防和國家安全的信息需要保密外,其他基礎信息都要免費或以較低成本提供給企業和民眾,基于基礎信息上的各種應用服務,應該大量放開,讓企業去做,進而推進經濟、物流和信息利用行業的進一步發展。
CEI:大數據應用是否存在安全問題?如果存在如何解決?
方濱興:我認為大數據應用是存在安全問題的,除了傳統的物理安全、網絡安全、數據安全和內容安全之外,還面臨著新的隱私保護和信任安全等問題。無論是對于個人、用戶還是國家,都不希望隱私、情報、信息因為大數據泄露,被第三方獲取,這需要進行隱私保護和信任管理。對于企業而言,這需要對個人信息匯總形成相應的決策以更好地服務于網民,形成矛和盾的關系。例如,央視“3·15”晚會揭發網絡服務商通過cookie獲取用戶的隱私,而事實上網絡服務商就是想通過cookie獲得用戶的上網習慣,通過分析用戶行為軌跡向用戶推送更貼切的服務,由此形成隱私與服務的沖突。
從信息防護角度即隱私保護的角度來看,無論是產業、用戶,還是國家,都不愿意看到大數據圍繞著網絡信息大爆炸的應用而危害到國家、社會、個人安全。要做到這點,就需要明確哪些信息不能被深度分析,需要研究如何做到不被分析。同時,還需要圍繞數據使用安全,圍繞社會意識形態等各方面,推出相應的技術和政策、法律約束手段,保障產業健康發展,保障國家、社會、個人的安全。
CEI:目前的大數據概念是否有被炒作嫌疑?
方濱興:首先,大數據概念肯定存在被炒作的情況。這也是所有新興創新技術在產生發展之初都必須經歷的過程。Gartner IT研究與顧問咨詢公司把一個完整的技術成熟周期分為五個時期:技術萌芽期、期望膨脹期、泡沫化的谷底期、穩步爬升的光明期、實質生產的高峰期。在《2012~2013年技術曲線成熟度報告》中,Gartner把大數據放在了期望膨脹期,這也說明目前各國、各行業一定會存在對大數據、大數據分析過度期望,甚至“炒作”的行為。
其次,對于真正的創新技術,輿論的炒作與否不會從本質上改變技術自身的發展。因此,面對大數據,擁有數據的企業和部門,應該保持冷靜深刻的思考:大數據技術中究竟哪些技術是可以成熟應用的,價值又是自身商業所需要的。如果是真正的需求,是真正需要攻克的技術,就應該花功夫去研發和應用。只有這樣,企業才可能從大數據中發現比以往“數據處理”預期更大的價值,從而提升企業的競爭力。
對企業而言,大數據不是包治百病的良藥,目前大多數企業與大數據技術可能并無多大關系。企業應該圍繞企業目標,用好已有的數據資源。如果該做的事情沒做好,別指望大數據能幫忙,信息技術更擅長的是錦上添花而不是雪中送炭。此外,有條件利用大數據資源的企業需要運籌帷幄,以需求、效益為導向,大數據資源用得好會有高效益,但利用成本也很高,企業不僅要有大數據來源還要有人才和技術處理能力,需要充分利用政府、科研機構的力量。