大數據之路:以應用為中心
互聯網與現代通信已經把一種新資源推到人類面前,這種資源就是大數據。大數據來自無所不在的IT設施,IT普及使得人人都成為數據制造者,短信、微博、照片、錄像都是其數據產品;數據來自無數自動化傳感器、自動記錄設施,生產監測、環境監測、交通監測、安防監測等等;來自自動流程記錄,刷卡機、收款機、ETC、互聯網點擊、電話撥號等設施以及各種辦事流程登記等。大量自動或人工產生的數據通過互聯網聚集到特定地點,如電信運營商、互聯網運營商、政府、銀行、商嘗企業、交通樞紐等機構,形成了大數據之海。大數據時代已經來臨。
大數據能夠成為可用的資源得益于大數據處理技術的出現。計算機歷史前五十年主要是利用人們專門收集的數據,這些資料被視為資源,而現在計算機開始關注工作流程中順帶積累的超大規模數據,無處不在的信息設施不停地記錄了人們行為的信息痕跡,利用大數據技術能夠分析這些信息痕跡,從中提取重要信息以減少對環境認識的不確定性,提高工作與生產效率。大數據已成為新時期人類可開發利用的重要資源,以美國為代表的發達國家已經開始把大數據的利用與大數據技術的開發視為國家一項戰略性任務。
如何看待大數據熱?
學術界、IT廠商、IT媒體對新名詞反應極快,大數據迅速成為繼物聯網、云計算、智慧城市之后的新熱點,人們呼吁要建立大數據技術開發中心、大數據產業發展中心,強調要盡快搶占大數據這一戰略制高點,一些地方政府已開始制定捷足先登計劃。一些專家對此持不同意見,認為大數據并非新概念,海量數據處理早已有之,大數據只是IT廠商的推銷策略,沒有必要盲目跟進,不必聽風就是雨。
本文認為技術的突破與應用市場的成熟是兩個階段,大數據概念拓展了我們的視野,大數據的確是一種重要的新資源。技術眼光超前是有益的,對大數據資源可用性的探討有助于發現新機會、提升業務創新能力。對大數據應用市場的估計不能激進,有規模的應用不僅需要成熟的技術還需要成熟的配套環境,大數據不是人人可用的大眾品,對大多數機構而言它仍是一種奢侈品。
應用要先行,投資需慎重
從產業發展的角度看,大規模投資需慎重,不可掀起大數據投資熱,應用與產業不同,應用是不競爭的,誰都可以去用,互不干擾,但產業是競爭的,技術制高點的競爭更為激烈,甲地區能想到戰略,乙地區也同樣想得到,憑什么就你能占據制高點呢?信息技術的制高點不是“不差錢、早下手”就能搞定的。技術制高點有自己的成長規律,它是特定生態環境的產物,在這里機制比錢更重要。技術的發展依賴于密集的應用環境,密集的應用需求推動著技術前進。谷歌、亞馬遜、IBM成為云計算的帶頭人是因為自身就存在著巨大的應用需求,需求推動技術,技術拉動需求,技術與需求的緊密結合共同發展。
信息產業發展經驗表明,技術的引進很容易,只要投錢就行了,但要創建能夠引領技術的產業集群卻極不容易,即使政府投入大筆資金開發也很難做到,因為應用的中心不在這里,沒有足夠肥沃的土壤無法生長出參天大樹。對于IT產業的關鍵技術政府曾投入大量資金去攻關,但效果并不大,因為無法創造出大規模的應用環境。現實合理的做法是:尋找國內應用密集的領域,集中開發該領域的專用技術,提升局部性的競爭力,再逐步擴大發展。技術與產業的發展更需要應用導向,從應用中發現機會,順勢發展應用技術,提升競爭力。