EMC副總裁:大數據正在改變思考方式
從2013年開始,EMC公司再次調整公司組織架構,形成以EMC II、VMware以及Pivotal三駕馬車的業務組合。云計算與大數據已經成為EMC公司戰略的重中之重。EMC副總裁、銷售部全球首席技術官Patricia Florissi博士表示云計算改變的是IT消費模式,而大數據正在改變人們工作、生活與思考的方式。
大數據不是新瓶裝舊酒
早在云計算剛剛興起之時,業界即有對云計算是屬于變革性的創新技術還是新瓶裝舊酒包裝出來的噱頭。時至今日,伴隨著云計算逐漸落地,大家對于云計算的理解才慢慢開始清晰。而大數據時代的到來,同樣有人斥之為商業智能與數據分析的再包裝宣傳,不過是一種新瓶裝舊酒的老套玩法而已。顯然,IT廠商們并不會認同這種觀點。
EMC副總裁、銷售部全球首席技術官Patricia Florissi博士就表示:“在我看來云計算改變的是IT消費模式,這代表著IT技術的消費化。而大數據則正在改變著我們工作、生活與思考的方式,并不是新瓶裝舊酒。大數據實際上不僅僅是單純的大數據,它代表著三個趨勢:一、大規模出現的海量數據是我們看待事物的方式、對整個事物的見地有所不同;第二、因為有云計算,我們有更強的存儲和處理能力來分析大數據;第三、人們已經達到了對于大數據的分析水平。”
圖一:EMC副總裁、銷售部全球首席技術官Patricia Florissi博士。
Patricia Florissi博士認為任何技術都需要有足夠條件和時間才能夠發揮作用:“如果海量數據出現,我們沒有足夠的存儲能力,那我們只能將數據刪除掉;如果我們有足夠的存儲能力,但是沒有數據分析能力,那么數據并沒有什么價值,就猶如金礦石在眼前,卻沒有能力提煉成為金子;如果我們有了存儲和處理數據的能力,卻沒有解讀和分析數據的能力,那我們同樣需要再等一段時間才能迎接大數據時代的到來,好比過去印刷術的發明到真正商用經歷了好幾代人的時間。如今大數據這三個條件都已經成熟。”
Amazon和Google的大數據服務未必更好
在云計算概念剛剛出爐之時,關于公有云與私有云孰優孰劣的爭論頗為熱鬧。我們也可以看到現在Amazon、Google以及Rackspace等提供的公有云服務被越來越多的用戶所采用。而在大數據時代下,Amazon與Google同樣推出了類似公有云的大數據分析服務。這讓用戶又一次面臨著云計算時代類似的問題:是自己構建大數據分析環境,還是通過Amazon或者Google來獲取分析能力?對此,Patricia Florissi博士表示需要用戶在使用難易度、成本以及使用目的三個角度考慮選擇。
Patricia Florissi博士深入分析道:“首先,我們需要了解到Amazon或者Google提供的大數據服務在易用性如何,它與企業級環境相比有何區別。如果是一家中小型公司,使用Amazon的API把數據存儲在Amazon上會更加容易。EMC現在的一個趨勢就是向用戶提供他們以前在Amazon和Google那里獲得的同樣的易用性、可編程性以及易于操作的界面。在這個前提下,EMC來幫助企業級用戶使得他們的數據中心虛擬化,也就是通過軟件定義數據中心、軟件定義存儲讓用戶獲得像Amazon、Google同樣的易用性和可編程性;其次,使用Amazon或者Google提供的大數據服務也會有所得失,Amazon和Google的服務比較容易,易用性強,不過使用它們意味著你將失去控制權;而使用自己數據中心則能夠掌握控制權,不過在易用性方面卻不足,EMC希望能夠在企業級環境讓用戶在易用性、可編程性和控制力方面達到一個平衡;最后從成本角度考慮,如果你對數據處理頻率進行一個經濟學評估的話,會發現如果數據處理頻率比較高,對數據處理能力和容量要求比較大的時候,也就是數據使用率超過50%的時候,就會出現一個經濟學的臨界點和轉折點,此時使用自己的數據中心就比Amazon或者Google便宜。當然,Amazon和Google也在數據高峰和未預見問題的處理上比較容易操作。”
根據Patricia Florissi博士介紹,EMC II的核心是聚焦在大數據管理,Pivotal則是大數據分析方面。
數據學是一個團隊的學科
隨著大數據的興起,一些與大數據相關的職業也開始熱門起來,這其中就包括首席數據官(CDO)以及各種大數據分析人才。EMC副總裁、銷售部全球首席技術官Patricia Florissi博士認為大數據衍生出來數據學應該是一個團隊合作的學科。
Patricia Florissi博士表示:“數據學其實包括不同的專業人才,主要是大數據科學家,這類人才主要建立不同的數據模型,將抽象的數據視覺化,并且需要有能力將不同組變量之間的相互關系進行分析;第二類就是業務科學家,這類人才對于所處的行業特點與業務環節非常了解;第三類就是計算機科學家,這類人才專門來設計基礎架構,在基礎架構之上按照業務科學家的要求去管理和運作大數據科學家設計出來的大數據模型。首席數據官CDO其實是建立和運營數據分析這個部門,CDO其實是大數據專家和計算機專家一個界面,因為CDO需要管理大數據專家,大數據專家需要不斷與計算機專家互動和合作,中間的配合工作則是由CDO來完成。”
軟件定義:瓦解傳統IT市場
軟件定義數據中心,被認為是又一大影響IT發展的方向,從中衍生出來的軟件定義存儲、軟件定義網絡、軟件定義計算等都在逐漸影響著IT業界。這種趨勢其實也非常好理解,在IT硬件逐漸走向同質化的今天,軟件才是差異化競爭的關鍵。
EMC副總裁、銷售部全球首席技術官Patricia Florissi博士就表示:“軟件定義數據中心將會瓦解現有數據中心的概念,包括存儲、網絡以及計算,這將是一個巨大的IT變革。其實軟件定義的本質就是智能從硬件轉向了軟件,通過軟件來實現數據中心的不同需求,這意味著軟件定義使你擁有一種很靈活、靈動的方式管理你的硬件。在存儲領域,我們看到軟件定義的存儲會將控制和數據管理這兩塊分割開,在控制方面,硬件變得越來越不重要;在數據管理方面,因為專業化的數據需要非常快的速度來存儲數據,所以對硬件的專業化要求也將越來越高。”
當前,隨著像Hadoop、Openstack、CloudStack等開源軟件項目的如火如荼,開源已經成為軟件定義數據中心中不可或缺的一股力量。那么EMC對于開源軟件項目的態度又會如何呢?Patricia Florissi博士對此表示:“EMC完全支持和擁抱開源像Openstack、CloudStack這些開源技術,而且會將所有開源技術與EMC產品集成。EMC所追求的是如果采用某項開源技術,那么EMC平臺上的性能將會是最好的。”
當然,Patricia Florissi博士仍然堅持企業級IT廠商非開源軟件平臺具有固有的優勢,企業級IT廠商的非開源軟件平臺在功能和時間領先方面是其他開源平臺所不能比的。Patricia Florissi博士表示:“企業級廠商有一種責任就是要比Openstack更快的把創新和更新的版本推向市場,需要在功能強大和時間上領先開源項目。”
最后,Patricia Florissi博士用一個笑話來表明了她對開源的觀點和看法:“在非洲有一個老人和一個男孩,他們兩人都看見一個老虎,男孩趕緊穿他的跑鞋,這個老人說你為什么要穿跑鞋,你穿上跑鞋也跑不過老虎。但是這個男孩說,我不在乎我能不能跑過老虎,我只在乎我是不是能夠跑過你。”