存儲大數據成本高 可考慮多平臺
導讀如今,眾多企業對于大數據是ldquo;趨之若鶩rdquo;,似乎沒有應用大數據就是落后,而大數據的挖掘對于企業來說卻并不全是機遇,因為這還意味著財政支出,這是因為針對大數據存儲或者挖掘的成本也很高
如今,眾多企業對于大數據是“趨之若鶩”,似乎沒有應用大數據就是落后,而大數據的挖掘對于企業來說卻并不全是機遇,因為這還意味著財政支出,這是因為針對大數據存儲或者挖掘的成本也很高。而在2013Teradata大數據峰會上,linkedIn商業分析高級經理李玥在接受采訪時也表示,企業在投入大數據存儲上的成本并不低。因而企業在應用時還應考慮到其他多個解決方案。
就以linkedIn為例,該公司就同時使用了Hadoop的解決方案和Teradata的解決方案。公司這樣做的原因在于,大部分數據的價值密度很低,如果全部使用Teradata來存儲,那么它的使用成本就會很高,而Hadoop則是公認的成本比較低的解決方案。
類似于Linux開源,基于Hadoop開發的公司也很多,他們可以為用戶提供產品。而通常來講,Hadoop的解決方案會便宜一些。
這就要求對涉及到大數據類工作的企業進行篩眩比如,對linkedIn來說,其報表數據分析對公司來說尤其重要。于是,該公司絕大多數的報表在后臺都是用Teradata數據倉庫來支持的。這部分報表要準時發出去給商業代表,而商業代表則要根據數據來做相關的決策,而且很多新功能也是通過TeradataAster大數據探索平臺開發的。
據李玥介紹稱,這些報表數據具有舞臺效應,如果有一個延遲,后面的就會全部延遲。而在linkedIn中,絕大多數的數據是先要從高度可靠Teradata系統里面讀出來,讀到linkedIn的數據挖掘的平臺上面,然后再用已有的這些統計上的工具來進行這些數據挖掘的工作。
免責聲明:本文章由會員“王原遠”發布如果文章侵權,請聯系我們處理,本站僅提供信息存儲空間服務如因作品內容、版權和其他問題請于本站聯系