LinkedIn李玥:存儲大數據成本高,考慮多平臺
導讀4月29日消息,大數據挖掘對企業來說可能并不全是機遇,還意味著財政支出,原因是針對大數據存儲或者挖掘的成本也很高。在2013 Teradata大數據峰會上,LinkedIn商業分析高級經理李玥接受So
4月29日消息,大數據挖掘對企業來說可能并不全是機遇,還意味著財政支出,原因是針對大數據存儲或者挖掘的成本也很高。在2013 Teradata大數據峰會上,linkedIn商業分析高級經理李玥接受Sohu IT采訪時表示,企業投入在大數據存儲上的成本并不低。因此,很多企業會同時考慮多個解決方案。
以linkedIn為例,該公司就同時使用了Teradata的解決方案和Hadoop的解決方案。這樣做的原因在于,大部分數據的價值密度很低,如果全部使用Teradata來存儲,那么成本就會很高,而Hadoop是公認的成本比較低的解決方案。
CSDN總編劉江向搜狐IT表示,類似于Linux開源,基于Hadoop開發的公司也很多,他們可以為用戶提供產品。通常來講,Hadoop的解決方案會便宜一些。
這就要求對涉及到大數據類工作的企業進行篩眩比如,對linkedIn來說,其報表數據分析對公司來說尤其重要。于是,該公司絕大多數的報表在后臺都是用Teradata數據倉庫來支持的。這部分報表要準時發出去給商業代表,而商業代表則要根據數據來做相關的決策,而且很多新功能也是通過Teradata Aster大數據探索平臺開發的。
據李玥介紹,這些報表數據具有舞臺效應,如果有一個延遲,后面的就會全部延遲。而在linkedIn中,絕大多數的數據是先要從高度可靠Teradata系統里面讀出來,讀到linkedIn的數據挖掘的平臺上面,然后再用已有的這些統計上的工具來進行這些數據挖掘的工作。
免責聲明:本文章由會員“張陽一”發布如果文章侵權,請聯系我們處理,本站僅提供信息存儲空間服務如因作品內容、版權和其他問題請于本站聯系