白皮書:大數據及其智能處理技術
導讀ldquo;大數據rdquo;ldquo;是一個體量特別大,數據類別特別大的數據集,并且這樣的數據集無法用傳統數據庫工具對其內容進行抓娶管理和處理。 ldquo;大數據rdquo;首先是指數
“大數據”“是一個體量特別大,數據類別特別大的數據集,并且這樣的數據集無法用傳統數據庫工具對其內容進行抓娶管理和處理。 “大數據”首先是指數據體量(volumes) 大,指代大型數據集,一般在10TB 規模左右,但在實際應用中,很多企業用戶把多個數據集放在一起,已經形成了PB級的數據量;其次是指數據類別(variety)大,數據來自多種數據源,數據種類和格式日漸豐富,已沖破了以前所限定的結構化數據范疇,囊括了半結構化和非結構化數據。
免責聲明:本文章由會員“王原遠”發布如果文章侵權,請聯系我們處理,本站僅提供信息存儲空間服務如因作品內容、版權和其他問題請于本站聯系