大數(shù)據(jù)(big data),指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價值密度低的四大特征。
一般認為,大數(shù)據(jù)主要具有以下4個方面的典型特征,即大量(Volume)、多樣(Variety)、高速(Velocity)和價值(Value),即所謂的4V。
1. Volume(大量),大數(shù)據(jù)的特征首先就是數(shù)據(jù)規(guī)模大。隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、移動互聯(lián)技術的發(fā)展,人和事物的所有軌跡都可以被記錄下來,數(shù)據(jù)呈現(xiàn)出爆發(fā)性增長。
2. Variety(多樣)。數(shù)據(jù)來源的廣泛性,決定了數(shù)據(jù)形式的多樣性。大數(shù)據(jù)可以分為三類,一是結構化數(shù)據(jù),如財務系統(tǒng)數(shù)據(jù)、信息管理系統(tǒng)數(shù)據(jù)、醫(yī)療系統(tǒng)數(shù)據(jù)等,其特點是數(shù)據(jù)間因果關系強;一是非結構化的數(shù)據(jù),如視頻、圖片、音頻等,其特點是數(shù)據(jù)間沒有因果關系;三是半結構化數(shù)據(jù),如HTML文檔、郵件、網(wǎng)頁等,其特點是數(shù)據(jù)間的因果關系弱。有統(tǒng)計顯示,目前結構化數(shù)據(jù)占據(jù)整個互聯(lián)網(wǎng)數(shù)據(jù)量的75%以上,而產(chǎn)生價值的大數(shù)據(jù),往往是這些非結構化數(shù)據(jù)。
3.Velocity(高速),數(shù)據(jù)的增長速度和處理速度是大數(shù)據(jù)高速性的重要體現(xiàn)。與以往的報紙、書信等傳統(tǒng)數(shù)據(jù)載體生產(chǎn)傳播方式不同,在大數(shù)據(jù)時代,大數(shù)據(jù)的交換和傳播主要是通過互聯(lián)網(wǎng)和云計算等方式實現(xiàn)的,其生產(chǎn)和傳播數(shù)據(jù)的速度是非常迅速的。另外,大數(shù)據(jù)還要求處理數(shù)據(jù)的響應速度要快,例如,上億條數(shù)據(jù)的分析必須在幾秒內(nèi)完成。數(shù)據(jù)的輸人、處理與丟棄必須立刻見效,幾乎無延遲。
4.Value(價值),大數(shù)據(jù)的核心特征是價值,其實價值密度的高低和數(shù)據(jù)總量的大小是成反比的,即數(shù)據(jù)價值密度越高數(shù)據(jù)總量越小,數(shù)據(jù)價值密度越低數(shù)據(jù)總量越大。任何有價值的信息的提取依托的就是海量的基礎數(shù)據(jù)。當然目前大數(shù)據(jù)背景下有個未解決的問題,如何通過強大的機器算法更迅速地在海量數(shù)據(jù)中完成數(shù)據(jù)的價值提純。
本文整合自:傳智教育、php中文網(wǎng)
審核編輯:符乾江
-
物聯(lián)網(wǎng)
+關注
關注
2914文章
44978瀏覽量
377474 -
大數(shù)據(jù)
+關注
關注
64文章
8910瀏覽量
137844
發(fā)布評論請先 登錄
相關推薦
使用ADS8513芯片進行數(shù)據(jù)采集,0~4V回讀數(shù)據(jù)對應的十六進制是如何計算的?
緩存對大數(shù)據(jù)處理的影響分析
大數(shù)據(jù)的3V、4V、7V,到底是什么意思?
![<b class='flag-5'>大數(shù)據(jù)</b>的3<b class='flag-5'>V</b>、<b class='flag-5'>4V</b>、7<b class='flag-5'>V</b>,到底是什么意思?](https://file.elecfans.com/web2/M00/1D/C6/poYBAGGTgNyAeYV4AAAjhcNnEaQ578.jpg)
ADS1675最大數(shù)據(jù)吞吐率是是多少?
raid 在大數(shù)據(jù)分析中的應用
數(shù)據(jù)準備指南:10種基礎特征工程方法的實戰(zhàn)教程
![<b class='flag-5'>數(shù)據(jù)</b>準備指南:10種基礎<b class='flag-5'>特征</b>工程方法的實戰(zhàn)教程](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
智慧城市與大數(shù)據(jù)的關系
云計算在大數(shù)據(jù)分析中的應用
IP 地址大數(shù)據(jù)分析如何進行網(wǎng)絡優(yōu)化?
![IP 地址<b class='flag-5'>大數(shù)據(jù)</b>分析如何進行網(wǎng)絡優(yōu)化?](https://file1.elecfans.com/web2/M00/09/50/wKgaomb3fYeADdmbAAEuarp64SY280.png)
使用CYW20829的BLE進行最大數(shù)據(jù)發(fā)送應用,BLE丟失數(shù)據(jù)如何解決?
大數(shù)據(jù)在軍事方面的應用
大數(shù)據(jù)采集系統(tǒng)分為幾類
特征工程與數(shù)據(jù)預處理全解析:基礎技術和代碼示例
![<b class='flag-5'>特征</b>工程與<b class='flag-5'>數(shù)據(jù)</b>預處理全解析:基礎技術和代碼示例](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
評論