什么是NoSQL - Stay foolish：初學者輕松了解“大數據”

　　什么是NoSQL？

　　NoSQL=Not Only SQL，指的是非關系型的數據庫。

　　非關系型數據庫以鍵值對存儲，它的結構不固定，每一個元組可以有不一樣的字段，每個元組可以根據需要增加一些自己的鍵值對，這樣就不會局限于固定的結構，可以減少一些時間和空間的開銷。

　　應該說明的是，NoSQL在處理超大量數據時性能卓越，而且可以在PC服務器集群上運行，成本低廉，具有高擴展性和實用性。但是，目前大多數NoSQL是開源項目，沒有供應商正是支持，而且在數據完整性等方面遠不如關系型數據庫，企業級應用不多。

　　HBASE 的原理簡要介紹，如何存儲非結構化數據

　　HBase是一個分布式的、面向列的開源數據庫，HBase在Hadoop平臺內的結構化數據的分布式存儲系統。HBase與傳統關系型數據庫的區別在于，它是一個適合非結構化數據存儲的數據庫，而且HBase是基于列而不是基于行的模式。

　　HBase利用Hadoop HDFS作為其文件存儲系統，HBase位于結構化存儲層，HDFS為HBase提供了高可靠性的底層存儲支持；用Hadoop MapReduce來處理海量數據，MapReduce為HBase提供了高性能的計算能力；用Hadoop Zookeeper作為協同服務，Zookeeper為HBase提供了穩定服務和failover機制。

　　HBase數據模型如下：

　　? Row Key：行鍵，Table的主鍵，Table中的記錄按照Row Key排序

　　? Timestamp：時間戳，每次數據操作對應的時間戳，可以看作是數據的version number

　　? Column Family：列簇，Table在水平方向有一個或者多個Column Family組成，一個Column Family中可以由任意多個Column組成，即Column Family支持動態擴展，無需預先定義Column的數量以及類型，所有Column均以二進制格式存儲，用戶需要自行進行類型轉換。

　　當Table隨著記錄數不斷增加而變大后，會逐漸分裂成多份splits，成為regions，一個region由［startkey，endkey）表示，不同的region會被Master分配給相應的RegionServer進行管理。

　　HBase中有兩張特殊的Table，-ROOT-和.META。

　　.META.：記錄了用戶表的Region信息，.META.可以有多個regoin

　　-ROOT-：記錄了.META.表的Region信息，-ROOT-只有一個region

　　Zookeeper中記錄了-ROOT-表的location

　　Client訪問用戶數據之前需要首先訪問zookeeper，然后訪問-ROOT-表，接著訪問.META.表，最后才能找到用戶數據的位置去訪問，中間需要多次網絡操作， client端會做cache緩存。

　　價值密度低

　　Mapreduce是在大數據中挖掘價值的有效方法

　　把MapReduce單獨列出來，是有必要的，因為它太重要了。MapReduce是一種編程模型，用于大規模數據集（大于1TB）的并行運算。概念“Map（映射）”和“Reduce（化簡）”，和他們的主要思想，都是從函數式編程語言里借來的，還有從矢量編程語言里借來的特性。

　　MapReduce 本身就是用于并行處理大數據集的軟件框架。MapReduce 的根源是函數性編程中的 map 和 reduce 函數。它由兩個可能包含有許多實例（許多 Map 和 Reduce）的操作組成。Map 函數接受一組數據并將其轉換為一個鍵/值對列表，輸入域中的每個元素對應一個鍵/值對。Reduce 函數接受 Map 函數生成的列表，然后根據它們的鍵（為每個鍵生成一個鍵/值對）縮小鍵/值對列表。

　　具體分步驟描述為：

　　1）在正式執行map函數前，需要對輸入進行“分片”（就是將海量數據分成大概相等的“塊”，hadoop的一個分片默認是64M），以便于多個map同時工作，每一個map任務處理一個“分片”。

　　2）分片完畢后，多臺機器就可以同時進行map工作了。map函數要做的事情，相當于對數據進行“預處理”，輸出所要的“鍵值”。map對每條記錄的輸出以《key，value》對的形式輸出。

　　3）在進入reduce階段之前，還要將各個map中相關的數據（key相同的數據）歸結到一起，發往一個reducer。這里面就涉及到多個map的輸出“混合地”對應多個reducer的情況，這個過程叫做“洗牌”。

　　4）接下來進入reduce階段。相同的key的map輸出會到達同一個reducer。reducer對key相同的多個value進行reduce操作，最后一個key的一串value經過reduce函數的作用后，變成了一個value。

　　處理速度快

　　MapReduce除了能挖掘大數據價值，同時也是一種分布式/并行計算模型。雖然它是一個很好的抽象，但不能有效地解決計算領域的任何問題。為了滿足大數據及時響應的特性，數據流計算的研究被提上了日程。實時計算方向重要的一個模塊就是實時數據流計算。

　　在數據流模型中，需要處理的輸入數據（全部或部分）并不存儲在可隨機訪問的磁盤或內存中，但它們卻以一個或多個“連續數據流”的形式到達。數據流不同于傳統的存儲關系模型，主要區別有如下幾個方面：

　　流中的數據元素在線到達；

　　系統無法控制將要處理的新到達的數據元素的順序，無論這些數據元素是在一個數據流中還是跨多個數據流；也即重放的數據流可能和上次數據流的元素順序不一致；

　　數據流的潛在大小也許是無窮無盡的；

　　一旦數據流中的某個元素經過處理，要么被丟棄，要么被歸檔存儲。因此，除非該數據被直接存儲在內存中，否則將不容易被檢索。相對于數據流的大小，這是一種典型的極小相關。

　　數據流模型中的操作并不排除傳統關系型數據的存在。通常，數據流操作將建立數據流和關系型數據的聯系。在數據流處理過程中，更新存儲關系的同時可能會產生傳輸處理問題。

　　近年來，業界出現了不少實時數據流計算系統，雖然沒有一個類似于Hadoop的集大成者，但是也都各具特色。由于網絡數據的不斷膨脹和用戶需求的不斷涌現，近年來互聯網企業開始廣泛研究和使用數據流處理，誕生了Yahoo！ S4、Twitter Storm、IBM StreamBase、Facebook的Puma/Puma2 及學術界開源的Borealis等系統。

　　大數據是云計算嗎？

　　如果有人問你這句話，你看完本文，可以很自信的回答他“Absolutely！”

　　為了回答這個問題，我們有需要引入一個概念----云計算是什么。

　　維基百科給云計算下的定義：云計算將IT相關的能力以服務的方式提供給用戶，允許用戶在不了解提供服務的技術、沒有相關知識以及設備操作能力的情況下，通過Internet獲取需要服務。

　　中國云計算網將云定義為：云計算是分布式計算（Distributed Computing）、并行計算（Parallel Computing）和網格計算（Grid Computing）的發展，或者說是這些科學概念的商業實現。

　　云計算分為三個層次：基礎設施即服務（IaaS），平臺即服務（PaaS）和軟件即服務（SaaS）。

　　“在說什么，云啊云啊，好多的云啊，好大的棉花糖啊~~”

　　云計算的核心技術是海量數據分布式存儲和海量數據分布式計算，現在云計算系統主要采用Map-Reduce模型。

　　“Map-Reduce？哪里看到過？”沒錯，在前面對大數據的解讀的時候，我們就已經明確描述過這一段。終于看到熟悉的內容了，無比興奮啊。

　　實際上，云計算的數據存儲技術主要有谷歌的非開源的GFS（Google File System）和 Hadoop 開發團隊開發的GFS的開源實現HDFS（Hadoop Distributed File System）。大部分IT廠商，包括yahoo、Intel的“云”計劃采用的都是HDFS的數據存儲技術。

　　通過對簡單的云計算的定義及技術分析，加上前面我們對大數據的了解，不難得出結論，大數據當然是可以歸為云計算的范疇。

　　應用領域有哪些？

　　說些我們熟知的地方吧，哪些我們接觸到的地方用到了Hadoop？

　　要回答這個問題，舉幾個例子，很容易。在國內，包括中國移動、百度、網易、淘寶、騰訊、金山和華為等眾多公司都在研究和使用它。

　　行業動態及展望

　　“大數據”的影響，增加了對信息管理專家的需求，甲骨文，IBM，微軟和SAP花了超過15億美元的在軟件智能數據管理和分析的專業公司。這個行業自身價值超過1000億美元，增長近10%，大數據已經出現，因為我們生活在一個社會中有更多的東西。有46億全球移動電話用戶有1億美元和20億人訪問互聯網?；旧?，人們比以往任何時候都與數據或信息交互。1990年至2005年，全球超過1億人進入中產階級，這意味著越來越多的人，誰收益的這筆錢將成為反過來導致更多的識字信息的增長。思科公司預計，到2013年，在互聯網上流動的交通量將達到每年667艾字節。

　　最早提出“大數據”時代已經到來的機構是全球知名咨詢公司麥肯錫。麥肯錫在研究報告中指出，數據已經滲透到每一個行業和業務職能領域，逐漸成為重要的生產因素；而人們對于海量數據的運用將預示著新一波生產率增長和消費者盈余浪潮的到來。

　　麥肯錫的報告發布后，大數據迅速成為了計算機行業爭相傳誦的熱門概念，也引起了金融界的高度關注。隨著大數據時代的全面開啟，你是否做好了充分的準備迎接這個時代的到來呢？

閱讀全文

上一頁 12全文

本文導航

第 1 頁：Stay foolish：初學者輕松了解“大數據”
第 2 頁：什么是NoSQL

云計算(135407) 云計算(135407)
大數據(136505) 大數據(136505)

初學者制作工頻逆變器

　工頻逆變器以其線路簡單,易于初學者制作、調式,抗過載能力強,成本低,實用等優點,深受廣大電子制作愛好者的青睞.

2011-03-03 09:55:13

18478

初學者

作為初學者，請求各位大神，我想學習單片機，但不知道如何著手，各位大神指教！{:1:}

2014-01-06 18:51:36

初學者

單片機初學者怎么學

2014-04-15 19:19:20

初學者28335的資料

初學者28335的資料

2015-11-20 21:47:46

初學者中文資料

初學者中文資料

2012-07-06 11:30:55

初學者入門

太好了，初學者學習慢慢消化中……

2023-09-21 13:50:01

初學者如何向高手請教問題？

為什么自學單片機，有的初學者卻能學會，有的初學者卻學了好久都沒學會；連個數字時鐘的程序都寫不出來；每次看到壇友們做出各種稀奇古怪的DIY，我都感到心里酸溜溜，請問高手該該怎。。。。。。總是被學會單片機的嘲笑，看的我們初學者很不是滋味，你們不也就是這么過來的嗎？有什么好自傲的

2012-05-21 22:53:28

初學者如何學習ARM？

初學者如何學習ARM？

2022-01-19 07:04:54

初學者如何學習單片機？

初學者如何學習單片機？

2022-02-17 08:03:29

初學者如何快速掌握

初學者如何快速掌握

2014-04-22 16:30:34

初學者學習的電路初學者學習的電路

初學者學習的電路

2014-03-12 10:17:29

初學者應重點掌握什么電子知識

我想這篇文章能給你點啟發，雖然有點長，但看完他你會受益匪淺的?！　∵@是一個寫給入門者的，要解決一個問題：初學者應重點掌握什么電子知識，大學階段如何學習？　　先說點貌似題外的東西——3個謬論?！　≈囌?/div>

2021-09-09 08:20:32

初學者是學習51還是arduino

如題，我是一名初學者，想問問各位大師入門是學習51還是arduino，哪個適合零基礎的初學者學習

2016-03-03 08:52:41

初學者求labview視頻

大家好，我是labview初學者，為初學者搭建一個平臺，來學習和實驗Labview程序啊，是否有適合初學者的教學視頻給予參考？謝謝大家幫忙！

2012-12-06 10:45:11

初學者看看

本帖最后由 eehome 于 2013-1-5 10:04 編輯 初學者可以看看，有用的！！！??！

2012-09-22 21:15:49

初學者問什么是IP庫啊?

初學者問什么是IP庫啊?

2012-04-12 10:45:59

DSP初學者選那款好呢？

2013-09-16 11:35:03

LabVIEW初學者數據采集

初學者利用生產消費者結構編寫的數據采集，2018版本

2021-01-03 20:25:45

Labview初學者

本人是個Labview初學者，想尋求一位老師教學

2017-12-02 10:49:25

labview初學者怎么學labview

我是初學者 以前指示了解有著東東現在想學卻無從下手求助啊

2012-12-06 13:58:57

labview初學者教程

方便初學者學習Labview

2012-07-11 20:30:41

labview怎么實現指定路徑保存數據，初學者求教

我是初學者現在在做個頻譜分析儀得到的頻譜數據怎么指定路徑保存，就是在前面板上有指定路徑的，，具體怎么做，，，萬分感謝

2011-05-25 21:04:25

寫給DSP初學者：輕松入門,快速精通

2012-08-17 14:25:42

單片機初學者群

單片機初學者群：129310660主要針對單片機初學者和在校大學生

2010-12-29 11:31:38

如何破解FPGA初學者糾結的仿真？

對于FPGA初學者而言，如何正確了解并理解FPGA的仿真是關鍵。應廣大FPGA初學者和愛好者要求，電子發燒友網編輯根據多名在FPGA領域有過多年工作經驗]　　Quartus和Modelsim軟件

2020-05-13 07:00:00

嵌入式Linux初學者快速了解和入門

PS: 本文轉載于網絡，具體出處不明。為了方便廣大嵌入式 Linux 初學者快速了解和入門，同時也記錄一下，故轉載原文，僅用于學習和交流，感謝原作者！從上圖可以知道：① 組成：嵌入式Linux系統

2021-11-05 06:12:28

怎么算電阻，初學者

怎么算電阻，初學者

2016-11-03 01:12:44

本人初學者怎么學習 pcb

怎么學習呢本人 初學者 怎么學習 pcb

2016-05-31 10:52:28

電子初學者手冊

`電子初學者手冊`

2011-05-03 21:17:44

Visual Studio NET初學者教程

2009-01-08 11:15:22

Allegro初學者圖解教程

Allegro初學者圖解教程:【1】如何讓空心圓圈焊盤正常地實體顯示？如何將拐角那些斷線平滑過渡顯示？打開Allegro 自帶的PCB 文件cds_routed.brd 你會看到焊盤是圓圈顯示，走線拐角有

2009-08-15 11:40:16

C語言初學者入門講座

C語言初學者入門講座:面向對象編程和可視化集成開發工具的發展，使很多曾經非常流行的編程語言影響下降甚至逐步消失，但有一種語言是例外，它就是C語言，時光流逝絲毫沒減

2009-10-24 13:38:38

106

與初學者談焊接

有些初學者認為焊接很簡單，其實不然。焊接是電子工作者必須掌握的一門重要技術。不正確的焊接

2006-04-16 23:30:17

1449

初學者USB技術入門總結

初涉學USB，初學者USB入門總結一，概述現在很多的主控上都帶有USB的功能，但是對于初學者來說，這方面應用還是比較棘手，因為usb的不但固件程序需要編

2009-04-22 16:57:40

708

致初學者:如何學好電子技術

致初學者:如何學好電子技術推薦學習電子技術是一個循序漸進的過程，我個人認為應該分五步來走： &n

2010-03-03 10:45:31

6676

proteus單片機初學者的35個試驗

電子發燒友為大家提供了proteus單片機初學者的35個試驗，現分享給大家學習及參考

2011-08-03 16:42:42

873

初學者之路—硬件學習經驗

初學者之路—硬件學習經驗一文是一位搞硬件的在校研究生寫的，希望對那些初學者之路電腦網等處于迷茫的硬件初學者學習之路有所幫助！

2011-12-29 10:20:02

14454

電子DIY初學者必備

電子DIY初學者必備適合電子diy初學者的學習資料，文中匯集了眾多diy愛好者的實用經驗，通俗易懂的技術文獻得以升華。

2012-01-06 10:58:22

2276

PCB Layout初學者必會知識總結

本內容為pcb layout初學者整理了相關的技術點及設計經驗、技巧等知識，方便初學者快速上手。

2012-07-04 16:55:46

5373

HDL初學者謹記：學習HDL前必知

電子發燒友網核心提示：對于初學者而言，在學硬件描述語言（HDL）之前一定要注意以下幾點。算是電子發燒友網小編給HDL語言初學者的一點小小提示吧，希望對初學者起到一些指引作

2012-10-15 11:14:16

2561

cad初學者應該注意的問題

很多學習CAD的新手都不免在學習過程中犯下各種各樣的錯誤，下面是小編整理出一些cad初學都應注意的問題，這此問題都是CAD初學者經常會遇到的問題，希望下面的文章對CAD初學者能有

2012-10-18 09:43:04

1578

編程及C C++初學者+FAQ

編程及C C++初學者+FAQ

2013-09-06 14:55:25

一個牛人給java初學者的建議

一個牛人給java初學者的建議。

2015-11-06 11:22:28

51單片機初學者智能車測速原理圖

51單片機初學者智能車測速，原理圖相關文件

2015-11-18 17:10:56

電子初學者電路圖如何看

電子初學者的指南，介紹了好些東西，都是最基礎的。適合于初學者

2015-11-23 12:05:03

從單片機初學者邁向單片機工程師

從單片機初學者邁向單片機工程師從單片機初學者邁向單片機工程師

2016-01-15 16:33:39

從51初學者到電子工程師

51初學者的學習指導，對51初學者是個很好的入門教程，

2016-02-23 15:53:57

verilog初學者學習ppt

適合verilog初學者的教程，可以好好參考學習。

2016-03-25 14:01:33

Stm32初學者全攻略

Stm32初學者全攻略------值得一看

2016-06-15 17:36:42

關于PNP三極管做開關初學者最容易忽略的問題

關于PNP三極管做開關初學者最容易忽略的問題，感興趣的小伙伴們可以看看。

2016-07-26 10:43:06

與初學者談電子制作

與初學者談電子制作，感興趣的小伙伴們可以看一看。

2016-08-23 15:23:05

verilog_經驗(適合初學者)

verilog_經驗(適合初學者)，感興趣的小伙伴們可以瞧一瞧。

2016-11-10 17:12:34

protel99初學者教程

2016-12-11 22:52:20

電子學習資料[適初學者]

適合初學者的學習資料

2017-02-08 17:25:22

初學者如何看電路圖

初學者如何看電路圖，拆解電路分步講解！

2017-04-19 10:37:34

Keil與proteus完美結合教程單片機初學者的福音

Keil與proteus完美結合教程單片機初學者的福音

2017-09-20 10:43:40

初學者的avr基礎教程

初學者的avr基礎教程

2017-09-21 08:45:51

初學者密碼學簡單入門

初學者密碼學簡單入門

2017-09-21 09:16:33

初學者邊用邊學C語言

初學者邊用邊學C語言

2017-09-22 10:14:24

PSOC1初學者5個實驗，針對初學者的實驗

PSOC1初學者5個實驗，針對初學者的實驗

2017-10-16 09:33:50

RDS的詳細介紹，對初學者有用

RDS的詳細介紹，對初學者有用

2017-10-24 11:29:19

linux初學者入門

2017-10-27 14:34:22

單片機初學者必備的裝備清單

單片機初學者必備的裝備清單：學習套裝：電腦；開發板；下載線（開發板一般會配有）；紙和筆。

2018-07-15 11:24:00

6717

Xilinx開發板初學者問題總結

Xilinx開發板初學者問題總結

2017-12-28 17:34:35

R語言初學者指南 pdf下載

R初學者指南

2018-02-26 09:35:05

適合樹莓派初學者的10個項目

下面小編就為初學者篩選了10個適合的樹莓派開發項目，這10個項目能夠很好地幫助初學者對樹莓派的硬件和軟件有更清晰的認識和理解。話不多說，開始行動吧！

2018-05-10 10:28:00

47064

初學者AVR軟件入門基礎知識(1)

初學者AVR軟件入門基礎知識(1)

2018-07-04 09:50:00

4501

初學者AVR軟件入門基礎知識（2）

初學者AVR軟件入門基礎知識（2）

2018-07-04 09:50:00

2395

初學者AVR軟件入門基礎知識（3）

初學者AVR軟件入門基礎知識（3）

2018-07-04 09:51:00

2315

GPIO、中斷和事件：為ARM初學者導航（6）

第六講：GPIO、中斷和事件－－《為ARM初學者導航》

2018-07-02 00:22:09

4368

DMA和RTC：為ARM初學者導航（7）

第七講：DMA和RTC－－《為ARM初學者導航》

2018-07-02 01:30:11

6959

單片機初學者必備的40個實驗教程

單片機初學者必備的40個實驗教程

2018-11-22 15:46:37

195

樹莓派3型號B初學者指南

我已經解釋了幾乎所有涉及選擇配件和安裝適合Raspberry Pi 3操作系統的內容。我希望這對初學者有所幫助誰對Raspberry Pi的最新型號感興趣。

2019-08-29 09:56:34

3258

初學者適合買什么牌子的萬用表

有人建議選指針萬用表，比如南京MF47型的，有人建議名牌數字表，比如美國品牌福祿克萬用表，說的太好了叫初學者買這么貴的。什么目的？還沒學會走路就想跑了。

2019-10-07 09:42:00

19888

初學者開發人員都會犯的7個Python錯誤

這篇文章主要介紹了七個初學者常犯的Python調試錯誤，并告訴大家如何去避免這些錯誤。

2020-06-23 15:19:45

2214

關于單片機初學者苦惱的問題

單片機代理商深圳英銳恩分享單片機初學者最苦惱的是哪些問題？

2020-06-24 14:30:50

844

fpga開發板推薦初學者

對于一個初學者來說，選擇一款適合學習的FPGA是整個FPGA學習生涯的必經之路。我個人建議在選擇FPGA的時候，應該抓住如下幾個原則：

2020-11-10 14:55:03

18067

給Linux初學者的一些經驗與建議與學習方法及其學習方向

這篇文章是寫給 Linux 初學者的，我會分享一些作為初學者應該知道的一些東西，這些內容都是本人從事 Linux 開發工作多年的心得體會，相信會對初學者有所幫助。

2021-03-19 11:33:43

2709

初學者必看的基本電子技術概念

初學者必看的基本電子技術概念

2021-05-17 11:41:44

Labview初學者常見問題及解答

Labview初學者常見問題及解答。

2021-05-25 15:56:48

初學者必知的20個模擬電路

初學者必知的20個模擬電路

2021-05-29 09:27:46

437

11649

已全部加載完成

搜索歷史

什么是NoSQL - Stay foolish：初學者輕松了解“大數據”

本文導航

評論