淺談MapR大數據融合平臺
大小:0.2 MB 人氣: 2017-10-12 需要積分:1
標簽:mapr(2087)

Hadoop企業版發行商MapR于3月8日宣布,旗下融合數據平臺(Converged Data Platform)正式上市,并加強Docker容器(Container)、安全性、數據治理等功能。另外,此平臺現在也包含了開源Hadoop專案Apache Myraid,讓集群管理工具YARN和Mesos間共享數據中心的資源,并支持多租戶環境。
MapR融合數據平臺將Hadoop和Spark、網絡規模(Web-Scale)的儲存、NoSQL、數據串流功能等整合到一個統一的集群,提供用戶可以部署即時數據應用程序。MapR Platform由業界最快速、最可靠、安全且開放的數據基礎設施所驅動,極大降低了TCO,并實現了全局的實時數據應用。而該平臺主要由大數據事件串流系統MapR Streams、NoSQL數據庫管理系統MapR DB,以及基于POSIX檔案系統型態的儲存系統MapR FS所組成。comScore的CTO Mike Brown這樣評價MapR:“MapR位列以數據為中心的業務解決方案的前沿,他們提供了最佳的大數據平臺,同時其核心架構成功地滿足了現代數據的挑戰”。
在這次的更新中,MapR透過狀態數據(Stateful Data)來加強Container與持續儲存(Persistent Storage)的互動,而狀態數據就是指數據的背景,舉例來說,顧客的銷售歷史記錄,每個重要信息構成了歷史記錄,歷史記錄則構成了數據背景,而此數據能供應用程序持續檢索。另外,融合數據平臺之于Docker Container就像數據服務層,提供Container分布式且彈性的儲存,也包含容器化(Containerized)應用程序所需的數據庫和信息與串流功能。
在安全性方面,融合數據平臺現在利用訪問控制表達式(Access Control Expressions,ACE)來描述使用者存取的數據權限,根據MapR,ACE讓系統管理員可用1~2行的代碼,就能描述指定的存取權限。而除了ACE外,MapR也在MapR Volume多加一層數據檔案的防護,加強多租戶控制,以確保數據僅供指定群組存取。
而在性能的部分,研究機構ESG進行MapR Streams的基準測試,結果顯示在每秒3.5GB的吞吐量下,每秒可處理超過1800萬筆 信息。另外,MapR DB現在支持原生JSON文件儲存格式,使用者可在SSD中,透過平行I/O即時存取NoSQL數據。
搭建融合數據平臺是為了滿足融合運營和分析管道的要求,以及隨后的捕獲、處理、存儲和查詢階段的存儲要求,一個基于大數據閃存的數據構造是融合平臺理想的存儲層構建模塊,可讓數據管道的每個階段都受益。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
淺談MapR大數據融合平臺下載
相關電子資料下載
- MapReduce和Spark概要介紹 525
- Apache Storm的安裝部署 460
- 谷歌大腦和DeepMind聯合發布堪稱AI界的MapReduce 4057
- MapReduce實現與自定義詞典文件基于hanLP的中文分詞詳解 137
- 一種基于MapReduce模型的并行化k-medoids聚類算法 4585
- mapreduce二次排序_ mapreduce二次排序原理 5874
- mapreduce工作原理圖文詳解_Map、Reduce任務中Shuffle和排序 7654
- mapreduce設置map個數_mapreduce設置map內存 11044
- Mapreduce和Hive中map reduce個數設定 5742
- mapreduce的應用開發步驟 4577