由雅虎為工程師和數(shù)據(jù)科學家打造的Apache Hadoop曾因巨大的潛力而備受稱贊,但如今它卻受到了更快的產(chǎn)品的影響,而這些產(chǎn)品往往來自于它本身的生態(tài)系統(tǒng)——Spark就是其中之一。今年早些,H20.ai的創(chuàng)始人Sri Ambati對Datanami 曾說:“Spark將會使Hadoop處于絕地”。
但在過去的幾年中,Hadoop似乎并沒有出現(xiàn)過任何衰退的跡象。在2015年Atscale的調查報告中顯示:“在未來3個月內(nèi),已經(jīng)有超過 76%的人使用Hadoop來做更多的工作。”這些受訪者中大約有一半聲稱他們利用Hadoop工作中獲得了一定的價值。Hadoop作為一個十多年的老品牌,在產(chǎn)品的采用方面并沒有減緩下降的趨勢,Spark也并沒有做到真正取代Hadoop。空口無憑,下面我們從以下幾個方面來分析一下Spark在未來的幾年之內(nèi)到底能不能真正的取代Hadoop。
按行業(yè)劃分的市場滲透率
毫無疑問,為專家設計的產(chǎn)品一般都會停留在原來的軌道上,在其他方面不會有所涉及。但Spark在各個行業(yè)都存在一些有意義的分布,這可能要歸功于各種市場上的大數(shù)據(jù)的泛濫。所以,雖然Spark可能有更廣泛的應用,但Hadoop仍然支配著原本預期的用戶群。
主要地理市場
在全球范圍內(nèi),我們可以看到Informatica處于中心位置——在歐洲和美洲整體市場份額占比達32%。在兩年半的時間里,我們跟蹤了Informatica在云市場和工業(yè)領域的增長,結果顯示達到了50%的增長,而且在高等教育領域也處于領先地位。上周, Informatica被Gartner評為主數(shù)據(jù)管理解決方案2017年魔力象限的領導者。而Hadoop仍然停留于過去成功的地理市場中。
公司規(guī)模的采用趨勢
在企業(yè)客戶中Spark也沒有大范圍的涉及。我們注意到世界上大多數(shù)公司規(guī)模較小,一般都為1-50名員工,所以Spark似乎并不是任何規(guī)模公司的唯一選擇。對于那些已經(jīng)使用Hadoop的人來說,這個產(chǎn)品也對企業(yè)和公司起到了一定的作用,而且 Hadoop并不僅限于一種用戶。而Hadoop無論在何種規(guī)模的公司中,使用率相對于Spark還是非常高的。
寫在最后
此外,在調查的過程中,傳統(tǒng)的科技公司像eBay、Verizon、惠普和亞馬遜等主流廠商已經(jīng)開始使用Spark,但是Hadoop還沒有被大規(guī)模的拋棄。相反,用戶使用Spark作為系統(tǒng)的介紹,利用這個程序來突破Hadoop的障礙,兩者的結合,使得工作更高效的完成。
-
Hadoop
+關注
關注
1文章
90瀏覽量
16049 -
大數(shù)據(jù)
+關注
關注
64文章
8909瀏覽量
137806
發(fā)布評論請先 登錄
相關推薦
Hadoop 生態(tài)系統(tǒng)在大數(shù)據(jù)處理中的應用與實踐
耳機座連接器:未來是否會被全部取代?
![耳機座連接器:<b class='flag-5'>未來</b>是否<b class='flag-5'>會被</b>全部<b class='flag-5'>取代</b>?](https://file1.elecfans.com/web1/M00/F2/B6/wKgZoWcI0LqAU1HgAABEEayfZhM247.png)
耳機座接口會被TYPE-C取代嗎?
基于Kepware的Hadoop大數(shù)據(jù)應用構建-提升數(shù)據(jù)價值利用效能
![基于Kepware的<b class='flag-5'>Hadoop</b><b class='flag-5'>大數(shù)據(jù)</b>應用構建-提升<b class='flag-5'>數(shù)據(jù)</b>價值利用效能](https://file1.elecfans.com/web2/M00/09/0E/wKgZomcE21CAHUHqAAET3eiQ6hk257.png)
spark為什么比mapreduce快?
spark運行的基本流程
![<b class='flag-5'>spark</b>運行的基本流程](https://file1.elecfans.com//web2/M00/F7/E3/wKgaomaDZoeAbeQsAAGiJ2LbwGw750.png)
Spark基于DPU的Native引擎算子卸載方案
![<b class='flag-5'>Spark</b>基于DPU的Native引擎算子卸載方案](https://file1.elecfans.com/web2/M00/F5/20/wKgZomZ-fKiAAsUcAAFEwmESLqQ755.png)
關于Spark的從0實現(xiàn)30s內(nèi)實時監(jiān)控指標計算
“Spark+Hive”在DPU環(huán)境下的性能測評 | OLAP數(shù)據(jù)庫引擎選型白皮書(24版)DPU部分節(jié)選
![“<b class='flag-5'>Spark</b>+Hive”在DPU環(huán)境下的性能測評 | OLAP<b class='flag-5'>數(shù)據(jù)</b>庫引擎選型白皮書(24版)DPU部分節(jié)選](https://file1.elecfans.com//web2/M00/EB/4E/wKgaomZYNDiAXNiyAACUUyvEjrw026.png)
如何利用DPU加速Spark大數(shù)據(jù)處理? | 總結篇
![如何利用DPU加速<b class='flag-5'>Spark</b><b class='flag-5'>大數(shù)據(jù)</b>處理? | 總結篇](https://file1.elecfans.com/web2/M00/C7/8C/wKgaomYLmjiANVkrAAIq5Cc3gGA857.png)
Spark基于DPU Snappy壓縮算法的異構加速方案
![<b class='flag-5'>Spark</b>基于DPU Snappy壓縮算法的異構加速方案](https://file1.elecfans.com/web2/M00/C5/B1/wKgZomYBSXOAHfkiAAL8llhFqoo690.png)
RDMA技術在Apache Spark中的應用
![RDMA技術在Apache <b class='flag-5'>Spark</b>中的應用](https://file1.elecfans.com/web2/M00/C3/6A/wKgaomXlNumAD4qkAAKXD6F2opA173.png)
基于DPU和HADOS-RACE加速Spark 3.x
![基于DPU和HADOS-RACE加速<b class='flag-5'>Spark</b> 3.x](https://file1.elecfans.com//web2/M00/C1/12/wKgZomXcZN2AYm7rAAIEZvTT08A684.png)
解鎖電梯大數(shù)據(jù)平臺的商業(yè)價值與未來展望
![解鎖電梯<b class='flag-5'>大數(shù)據(jù)</b>平臺的商業(yè)價值與<b class='flag-5'>未來</b>展望](https://file1.elecfans.com//web2/M00/C6/88/wKgaomYA5paAPxefAADH8XuRg80676.jpg)
淺析大數(shù)據(jù)時代下的數(shù)據(jù)中心運維管理
![淺析<b class='flag-5'>大數(shù)據(jù)</b><b class='flag-5'>時代</b>下的<b class='flag-5'>數(shù)據(jù)</b>中心運維管理](https://file1.elecfans.com//web2/M00/C1/84/wKgaomXW7EeAYqmBAAL42XgFWOQ177.png)
評論