在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>模擬數(shù)字>如何解決Spark數(shù)據(jù)傾斜的八種實用方法詳細(xì)說明

如何解決Spark數(shù)據(jù)傾斜的八種實用方法詳細(xì)說明

2020-04-02 | doc | 0.04 MB | 次下載 | 2積分

資料介紹

  什么是數(shù)據(jù)傾斜?

  對 Spark/Hadoop 這樣的分布式大數(shù)據(jù)系統(tǒng)來講,數(shù)據(jù)量大并不可怕,可怕的是數(shù)據(jù)傾斜。

  對于分布式系統(tǒng)而言,理想情況下,隨著系統(tǒng)規(guī)模(節(jié)點數(shù)量)的增加,應(yīng)用整體耗時線性下降。如果一臺機(jī)器處理一批大量數(shù)據(jù)需要 120 分鐘,當(dāng)機(jī)器數(shù)量增加到 3 臺時,理想的耗時為 120 / 3 = 40 分鐘。但是,想做到分布式情況下每臺機(jī)器執(zhí)行時間是單機(jī)時的1 / N,就必須保證每臺機(jī)器的任務(wù)量相等。不幸的是,很多時候,任務(wù)的分配是不均勻的,甚至不均勻到大部分任務(wù)被分配到個別機(jī)器上,其它大部分機(jī)器所分配的任務(wù)量只占總量的小部分。比如一臺機(jī)器負(fù)責(zé)處理 80% 的任務(wù),另外兩臺機(jī)器各處理 10% 的任務(wù)。

  『不患多而患不均』,這是分布式計算環(huán)境下最大的問題。意味著計算能力不是線性擴(kuò)展的,而是存在短板效應(yīng): 一個 Stage 所耗費的時間,是由最慢的那個 Task 決定。

  由于同一個 Stage 內(nèi)的所有 task 執(zhí)行相同的計算,在排除不同計算節(jié)點計算能力差異的前提下,不同 task 之間耗時的差異主要由該 task 所處理的數(shù)據(jù)量決定。所以,要想發(fā)揮分布式系統(tǒng)并行計算的優(yōu)勢,就必須解決數(shù)據(jù)傾斜問題。

  數(shù)據(jù)傾斜的危害

  當(dāng)出現(xiàn)數(shù)據(jù)傾斜時,小量任務(wù)耗時遠(yuǎn)高于其它任務(wù),從而使得整體耗時過大,未能充分發(fā)揮分布式系統(tǒng)的并行計算優(yōu)勢。

  另外,當(dāng)發(fā)生數(shù)據(jù)傾斜時,部分任務(wù)處理的數(shù)據(jù)量過大,可能造成內(nèi)存不足使得任務(wù)失敗,并進(jìn)而引進(jìn)整個應(yīng)用失敗。

  數(shù)據(jù)傾斜的現(xiàn)象

  當(dāng)發(fā)現(xiàn)如下現(xiàn)象時,十有八九是發(fā)生數(shù)據(jù)傾斜了:

  絕大多數(shù) task 執(zhí)行得都非???,但個別 task 執(zhí)行極慢,整體任務(wù)卡在某個階段不能結(jié)束。

  原本能夠正常執(zhí)行的 Spark 作業(yè),某天突然報出 OOM(內(nèi)存溢出)異常,觀察異常棧,是我們寫的業(yè)務(wù)代碼造成的。這種情況比較少見。

  TIPS:

  在 Spark streaming 程序中,數(shù)據(jù)傾斜更容易出現(xiàn),特別是在程序中包含一些類似 sql 的 join、group 這種操作的時候。因為 Spark Streaming 程序在運行的時候,我們一般不會分配特別多的內(nèi)存,因此一旦在這個過程中出現(xiàn)一些數(shù)據(jù)傾斜,就十分容易造成 OOM。

  數(shù)據(jù)傾斜的原因

  在進(jìn)行 shuffle 的時候,必須將各個節(jié)點上相同的 key 拉取到某個節(jié)點上的一個 task 來進(jìn)行處理,比如按照 key 進(jìn)行聚合或 join 等操作。此時如果某個 key 對應(yīng)的數(shù)據(jù)量特別大的話,就會發(fā)生數(shù)據(jù)傾斜。比如大部分 key 對應(yīng)10條數(shù)據(jù),但是個別 key 卻對應(yīng)了100萬條數(shù)據(jù),那么大部分 task 可能就只會分配到10條數(shù)據(jù),然后1秒鐘就運行完了;但是個別 task 可能分配到了100萬數(shù)據(jù),要運行一兩個小時。

  因此出現(xiàn)數(shù)據(jù)傾斜的時候,Spark 作業(yè)看起來會運行得非常緩慢,甚至可能因為某個 task 處理的數(shù)據(jù)量過大導(dǎo)致內(nèi)存溢出。

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1電子電路原理第七版PDF電子教材免費下載
  2. 0.00 MB  |  1490次下載  |  免費
  3. 2單片機(jī)典型實例介紹
  4. 18.19 MB  |  92次下載  |  1 積分
  5. 3S7-200PLC編程實例詳細(xì)資料
  6. 1.17 MB  |  27次下載  |  1 積分
  7. 4筆記本電腦主板的元件識別和講解說明
  8. 4.28 MB  |  18次下載  |  4 積分
  9. 5開關(guān)電源原理及各功能電路詳解
  10. 0.38 MB  |  10次下載  |  免費
  11. 6基于AT89C2051/4051單片機(jī)編程器的實驗
  12. 0.11 MB  |  4次下載  |  免費
  13. 7藍(lán)牙設(shè)備在嵌入式領(lǐng)域的廣泛應(yīng)用
  14. 0.63 MB  |  3次下載  |  免費
  15. 89天練會電子電路識圖
  16. 5.91 MB  |  3次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234313次下載  |  免費
  3. 2PADS 9.0 2009最新版 -下載
  4. 0.00 MB  |  66304次下載  |  免費
  5. 3protel99下載protel99軟件下載(中文版)
  6. 0.00 MB  |  51209次下載  |  免費
  7. 4LabView 8.0 專業(yè)版下載 (3CD完整版)
  8. 0.00 MB  |  51043次下載  |  免費
  9. 5555集成電路應(yīng)用800例(新編版)
  10. 0.00 MB  |  33562次下載  |  免費
  11. 6接口電路圖大全
  12. 未知  |  30320次下載  |  免費
  13. 7Multisim 10下載Multisim 10 中文版
  14. 0.00 MB  |  28588次下載  |  免費
  15. 8開關(guān)電源設(shè)計實例指南
  16. 未知  |  21539次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935053次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
  4. 78.1 MB  |  537791次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420026次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234313次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233045次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191183次下載  |  免費
  13. 7十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
  14. 158M  |  183277次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138039次下載  |  免費
主站蜘蛛池模板: 涩涩97在线观看视频 | 久久性色| 亚洲热热久久九九精品 | 啪啪网站免费看 | 免费看一级片 | 女人张开双腿让男人桶完整 | 久久婷五月| 亚洲狠狠色丁香婷婷综合 | 成人做视频免费 | 国产一区二区播放 | 欧美不卡视频在线观看 | 九色在线观看视频 | 国产98在线传媒在线视频 | 在线播放免费人成毛片乱码 | 日本高清加勒比 | 亚洲 欧美 精品专区 极品 | 天天操天 | 亚洲国产片 | 在线视频免费视频网站 | 精品精品国产理论在线观看 | аⅴ天堂 在线 | 一级毛片免费毛片一级毛片免费 | 午夜国产在线观看 | 黄色网址日本 | 色综合天天综一个色天天综合网 | 免费看黄色毛片 | 午夜影院欧美 | 亚洲专区一路线二 | 免费国产午夜在线观看 | 久久久久毛片成人精品 | 天堂网. www在线资源 | 色综合一区 | 婷婷午夜激情 | 中文字幕在线观看一区二区三区 | 在线视频观看免费 | 国产精品美女自在线观看免费 | 在线免费观看91 | 特黄黄三级视频在线观看 | 午夜精品久久久久久久第一页 | 午夜社区| 国产精品第一页在线观看 |