資料介紹
軟件簡介
Taier是袋鼠云數(shù)棧大數(shù)據(jù)家族的開源項目之一 ,它是一個分布式可視化的DAG任務(wù)調(diào)度系統(tǒng),旨在降低ETL開發(fā)成本、提高大數(shù)據(jù)平臺穩(wěn)定性,讓大數(shù)據(jù)開發(fā)人員可以在Taier直接進行業(yè)務(wù)邏輯的開發(fā),而不用關(guān)心任務(wù)錯綜復(fù)雜的依賴關(guān)系與底層的大數(shù)據(jù)平臺的架構(gòu)實現(xiàn),將工作的重心更多地聚焦在業(yè)務(wù)之中。
一、架構(gòu)設(shè)計和功能詳解
在架構(gòu)設(shè)計與功能特點上,Taier整體架構(gòu)是使用插件式的開發(fā)模式,在任務(wù)開發(fā)下面有調(diào)度模塊和各項組件,也包括數(shù)棧開源家族的Chunjun等等。
(一)Taier功能特點
Taier的功能特點有下面幾個比較重要的方面:
1.任務(wù)類型:Spark SQL、數(shù)據(jù)同步(流計算任務(wù));
2.控制臺:包括隊列管理、資源管理、多集群管理等;
3.運維中心:比如任務(wù)管理、周期調(diào)度、補數(shù)據(jù)等;
4.插件化開發(fā):具體包括 taier-plugin、、DatasourceX、Chunjun等幾個插件。
(二)Taier功能特征
隨著不斷更新完善,現(xiàn)在的Taier已經(jīng)具有以下的幾種特性:
1、拓展性
-
單點故障:去中心化的分布式模式
-
高可用方式:Zookeeper
-
過載處理∶分布式節(jié)點+兩級存儲策略+隊列機制。每個節(jié)點都可以處理任務(wù)調(diào)度與提交;任務(wù)多時會優(yōu)先緩存在內(nèi)存隊列,超出可配置的隊列最大數(shù)量值后會全部落數(shù)據(jù)庫;任務(wù)處理以隊列方式消費,隊列異步從數(shù)據(jù)庫獲取可執(zhí)行實例
-
實戰(zhàn)檢驗:得到數(shù)百家企業(yè)客戶生產(chǎn)環(huán)境實戰(zhàn)檢驗
2、易用性
-
支持大數(shù)據(jù)作業(yè)Spark、Flink的調(diào)度;
-
支持眾多的任務(wù)類型,目前支持Spark SQL、Chunjun
-
可視化工作流配置︰支持封裝工作流、支持單任務(wù)運行,不必封裝工作流、支持拖拽模式繪制;
-
DAG監(jiān)控界面:運維中心、支持集群資源查看,了解當(dāng)前集群資源的剩余情況、支持對調(diào)度隊列中的任務(wù)批量停止、任務(wù)狀態(tài)、任務(wù)類型、重試次數(shù)、任務(wù)運行機器、可視化變量等關(guān)鍵信息一目了然;
-
調(diào)度時間配置:可視化配置;
-
多集群連接:支持一套調(diào)度系統(tǒng)連接多套Hadoop集群。
3、多版本引擎
-
支持Spark 、Flink等引擎的多個版本共存,例如可同時支持Flink1.10、Flink1.12(后續(xù)開源)
-
Kerberos支持Spark、Flink
-
豐富,支持3種時間基準,且可以靈活設(shè)置輸出格式。
4、拓展性
-
設(shè)計之處就考慮分布式模式,目前支持整體Taier 水平擴容方式;調(diào)度能力也隨集群線性增長。
?
二、Taier重要概念
下面從原理和操作層面給大家進一步介紹Taier,還有一些具體概念的解釋。
(一)任務(wù)與實例
方便起見,數(shù)棧在Taier中提出“任務(wù)”和“實例”兩個概念,例如數(shù)據(jù)開發(fā)的數(shù)據(jù)同步這項工作稱之為“任務(wù)”,而已經(jīng)提交并且配置了周期屬性的任就稱之為“實例”。
(二)實例具體操作
在Taier中,實例有這幾種構(gòu)建的方式:
1.基于Zookeeper選舉Master節(jié)點參與Job 實例構(gòu)建,T+1構(gòu)建JobGraph
2. JobGraph構(gòu)建前check &clean DirtyData
3.依據(jù)Task、TaskTask的數(shù)據(jù)(JobGraph)生成Job .JobJob實例數(shù)據(jù)
4.Master節(jié)點控制實例數(shù)據(jù)的負載均衡持久化入數(shù)據(jù)庫
構(gòu)建完畢后,實例處理的幾種方式如下圖所示:
其中:
1.三種任務(wù)類型:周期任務(wù)、補數(shù)據(jù)任務(wù)、重跑任務(wù),統(tǒng)一調(diào)度方式
2. Job 優(yōu)先入隊列(1),隊列容量不足入DB (2)
3.當(dāng)隊列容量空余時,異步線程從DB加載數(shù)據(jù)入隊列(3)
4. Job出隊列后進行任務(wù)提交
?
處理完成后,實例提交我們也做了思考,具體設(shè)計:
1.內(nèi)存優(yōu)先級隊列,控制Job有序執(zhí)行
2.多線程并發(fā)提交(可配置)
3. Job 執(zhí)行超時判斷(可配置)
4. Job資源不足/失敗重試進入延遲隊列(可配置)﹔避免長時間占用提交權(quán)
?
Taier 的實例狀態(tài)大家主要應(yīng)該關(guān)注標志停止的幾個,具體有下面幾種:
1.?WaitEngine:內(nèi)存隊列中的Job、內(nèi)存容量不足存儲在DB中的Job(默認500 )
2.?Lacking:資源不足暫時等待的Job(默認2min)
3. Restarting:失敗重試的Job(默認2min )
4. Finshed、Failed、Canceled、Killed:結(jié)束狀態(tài)
Taier的整個控制臺設(shè)計分為公共組件、調(diào)度組件、存儲組件和計劃組件。通過一個租戶ID,拿到這個集群下common, YARN-conf等的四個配置信息,組成包含一個任務(wù)插件所有信息的pluginlnfo。將它解析之后,一些資源初始化上傳,以便我們緩存對應(yīng)的客戶端。?
Taier Client Plugin這里,要快速開發(fā)一個插件要注意以下幾點:
-
一種任務(wù)類型對應(yīng)一個插件,即一個jar包
-
SPI: 在classpath 下的META-INF/services/目錄下,創(chuàng)建以接口IClient 全限定名命名的文件,內(nèi)容是上一步中實現(xiàn)類的全限定名
?
?
?
- 基于Simulink的電子對抗分布式仿真系統(tǒng) 26次下載
- 異構(gòu)環(huán)境下的多DAG任務(wù)調(diào)度算法綜述 13次下載
- 面向聯(lián)邦學(xué)習(xí)的分布式與隱私安全性綜述 3次下載
- 一種分布式網(wǎng)絡(luò)掃描架構(gòu)和任務(wù)調(diào)度算法 19次下載
- 如何通過YARN設(shè)計分布式資源動態(tài)調(diào)度協(xié)同分配系統(tǒng) 12次下載
- 如何設(shè)計液壓式雙足機器人運動數(shù)據(jù)可視化系統(tǒng) 6次下載
- 分布式智能電網(wǎng)控制系統(tǒng)的設(shè)計與實現(xiàn) 2次下載
- 電力系統(tǒng)分布式經(jīng)濟調(diào)度 10次下載
- SCADA過程可視化系統(tǒng)用戶手冊 2次下載
- 分布式系統(tǒng)進程調(diào)度方法研究
- 基于GIS的配電網(wǎng)調(diào)度可視化研究 16次下載
- 三層分布式計算網(wǎng)格任務(wù)調(diào)度系統(tǒng) 25次下載
- 基于Multi-Agent的分布式測控系統(tǒng)任務(wù)調(diào)度算法
- 基于實數(shù)編碼免疫算法的分布式任務(wù)調(diào)度
- 基于擴展的隨機DAG的EST估算與任務(wù)調(diào)度
- 分布式SCADA系統(tǒng)的特點的組成 581次閱讀
- 任務(wù)調(diào)度系統(tǒng)設(shè)計的核心邏輯 935次閱讀
- 訊維分布式可視化控制系統(tǒng)的功能特點 500次閱讀
- Java手寫分布式鎖的實現(xiàn) 612次閱讀
- tldb提供分布式鎖使用方法 923次閱讀
- 訊維分布式智慧指揮系統(tǒng)有哪些“黑科技”? 633次閱讀
- 如何使用分布式存儲系統(tǒng)促進AI模型訓(xùn)練 608次閱讀
- 利用NI VeriStand 2010實現(xiàn)分布式同步系統(tǒng)的設(shè)計 3437次閱讀
- 詳談分布式系統(tǒng)的定義及屬性 3897次閱讀
- 關(guān)于騰訊的開源分布式存儲系統(tǒng)DCache 2028次閱讀
- 分布式可視化管理系統(tǒng)的關(guān)鍵技術(shù)到底有哪些呢?詳細資料分析 7147次閱讀
- 存儲分布式系統(tǒng)中如何從CAP轉(zhuǎn)到PACELC 2780次閱讀
- AS:可視化的調(diào)試工具--FreeRTOS+Trace 6896次閱讀
- 深度解讀分布式存儲技術(shù)之分布式剪枝系統(tǒng) 1861次閱讀
- 基于CAN總線的分布式網(wǎng)架健康狀態(tài)監(jiān)測系統(tǒng)的設(shè)計 1027次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數(shù)據(jù)手冊
- 1.06 MB | 532次下載 | 免費
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費
- 3TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費
- 5元宇宙深度解析—未來的未來-風(fēng)口還是泡沫
- 6.40 MB | 227次下載 | 免費
- 6迪文DGUS開發(fā)指南
- 31.67 MB | 194次下載 | 免費
- 7元宇宙底層硬件系列報告
- 13.42 MB | 182次下載 | 免費
- 8FP5207XR-G1中文應(yīng)用手冊
- 1.09 MB | 178次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關(guān)電源設(shè)計實例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅(qū)動電路設(shè)計》 溫德爾著
- 0.00 MB | 6656次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191187次下載 | 免費
- 7十天學(xué)會AVR單片機與C語言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論