在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

rubik混部引擎的愿景、目標、設計原則

openEuler ? 來源:openEuler ? 作者:openEuler ? 2022-08-30 09:16 ? 次閱讀

概述

在云上業務類型和硬件資源越來越豐富的背景下,對云原生系統提出了更高的管理要求,例如在概論[1]中提到的資源利用率問題,服務質量保障問題,黑盒泛化問題,異構算力效率問題等等。為了讓多樣性業務和算力混部系統以最佳狀態運行,Rubik 混部解決方案應運而生,在 Rubik 解決方案中,包括了集群感知調度、單機混部引擎(rubik)和內核隔離技術等多層次優化系統。本文是對 rubik 混部引擎的概要性介紹。

Rubik 字面意思為魔方,魔方由 Rubik 在 1974 年發明,故 Rubik 既是人名也指代魔方,在我們的解決方案中,Rubik 象征著能夠將任務和算力資源有條不紊的管理起來。

rubik 混部引擎的愿景是提供一套自適應的單機算力調優和服務質量保障服務。包括如下能力目標:

兼容原生 kubernetes 系統:基于原生 kubernetes 的擴展接口進行能力擴展。

兼容 openEuler 系統:自動使能 openEuler 提供的增強特性(如內核分級資源隔離技術),對于其他 linux 發行版,由于存在部分內核特性缺失,僅提供受限管理能力。

注入式應用畫像:通過干擾自動注入對業務進行畫像標記,指導調度及運行時干擾識別控制。

節點及業務特征收集:上報節點及業務特征信息指導集群資源規劃、調度策略優化,實現集群負載均衡、節點資源錯峰互補使用。

運行時干擾識別控制:提供對關鍵業務性能干擾實時檢測能力、干擾源快速定位能力以及干擾快速控制能力。

自適應動態調優:例如對關鍵業務性能優化,使其能能更高效穩定的運行;動態在離線資源配比調優,減少關鍵業務 QoS 違規等等。

支持自定義擴展:支持高級用戶針對特定業務場景開發自定義擴展插件。

95b85032-27e1-11ed-ba43-dac502259ad0.pngrubik混部引擎在系統中的位置

特性介紹

在保障在線業務服務質量前提下實現資源利用率最大化提升是在離線混合部署的設計目標,rubik 混部引擎作為節點管理組件在整個混部解決方案中起到至關重要的作用,因此,rubik 混部引擎主要圍繞資源利用率提升、QoS 保障展開。

在資源利用率提升方面,rubik 提供以下機制指導集群資源調度、實現集群節點各維度資源均衡、錯峰互補、干擾打散。

基于注入式應用畫像指導作業調度的調度及重調度機制

待調度作業通過干擾自動注入對業務進行畫像標記, 分析工作負載的資源敏感度及壓力度,調度階段結合節點各維度資源(CPU、內存帶寬、緩存帶寬、磁盤帶寬、網絡帶寬等)預測使用情況,指導集群節點資源統籌管理調度,不同資源密集型業務交錯部署,均衡各維度平均資源利用率水平,同時也指導作業二次調度。

基于在線業務資源預測的節點資源超賣機制

通過對在線業務的各維度資源采樣,預測可/不可壓縮資源使用情況并上報,為在線業務準確預留所需資源保障其 QoS 的同時,將未使用資源盡可能多地分配給離線業務,最大化離線的吞吐率,提升節點的資源利用率。

在 QoS 保障方面,在混部作業的運行過程中,由于在離線作業競爭 CPU、緩存帶寬、內存帶寬、網絡帶寬、磁盤帶寬等共享資源以及由于進程在不同 CPU 頻繁切換及負載流量突發等情況,往往會導致業務性能受損,為了保障在線業務服務質量,防范關鍵業務 QoS 違規,rubik 混部引擎規劃提供多重保障以提升工作負載的運行效率及穩定性。

第一道防線 - 基于內核特性的資源隔離搶占機制

openEuler Kernel 為了適配云原生混部場景,規劃了 CPU、cache、Disk I/O、Network I/O 等資源的分級搶占能力,rubik 作為用戶態組件,為在離線業務配置 QoS 優先級,使得當在線業務流量上升時,內核層面能為其快速搶占到所需資源,保障在線業務的服務質量,當在線業務的流量下降時,放寬對離線業務資源的限制,提高離線業務的吞吐率。

第二道防線 - 基于資源預測的在離線資源配比調優的預防機制

通過對在線業務相關資源的監控采集,預測在線業務各資源的使用情況,并結合節點資源的使用情況,提前對資源進行規劃,降低在線業務 QoS 違規風險。當預測在線業務資源需求變大時,根據節點資源的空閑情況,選擇是否對離線業務資源的配比調整。

第三道防線 - 基于資源編排與彈性限流的自適應性能調優機制

提供拓撲均衡&潮汐親和性編排,減少進程在不同 CPU 的頻繁切換、進程遷移開銷以及訪問遠程 NUMA 導致性能抖動,同時應對關鍵業務流量突發,在保障整機負載水位安全穩定前提下,允許臨時突破限制,協調資源進行自適應調整,快速解決或者緩解對應資源瓶頸,保障關鍵業務的服務質量。

第四道防線 - 基于指標監控的性能干擾檢測控制的反饋機制

在現有的計算機硬件體系結構中,除了 CPU、Memory、Disk、Network 等資源,還有諸如 Memory Bus、 System I/O Bus、 DMA Bus、MMU-TLB 等關鍵資源,且這些資源尚無對應的軟硬件協同的資源隔離機制,無法實現應用級的隔離,僅僅對 CPU 等資源隔離搶占無法完全解決資源競爭帶來的 QoS 違規問題。因此節點管理組件需要提供對關鍵業務的性能干擾分析,然而在實際的生產環境上,通常無法直接獲得業務的 QoS 情況,因此,在預分析階段對底層性能指標與上層應用 QoS 建模,在運行期根據模型實時檢測評估 QoS 是否違規,并在出現 QoS 違規后基于異常指標定位干擾來源,最后對干擾源進行壓制甚至驅逐來保障在線業務的服務質量。

95f1107a-27e1-11ed-ba43-dac502259ad0.pngrubik 混部引擎特性

部署

首先,需要準備一套基于 openEuler 22.03 完成部署的 kubernetes 集群,然后在 master 節點準備 rubik 的 yaml 部署文件,可以直接從 rubik 源碼倉下載 example:

wget-Orubik-daemonset.yamlhttps://gitee.com/openeuler/rubik/raw/master/hack/rubik-daemonset.yaml

下載之后,正確配置 yaml 里面的鏡像地址,讓它能夠正確下載 rubik 鏡像。

?

需要注意:

yaml 里需要正確配置 rubik 容器鏡像的地址。假如前面采用的是 rubik 源碼倉的 example,則需要修改 yaml 文件中的image: rubik_image_name_and_tag 為 image: hub.oepkgs.net/cloudnative/rubik:latest

yaml 中主要包含 ClusterRole、ClusterRoleBinding、ConfigMap、DaemonSet 四部分。其中 rubik 的啟動配置參數包含在 ConfigMap 里,詳細的配置說明可以參考rubik 配置說明(https://gitee.com/openeuler/rubik/blob/master/docs/config.md)

?

然后,一鍵部署 rubik daemonset:

kubectlapply-frubik-daemonset.yaml

部署完成后,通過 kubectl 可以查詢名為rubik-agent的 pod:

#kubectlgetpods-A
NAMESPACENAMEREADYSTATUSRESTARTSAGE
kube-systemrubik-agent-jhjdg1/1Running04d

使用示例

以下演示如何啟動一個 nginx Pod 并將對其設置為在線業務,rubik 為該業務使能 kernel 資源 QoS 保障機制。

首先,需要在工作節點上使能 memory QoS 特性:

echo1>/proc/sys/vm/memcg_qos_enable

然后,在部署文件 yaml 添加 volcano.sh/preemptable 的 annotation 以標識業務屬性:

#catnginx-online.yaml
apiVersion:v1
kind:Pod
metadata:
name:nginx-online
annotations:
volcano.sh/preemptable:"false"#volcano.sh/preemptable為true代表業務為離線業務,false代表業務為在線業務,默認為false
spec:
containers:
-name:nginx
image:nginx
resources:
limits:
memory:"200Mi"
cpu:"1"
requests:
memory:"200Mi"
cpu:"1"

接著,部署 nginx 業務:

#kubectlapply-fnginx-online.yaml
#kubectlgetpods
NAMEREADYSTATUSRESTARTSAGE
nginx-online1/1Running04d

最后,查找并進入nginx-online Pod 對應的 cgroup 下,查看cpu.qos_level是否生效(在線業務為 0,離線業務為-1),具體運行效果可以查閱典型應用下的效果中案例 1[2]:

#cat/sys/fs/cgroup/cpu/kubepods/pod59f1cdfa-a0ad-4208-9e95-efbef3519c00/cpu.qos_level
0

展望

在離線混合部署作為提升數據中心資源利用率的重要手段,得到學術界和工業界的關注,成為了研究的熱點領域,但目前也面臨著諸多技術挑戰,尚有許多亟待解決的問題,如黑盒業務混部、異構資源混部等,需要在作業感知調度、性能干擾建模、資源隔離搶占等領域逐個突破。為了達成泛型混部及融合部署的目標,節點管理層面對關鍵業務進行性能干擾建模,提供精確的 QoS 量化模型,指導干擾實時檢測與定位,并基于干擾檢測與定位實現更精確的動態資源配比控制以及探索更精準普適的動態監測指標數據對應用畫像以指導感知調度,這些方面具有著至關重要的作用,也是 rubik 后續研究的重點所在。

本文簡要介紹 rubik 混部引擎的愿景、目標、設計原則及特性機制,后續計劃對其中涉及的性能調優技術,資源隔離搶占技術,干擾檢測及控制技術等進行詳細介紹,敬請期待!

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 帶寬
    +關注

    關注

    3

    文章

    953

    瀏覽量

    41079
  • 硬件
    +關注

    關注

    11

    文章

    3382

    瀏覽量

    66461
  • 隔離技術
    +關注

    關注

    1

    文章

    56

    瀏覽量

    13166

原文標題:openEuler 資源利用率提升之道 03:rubik 混部引擎簡介

文章出處:【微信號:openEulercommunity,微信公眾號:openEuler】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    下一代測試系統:用LXI推進

    下一代測試系統:用LXI推進(AN 1465-16)
    發表于 10-09 09:47

    實現三頻Wi-Fi 802.11ad開拓無線應用

    實現三頻Wi-Fi 802.11ad開拓無線應用
    發表于 05-14 07:16

    無線通信行業對5G市場的和該市場面臨的技術挑戰是什么?

    無線通信行業對5G市場的和該市場面臨的技術挑戰是什么?BEE7原型設計環境的具體方面和設計過程中需要做出的部分利弊權衡和設計決策
    發表于 05-21 06:09

    openEuler 資源利用率提升之道 03:rubik 引擎簡介

    rubik 引擎目標、設計
    發表于 09-01 11:00

    :系列采訪》:PowerVR產品與技術營銷高級總監Chris Longstaff

    Imagination Technologies 有一個美好的:為創新人才、為那些尋求改變世界的人創造優質的產品。懷著這樣的夙愿,我們總是思考,如何才能創造更好的未來——一個光明的未來,一個充滿
    發表于 03-20 10:53 ?296次閱讀

    西門子發布“2020公司”戰略計劃,未來發展有何改變?

    西門子官方發布“公司2020+”,建立新組織架構,下設三個“運營公司”和三個“戰略公司”,同時宣布,收購mendix公司,以期繼續擴展數字化業務。那么這個新的“公司2020+”
    的頭像 發表于 08-07 17:15 ?8096次閱讀

    豐田邂逅設計思維,明確"未來

    豐田汽車引進富士通的“設計思維”,描繪維修技師心中的圖。
    的頭像 發表于 10-17 14:27 ?3407次閱讀

    游戲藍圖:你做出了正確的游戲了嗎

    游戲藍圖:你是否做出了正確的游戲
    的頭像 發表于 05-31 09:14 ?2006次閱讀

    微軟未來揭秘

    微軟公司每隔幾年就發布一段視頻來展望生產力的發展,這似乎已經成了一種慣例,而大型屏幕、超薄設備、傳感器一般都是這些視頻里的“主角”。然而不同以往的是,微軟今年并沒有發布視頻,而是邀請記者參觀“展望中心”實驗室,親身感受微軟對未來的
    的頭像 發表于 05-10 09:06 ?4153次閱讀

    區塊鏈芯片驅動世界的美好還能否實現

    芯鏈曾號稱著要實現「區塊鏈芯片驅動世界」的美好,只不過,如今來看,這樣的被擊碎了:團隊內部分崩離析、成員成批離開,項目未來會如何無人可知。
    發表于 11-11 11:15 ?781次閱讀

    亞馬遜AWS的云計算有什么

    上周,Jassy 在采訪中,透露了他對 AWS 的和方向的新見解,坦率地談論了對云計算行業的影響、不斷變化的客戶需求以及近期競爭的激增。
    的頭像 發表于 12-04 16:28 ?6136次閱讀

    成科創板首個EDA公司?

    近日,北京芯軟件技術股份有限公司(以下簡稱“芯”)的科創板上市申請被受理。公司的主營業務為依托自主開發的電子設計自動化(EDA)軟件,開展集成電路分析服務和設計服務。
    發表于 02-12 09:52 ?1809次閱讀

    FORVIA佛瑞亞集團發布全新和使命

    全球第七大汽車技術供應商 FORVIA佛瑞亞集團 首次亮相中國國際進口博覽會 汽車展區(2.1H館) 智慧出行專區(C3-002), 以中國傳統紙藝為靈感, 打造出一間“FORVIA佛瑞亞空間
    的頭像 發表于 11-07 16:46 ?2035次閱讀

    EDA廠商芯終止深交所主板IPO

    ? ? ? ?北京芯軟件技術股份有限公司主營業務是依托自主開發的電子設計自動化EDA軟件,開展集成電路分析服務和設計服務。 此前芯計劃是在科創板上市,后來主動撤回科創板上市。并
    的頭像 發表于 12-07 16:32 ?2940次閱讀

    富士通發布《富士通技術與服務2024》

    富士通近日發布了《富士通技術與服務2024(Fujitsu Technology and Service Vision 2024,簡稱FT&SV 2024)》,闡述了對未來商業和社會的
    的頭像 發表于 05-29 17:07 ?592次閱讀
    富士通發布《富士通技術與服務<b class='flag-5'>愿</b><b class='flag-5'>景</b>2024》
    主站蜘蛛池模板: 日韩精品视频免费在线观看 | 新版天堂中文网 | 国产美女在线精品免费观看 | 免费大片黄日本在线观看 | 2018天天操天天干 | 日本一区不卡在线观看 | 久久99热狠狠色精品一区 | bt天堂网在线www资源 | 国内自拍网红在综合图区 | 亚洲天堂免费看 | 久久午夜宅男免费网站 | 国内真实实拍伦视频在线观看 | 欧美日韩国产一区 | 国产视频一二区 | 欧美色图在线视频 | 高清影院在线欧美人色 | 午夜高清视频在线观看 | 日本69sexmovies| 色就是色欧美色图 | 特级片毛片 | 久久精品国产99精品国产2021 | 免费一级在线观看 | 男子扒开美女尿口做羞羞的事 | 亚洲天堂爱爱 | 国产美女精品久久久久久久免费 | 91极品女神私人尤物在线播放 | 中文字幕不卡免费高清视频 | 午夜国产理论 | 在线观看天堂 | 亚洲福利一区二区 | 四虎永久在线免费观看 | 日本理论在线观看被窝网 | 男女性生动态免费视频 | 五月婷婷六月激情 | 手机看片国产高清 | yiren22亚洲综合高清一区 | 狠狠曹 | 噜噜噜久久 | 国产精品久久久福利 | 俺就色 | 奇米久草|