演講嘉賓 | 徐子川
回顧整理 | 廖 濤
排版校對(duì) | 李萍萍
嘉賓介紹
OpenHarmony技術(shù)俱樂(lè)部分論壇
徐子川,大連理工大學(xué)教授、博士生導(dǎo)師,大連理工大學(xué)OpenHarmony技術(shù)俱樂(lè)部主任,教育部重點(diǎn)實(shí)驗(yàn)室副主任。研究方向?yàn)檫吘壴品?wù),領(lǐng)域涵蓋邊緣智能,網(wǎng)絡(luò)功能虛擬化,云原生等。在頂級(jí)期刊和會(huì)議發(fā)表論文100余篇,谷歌學(xué)術(shù)引用超過(guò)3800次,h-index 34,持有10余項(xiàng)專(zhuān)利和3項(xiàng)軟件著作權(quán)。
視頻回顧
打開(kāi)嗶哩嗶哩APP,觀看更清晰視頻
正文內(nèi)容
近十年間,我國(guó)云服務(wù)市場(chǎng)規(guī)??焖僭鲩L(zhǎng),邊緣計(jì)算需求激增,云邊協(xié)同成為未來(lái)重要演進(jìn)方向。Serverless作為一種構(gòu)建和管理基于微服務(wù)架構(gòu)的技術(shù),為軟件架構(gòu)設(shè)計(jì)與應(yīng)用服務(wù)部署帶來(lái)了新的設(shè)計(jì)思路,在邊緣計(jì)算場(chǎng)景中正得到廣泛應(yīng)用。如何基于Serverless邊緣云實(shí)現(xiàn)容器鏡像的彈性部署?大連理工大學(xué)教授、OpenHarmony技術(shù)俱樂(lè)部主任徐子川在第二屆OpenHarmony技術(shù)大會(huì)上進(jìn)行了精彩分享。
01
研究背景
目前,我國(guó)企業(yè)“上云用云”進(jìn)程加快、計(jì)算業(yè)務(wù)需求激增、物聯(lián)網(wǎng)數(shù)據(jù)爆炸式增長(zhǎng)。為了解決網(wǎng)絡(luò)帶寬限制、存儲(chǔ)能力限制、AI算力限制等實(shí)際痛點(diǎn),以及滿(mǎn)足特定場(chǎng)景高時(shí)效性要求,云計(jì)算逐漸在用戶(hù)邊緣側(cè)的延伸,實(shí)現(xiàn)算力下沉。邊緣計(jì)算為云計(jì)算提供了更快的速度、更高的安全性、更可靠的計(jì)算環(huán)境以及可擴(kuò)展性,是萬(wàn)物互聯(lián)的關(guān)鍵技術(shù)之一。
如果簡(jiǎn)單地把云服務(wù)從云數(shù)據(jù)中心下沉到邊緣側(cè),存在以下2個(gè)主要問(wèn)題:(1)服務(wù)部署粒度大、邊緣資源利用率低。IDC的計(jì)算資源冗余,平均利用率低至10%;(2)邊緣資源受限、大規(guī)模可擴(kuò)展性差。大規(guī)模服務(wù)請(qǐng)求響應(yīng)速度慢。為了避免資源浪費(fèi)、實(shí)現(xiàn)邊緣智能服務(wù)的細(xì)粒度可擴(kuò)展部署,亟需新的范式。
云原生開(kāi)發(fā)架構(gòu),由最初的單體應(yīng)用時(shí)期(快速、簡(jiǎn)單、耦合強(qiáng)),經(jīng)垂直應(yīng)用時(shí)期(隔離、穩(wěn)定、復(fù)制多)、微服務(wù)時(shí)期(隔離、穩(wěn)定、復(fù)用高),發(fā)展至當(dāng)前的Serverless時(shí)期(超輕量、高彈性、低門(mén)檻、極細(xì)粒度、復(fù)用更高)。Serverless計(jì)算作為新興的下一代云計(jì)算范式,正在迅速發(fā)展。其可以提供代碼函數(shù)片段級(jí)極細(xì)粒度的開(kāi)發(fā)部署及彈性執(zhí)行能力,而無(wú)需用戶(hù)關(guān)注粗粒度細(xì)節(jié)(硬件、系統(tǒng)、運(yùn)行庫(kù)、函數(shù)級(jí)上下文環(huán)境、函數(shù)級(jí)并發(fā)等)。基于Serverless計(jì)算,實(shí)現(xiàn)面向邊緣智能應(yīng)用的細(xì)粒度容器鏡像彈性部署方案,能夠有效應(yīng)對(duì)邊緣智能應(yīng)用資源利用率低及可擴(kuò)展性差等問(wèn)題。
基于Serverless邊緣云的容器鏡像彈性部署需要解決以下關(guān)鍵問(wèn)題:
如何解決基于Serverless的鏡像部署及狀態(tài)依賴(lài)問(wèn)題?——研究有狀態(tài)Serverless應(yīng)用的鏡像部署問(wèn)題
如何解決大規(guī)模集群中源站拉取鏡像面臨帶寬瓶頸的困局?——設(shè)計(jì)基于P2P的鏡像加速分發(fā)系統(tǒng)
如何去除鏡像冗余,實(shí)現(xiàn)Serverless容器的快速啟動(dòng)?——提出按需加載的容器鏡像加速策略
02
理論研究:有狀態(tài)Serverless應(yīng)用鏡像部署
目前,基于Serverless邊緣云的容器鏡像彈性部署相關(guān)研究主要集中于Serverless函數(shù)放置/調(diào)度以及Serverless函數(shù)內(nèi)存資源預(yù)測(cè)。但仍存在一定不足:(1)很少考慮Serverless函數(shù)的狀態(tài)管理;(2)未同時(shí)考慮函數(shù)依賴(lài)及復(fù)雜狀態(tài)依賴(lài);(3)未考慮邊緣節(jié)點(diǎn)異質(zhì)資源;(4)未考慮網(wǎng)絡(luò)動(dòng)態(tài)性及不確定性。因此,有狀態(tài)Serverless應(yīng)用鏡像部署研究,將重點(diǎn)聚焦在基于Serverless邊緣云的有狀態(tài)細(xì)粒度函數(shù)部署問(wèn)題、Serverless應(yīng)用復(fù)雜的函數(shù)及狀態(tài)依賴(lài)關(guān)系、未來(lái)數(shù)據(jù)量及網(wǎng)絡(luò)延遲的不確定性等方面的內(nèi)容。
有狀態(tài)Serverless應(yīng)用鏡像部署的理論研究,具體包括以下幾個(gè)方面:(1)建立函數(shù)執(zhí)行延遲、成本模型,問(wèn)題定義。延遲模型包括處理延遲、傳輸延遲;成本模型包括處理成本、傳輸成本、存儲(chǔ)成本;(2)設(shè)計(jì)面向有狀態(tài)Serverless函數(shù)的高效部署方法,包括:面向有狀態(tài)Serverless函數(shù)的啟發(fā)式算法;面向有狀態(tài)Serverless函數(shù)的基于多物最小成本流的近似算法;面向網(wǎng)絡(luò)延遲不確定的基于多臂老虎機(jī)的學(xué)習(xí)驅(qū)動(dòng)算法;(3)基于Serverless邊緣云的容器鏡像彈性部署實(shí)際驗(yàn)證。由驗(yàn)證結(jié)果可知,基于Serverless邊緣云的容器鏡像彈性部署策略能極大程度上減少邊緣智能服務(wù)供應(yīng)開(kāi)銷(xiāo),提高服務(wù)質(zhì)量、提高用戶(hù)服務(wù)體驗(yàn)。
03
工程實(shí)踐:基于P2P的鏡像加速分發(fā)系統(tǒng)
在實(shí)際的工程應(yīng)用中,大規(guī)模集群中從源站拉取文件常常面臨帶寬限制,如何最大限度的利用集群內(nèi)網(wǎng)帶寬實(shí)現(xiàn)鏡像加速部署成為一個(gè)值得探索的問(wèn)題。
基于上述問(wèn)題,業(yè)界提出了基于P2P的鏡像加速文件分發(fā)系統(tǒng)——Dragonfly。Dragonfly是CNCF托管的Incubating項(xiàng)目,旨在提高大規(guī)模文件傳輸?shù)男屎退俣取F淠軌蜃畲笙薅鹊睦霉?jié)點(diǎn)之間閑置帶寬,減少回源流量。目前,該項(xiàng)目的Contributer已有100+,用戶(hù)包括Intel、ByteDance、DiDi等公司據(jù)不完全統(tǒng)計(jì)約40+,基本涵蓋國(guó)外大型互聯(lián)網(wǎng)公司。公有云支持 Google Cloud Platform(GCP)、Volcano Engine Baidu AI Cloud、Alibaba Cloud(Aliyun) 等。
Dragonfly項(xiàng)目整體架構(gòu)主要包括:
Manager:維護(hù)多個(gè) P2P 集群 關(guān)聯(lián)關(guān)系,剔除異常節(jié)點(diǎn),保證 P2P 集群穩(wěn)定性。并且提供用戶(hù)態(tài)管理、RBAC、動(dòng)態(tài)配置等功能。
Scheduler:為當(dāng)前下載節(jié)點(diǎn)調(diào)度一組最優(yōu)的父節(jié)點(diǎn)。并且在適當(dāng)時(shí)機(jī)觸發(fā)節(jié)點(diǎn)回源做種。
Peer:客戶(hù)端提供上傳和下載功能。
Seed Peer:客戶(hù)端提供上傳和下載功能。當(dāng)集群內(nèi)任務(wù)首次下載,Scheduler會(huì)觸發(fā)Seed Peer回源。
在Dragonfly中,采取了分級(jí)異常隔離策略,可有效提高P2P集群整體的穩(wěn)定性。例如:
服務(wù)級(jí)別:(1)Scheduler, Seed Peer服務(wù)異常隔離,狀態(tài)Inactive;(2)Manager服務(wù)異常隔離,Peer使用最新Cache;(3)控制臺(tái)應(yīng)急下線(xiàn)異常服務(wù)。
節(jié)點(diǎn)級(jí)別:(1)節(jié)點(diǎn)間網(wǎng)絡(luò)異常,當(dāng)前節(jié)點(diǎn)隔離對(duì)端節(jié)點(diǎn);(2)被訪(fǎng)問(wèn)錯(cuò)誤超過(guò)上限,P2P集群內(nèi)暫時(shí)隔離節(jié)點(diǎn);(3)基于6sigma隔離當(dāng)前下載Piece速度過(guò)慢節(jié)點(diǎn);(4)節(jié)點(diǎn)達(dá)到負(fù)載上限,P2P集群內(nèi)暫時(shí)隔離節(jié)點(diǎn);(5)節(jié)點(diǎn)Announce狀態(tài)Inactive。
任務(wù)級(jí)別:(1)任務(wù)狀態(tài)失敗,隔離當(dāng)前節(jié)點(diǎn)任務(wù);(2)任務(wù)下載有環(huán),隔離當(dāng)前節(jié)點(diǎn)任務(wù);(3)回源下載任務(wù)失敗,隔離所有已下載節(jié)點(diǎn)任務(wù)。
為了優(yōu)化Dragonfly系統(tǒng)中的Scheduler父節(jié)點(diǎn)調(diào)度策略,使其選擇更能反映父節(jié)點(diǎn)下載優(yōu)劣的特征,更適用于大規(guī)模容器鏡像部署場(chǎng)景,作者本人所在團(tuán)隊(duì)提出了(1)主動(dòng)測(cè)量網(wǎng)絡(luò)延遲與收集并推測(cè)帶寬相結(jié)合的特征機(jī)制;(2)構(gòu)建Trainer模塊,利用探測(cè)信息和歷史數(shù)據(jù)進(jìn)行圖神經(jīng)網(wǎng)絡(luò)訓(xùn)練方案。目前,上述方案相關(guān)代碼已經(jīng)合入Dragonfly開(kāi)源項(xiàng)目主線(xiàn)。
04
工程實(shí)踐:按需加載的容器鏡像加速
Serverless容器快速啟動(dòng)對(duì)Serverless冷啟動(dòng)性能至關(guān)重要,但目前容器鏡像冗余極多,啟動(dòng)容器所需文件體積約占鏡像10%~30%,且邊緣計(jì)算、物聯(lián)網(wǎng)等場(chǎng)景,帶寬存在瓶頸(鏡像下載約占95%啟動(dòng)用時(shí))?;谠搯?wèn)題,業(yè)界提出了按需加載的容器鏡像加速方案,通過(guò)按需加載減少容器啟動(dòng)過(guò)程的傳輸流量,快速啟動(dòng)容器。
目前,該容器鏡像加速開(kāi)源框架已經(jīng)成為Dragonfly的子項(xiàng)目(CNCF托管孵化中項(xiàng)目),Contributer已有100+, 用戶(hù)包括阿里云、螞蟻集團(tuán)、字節(jié)跳動(dòng)、快手等公司。
容器鏡像加速開(kāi)源框架的鏡像格式為:
OCIv1格式按層存儲(chǔ) -----------> 文件粒度存儲(chǔ)
缺少文件目錄元數(shù)據(jù) ----------> 分離數(shù)據(jù)(blobs)和元數(shù)據(jù)(bootstrap)
完全加載鏡像后啟動(dòng) ----------> 僅加載元數(shù)據(jù)后啟動(dòng),快速掛載文件系統(tǒng)
容器鏡像加速開(kāi)源框架的按需加載流程為:
容器發(fā)起I/O請(qǐng)求
檢查本地文件緩存(文件粒度)
如果未命中緩存,從遠(yuǎn)端存儲(chǔ)中按需加載對(duì)應(yīng)文件
返回I/O請(qǐng)求繼續(xù)運(yùn)行容器
在該項(xiàng)目中,作者本人所在團(tuán)隊(duì),提出了(1)文件預(yù)取重排:算法優(yōu)化預(yù)讀取的文件列表,提升啟動(dòng)速度;(2)請(qǐng)求碎片合并:將碎片文件合并加載,提高加載性能;(3)鏡像間文件去重:同鏡像內(nèi)層間去重、相似鏡像間去重,降低鏡像體積等優(yōu)化方案,且相關(guān)代碼已進(jìn)入項(xiàng)目主線(xiàn)。
05
總結(jié)展望
未來(lái),OpenHarmony融合彈性無(wú)服務(wù)器計(jì)算成為可能:將彈性無(wú)服務(wù)器計(jì)算與OpenHarmony融合,為智能服務(wù)彈性部署與調(diào)度提供統(tǒng)一平臺(tái)與中間件,可賦能更多新興智能業(yè)務(wù)場(chǎng)景。此外,將OpenHarmony融合基于P2P的鏡像加速文件分發(fā)系統(tǒng),也能夠在一定程度上克服有限回源帶寬,進(jìn)一步提高大規(guī)模文件傳輸?shù)男屎退俣取?/p>
「嘉賓材料暫不分享」
審核編輯 黃宇
-
邊緣計(jì)算
+關(guān)注
關(guān)注
22文章
3260瀏覽量
50460 -
serverless
+關(guān)注
關(guān)注
0文章
65瀏覽量
4656 -
OpenHarmony
+關(guān)注
關(guān)注
26文章
3814瀏覽量
18051
發(fā)布評(píng)論請(qǐng)先 登錄
主線(xiàn)科技亮相第二屆中國(guó)具身智能大會(huì)
華為智能光伏第二屆全球安裝商大會(huì)圓滿(mǎn)落幕
翱捷科技亮相第二屆移動(dòng)物聯(lián)網(wǎng)大會(huì)
第二屆開(kāi)放原子大賽首批賽項(xiàng)頒獎(jiǎng)儀式在武漢舉辦
第二屆開(kāi)放原子大賽首批創(chuàng)新成果集結(jié)武漢
谷東科技受邀參加2024第二屆元宇宙大會(huì)
美光科技第二屆鏈博會(huì)精彩回顧
智芯公司亮相2024第二屆中國(guó)電氣工程大會(huì)
帝奧微第二屆代理商大會(huì)圓滿(mǎn)召開(kāi)
成都華微亮相第二屆腦機(jī)接口大會(huì)
知存科技邀您相約第二屆集成芯片和芯粒大會(huì)
第二屆openEuler生態(tài)大會(huì)圓滿(mǎn)結(jié)束
50萬(wàn)獎(jiǎng)金池!開(kāi)放原子大賽——第二屆OpenHarmony創(chuàng)新應(yīng)用挑戰(zhàn)賽正式啟動(dòng)
第二屆開(kāi)放原子大賽火熱開(kāi)啟
第二屆大會(huì)回顧第24期 | 面向OpenHarmony的軟件工程研究:機(jī)遇與挑戰(zhàn)

評(píng)論