在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

華為云Stack發布用于虛擬網絡監控的主動鏈路監控系統

華為開發者社區 ? 來源:華為開發者社區 ? 作者:華為開發者社區 ? 2021-12-07 10:34 ? 次閱讀

背景

在云數據中心環境下,IAAS云網絡是數據中心所有業務的通信基礎;云網絡的穩定保障,需要全面、高性能、實時的監控能力,能夠覆蓋所有轉發網元、路徑和業務,這套能力一定是多手段的、多維度的和多層次的,目前還沒有一種監控方案或工具能滿足所有的監控訴求,我們在一些實際案例中發現由于缺失網元/云服務的某些監控指標,無法及時發現一些業務故障。

案例1:某客戶進行新版本的云平臺網絡組件升級,升級后各組件的指標監控以及其他監控測試方法沒有發現異常,但是由于升級導致EndPoint轉發網元的某個組件異常,小概率場景使用到這個網元的時候會導致流量中斷,當前監控體系沒有做到能力覆蓋,導致當客戶的實際業務使用時發生業務故障,而阻塞業務超過1個小時。

案例2:某項目物理網絡進行了變更,物理網絡變更引入一個路由拒收問題,從物理網絡的監控沒有發現問題,但是實際影響了業務流量,導致業務故障長達2小時。

案例3:某項目站點某租戶突發流量導致網關轉發性能到達瓶頸,影響其他租戶的時延高達20ms,網絡監控無法及時發現此時延問題,直到其他租戶業務報障。

上面的案例都有一個共同特點:單個網元和交換機的指標正常,但是綜合用到這些網元和交換機的網絡服務有問題,華為云Stack不斷致力于在網絡監控上增加監控指標,不斷補充監控手段,我們發布了用于虛擬網絡監控的主動鏈路監控系統,通過點-》線-》面的邏輯構建整個網絡服務監控系統。

“點”:包括物理網元和軟件網元,主要監控單個網元的CPU、內存、收發報文、錯包處理/丟包、轉發相關的表項、規格和資源占用情況等。“點”的監控能夠監控當前網元的KPI是否正常,是否具備符合預期的業務能力。

“線”:包括監控物理鏈路,虛擬鏈路和租戶業務流。

1)物理鏈路監控:是指從一個計算節點到另外一個計算節點的物理轉發路徑的KPI是否正常,或者從一個物理交換機到另外一個物理交換機的路徑KPI是否符合預期。

2)虛擬鏈路監控:是從云服務的維度,檢測某個網絡服務的服務通道是否正常,云網絡下的網絡服務鏈路是物理網元和軟件網元配合完成的一個整體鏈路。

3)租戶業務流監控:將物理鏈路和虛擬鏈路比作道路,那么租戶業務流可以認為是這條路上跑的汽車。物理鏈路和虛擬鏈路的監控可以保證大部分的汽車運行正常,不會有大規模的阻塞問題,但是并不代表某輛汽車的運行一定是正常的。租戶業務流監控是在物理物理監控和虛擬物理監控的基礎上補充對某個業務實例的監控。

“面”:是從云服務的維度對網絡監控進行統一的整理和展示,一個標準網絡服務的組件包括管理面組件,數據面組件和租戶實例。以華為云Stack為例,其支持的云服務數量眾多,網絡服務就有10多種,每種網絡服務有不同的組件,為了幫助運維管理員管理好這些服務,按照云服務的角度,把資源、拓撲、告警、性能、規格、日志、配置、撥測等進行統一整理和分類,做到一站式監控整個云服務的運維能力。

表1 網絡監控對比

f773e318-5541-11ec-b2e9-dac502259ad0.png

虛擬鏈路監控殺手锏:主動鏈路監控

云網絡大部分都是軟件化部署,僅僅監控物理網絡的質量是不夠的,更重要的是監控虛擬網絡端到端的質量,比如VPC服務網絡質量(從ECS到ECS),VPC-Peer服務網絡質量(ECS-vRouter-ECS),ELB服務網絡質量(client-LVS-member)等,虛擬網絡鏈路是云網絡的本質轉發路徑,云網絡下的虛擬網絡監控對于網絡轉發,應用質量保障非常重要。

華為云Stack面向政企市場,為了監控虛擬鏈路質量,提供了智能化的主動鏈路監控系統,客戶不需要理解復雜的云網絡/的內部原理,只需要傻瓜式的啟動這個系統,主動鏈路監控系統能夠根據項目業務場景和客戶組網,自動計算需要監控的虛擬網絡對象,主動規劃學習監控路徑,自動上報網絡監控指標和告警網絡故障。

通過主動鏈路監控,可以及時發現前面案例中的各種故障,故障發現時間從不確定走向確定,故障定界定位時間從小時級變成分鐘級。

一、黃金指標:丟包率和時延

網絡監控的指標很多,但是最能代表網絡質量的是丟包率和時延兩個指標。丟包率和時延是網絡轉發能力和業務質量體驗的最直接指標,丟包會導致報文重傳,會引起網絡震蕩,對業務的影響表現為業務不平穩,有抖動。時延高會導致網絡傳輸慢,導致頁面卡頓、應用反應遲緩。丟包率和時延的檢測需要通過主動或者被動的方式來動態測量,不能通過直接查詢或者采集交換機或者服務器的某個指標獲取,相關的網絡測量技術有很多,在此不做過多贅述。為了獲取到設備級、Fabric級、整個DC和跨DC的時延和丟包率指標,各個廠家都設計了自己的工具系統,比如微軟的Pingmesh,Facebook的NETNORAD,百度的NetRadar,阿里的vTrace等,都是為了監控整個數據中心網絡質量的系統方案,其中最重要的輸出指標就是丟包率和時延。

二、鏈路檢測根技術

黑盒檢測方法是計算時延和丟包率最常用,最簡單的方法。傳統的黑盒撥測通常只關注最后撥測的結果通或者不通,如圖1所示,通過發送ICMP request和TCP SYN,關注 ICMP replay和TCP ACK報文是否有回應,發送和接受報文間RTT時延,由此計算整條探測路徑的丟包率和時延。如果中間某個交換機或者網元有了故障,并且網元已經自我隔離了,對外的服務質量并沒有中斷,這種情況下通過普通的黑盒探測是無法探測的?;谌旧珗笪牡膿軠y常用于出現問題后對問題進行復現時候的故障定界定位,如圖2所示,在每個網元,包括物理網元和軟件網元,都具備對染色報文進行鏡像和統計的能力,可以精確定位每個監測點接收和發送的報文數,以及每個點的時延信息,是一種高精度的黑盒檢測方法。基于染色的撥測方法,我們主動鏈路監控進行主動配置探針,主動編排策略,達到覆蓋所有網元節點的探測目的,可以監控網絡服務經過所有網元的服務可用性,同時得到全量網元的時延和丟包率指標。主動鏈路監控以染色報文的撥測作為測量方法,可以做到比傳統黑盒監控更精細化的監控效果,不僅監控云服務的質量,更能覆蓋的所有網元的轉發質量,更大化的保障租戶業務流質量。

f79ce31c-5541-11ec-b2e9-dac502259ad0.png

圖1 傳統黑盒撥測

f7c1c74a-5541-11ec-b2e9-dac502259ad0.png

圖2 基于染色報文的撥測

三、系統架構

主動鏈路監控整體系統架構如圖3所示,主要包括Server端和Agent端。Server端用于根據云服務維度和監控場景生成策略列表和創建撥測任務,agent端用于報文注入和鏡像報文收集。

f7e2c788-5541-11ec-b2e9-dac502259ad0.png

圖3 主動鏈路監控系統架構

監控場景:包括日常監控場景和升級監控場景,日常監控是一個持續監控的過程,主要側重于監控面廣,持續迭代和優化;升級監控,側重于快速給出某個網絡服務的監控結果,需要針對某個網絡服務進行快速迭代和升級前后對比。

網絡拓撲:數據中心的網絡拓撲,包括所有的交換機和所有的計算節點,軟件網元的網口連接信息。

策略列表:包含所有要探測的鏈路的集合,一個策略對象是一個五元組信息,包括源探針IP,目的探針IP,協議,源端口和目的端口。

撥測Controller:按照策略列表下發撥測任務。

撥測Analyzer:收集撥測結果,并根據撥測結果對策略進行正向反饋優化,策略優化后可以覆蓋更全的鏈路。

撥測Agent:對探針注入染色報文,并收集OVS的鏡像報文。在所有的計算節點和網元節點部署。

ERSPAN:物理交換機通過ERSPAN的方式,把染色的撥測報文鏡像到Analyzer,供Analyzer進行虛擬網絡和物理網絡的統一路徑檢測和分析。

四、關鍵技術

亮點1:策略優化

按照用戶輸入的監控場景和云服務列表,Server會生成一個默認的策略列表,但是每個客戶現網的情況都不盡相同,初始創建的策略難點在于如何覆蓋所有的網元,比如下面的圖4,網元1_3和網元2_3并沒有被探測到,達不到鏈路覆蓋的效果。我們基于染色報文的撥測方法,提出策略優化的方案,Analyzer得到撥測結果后會進行分析,不斷的迭代策略的五元組信息,按照不斷的反饋和補償,可以達到一條策略能夠覆蓋所有網元的目的,如圖5所示。策略從圖4的結果到圖5的結果就是一個策略優化的過程。策略優化還有另外一種結果,那就是嘗試了所有的可能后,始終無法覆蓋到某個網元,比如圖6中的網元1_3,出現這種情況我們有理由懷疑,網元1_3業務出現某種問題后觸發了自身的自動隔離,這種情況不影響這個網絡服務整體對外的可用性,只是性能或者服務等級下降,主動鏈路監控一樣可以發現網絡服務的亞健康問題。因此主動鏈路監控的策略優化機制,監控的不僅包括云服務的可用性,而且包括網元的可用性,監控粒度和精度比傳統的黑盒監控要高很多。

f80f2080-5541-11ec-b2e9-dac502259ad0.png

圖4 初始策略

f84333de-5541-11ec-b2e9-dac502259ad0.png

圖5 優化后策略-1

f875a472-5541-11ec-b2e9-dac502259ad0.png

圖6 優化后策略-2

亮點2:告警匯聚

f8afd55c-5541-11ec-b2e9-dac502259ad0.png

圖7 故障場景在網元故障場景下,某個網元出現故障,由于網元是被所有節點和所有租戶共同使用的,大量的主動鏈路監控撥測任務會定位到此網元,如何不做任何過濾直接上報,Server會產生大量的告警,這些告警的問題溯源是重復的,告警處理效率低。告警匯聚的過程,會把所有的故障點信息進行匯總分析,匯聚成統一故障點之后再上報,避免了大量重復告警上送,運維管理員根據上報的匯聚告警快速定界到故障點,得到故障的影響范圍。

亮點3:可視化指標

為了展示測量數據和異常檢測結果,主動鏈路監控設計可視化指標,包括兩部分,虛擬鏈路的時延、丟包率指標和網元的時延、丟包率指標。虛擬鏈路是包含多個路徑的,比如VPC的服務,包括的是計算節點的虛擬交換機到其他計算節點的虛擬機交換機的路徑。圖8中的每個原點表示某個計算節點的探針,兩個網點之間的線表示兩個探針之間的路徑,這個路徑是包括兩邊的OVS和中間的物理交換機,同時通過策略優化,每個網卡和每個物理交換機也會被覆蓋到。線是綠色表示指標正常,如果指標異常,圖8中的連線會紅色展示。點擊其中的某條路徑,可以查看這個路徑的丟包率和時延指標,可以查看最近30分鐘,近一小時,近一天以及最長最近一個月的指標。

f8ea1db6-5541-11ec-b2e9-dac502259ad0.png

圖8 VPC服務鏈路質量展示

f90f1468-5541-11ec-b2e9-dac502259ad0.png

圖9 路徑指標展示圖10和圖11展示的是網元的丟包率和時延指標,如果一種網元類型有多個,會分別展示每個的時延和丟包率指標。

f93dedce-5541-11ec-b2e9-dac502259ad0.png

圖10 網元丟包率

f95bb30e-5541-11ec-b2e9-dac502259ad0.png

圖11 網元時延

最后

主動鏈路監控基于染色報文的探測方案,改善了傳統黑盒監控,只能監控網絡服務SLA,沒法監控網元級服務SLA的弊端,采取主動探測和策略優化的方法,做到盡可能覆蓋每個服務和每條路徑,最大可能的探測到客戶實際業務流的每條路徑,盡早的發現網絡質量問題,切實保障客戶業務質量。

原文標題:【大架光臨】云網絡的守護神,主動鏈路監控

文章出處:【微信公眾號:華為開發者社區】歡迎添加關注!文章轉載請注明出處。
責任編輯:pj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 網絡監控
    +關注

    關注

    0

    文章

    111

    瀏覽量

    21830
  • 云數據中心
    +關注

    關注

    0

    文章

    21

    瀏覽量

    4715

原文標題:【大架光臨】云網絡的守護神,主動鏈路監控

文章出處:【微信號:Huawei_Developer,微信公眾號:華為開發者社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于華為 Flexus X 實例部署 Uptime-Kuma 服務器監控面板

    系統來實時掌握服務器的運行狀態。 ????????在這樣的背景下,uptime-kuma 應運而生。uptime-kuma 是一款開源的服務器監控面板,它能夠幫助用戶實時監控服務器的關鍵指標,如 CPU 使用率、內存使用情況、磁
    的頭像 發表于 01-17 09:42 ?238次閱讀
    基于<b class='flag-5'>華為</b><b class='flag-5'>云</b> Flexus X 實例部署 Uptime-Kuma 服務器<b class='flag-5'>監控</b>面板

    華為 X 實例監控與告警管理詳解

    是關鍵手段。本文將詳細介紹服務器管理的重要性,并重點探討華為云云監控(Cloud Eye Service, CES)的功能、告警機制以及自動化運維的最佳實踐。 1. 服務器管理的重
    的頭像 發表于 01-08 11:50 ?209次閱讀
    <b class='flag-5'>華為</b><b class='flag-5'>云</b> X 實例<b class='flag-5'>監控</b>與告警管理詳解

    云端監控新體驗,打造強大的 Zabbix 主機監控解決方案

    前言**** 華為服務器 Flexus X 實例,以革命性柔性算力與卓越性能,重塑云端監控體驗。攜手 Zabbix 主機監控解決方案 ,為您打造前所未有的強大
    的頭像 發表于 01-07 17:23 ?186次閱讀
    云端<b class='flag-5'>監控</b>新體驗,打造強大的 Zabbix 主機<b class='flag-5'>監控</b>解決方案

    Acrel-2000電力監控系統

    監控系統
    安科瑞繆志澄
    發布于 :2024年12月30日 16:23:52

    通信機房動環監控系統

    ,是針對通信機房、數據中心、基站等各類局站的設備及環境進行監控系統。集成傳感器、控制器和動環監控平臺,對動力設備和環境因素的全面監控,保
    的頭像 發表于 12-25 16:20 ?258次閱讀

    樓宇安防智能監控系統

    技術深度融合。由周邊防盜報警系統、閉路電視監控系統、電子防盜報警系統、樓宇對講系統、出入控制及門禁系統
    的頭像 發表于 12-02 16:50 ?194次閱讀

    倉儲環境監控系統方案

    倉儲環境監控系統,作為現代物流與供應管理中的重要組成部分,扮演著確保食品、藥品等易腐、易變質商品在儲存和運輸過程中保持恒定溫度、濕度等關鍵環境參數的關鍵角色。隨著科技的進步和消費
    的頭像 發表于 11-29 16:48 ?264次閱讀

    如何利用zabbix進行網絡監控

    了解Zabbix的基本概念 在開始使用Zabbix進行網絡監控之前,我們需要了解一些基本概念。Zabbix主要由以下幾個部分組成: Zabbix Server:負責收集監控數據并存儲在數據庫中
    的頭像 發表于 11-08 10:39 ?563次閱讀

    zabbix監控系統使用指南

    1. Zabbix簡介 Zabbix是一個企業級的開源監控解決方案,用于監控IT基礎設施,包括網絡、服務器、虛擬機和應用程序。它可以實時
    的頭像 發表于 11-08 10:37 ?653次閱讀

    什么是動環監控系統?

    ,利用物聯網、計算、大數據等技術,集成采集器/傳感器、動環主機、動環監控平臺等部分,對機房的環境系統、供電動力、網絡、安防、消防等
    的頭像 發表于 10-12 16:12 ?540次閱讀

    醫院智慧冷監控系統

    物資管理水平、保障醫療安全的重要手段。 一、基本原理 醫院智慧冷監控系統,基于物聯網、大數據、計算等現代信息技術構建的物聯網解決方案。通過安裝在冷
    的頭像 發表于 09-09 18:02 ?365次閱讀

    醫療冷監控系統

    系統,集成物聯網、計算、大數據等技術的智能化管理系統,由溫度傳感器、數據采集器、數據傳輸設備、管理平臺軟件等部分組成。用于實時
    的頭像 發表于 07-05 16:30 ?329次閱讀

    水庫水文遠程監控系統

    方便。于是在這種背景下,通過無線GPRS監控水庫安全、自動預警的監控系統應運而生。 水庫水文遠程監控系統解決方案,遠程監測雨量、水位、水質等
    的頭像 發表于 05-06 16:42 ?529次閱讀

    服務器監控完整指南

    如今,大多數組織都依賴混合IT基礎設施,并使用公共提供商及其本地系統的服務。基礎設施更具可擴展性,更容易適應公司的需求。盡管如此,您還是應該持續進行基礎設施監控,尤其是在將服務器遷
    的頭像 發表于 03-20 17:19 ?457次閱讀
    主站蜘蛛池模板: 日本高清视频wwww色 | 精品你懂的 | 天天干天天操天天舔 | 亚洲狠狠网站色噜噜 | 曰本在线网 | 视频一区二区在线观看 | 欧美私人网站 | 男女交性视频免费视频 | 欧美日韩色片 | 日本aaaaa特黄毛片 | 亚洲精品自拍区在线观看 | 天天伊人 | 日本特级淫片免费看 | 欧美伦理影院 | 美女一级毛片毛片在线播放 | 黄色在线看网站 | 性欧美f | 你懂得福利 | 伊人久久综合网亚洲 | 神马午夜嘿嘿嘿 | 么公的好大好硬好深好爽视频 | www.亚洲综合 | 精品国产一区二区三区国产馆 | 国产大乳美女挤奶视频 | 欧美一级二级三级视频 | 狠狠色视频 | 亚洲综合五月天婷 | 69色视频| 日本黄在线观看 | 天天操天天操天天 | 久久久精品免费热线观看 | 成 人网站免费 | 免播放器av少妇影院 | 黄色毛片免费 | 狠狠色成人综合首页 | 色婷婷久久免费网站 | 成年人黄色片视频 | 久久精品香蕉视频 | 亚洲天堂bt | 四虎在线视频观看 | 国产色窝 |