在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

TECS資源池上報BFD會話DOWN和網絡流量異常告警的問題處理

中興文檔 ? 來源:中興文檔 ? 2023-06-07 09:49 ? 次閱讀

某資源池TECS上報BFD會話DOWN告警和網絡流量異常告警,持續時間1秒至6分鐘不等,如下圖所示。

4feac93c-0485-11ee-90ce-dac502259ad0.png

同時,業務側反饋,該資源池ISBG業務網元產生指標下降等異常情況,但已快速恢復。

物理節點上的虛擬機都通過業務面網卡和節點外部通信。當流量異常時,業務網卡上會出現很多丟棄包。

系統周期性采樣網卡所有收發包總數和丟棄包總數,當丟棄包占比數連續多次超過門限時,則上報告警;當連續幾個采樣周期的丟棄包占比數低于門限,則恢復告警。

虛擬網絡上出現較重負荷,造成報文丟棄率超過給定閾值。短暫的指標下降異常情況可能和資源相關,例如CPU、內存、網絡資源不足,或者硬盤的IO讀寫過低導致延遲。

問題分析過程如下:

1.觀察到異常情況后,對告警內容展開分析。執行dvs show-dpifstats命令,找到對應端口,查看overrun和drop統計項是否在增加。

2.觀察到計算服務器NFV-D-XXX-SRV-15業務bond子接口均上報了網絡流量異常告警,分析可能是端口丟包。

3.登錄服務器查看DVS日志,端口丟包量在告警時刻出現上漲,如下圖所示。

500e8836-0485-11ee-90ce-dac502259ad0.png

4.登錄云平臺查看NFV-D-XXX-SRV-15承載業務,該主機承載虛機四臺,其中包含ISBG的XX-isbg-OMPIPI_2_L虛機。分析可能為DVS接收丟包影響到虛機業務。

5.分析SAR日志,確認DVS的綁定核在故障期間出現被占用的情況,時間點與網卡丟包基本一致,認定為DVS核占用導致的DVS物理網卡丟包,如下圖所示。

5030ab3c-0485-11ee-90ce-dac502259ad0.png

6.分析BMC黑盒子日志,該時間(+8)在日志中大量出現ECC內存錯誤,內存定位DIMM11,如下圖所示。

504fd5ac-0485-11ee-90ce-dac502259ad0.png

7.ECC錯包出現的時間點與DVS網卡丟包時間點(DVS轉發核被占用的時間點)基本重合,認定內存ECC錯誤與DVS的丟包強相關。

8.根據日志顯示報錯信息,ECC內存錯誤觸發的內存槽位為DIMM11。

1.登錄管理頁面,選擇“云平臺管理-計算-實例”,選中該臺主機上虛擬機,完成主機上虛擬機的熱遷移,如下圖所示。

507207b2-0485-11ee-90ce-dac502259ad0.png

2.完成遷移后,選擇“云平臺管理-計算-主機”,選中這臺主機,設置維護模式,如下圖所示。

5093f0d4-0485-11ee-90ce-dac502259ad0.png

3.下電服務器完成內存更換,完成后上電,取消“設置維護模式”。

4.遷移回虛擬機,測試正常。

5.內存ECC錯誤為此次異常故障根因。內存ECC錯誤影響DVS轉發分析:

l在內存ECC錯誤故障期間,現有的BIOS配置會為每一個內存ECC錯誤產生一個SMI中斷。

如果產生ECC風暴,那么影響CPU處理性能。

SMI中斷在內核感知為NMI,不受內核控制,從硬件描述看內核是無法屏蔽此類中斷的。內存ECC默認不告警。

SMI中斷導致CPU進入SMM模式,該模式對于OS是透明的。

因此SMI中斷是硬件和固件(BIOS)共同處理的,其對于CPU處理流程的打斷,對OS而言是不可感知的,不會出現在OS的統計項里面。

只有當BIOS處理SMI后,并以SCI中斷通知OS時,OS才能感知到SCI中斷。但是BIOS是否觸發SCI中斷也不是OS所能控制的。

總之,SMI中斷對于DVS處理核的影響是硬件和固件的行為。






審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • SAR
    SAR
    +關注

    關注

    3

    文章

    423

    瀏覽量

    46601
  • BIOS
    +關注

    關注

    5

    文章

    470

    瀏覽量

    46528
  • ECC
    ECC
    +關注

    關注

    0

    文章

    97

    瀏覽量

    20858
  • 虛擬機
    +關注

    關注

    1

    文章

    955

    瀏覽量

    28865
  • SCI
    SCI
    +關注

    關注

    1

    文章

    57

    瀏覽量

    20332

原文標題:TECS資源池上報BFD會話DOWN和網絡流量異常告警的問題處理

文章出處:【微信號:ztedoc,微信公眾號:中興文檔】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    異常流量小區檢測功能介紹

    隨著5G部署規模不斷擴大,網管KPI的分析需求突增也日益顯著,存在用戶感知問題無法從告警和KPI數值中直接體現的情況;或者某些小區存在故障而網絡維護工程師無法及時監控識別出來。異常流量
    的頭像 發表于 03-22 09:54 ?293次閱讀
    <b class='flag-5'>異常</b>零<b class='flag-5'>流量</b>小區檢測功能介紹

    TECS OpenStack資源池主機磁盤分區使用率過高的問題處理

    某運營商TECS資源池上報“主機磁盤分區使用率過高”的告警,如下圖所示。
    的頭像 發表于 03-21 09:47 ?302次閱讀
    <b class='flag-5'>TECS</b> OpenStack<b class='flag-5'>資源</b>池主機磁盤分區使用率過高的問題<b class='flag-5'>處理</b>

    TECS OpenStack資源池虛機寫磁盤時延高告警的問題處理

    某運營商TECS資源池,在當前告警中顯示“虛機寫磁盤時延高告警”,如下圖所示。告警統計總體平均10分鐘左右自動恢復。
    的頭像 發表于 03-21 09:36 ?257次閱讀
    <b class='flag-5'>TECS</b> OpenStack<b class='flag-5'>資源</b>池虛機寫磁盤時延高<b class='flag-5'>告警</b>的問題<b class='flag-5'>處理</b>

    高效流量復制匯聚,構建自主可控的網絡安全環境

    隨著大數據監測、流量分析以及網絡安全監管等核心業務需求的日益增長,網絡環境對高性能、高可靠性的流量監控和分析提出了更高的要求。流量復制匯聚平
    的頭像 發表于 03-10 14:29 ?351次閱讀
    高效<b class='flag-5'>流量</b>復制匯聚,構建自主可控的<b class='flag-5'>網絡</b>安全環境

    TECS OpenStack資源池時間同步失敗的故障分析

    某運營商TECS OpenStack資源池,在當前告警中顯示“時鐘同步失敗”,以10分鐘整數倍為間隔上報“時間同步失敗”告警,持續時間30秒
    的頭像 發表于 03-03 10:09 ?269次閱讀
    <b class='flag-5'>TECS</b> OpenStack<b class='flag-5'>資源</b>池時間同步失敗的故障分析

    TECS OpenStack資源池虛機殘留導致網元異常的問題處理

    某運營商TECS資源池的一臺主機內存故障,進行關機、內存更換操作,虛機自動遷移到其他主機上,同時做了其他虛擬機的手動遷移操作。后續在TECS上出現虛機內核異常
    的頭像 發表于 03-03 09:42 ?235次閱讀
    <b class='flag-5'>TECS</b> OpenStack<b class='flag-5'>資源</b>池虛機殘留導致網元<b class='flag-5'>異常</b>的問題<b class='flag-5'>處理</b>

    排查并處理共享站點S1用戶面路徑不可用告警

    增多,如圖1所示。 圖 1? 電信4G基站告警 1. 通過對基站告警進行分析后發現,出現告警的S1用戶面路徑不可用告警,對端IP地址為10.100.33.X,如圖2所示。 圖2 對端I
    的頭像 發表于 01-23 11:08 ?507次閱讀
    排查并<b class='flag-5'>處理</b>共享站點S1用戶面路徑不可用<b class='flag-5'>告警</b>

    交換機MC-LAG場景下單臂BFD無法UP問題

    作為源IP地址做BFD,VEG上配置靜態路由打通loopback連通性(注:直連地址在MC-LAG場景只有一邊互通)。 版本:9900X V1.00.20.02P16 ? 圖1?MC-LAG單臂BFD場景組網示意圖 單臂BFD
    的頭像 發表于 01-17 11:43 ?348次閱讀
    交換機MC-LAG場景下單臂<b class='flag-5'>BFD</b>無法UP問題

    網絡流量監控與網關優化

    在當今數字化時代,網絡流量的監控和管理對于任何組織來說都是至關重要的。隨著數據量的激增和網絡攻擊的日益復雜,有效的網絡流量監控和網關優化變得尤為重要。 網絡流量監控的重要性 1. 識別
    的頭像 發表于 01-02 16:14 ?494次閱讀

    VLAN 實施對網絡性能的影響

    的廣播域和沖突域。這樣,網絡中的廣播流量和沖突就被限制在每個VLAN內部,減少了網絡擁塞,提高了網絡的整體性能。 優化網絡流量 VLAN允許
    的頭像 發表于 11-19 09:35 ?1205次閱讀

    IR615配置流量告警方法

    1.登錄路由器,服務流量管理中設置流量使用閥值. 2.添加告警設置,在服務&gt;告警設置中勾選告警輸入和
    發表于 07-25 07:59

    艾體寶干貨 IOTA流量分析秘籍第一招:網絡基線管理

    網絡基線管理是一項關鍵的網絡安全實踐,它有助于識別網絡中的異常活動并及時采取措施。本文將探討如何利用IOTA這一強大的工具來捕獲和分析網絡流量
    的頭像 發表于 07-02 14:53 ?552次閱讀
    艾體寶干貨  IOTA<b class='flag-5'>流量</b>分析秘籍第一招:<b class='flag-5'>網絡</b>基線管理

    艾體寶干貨 | 教程:使用ntopng和nProbe監控網絡流量

    本文是關于使用 ntopng 和 nProbe 監控網絡流量的教程。文章詳細介紹了如何配置和使用這兩個工具來監控和分析網絡流量。內容涉及硬件和軟件的安裝、配置端口鏡像、靜態IP地址設置、SSH服務器
    的頭像 發表于 05-29 15:35 ?1241次閱讀
    艾體寶干貨 | 教程:使用ntopng和nProbe監控<b class='flag-5'>網絡流量</b>

    TSN抓包工具解密:數據包捕獲,為什么選Profishark?

    網絡管理中,網絡流量分析和故障排查是重要環節,如何高效精準地進行網絡流量分析和故障排查?來看看利用ProfiShark數據包捕獲,讓我們一起探索其中的優勢和特點。一、捕獲網絡流量的重
    的頭像 發表于 04-29 08:04 ?917次閱讀
    TSN抓包工具解密:數據包捕獲,為什么選Profishark?

    艾體寶產品 | Allegro網絡流量分析儀

    艾體寶產品 | Allegro網絡流量分析儀
    的頭像 發表于 04-29 08:04 ?662次閱讀
    艾體寶產品 | Allegro<b class='flag-5'>網絡流量</b>分析儀
    主站蜘蛛池模板: 在线视频 二区 | 77米奇影院 | 亚洲色图图片专区 | 五月天免费在线播放 | 色噜噜狠狠狠狠色综合久一 | 四虎永久免费地ww4hu57 | 色多多网| 台湾毛片 | 天天视频观看 | 天使色吧 | ww欧洲ww在线视频看 | 天堂资源在线官网资源 | 欧美 亚洲 一区 | 五月天婷婷色综合 | 4399一级成人毛片 | 91在线视频免费 | 中文字幕在线二区 | 男人午夜天堂 | 成人免费看黄网站无遮挡 | 国产女主播在线 | 色婷婷狠狠久久综合五月 | 韩彩英三级无删版甜性涩爱 | 激情在线视频 | 四虎影库在线播放 | 最近高清在线国语 | www.色老头.com | 国产三片理论电影在线 | 色婷婷色综合缴情在线 | 激情五月婷婷久久 | 一区二区三区高清在线 | 美女扒开尿口给男人桶 | 久久午夜影院 | www我要色综合com | 狠狠色丁香婷婷综合橹不卡 | 黄色大片在线视频 | 日韩亚洲人成网站在线播放 | 人人爽人人爱 | 一区二区三区影视 | 丁香婷婷电影 | 午夜精品在线观看 | 狠狠色丁香婷婷第六色孕妇 |