91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

TECS OpenStack資源池虛機殘留導致網元異常的問題處理

中興文檔 ? 來源:中興文檔 ? 2025-03-03 09:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

故障現象

某運營商TECS資源池的一臺主機內存故障,進行關機、內存更換操作,虛機自動遷移到其他主機上,同時做了其他虛擬機的手動遷移操作。后續在TECS上出現虛機內核異常告警,如下圖所示。

942c8290-f40f-11ef-9310-92fbcf53809c.png

故障分析

1. 檢查告警,確認是一臺虛擬機的多次告警,如下圖所示。

944e21ac-f40f-11ef-9310-92fbcf53809c.png

2. 經排查,服務器SRV-09有內存更換和下電操作,00:39 虛機全部自動遷移成功,其中包含了XXX0012虛機,同時還包括其他網元的虛機,其他網元未出現異常。

3. 現場進行虛機重啟、遷移等操作,未成功恢復XXX00012虛機。分析虛機CPU都沖高到100%,虛機操作系統顯示軟鎖,如下圖所示。

9485e0b0-f40f-11ef-9310-92fbcf53809c.png

4. 經操作系統分析,是有大量外部報文沖擊導致CPU沖高到100%,系統得不到調度。

5. 將該網元中除XXX00012外的其他虛機都shutdown后,再重啟XXX00012虛機,XXX00012虛擬機恢復正常。

6. 逐一開啟其他虛機,發現XXX00012虛機異常,其余虛機均正常啟動。3分鐘后XXX00012虛機CPU再次沖高到100%。

7. 分析XXX00012虛機,發現該虛機存在I/O Error,數據盤不能正常讀寫,如下圖所示。

94916b24-f40f-11ef-9310-92fbcf53809c.png

8. 分析虛機殘留問題,原主機SRV-09故障下電后,虛機自動遷移,第一次自動遷移失敗,自動遷移落地的節點是SRV-10,如下圖所示。

94a8e088-f40f-11ef-9310-92fbcf53809c.png

9. SRV-10節點上因為帶寬資源不足落地失敗,XXX00012虛機重新自動遷移到SRV-12,自動遷移成功,如下圖所示。

94cc0842-f40f-11ef-9310-92fbcf53809c.png

10. 自動遷移異常導致虛機實例在SRV-10和SRV-12同時啟動,如下圖所示。

94f0ad00-f40f-11ef-9310-92fbcf53809c.png

11. 綜上分析,產生該問題的原因是殘留虛機,導致網元異常。

故障處理

1. 關閉SRV-12服務器上XXX0012虛機,同時刪除SRV-10服務器上該虛機殘留的實例。

2. 重啟XXX0012虛機,虛機啟動正常,CPU恢復正常。觀察半小時未再出現異常。

3. 總結:異地重生階段建議不要做其他互斥或者相同的操作,容易造成集群中數據不一致等問題。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 內核
    +關注

    關注

    3

    文章

    1416

    瀏覽量

    41426
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11080

    瀏覽量

    217061
  • 內存
    +關注

    關注

    8

    文章

    3124

    瀏覽量

    75268
  • 主機
    +關注

    關注

    0

    文章

    1038

    瀏覽量

    35985
  • 虛擬機
    +關注

    關注

    1

    文章

    966

    瀏覽量

    29358

原文標題:TECS OpenStack-資源池虛機殘留導致網元異常的問題處理

文章出處:【微信號:ztedoc,微信公眾號:中興文檔】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    RCS融合通信系統設計方案解析

    TECS主要由以下部分組成:OpenStack自身的組件,OpenStack部署相關組件,以及擴展的HA、自動部署與管理、系統管理(軟、硬件資源管理)等組件,
    發表于 07-01 15:45 ?3211次閱讀
    RCS融合通信系統設計方案解析

    OpenStack資源調度和現狀分析

    OpenStack云端的資源調度和優化剖析2016-07-03 19:12 作者簡介:胡曉亮,目前就職于IBM Platform Computing 系統科技部云計算部門,擔任云計算開發部工程師。自
    發表于 10-10 10:44 ?0次下載
    <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b>調度和現狀分析

    電力云資源的建立

    國家電網公司從2010年開始建設電力云資源,存儲域作為資源的必須部分,設計和實現存儲域是資源
    發表于 11-27 17:33 ?0次下載
    電力云<b class='flag-5'>資源</b><b class='flag-5'>池</b>的建立

    OpenStack云平臺監控數據采集及處理的實踐與優化

    本文介紹了在OpenStack云平臺中通過Ceilometer采集云平臺中虛擬、磁盤、網絡等資源的使用數據,并通過Gnocchi處理、儲存和索引數據的實踐。
    的頭像 發表于 12-25 18:38 ?2322次閱讀

    線程池中如何獲取和處理異常

    在實際開發中,我們常常會用到線程,但任務一旦提交到線程之后,如果發生異常之后,怎么處理?
    的頭像 發表于 10-24 15:44 ?1700次閱讀

    TECS資源池上報網絡流程異常告警的問題處理

    資源TECS上報網絡流程異常告警,告警單次持續15秒-4分鐘之間。
    的頭像 發表于 06-07 09:41 ?1281次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b>池上報網絡流程<b class='flag-5'>異常</b>告警的問題<b class='flag-5'>處理</b>

    TECS資源池上報存儲設備離線的問題處理

    資源在運行過程中出現存儲設備離線告警,通過底層cinder service-list命令查看,確認存儲state為down狀態。
    的頭像 發表于 06-07 09:44 ?917次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b>池上報存儲設備離線的問題<b class='flag-5'>處理</b>

    TECS資源SSH控制節點提示connection refused的問題處理

    某局點現場TECS控制節點的TECSClient平面使用雙棧配置,同時使用IPv4和IPv6。
    的頭像 發表于 06-07 09:47 ?1117次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>SSH控制節點<b class='flag-5'>虛</b><b class='flag-5'>機</b>提示connection refused的問題<b class='flag-5'>處理</b>

    TECS資源池上報BFD會話DOWN和網絡流量異常告警的問題處理

    資源TECS上報BFD會話DOWN告警和網絡流量異常告警,持續時間1秒至6分鐘不等,如下圖所示。
    的頭像 發表于 06-07 09:49 ?1850次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b>池上報BFD會話DOWN和網絡流量<b class='flag-5'>異常</b>告警的問題<b class='flag-5'>處理</b>

    資源后端存儲服務狀態異常的問題處理

    故障現象某資源在巡檢過程中檢查服務狀態,其中云盤后端的服務狀態為down,如下圖所示,影響虛擬云盤的生命周期管理操作。
    的頭像 發表于 09-20 11:06 ?1029次閱讀
    <b class='flag-5'>資源</b><b class='flag-5'>池</b>后端存儲服務狀態<b class='flag-5'>異常</b>的問題<b class='flag-5'>處理</b>

    資源虛擬機時鐘跳變異常的問題處理

    資源在運行過程中一臺虛擬出現業務異常,通過查看日志和異常記錄,判斷為虛擬發生時鐘跳變問題
    的頭像 發表于 09-20 11:08 ?1923次閱讀
    <b class='flag-5'>資源</b><b class='flag-5'>池</b>虛擬機時鐘跳變<b class='flag-5'>異常</b>的問題<b class='flag-5'>處理</b>

    TECS OpenStack資源時間同步失敗的故障分析

    某運營商TECS OpenStack資源,在當前告警中顯示“時鐘同步失敗”,以10分鐘整數倍為間隔上報“時間同步失敗”告警,持續時間30秒-1分鐘不等。
    的頭像 發表于 03-03 10:09 ?449次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>時間同步失敗的故障分析

    TECS OpenStack資源寫磁盤時延高告警的問題處理

    某運營商TECS資源,在當前告警中顯示“寫磁盤時延高告警”,如下圖所示。告警統計總體平均10分鐘左右自動恢復。
    的頭像 發表于 03-21 09:36 ?447次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b><b class='flag-5'>虛</b><b class='flag-5'>機</b>寫磁盤時延高告警的問題<b class='flag-5'>處理</b>

    TECS OpenStack資源主機磁盤分區使用率過高的問題處理

    某運營商TECS資源池上報“主機磁盤分區使用率過高”的告警,如下圖所示。
    的頭像 發表于 03-21 09:47 ?496次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>主機磁盤分區使用率過高的問題<b class='flag-5'>處理</b>

    TECS OpenStack資源虛擬網絡二層地址無法互通的問題處理

    某運營商TECS OpenStack使用主機overlay SDN方案組網,運維人員在創建虛擬測試虛擬網絡狀態時發現問題:在其中一臺主機上創建兩臺同網段虛擬
    的頭像 發表于 06-12 09:28 ?282次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>虛擬<b class='flag-5'>機</b>網絡二層地址無法互通的問題<b class='flag-5'>處理</b>
    主站蜘蛛池模板: 日韩在线一区视频 | 天天操天天操 | 激情综合婷婷丁香六月花 | 亚洲一区二区精品推荐 | av在线天堂网| 国产乱辈通伦影片在线播放 | 亚洲国产日韩精品怡红院 | 乱色伦短篇小说 | 美女视频大全美女视频黄 | 成人精品一级毛片 | 天堂网免费 | 四虎欧美 | 人人爱天天操 | 国产片翁熄系列乱在线视频 | 狠狠色噜噜狠狠狠狠97影音先锋 | 激情亚洲综合网 | 国产情侣草莓视频在线 | 毛片午夜| 日韩插插 | 国产小视频你懂的 | 欧美a∨ | 8050午夜一级二级全黄 | 狠狠色狠狠色综合 | 网站在线播放 | 成年女人色费视频免费 | 男女吃奶一进一出动态图 | 插插天天 | 色人在线 | 俄罗斯美女69xxxxxx | 康熙古代高h细节肉爽文全文 | 伊人网狠狠干 | 亚洲午夜视频在线 | 抽搐一进一出gif免费男男 | 黄蓉吕文德欲乱系列小说 | 狠狠色丁香婷婷 | 人人爽天天爽夜夜爽曰 | 国产视频三级 | 免费高清一级欧美片在线观看 | 色妞综合| 色噜噜狠狠色综合中文字幕 | 国产精品你懂得 |