9 月 19 日,華為全聯(lián)接大會 2024 舉辦期間,在“AI 賦能應用現(xiàn)代化,加速軟件生產力躍升”為主題的論壇上,華為云發(fā)布全棧可觀測平臺AOM,以 AI 賦能應用運維可觀測,提升企業(yè)應用可用性與穩(wěn)定性。
該平臺發(fā)布標志著華為云在推動數(shù)字化轉型和智能化運維領域的又一重大突破,全棧可觀測平臺的推出不僅為企業(yè)提供了更加全面和深入的系統(tǒng)監(jiān)控和數(shù)據(jù)分析能力,還通過集成先進的人工智能技術,實現(xiàn)了對復雜應用環(huán)境的實時優(yōu)化和問題預警。
應用運維管理(Application Operations Management,簡稱 AOM)是云上應用一站式可觀測性分析平臺,基于四層指標體系(業(yè)務層指標、應用層指標、中間件層指標、基礎設施層),提供指標、日志、調用鏈 3 類數(shù)據(jù)關聯(lián)分析、根因分析、場景化分析等可觀測分析能力,全面掌握應用、資源實時運行狀況,及時發(fā)現(xiàn)故障。
華為云 AOM 主要能力
全場景數(shù)據(jù)接入,統(tǒng)一監(jiān)控大盤與告警管理:統(tǒng)一接入中心實現(xiàn) 4 層指標體系數(shù)據(jù)上報,提供可視化圖表統(tǒng)一匯總呈現(xiàn)指標、日志信息,統(tǒng)一告警規(guī)則配置、開箱即用告警模板以及智能告警降噪。
全鏈路調用鏈分析,智能化代碼級剖析 Profiling:支持調用鏈路時序圖,直觀展示 Web 端、App 端到后端服務、數(shù)據(jù)庫、中間件鏈路關系,用戶一站式定位故障鏈路,快速發(fā)現(xiàn)消耗資源的代碼,定位 CPU、內存、時延性能問題。
容器監(jiān)控體系洞察:支持集群維度、核心插件、節(jié)點、負載、外部 5 大檢測維度、16 個巡檢場景、49 個檢測項診斷,實施掌握容器健康狀態(tài)。
海量日志引擎:自主創(chuàng)新的高性能搜索引擎,存算分離架構,多租戶共享海量彈性計算資源,實現(xiàn)百億級日志 3 秒內返回搜索結果,提供日志結構化解析組合編排、高性能 SQL 分析、一站式日志加工等能力。
華為云 PaaS 服務產品部部長徐峰對 AIOps 領域的發(fā)展做了系統(tǒng)性的規(guī)劃與展望,未來 AIOps 將是小模型與大模型結合使用,小模型聚焦故障感知定位解決量化確定性問題,大模型面向故障修復決策提升運維輔助人效,從 AI 故障感知、AI 故障定位、AI 生成故障修復建議三個方面構筑未來智能可觀測產品力。
故障感知:通過多維指標智能聚合與故障預測算法,面向 AnyStack 與 AnyWhere 數(shù)據(jù)實時分析,實現(xiàn)應用故障 1 分鐘及時發(fā)現(xiàn)。
故障定位:通過告警相關性分析、水平 &垂直關聯(lián)分析能力實現(xiàn)場景化根因分析,5 分鐘完成故障定位診斷。
故障決策與修復:生成式算法結合華為 SRE 運維經(jīng)驗和案例庫,覆蓋應用到資源各類場景問題的解決方案,提供精準修復建議,10 分鐘完成應用故障修復閉環(huán)。
會上,上海松鼠云上人工智能技術有限公司(簡稱松鼠 AI)技術 VP 劉海濤分享了松鼠 AI 基于華為云 AOM 在智慧教育領域的實踐。
松鼠 AI 基于華為云 AOM 構建 Ai 智適應學習系統(tǒng)一站式可觀測性分析能力,融合指標、日志、調用鏈 3 類數(shù)據(jù),實時掌握應用健康狀態(tài),通過數(shù)據(jù)關聯(lián)、根因診斷、場景化分析等可觀測能力,做到應用運維問題早發(fā)現(xiàn)早消除,全面保證 Ai 智適應學習系統(tǒng)的健康、平穩(wěn)運轉。
未來,華為云應用運維管理 AOM 將持續(xù)聚焦可觀測領域,利用 AI 賦能應用智能可觀測,推動數(shù)字化轉型和智能化升級,面向用戶提供更高效、精準的監(jiān)控和分析解決方案,通過智能化的數(shù)據(jù)處理和分析能力,為客戶提供全方位的系統(tǒng)洞察,在復雜的業(yè)務環(huán)境中快速識別潛在風險,優(yōu)化操作流程,提升業(yè)務效益,顯著降低運維成本。
審核編輯 黃宇
-
AI
+關注
關注
87文章
31521瀏覽量
270339 -
華為云
+關注
關注
3文章
2682瀏覽量
17587
發(fā)布評論請先 登錄
相關推薦
評論