隨著信息技術和互聯網的發展,終端設備從 PC 端擴展到移動端,應用的架構從單體架構演進為分布式的微服務架構,軟件系統服務層之間的交互日益復雜,給系統的運維管理帶來了巨大的挑戰,應運而生的可觀測性技術,帶來了問題的答案。
近日,上海道客網絡科技有限公司(簡稱:「DaoCloud 道客」)攜手北京基調網絡股份有限公司(簡稱:基調聽云)推出云原生智能可觀測性平臺聯合解決方案。雙方基于 DaoCloud Enterprise 云操作系統與基調聽云智能可觀測性平臺的產品兼容性互認證,在異構環境下,為企業提供覆蓋應用計算、服務編排、多云納管等方面的端到端一體化監控解決方案。
隨著 Kubernetes 得到越來越廣泛的采用,企業軟件系統正在向復雜的云原生架構進行革命性轉變。應用的架構從單體架構演進為微服務架構,應用形式呈現有 Web、APP、小程序等多種形式,訪問的網絡有 4G、5G、Wi-Fi 等。企業用云也從單一云時代,逐漸來到混合多云時代。在這些龐大復雜的多云環境中,各種模塊、各種語言開發的應用程序或服務的數量與日俱增,如何追蹤它們運行在何處、性能如何、故障定位、請求的完整端到端流程等,并持續檢查海量高速數據流以識別系統中的已知和未知問題,顯得至關重要。
云原生智能可觀測性平臺聯合解決方案,以 DaoCloud Enterprise 云操作系統為底座,結合基調聽云智能可觀測性平臺,提供云原生計算、網絡、存儲的能力,屏蔽底層基礎設施復雜性,支持多云、多集群全生命周期統一納管,同時為不同的角色提供不同的監控視角,全面覆蓋了最終用戶體驗、應用性能、業務性能、基礎架構、云平臺等客戶 IT 環境,具有全量的數據采集、全鏈路數據事務追蹤、代碼級根源分析、調用鏈日志溯源、健康度和智能告警能力,幫助企業了解用戶體驗及應用性能,構建業務系統的云原生智能可觀測性平臺。
如上所說,龐大復雜的多云異構環境,以及日益增長的應用程序和服務數量,使排查定位系統問題的難度呈指數級上升,面對這些挑戰,該方案具備三個關鍵優勢:
統一、安全、成熟穩定的高性能云原生應用平臺
DaoCloud Enterprise支持 x86、 ARM 架構的異構服務器的接入,快速構建高性能云原生應用集群。依托于云原生容器封裝技術,屏蔽操作系統之間的差異性,為業務應用構建統一的管理平臺,并提供“一次構建,隨處運行”的能力。
降本增效的云原生彈性可觀測
方案以云原生技術為底座,支持業務和可觀測組件的彈性擴展,減少動態 IT 環境中的人工維護工作,能夠動態適應業務需求,實現隨業務高峰而彈性擴張計算,隨低谷而釋放資源,降低 IT 運營成本。
完善的指標體系
在此基礎上,方案構建了完善的指標體系,橫跨基礎組件層、應用層、業務層、用戶體驗層,為故障感知提供質量標準:
基礎組件層:包含了企業常用的主機、數據庫、容器等常規指標;
應用層:除了包含應用健康度、響應時間、吞吐率、錯誤率等通用指標外,還包含服務或數據庫組件的實例、執行時間等指標,錯誤分析的開始時間、最后發生時間、異常名稱、錯誤次數等指標,以及事務追蹤的追蹤 ID、事務名稱、業務標識等指標;
業務層:包含業務可用性、活躍用戶數、業務流、執行周期等通用業務指標外,還支持自定義監控指標。 如:交易金額、訂單總數、Top10 銷售排名等;
用戶體驗層:包含 PC 端、小程序端的 PV、白屏時間、首屏時間、慢頁面占比等指標,以及移動端的頁面完整度、頁面流暢度、冷啟動時間、次數等指標。
該方案有效結合了云原生與可觀測性的技術優勢,在通過分析系統生成的數據,理解推演出系統內部的狀態,實現快速排障的同時,也能利用云原生技術實現降本增效,在各種應用場景中都得到了驗證,如:
一體化監控
復雜的多云異構環境加海量客戶端設備的情況下,大量的服務端運行情況、日志、應用性能數據等監控數據通常由多個第三方監控平臺提供支持,眾多采集 agent、異構的數據存儲庫、定制化的數據模型和查詢語句、分散監控大屏等導致企業需要大量人員對監控進行管理,例如研發適配、存儲策略、告警策略、大屏展示圖表以及各個平臺的權限控制等事務。海量監測數據如何統一采集、上傳、存儲、分析和應用成為企業降本增效的關鍵因素。
該方案構建從基礎設施到應用層全方位立體化監控。以 APM 為核心,調用鏈追蹤技術為手段,將業務監控、應用監控、日志監控、Kubernetes平臺監控、容器監控等有機關聯在一起,實現端到端一體化監控,提高根因定位效率。
DevOps 集成強化
DevOps 流程中,一次質量測試需要多方協作共同完成:運維協調測試資源和壓測環境、測試執行測試用例、研發使用監控平臺和測試平臺獲取測試結果和事務分析結果。但基于傳統的 CI/CD 流程,功能和性能測試往往是和 CI 流程分開進行,先執行 CI,然后到性能測試環境部署監控探針,通過各種監控平臺觀察信息,效率相對較低。
該方案實現在測試階段一鍵創建測試環境,CI 階段引入 APM 工具、集成探針,通過 API 即可獲取檢測數據和結果,自動生成報告并發送,提高測試效率,結合事務分析和追蹤功能快速發現性能瓶頸,優化應用質量。
微服務架構下的故障定位、性能優化
云原生已是業界公認的數字化轉型最佳路徑。以云原生為核心的云操作系統,對微服務架構和容器化技術的應用,提供天然的支持,新的技術架構使得平臺上應用的監控從穩態的方式向敏態的方向轉變,這種轉變帶來便利的同時,也帶來了一些新的挑戰:容器易于創建和銷毀的特性,以及應用采用微服務架構的方式,使得應用的調用鏈變得繁雜,單個服務故障會引發多個服務告警,被動采集監控指標數據的方式難以精準定位故障。
該方案的 APM 能夠實現 100% 真全量的性能追蹤和業務數據采集,保證了調用鏈數據的完整性,可以實現深度代碼級性能診斷和優化,配合分層展示的拓撲圖,友好的展現微服務間的依賴和調用關系,幫助運維團隊快速定位問題根因,降低 MTTR。
移動端 APP 真實用戶體驗監測
移動端作為互聯網新時代的流量入口的重要性不言而喻,移動端 APP 開發后難以在海量設備上進行測試,在發布后可能遇到在某些設備上出現啟動崩潰、首次啟動加載時間過長、頁面渲染異常等問題,企業往往難以及時獲取有效的反饋,對用戶體驗產生了極大的影響。
方案通過 APP SDK 字節碼技術和運行時 hook 技術,能夠實時采集 APP性能數據,并且不影響業務代碼邏輯,當 APP 切換到后臺或者退出時,SDK 會自動停止采集和上報,減少不必要的流量消耗。服務端依托云操作系統的容器編排技術,結合自動彈性擴縮功能,針對移動端彈性的流量,自動適配服務器資源,利用自動化編排技術提供高性能高可靠的可觀測服務,保障平臺高可用的同時,為企業降低監控運營成本。
云原生時代,以運維的視角、被動解決故障為目標的監控正在逐漸退出舞臺,而適配 IT 架構變革和云原生技術實踐、協同開發和業務視角、具備更廣泛和主動能力的可觀測性,正在冉冉升起。未來,基調聽云將攜手DaoCoud道客結合雙方技術優勢,為企業數字化轉型提供與時俱進的云原生可觀測性解決方案。
審核編輯黃宇
-
測試
+關注
關注
8文章
5608瀏覽量
128222 -
云原生
+關注
關注
0文章
256瀏覽量
8194
發布評論請先 登錄
DeepSeek賦能Vixtel飛思達CloudFox可觀測性平臺,打破可觀測性工程的實施壁壘

云原生AI服務怎么樣
云原生LLMOps平臺作用
鴻蒙原生頁面高性能解決方案上線OpenHarmony社區 助力打造高性能原生應用
如何選擇云原生機器學習平臺
什么是云原生MLOps平臺
【質量視角】可觀測性背景下的質量保障思路

云原生和非云原生哪個好?六大區別詳細對比
京東云原生安全產品重磅發布

基于DPU與SmartNic的云原生SDN解決方案

首批認證!拓維信息梧桐云原生平臺獲鯤鵬原生開發技術認證

評論