在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用Prometheus與Grafana實(shí)現(xiàn)MindIE服務(wù)可視化監(jiān)控功能

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 2025-04-21 11:48 ? 次閱讀

作者 | 孫曉 李鋒

1相關(guān)概念

1.1 MindIE 服務(wù)化監(jiān)控指標(biāo)查詢接口

在 MindIE 服務(wù)化運(yùn)行過程中,為了及時(shí)掌握服務(wù)的運(yùn)行狀態(tài)、性能表現(xiàn)以及發(fā)現(xiàn)潛在問題,提供了服務(wù)監(jiān)控指標(biāo)查詢接口(普羅 (Prometheus) 格式)。該接口能夠幫助開發(fā)者和運(yùn)維人員獲取豐富的服務(wù)監(jiān)控指標(biāo)數(shù)據(jù),為優(yōu)化服務(wù)配置、保障服務(wù)質(zhì)量提供有力支持。

本文將介紹如何使用 Prometheus 與 Grafana 來實(shí)現(xiàn) MindIE 服務(wù)可視化監(jiān)控功能。

當(dāng)前接口支持以下指標(biāo)監(jiān)控,詳情可以參考:服務(wù)監(jiān)控指標(biāo)查詢接口(普羅格式)

名稱 描述
請(qǐng)求相關(guān)指標(biāo)
request_received_total 服務(wù)端接收到的推理請(qǐng)求總數(shù)。通過該指標(biāo)可了解服務(wù)的訪問熱度。
request_success_total 推理成功的請(qǐng)求個(gè)數(shù),用于衡量服務(wù)的推理成功率。
request_failed_total 推理失敗的請(qǐng)求個(gè)數(shù),結(jié)合成功請(qǐng)求數(shù)可計(jì)算失敗率,評(píng)估服務(wù)的穩(wěn)定性。
num_requests_running 當(dāng)前正在運(yùn)行的請(qǐng)求個(gè)數(shù),反映服務(wù)當(dāng)前的負(fù)載情況。
num_requests_waiting 當(dāng)前等待處理的請(qǐng)求個(gè)數(shù),可用于判斷服務(wù)的處理能力是否滿足需求。
num_requests_swapped 當(dāng)前被交換到 CPU 上的請(qǐng)求個(gè)數(shù),幫助了解資源調(diào)度情況。
num_preemptions_total 累計(jì)觸發(fā)請(qǐng)求搶占的次數(shù),用于分析服務(wù)資源競(jìng)爭(zhēng)和調(diào)度策略的合理性。
Token 相關(guān)指標(biāo)
prompt_tokens_total 處理的所有請(qǐng)求的輸入 prompt token 總數(shù),反映輸入數(shù)據(jù)量。
generation_tokens_total 推理后生成的 token 總數(shù),體現(xiàn)服務(wù)的輸出量。
avg_prompt_throughput_toks_per_s 平均 Prefill 吞吐量,衡量輸入階段的處理速度。
avg_generation_throughput_toks_per_s 平均 token 吞吐量,反映整體的推理生成速度。
request_prompt_tokens 請(qǐng)求輸入的 token 數(shù)量,用于分析單個(gè)請(qǐng)求的輸入規(guī)模。
request_generation_tokens 請(qǐng)求輸出的 token 數(shù)量,幫助了解單個(gè)請(qǐng)求的輸出規(guī)模。
性能和資源指標(biāo)
failed_request_perc 推理失敗的請(qǐng)求率,直觀反映服務(wù)的可靠性。
npu_cache_usage_perc KV Cache 的 NPU 顯存利用率,監(jiān)控 NPU 資源使用情況。
cpu_cache_usage_perc KV Cache 的 CPU 利用率,掌握 CPU 資源使用狀況。
npu_prefix_cache_hit_rate NPU 卡上 prefix cache 的命中率,評(píng)估緩存的使用效率。
時(shí)延指標(biāo)
time_to_first_token_seconds 首 token 時(shí)延,衡量請(qǐng)求推理生成首個(gè) token 的速度,對(duì)實(shí)時(shí)性要求較高的場(chǎng)景至關(guān)重要。
time_per_output_token_seconds token 生成時(shí)延,反映連續(xù)生成 token 之間的時(shí)間間隔,影響服務(wù)的響應(yīng)流暢度。
e2e_request_latency_seconds 端到端時(shí)延,代表請(qǐng)求從接收到執(zhí)行完成的總耗時(shí),綜合體現(xiàn)服務(wù)的整體性能。

1.2Prometheus 是什么

Prometheus 是一個(gè)開源的系統(tǒng)監(jiān)控和報(bào)警工具包,最初由 SoundCloud 開發(fā),現(xiàn)在是 Cloud Native Computing Foundation(CNCF)的一部分。Prometheus 以其強(qiáng)大的數(shù)據(jù)收集和查詢能力、易于擴(kuò)展和高可用性在行業(yè)內(nèi)得到了廣泛應(yīng)用。以下是 Prometheus 的核心概念:

時(shí)間序列數(shù)據(jù)庫(kù):Prometheus 主要用于存儲(chǔ)時(shí)間序列數(shù)據(jù),即帶有時(shí)間戳的指標(biāo)數(shù)據(jù)。每個(gè)時(shí)間序列由一個(gè)指標(biāo)名和一組標(biāo)簽(key-value 對(duì))標(biāo)識(shí)。

多維數(shù)據(jù)模型:Prometheus 的數(shù)據(jù)模型基于指標(biāo)名稱和標(biāo)簽,可以靈活地對(duì)監(jiān)控?cái)?shù)據(jù)進(jìn)行分類和過濾,從而實(shí)現(xiàn)復(fù)雜的查詢和分析。

PromQL:Prometheus 查詢語(yǔ)言(PromQL)用于實(shí)時(shí)查詢和分析存儲(chǔ)在 Prometheus 中的數(shù)據(jù)。它支持豐富的運(yùn)算符和函數(shù),能夠滿足多種監(jiān)控和報(bào)警需求.

1.3 Grafana 是什么

Grafana 是一個(gè)開源的可視化和監(jiān)控平臺(tái),廣泛應(yīng)用于數(shù)據(jù)分析、監(jiān)控和報(bào)警。它支持多種數(shù)據(jù)源,提供豐富的可視化工具,使用戶能夠創(chuàng)建交互式的儀表盤。以下是 Grafana 的核心功能:

數(shù)據(jù)可視化:Grafana 提供了多種圖表類型,包括折線圖、柱狀圖、餅圖、熱圖等,用戶可以通過拖拽的方式輕松創(chuàng)建和自定義儀表盤。

支持多種數(shù)據(jù)源:Grafana 支持從多種數(shù)據(jù)源獲取數(shù)據(jù),包括 Prometheus、InfluxDB、Graphite、Elasticsearch、MySQL、PostgreSQL 等。

靈活的查詢和過濾:通過集成的數(shù)據(jù)源查詢語(yǔ)言,Grafana 允許用戶靈活地對(duì)數(shù)據(jù)進(jìn)行過濾、聚合和轉(zhuǎn)換。每種數(shù)據(jù)源都有專門的查詢編輯器,幫助用戶編寫查詢語(yǔ)句。

報(bào)警和通知:Grafana 提供強(qiáng)大的報(bào)警功能,允許用戶基于查詢結(jié)果設(shè)置報(bào)警規(guī)則。當(dāng)條件滿足時(shí),可以通過郵件、Slack、PagerDuty 等多種渠道發(fā)送通知。

用戶管理和權(quán)限控制:Grafana 提供詳細(xì)的用戶管理和權(quán)限控制功能,支持用戶、團(tuán)隊(duì)和組織的管理。用戶可以根據(jù)需要設(shè)置不同的訪問權(quán)限,保護(hù)敏感數(shù)據(jù)。

2 實(shí)踐記錄

2.1 Prometheus 安裝

Prometheus 安裝方法參考:

https://prometheus.cloudnative.io/di-san-zhang-prometheus/di-2-jie-an-zhuang/installation

為方便起見,本次實(shí)踐筆者采用預(yù)編譯二進(jìn)制文件安裝方法,在 Windows PC 上安裝。

安裝地址:https://prometheus.io/download/

7eb4e734-1c0c-11f0-9310-92fbcf53809c.png

2.2 Grafana 安裝

Grafana 同樣支持在不同操作系統(tǒng)安裝,詳見教程https://grafana.com/docs/grafana/latest/setup-grafana/installation/

本次實(shí)踐選擇在 Windows 安裝,安裝地址https://grafana.com/grafana/download?platform=windows

7ed5c5bc-1c0c-11f0-9310-92fbcf53809c.png

2.3 MindIEService 服務(wù)部署啟動(dòng)

需在服務(wù)器啟動(dòng) MindIE-Service 服務(wù),服務(wù)啟動(dòng)教程不做贅述。

由于 MindIE 服務(wù)和 Prometheus+Grafana 在不同主機(jī)啟動(dòng),因此注意配置 config.json 文件。修改 ipAddress 和 managementIpAddress 為服務(wù)器 IP,保證 Prometheus+Grafana 服務(wù)可訪問該 IP 地址。同時(shí)需要注意端口設(shè)置。

7eef39fc-1c0c-11f0-9310-92fbcf53809c.png

另外,需要確保啟動(dòng)服務(wù)前開啟服務(wù)化監(jiān)控開關(guān),開啟服務(wù)化監(jiān)控功能的命令如下:

export MIES_SERVICE_MONITOR_MODE=1

參考:https://www.hiascend.com/document/detail/zh/mindie/10RC3/mindieservice/servicedev/mindie_service0251.html

7f01b370-1c0c-11f0-9310-92fbcf53809c.png

嘗試使用 curl 命令驗(yàn)證 metricsPort 輸出正常:curl http://{ip}:{port}/metrics

發(fā)現(xiàn)能返回普羅格式 metric 輸出

7f11e9ac-1c0c-11f0-9310-92fbcf53809c.png

2.4 啟動(dòng) Prometheus 和 Grafana

Step1修改 prometheus 安裝目錄下的 promethues.yml 文件,添加 MindIE 服務(wù)的 IP 和 metricsport

7f269960-1c0c-11f0-9310-92fbcf53809c.png

點(diǎn)擊 Prometheus 安裝目錄下的 promethrus.exe 和 Grafana 安裝目錄下的 bin/grafana-server.exe 啟動(dòng) Prometheus 和 Grafana

Step2打開 Grafana http://localhost:3000 ,預(yù)設(shè)賬號(hào)密碼是 admin@admin,第一次登錄會(huì)需要修改密碼。

7f3b06c0-1c0c-11f0-9310-92fbcf53809c.png

Step3點(diǎn)擊 Connection > Data sources > Add new data source,選擇 prometheus,之后把 prometheus 的 URL http://localhost:9090 / 填上去,點(diǎn)擊最下面 Save & test。

7f54b49e-1c0c-11f0-9310-92fbcf53809c.png

Step4之后可以在 Grafana 頁(yè)面建立 dashboard,在 Home-Dashboards-New dashboard 建立 dashboard, Dashboard 手動(dòng)構(gòu)建較麻煩,可以參考一些 Grafana 教程 https://imageslr.com/2024/grafana.html

7f67d2ae-1c0c-11f0-9310-92fbcf53809c.png

好在可以通過 json 格式輸入或 json 文件 import 快速構(gòu)建 dashboard

這里選擇參考下面 vllm 的 grafana json 文件,將其中的 vllm: 字段去掉(因?yàn)?MindIE 的 metrics 字段和 vllm 的 metric 有區(qū)別)

http://www.gitpp.com/digiman/vllm/-/blob/main/examples/production_monitoring/grafana.json?ref_type=heads

7f82219a-1c0c-11f0-9310-92fbcf53809c.png

最終得到 MindIE 指標(biāo)監(jiān)控看板界面

7f99eac8-1c0c-11f0-9310-92fbcf53809c.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 接口
    +關(guān)注

    關(guān)注

    33

    文章

    8885

    瀏覽量

    152960
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3533

    瀏覽量

    43283
  • 可視化
    +關(guān)注

    關(guān)注

    1

    文章

    1231

    瀏覽量

    21522
  • 服務(wù)端
    +關(guān)注

    關(guān)注

    0

    文章

    68

    瀏覽量

    7168

原文標(biāo)題:MindIE服務(wù)化部署實(shí)現(xiàn)監(jiān)控功能

文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    軌道交通路面3G手機(jī)移動(dòng)可視化巡檢系統(tǒng)方案

    和動(dòng)態(tài)圖像的采集和傳送功能實(shí)現(xiàn)視頻發(fā)送、接收數(shù)據(jù)通信功能,3G移動(dòng)可視化巡檢即移動(dòng)影音采集設(shè)備,具備雙向?qū)χv功能,夜間拍攝
    發(fā)表于 01-28 10:05

    阿里云容器Kubernetes監(jiān)控(二) - 使用Grafana展現(xiàn)Pod監(jiān)控數(shù)據(jù)

    摘要: 簡(jiǎn)介 在kubernetes的監(jiān)控方案中,Heapster+Influxdb+Grafana的組合相比prometheus等開源方案而言更為簡(jiǎn)單直接。而且Heapster在
    發(fā)表于 05-10 15:28

    可視化MES系統(tǒng)軟件

    和客戶都會(huì)造成損失,為了更好的滿足客戶需求、實(shí)現(xiàn)企業(yè)信息,目前企業(yè)制造過程中主要還存在以下需求:(1)數(shù)據(jù)可視化方面。MES系統(tǒng)軟件之所以能有效的監(jiān)控整個(gè)車間的生產(chǎn)過程,主要是通過對(duì)
    發(fā)表于 11-30 19:55

    三維可視化的應(yīng)用和優(yōu)勢(shì)

    。  數(shù)據(jù)統(tǒng)計(jì)分析可視化:目前應(yīng)用較為廣泛,此功能普遍應(yīng)用于商業(yè)智能、***決策、公眾服務(wù)、市場(chǎng)營(yíng)銷等等領(lǐng)域。借助可視化的管理系統(tǒng),可以更加清晰的進(jìn)行信息傳達(dá)與溝通。  三維
    發(fā)表于 12-02 11:52

    prometheus監(jiān)控服務(wù)的整個(gè)流程介紹

    Prometheus,Graphite,InfluxDB等各種數(shù)據(jù)源中獲取數(shù)據(jù),并通過精美的圖形將其可視化Prometheus UI主界面大致如下:所有注冊(cè)的Exporter都可以在UI查看,告警也可以在
    發(fā)表于 12-23 17:34

    簡(jiǎn)述linux-arm64 UOS安裝開源Grafana的步驟

    (linux-arm64)UOS安裝開源Grafana-7.2.0,和CentOS安裝步驟一樣Grafana是一款用Go語(yǔ)言開發(fā)的開源數(shù)據(jù)可視化工具,可以做數(shù)據(jù)監(jiān)控和數(shù)據(jù)統(tǒng)計(jì),帶有告警
    發(fā)表于 06-16 15:00

    使用Thanos+Prometheus+Grafana構(gòu)建監(jiān)控系統(tǒng)

    對(duì)于彈性伸縮和高可用的系統(tǒng)來說,一般有大量的指標(biāo)數(shù)據(jù)需要收集和存儲(chǔ),如何為這樣的系統(tǒng)打造一個(gè)監(jiān)控方案呢?本文介紹了如何使用 Thanos+Prometheus+Grafana 構(gòu)建監(jiān)控系統(tǒng)。
    的頭像 發(fā)表于 05-05 21:14 ?2903次閱讀

    通過Grafana實(shí)現(xiàn)OVL數(shù)據(jù)可視化的兩種方法

    本文以MySQL數(shù)據(jù)庫(kù)為例介紹如何通過Grafana實(shí)現(xiàn)OVL數(shù)據(jù)的可視化,其中有兩種方法,一種是通過OVL的REST API來實(shí)現(xiàn)數(shù)據(jù)可視化
    的頭像 發(fā)表于 05-27 17:52 ?1635次閱讀

    互動(dòng)倉(cāng)庫(kù)物流監(jiān)控管理可視化服務(wù)

    智能倉(cāng)庫(kù)的優(yōu)勢(shì)在于3D智能可視化服務(wù),使倉(cāng)庫(kù)物流監(jiān)控和管理能夠?qū)崟r(shí)顯示并自動(dòng)識(shí)別,智能決策可以與各個(gè)環(huán)節(jié)的物流信息系統(tǒng)集成。廣州華銳互動(dòng)利用3D可視化和3D建模技術(shù),為智能倉(cāng)庫(kù)創(chuàng)建3D
    發(fā)表于 06-24 17:40 ?816次閱讀

    Grafana 9泰酷了吧

    Grafana 9.0 的主要重點(diǎn)是改善 Grafana 的用戶體驗(yàn),使可觀察性和數(shù)據(jù)可視化更易用也更容易獲得。無論是通過 Prometheus 和 Loki
    的頭像 發(fā)表于 05-30 11:30 ?667次閱讀
    <b class='flag-5'>Grafana</b> 9泰酷了吧

    如何使用Grafana輕松實(shí)現(xiàn)OVL數(shù)據(jù)可視化

    前言本文以MySQL數(shù)據(jù)庫(kù)為例介紹如何通過Grafana實(shí)現(xiàn)OVL數(shù)據(jù)的可視化,其中有兩種方法,一種是通過OVL的RESTAPI來實(shí)現(xiàn)數(shù)據(jù)可視化
    的頭像 發(fā)表于 06-01 18:23 ?1018次閱讀
    如何使用<b class='flag-5'>Grafana</b>輕松<b class='flag-5'>實(shí)現(xiàn)</b>OVL數(shù)據(jù)<b class='flag-5'>可視化</b>

    虹科干貨 | 虹科教您使用Grafana輕松實(shí)現(xiàn)OVL數(shù)據(jù)可視化

    虹科IIoT虹科教您使用Grafana輕松實(shí)現(xiàn)OVL數(shù)據(jù)可視化前言本文以MySQL數(shù)據(jù)庫(kù)為例介紹如何通過Grafana實(shí)現(xiàn)OVL數(shù)據(jù)的
    的頭像 發(fā)表于 05-27 10:34 ?944次閱讀
    虹科干貨 | 虹科教您使用<b class='flag-5'>Grafana</b>輕松<b class='flag-5'>實(shí)現(xiàn)</b>OVL數(shù)據(jù)<b class='flag-5'>可視化</b>

    物聯(lián)網(wǎng)可視化監(jiān)控大屏如何實(shí)現(xiàn)?有什么功能

    在物聯(lián)網(wǎng)飛速發(fā)展的時(shí)代,可視化監(jiān)控大屏成為了眾多企業(yè)和機(jī)構(gòu)實(shí)現(xiàn)智能管理和監(jiān)控的重要工具。它將各種各樣設(shè)備的運(yùn)行狀態(tài)和數(shù)據(jù)以圖形、圖表、動(dòng)畫
    的頭像 發(fā)表于 04-11 09:25 ?1187次閱讀

    如何實(shí)現(xiàn)園區(qū)大屏可視化

    如何實(shí)現(xiàn)園區(qū)大屏可視化? 1.建立孿生模型:首先需要建立園區(qū)的孿生模型,即一個(gè)數(shù)字的虛擬模型,反映了園區(qū)的實(shí)際情況、結(jié)構(gòu)、設(shè)備、人員等信息。這個(gè)模型可以通過傳感器、監(jiān)控設(shè)備、GIS
    的頭像 發(fā)表于 06-19 15:39 ?648次閱讀
    如何<b class='flag-5'>實(shí)現(xiàn)</b>園區(qū)大屏<b class='flag-5'>可視化</b>?

    服務(wù)器 Flexus X 實(shí)例,Docker 集成搭建 Grafana 開源數(shù)據(jù)可視化平臺(tái)

    Grafana 是一個(gè)開源數(shù)據(jù)可視化平臺(tái),廣泛用于監(jiān)控和分析系統(tǒng)性能、應(yīng)用程序指標(biāo)和其他數(shù)據(jù)。它支持多種數(shù)據(jù)源,如 Prometheus、Graphite、InfluxDB 和 MyS
    的頭像 發(fā)表于 01-13 15:50 ?308次閱讀
    云<b class='flag-5'>服務(wù)</b>器 Flexus X 實(shí)例,Docker 集成搭建 <b class='flag-5'>Grafana</b> 開源數(shù)據(jù)<b class='flag-5'>可視化</b>平臺(tái)
    主站蜘蛛池模板: 亚洲精品456人成在线 | 国产成人久视频免费 | 欧美一级艳片视频免费观看 | 国产全部理论片线观看 | 在线观看免费观看 | 亚洲激情视频 | 国产精品视频永久免费播放 | 黄色免费三级 | 55夜色66夜色国产精品站 | 欧美性猛交aa一级 | 色噜噜亚洲精品中文字幕 | 美女喷白浆 | 四虎国产精品永久在线看 | 国产婷婷色一区二区三区 | 亚洲伊人久久大香线蕉综合图片 | 国产高清视频在线免费观看 | 张柏芝三级无删减在线观看 | 午夜影视在线 | 午夜视频网站在线观看 | 国产三级在线播放 | 中文字幕亚洲一区婷婷 | a资源在线 | 在线观看视频一区 | 欧美成人 一区二区三区 | 中文字幕123 | 丁香六月激情网 | 国产午夜精品一区二区三区 | 91一区二区三区四区五区 | 欧美天天性影院 | 精品国产自在现线看久久 | 欧美亚洲另类在线观看 | 天天色影| 婷婷九月色| 在线免费视频你懂的 | 久久综合九色 | 唐人呦一呦xxxx视频 | 色老头综合免费视频 | 六月丁香婷婷网 | 欧美精品久久久久久久小说 | 色婷婷一区二区三区四区成人网 | 午夜色大片 |