在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何評估CPU、內(nèi)存以及I/O它們性能的命令

dyquk4xk2p3d ? 來源:小姐姐味道 ? 作者:小姐姐養(yǎng)的狗 ? 2022-10-24 09:09 ? 次閱讀

操作系統(tǒng)作為所有程序的載體,對應(yīng)用的性能影響是非常重要的。然而計算機各個組件之間的速度,是非常不均衡的。拿CPU和硬盤的速度來說,比兔子和烏龜?shù)乃俣炔顒e還要大。

下面將簡單的介紹CPU、內(nèi)存、I/O的一些基本知識,以及一些如何評估它們性能的命令。

1.CPU

首先介紹計算機中最重要的計算組件:中央處理器。一般我們可以通過top命令來觀測它的性能。

1.1 top命令

top命令可用于觀測CPU的一些運行指標(biāo)。如圖,進入top命令之后,按1鍵即可看到每核CPU的詳細(xì)狀況。

dceef79c-532b-11ed-a3b6-dac502259ad0.png

CPU的使用有多個維度的指標(biāo),以下分別說明一下:

us用戶態(tài)所占用的CPU百分比。

sy內(nèi)核態(tài)所占用的CPU百分比。如果這個值過高,需要配合vmstat命令,查看是否是上下文切換是否頻繁。

ni高優(yōu)先級應(yīng)用所占用的CPU百分比。

wa等待I/O設(shè)備所占用的CPU百分比。如果這個值非常高,輸入輸出設(shè)備可能存在非常明顯的瓶頸。

hi硬件中斷所占用的CPU百分比。

si軟中斷所占用的CPU百分比。

st這個一般發(fā)生在虛擬機上,指的是虛擬CPU等待實際CPU時間的百分比。如果這個值過大,則你的宿主機壓力可能過大。如果你是云主機,則你的服務(wù)商可能存在超賣。

id空閑CPU百分比。

一般的,我們比較關(guān)注空閑CPU的百分比,它可以從整體上體現(xiàn)CPU的利用情況。

1.2 什么是負(fù)載

我們還要評估CPU任務(wù)執(zhí)行的排隊情況,這些值就是負(fù)載(load)。top命令,顯示的CPU負(fù)載,分別是最近1分鐘、5分鐘、15分鐘的數(shù)值。

dd0b53d8-532b-11ed-a3b6-dac502259ad0.png

如圖,以單核操作系統(tǒng)為例,將CPU資源抽象成一條單向行駛的馬路。則會發(fā)生三種情況:

馬路上的車只有4輛,車輛暢通無阻,load大約是0.5。

馬路上的車有8輛,正好能首尾相接安全通過,此時load大約為1。

馬路上的車有12輛,除了在馬路上的8輛車,還有4輛等在馬路外面,需要排隊。此時load大約為1.5。

那load為1代表的是啥?針對這個問題,誤解還是比較多的。

很多同學(xué)認(rèn)為,load達到1,系統(tǒng)就到了瓶頸,這不完全正確。load的值和cpu核數(shù)息息相關(guān)。舉例如下:

單核的負(fù)載達到1,總load的值約1。

雙核的每核負(fù)載都達到1,總load約2。

四核的每核負(fù)載都達到1,總load約為4。

所以,對于一個load到了10,卻是16核的機器,你的系統(tǒng)還遠(yuǎn)沒有達到負(fù)載極限。通過uptime命令,同樣能夠看到負(fù)載情況。

1.3 vmstat

要看CPU的繁忙程度,還可以通過vmstat命令。下面是vmstat命令的一些輸出信息

dd3096e8-532b-11ed-a3b6-dac502259ad0.gif

我們比較關(guān)注的有下面幾列:

b存在于等待隊列的內(nèi)核線程數(shù)目,比如等待I/O等。數(shù)字過大則cpu太忙。

cs代表上下文切換的數(shù)量。如果頻繁的進行上下文切換,就需要考慮是否是線程數(shù)開的過多。

si/so顯示了交換分區(qū)的一些使用情況,交換分區(qū)對性能的影響比較大,需要格外關(guān)注。

$vmstat1
procs---------memory-------------swap-------io-----system--------cpu-----
rbswpdfreebuffcachesisobiboincsussyidwast
3400200889792737085918280005610961300
320020088992073708591860000592132844282981100
320020089011273708591860000095012154991000
32002008895687371259185600048119002459990000
3200200890208737125918600000158984840981100
^C

2.內(nèi)存

2.1 觀測命令

dd3fe8f0-532b-11ed-a3b6-dac502259ad0.png

要想了解內(nèi)存對性能的一些影響,就需要從操作系統(tǒng)層面來看一下內(nèi)存的分布。

我們在平常寫完代碼后,比如寫了一個C++程序,如果去查看它的匯編,可以看到其中的內(nèi)存地址,并不是實際的物理內(nèi)存地址。

那么應(yīng)用程序所使用的,就是邏輯內(nèi)存,這個學(xué)過計算機組成結(jié)構(gòu)的同學(xué)都有了解。

邏輯地址可以映射到物理內(nèi)存和虛擬內(nèi)存上。比如你的物理內(nèi)存是8GB,分配了16GB的SWAP分區(qū),那么應(yīng)用可用的總內(nèi)存就是24GB。

從top命令可以看到幾列數(shù)據(jù),注意方塊括起來的三個區(qū)域,解釋如下:

dd49e0b2-532b-11ed-a3b6-dac502259ad0.png

VIRT這里就是虛擬內(nèi)存,一般比較大,不用做過多關(guān)注。

RES我們平常關(guān)注的就是這一列的數(shù)值,它代表了進程實際占用的內(nèi)存。平常在做監(jiān)控時,也主要是監(jiān)控這個數(shù)值。

SHR指的是共享內(nèi)存,比如可以復(fù)用的一些so文件等。

2.2 CPU緩存

由于CPU核內(nèi)存之間的速度差異是非常大的,解決方式就是加入高速緩存。其實,這些高速緩存,往往會有多層,如下圖。

dd5c1a3e-532b-11ed-a3b6-dac502259ad0.png

Java有大部分知識點是圍繞多線程的,那是因為,如果一個線程的時間片跨越了多個CPU,那么就會存在同步問題。

在Java中,最典型的和CPU緩存相關(guān)的知識點,就是并發(fā)編程中,針對Cache line的偽共享(false sharing)問題。

偽共享是指:在這些高速緩存中,是以緩存行為單位進行存儲的。哪怕你修改了緩存行中一個很小很小的數(shù)據(jù),它都會整個的刷新。所以,當(dāng)多線程修改一些變量的值時,如果這些變量在同一個緩存行里,就會造成頻繁刷新,無意中影響彼此的性能。

通過以下命令即可看到當(dāng)前操作系統(tǒng)的緩存行大小。

cat/sys/devices/system/cpu/cpu0/cache/index0/coherency_line_size

通過以下命令可以看到不同層次的緩存大小。

[root@localhost~]#cat/sys/devices/system/cpu/cpu0/cache/index1/size
32K
[root@localhost~]#cat/sys/devices/system/cpu/cpu0/cache/index2/size
256K
[root@localhost~]#cat/sys/devices/system/cpu/cpu0/cache/index3/size
20480K

在JDK8以上的版本,通過開啟參數(shù)-XX:-RestrictContended,就可以使用注解@sun.misc.Contended進行補齊,來避免偽共享的問題。在并發(fā)優(yōu)化中,我們再詳細(xì)講解。

2.3 HugePage

回頭看我們最長的那副圖,上面有一個叫做TLB的組件,它的速度雖然高,但容量也是有限的。這就意味著,如果物理內(nèi)存很大,那么映射表的條目將會非常多,會影響CPU的檢索效率。

默認(rèn)內(nèi)存是以4K的page來管理的。如圖,為了減少映射表的條目,可采取的辦法只有增加頁的尺寸。像這種將Page Size加大的技術(shù),就是Huge Page。

dd69828c-532b-11ed-a3b6-dac502259ad0.png

HugePage有一些副作用,比如競爭加劇,Redis還有專門的研究(https://redis.io/topics/latency) ,但在一些大內(nèi)存的機器上,開啟后會一定程度上增加性能。

2.4 預(yù)先加載

另外,一些程序的默認(rèn)行為,也會對性能有所影響。比如JVM的-XX:+AlwaysPreTouch參數(shù)。默認(rèn)情況下,JVM雖然配置了Xmx、Xms等參數(shù),但它的內(nèi)存在真正用到時,才會分配。

但如果加上這個參數(shù),JVM就會在啟動的時候,把所有的內(nèi)存預(yù)先分配。這樣,啟動時雖然慢了些,但運行時的性能會增加。

3.I/O

3.1 觀測命令

I/O設(shè)備可能是計算機里速度最差的組件了。它指的不僅僅是硬盤,還包括外圍的所有設(shè)備。

硬盤有多慢呢?我們不去探究不同設(shè)備的實現(xiàn)細(xì)節(jié),直接看它的寫入速度(數(shù)據(jù)未經(jīng)過嚴(yán)格測試,僅作參考)。

dd760b6a-532b-11ed-a3b6-dac502259ad0.png

可以看到普通磁盤的隨機寫和順序?qū)懴嗖钍欠浅4蟮摹6S機寫完全和cpu內(nèi)存不在一個數(shù)量級。

緩沖區(qū)依然是解決速度差異的唯一工具,在極端情況比如斷電等,就產(chǎn)生了太多的不確定性。這些緩沖區(qū),都容易丟。

最能體現(xiàn)I/O繁忙程度的,就是top命令和vmstat命令中的wa%。如果你的應(yīng)用,寫了大量的日志,I/O wait就可能非常的高。

dd7f3bf4-532b-11ed-a3b6-dac502259ad0.png

對于硬盤來說,可以使用iostat命令來查看具體的硬件使用情況。只要%util超過了80%,你的系統(tǒng)基本上就跑不動了。

dd904fa2-532b-11ed-a3b6-dac502259ad0.png

詳細(xì)介紹如下:

%util最重要的判斷參數(shù)。一般地,如果該參數(shù)是100%表示設(shè)備已經(jīng)接近滿負(fù)荷運行了

Device表示發(fā)生在哪塊硬盤。如果你有多快,則會顯示多行

avgqu-sz這個值是請求隊列的飽和度,也就是平均請求隊列的長度。毫無疑問,隊列長度越短越好。

await響應(yīng)時間應(yīng)該低于5ms,如果大于10ms就比較大了。這個時間包括了隊列時間和服務(wù)時間

svctm 表示平均每次設(shè)備I/O操作的服務(wù)時間。如果svctm的值與await很接近,表示幾乎沒有I/O等待,磁盤性能很好,如果await的值遠(yuǎn)高于svctm的值,則表示I/O隊列等待太長,系統(tǒng)上運行的應(yīng)用程序?qū)⒆兟?/p>

3.2 零拷貝

kafka比較快的一個原因就是使用了zero copy。所謂的Zero copy,就是在操作數(shù)據(jù)時, 不需要將數(shù)據(jù)buffer從一個內(nèi)存區(qū)域拷貝到另一個內(nèi)存區(qū)域。因為少了一次內(nèi)存的拷貝, CPU的效率就得到提升。

我們來看一下它們之間的區(qū)別:

dda4dd46-532b-11ed-a3b6-dac502259ad0.png

要想將一個文件的內(nèi)容通過socket發(fā)送出去,傳統(tǒng)的方式需要經(jīng)過以下步驟:

將文件內(nèi)容拷貝到內(nèi)核空間。

將內(nèi)核空間的內(nèi)容拷貝到用戶空間內(nèi)存,比如Java應(yīng)用。

用戶空間將內(nèi)容寫入到內(nèi)核空間的緩存中。

socket讀取內(nèi)核緩存中的內(nèi)容,發(fā)送出去。

ddb45618-532b-11ed-a3b6-dac502259ad0.png

零拷貝又多種模式,我們拿sendfile來說明。如上圖,在內(nèi)核的支持下,零拷貝少了一個步驟,那就是內(nèi)核緩存向用戶空間的拷貝。即節(jié)省了內(nèi)存,也節(jié)省了CPU的調(diào)度時間,效率很高。

4.網(wǎng)絡(luò)

除了iotop、iostat這些命令外,sar命令可以方便的看到網(wǎng)絡(luò)運行狀況,下面是一個簡單的示例,用于描述入網(wǎng)流量和出網(wǎng)流量。

$sar-nDEV1
Linux3.13.0-49-generic(titanclusters-xxxxx)07/14/2015_x86_64_(32CPU)

1248AMIFACErxpck/stxpck/srxkB/stxkB/srxcmp/stxcmp/srxmcst/s%ifutil
1249AMeth018763.005032.0020686.42478.300.000.000.000.00
1249AMlo14.0014.001.361.360.000.000.000.00
1249AMdocker00.000.000.000.000.000.000.000.00

1249AMIFACErxpck/stxpck/srxkB/stxkB/srxcmp/stxcmp/srxmcst/s%ifutil
1250AMeth019763.005101.0021999.10482.560.000.000.000.00
1250AMlo20.0020.003.253.250.000.000.000.00
1250AMdocker00.000.000.000.000.000.000.000.00
^C

當(dāng)然,我們可以選擇性的只看TCP的一些狀態(tài)。

$sar-nTCP,ETCP1
Linux3.13.0-49-generic(titanclusters-xxxxx)07/14/2015_x86_64_(32CPU)

1219AMactive/spassive/siseg/soseg/s
1220AM1.000.0010233.0018846.00

1219AMatmptf/sestres/sretrans/sisegerr/sorsts/s
1220AM0.000.000.000.000.00

1220AMactive/spassive/siseg/soseg/s
1221AM1.000.008359.006039.00

1220AMatmptf/sestres/sretrans/sisegerr/sorsts/s
1221AM0.000.000.000.000.00
^C

5.End

不要寄希望于這些指標(biāo),能夠立刻幫助我們定位性能問題。這些工具,只能夠幫我們大體猜測發(fā)生問題的地方,它對性能問題的定位,只是起到輔助作用。想要分析這些bottleneck,需要收集更多的信息。

想要獲取更多的性能數(shù)據(jù),就不得不借助更加專業(yè)的工具,比如基于eBPF的BCC工具,這些牛x的工具我們將在其他文章里展開。讀完本文,希望你能夠快速的了解Linux的運行狀態(tài),對你的系統(tǒng)多一些掌控。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10932

    瀏覽量

    213556
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11358

    瀏覽量

    210895
  • 操作系統(tǒng)
    +關(guān)注

    關(guān)注

    37

    文章

    6920

    瀏覽量

    123978

原文標(biāo)題:61秒,摸透Linux的健康狀態(tài)!

文章出處:【微信號:良許Linux,微信公眾號:良許Linux】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    virtio I/O通信流程及設(shè)備框架的實現(xiàn)

    virtio 是一種通用的半虛擬化的 I/O 通信協(xié)議,提供了一套前后端 I/O 通信的的框架協(xié)議和編程接口。根據(jù)該協(xié)議實現(xiàn)的設(shè)備通過前后端的配合,相比全模擬設(shè)備可以大幅減少陷入陷出
    的頭像 發(fā)表于 03-10 13:37 ?6724次閱讀

    UBIFS損耗均衡對系統(tǒng)I/O性能的影響

    分析flash 文件系統(tǒng)的損耗均衡問題,指出損耗均衡的觸發(fā)條件對系統(tǒng)I/O 性能的影響。在最新UBIFS 文件系統(tǒng)上運行測試程序,結(jié)果證明在不同損耗均衡觸發(fā)條件下,系統(tǒng)I/
    發(fā)表于 03-30 10:10 ?24次下載

    Linux系統(tǒng)中網(wǎng)絡(luò)I/O性能改進方法的研究

    選擇并設(shè)計高效的網(wǎng)絡(luò)I/O模型是改善服務(wù)器性能的關(guān)鍵。該文通過對Linux系統(tǒng)中幾種網(wǎng)絡(luò)I/O模型的分析和研究,提出3種改善網(wǎng)絡(luò)
    發(fā)表于 04-09 09:41 ?28次下載

    基于Linux下的/O端口和I/O內(nèi)存詳解

    端口(port)是接口電路中能被CPU直接訪問的寄存器的地址。幾乎每一種外設(shè)都是通過讀寫設(shè)備上的寄存器來進行的。CPU通過這些地址即端口向接口電路中的寄存器發(fā)送命令,讀取狀態(tài)和傳送數(shù)據(jù)。外設(shè)寄存器
    發(fā)表于 06-14 16:42 ?1285次閱讀
    基于Linux下的/<b class='flag-5'>O</b>端口和<b class='flag-5'>I</b>/<b class='flag-5'>O</b><b class='flag-5'>內(nèi)存</b>詳解

    超全的SPDK性能評估指南

    SPDK采用異步I/O(Asynchronous I/O)加輪詢(Polling)的工作模式,通常與Kernel的異步I/
    的頭像 發(fā)表于 11-26 09:58 ?9118次閱讀

    Linux驅(qū)動技術(shù)之一:訪問I/O內(nèi)存

    ARM是對內(nèi)存空間和IO空間統(tǒng)一編址的,所以,通過讀寫SFR來控制硬件也就變成了通過讀寫相應(yīng)的SFR地址來控制硬件。這部分地址也被稱為I/O內(nèi)存
    發(fā)表于 05-08 14:33 ?608次閱讀
    Linux驅(qū)動技術(shù)之一:訪問<b class='flag-5'>I</b>/<b class='flag-5'>O</b><b class='flag-5'>內(nèi)存</b>

    Linux查看資源使用情況和性能調(diào)優(yōu)常用的命令

    目錄 前言 top命令 htop命令 ps命令 free命令 vmstat命令 iosat命令
    的頭像 發(fā)表于 11-12 17:54 ?4302次閱讀

    EVAL-ADP5588:ADP5588鍵盤I/O擴展器評估

    EVAL-ADP5588:ADP5588鍵盤I/O擴展器評估
    發(fā)表于 05-24 16:37 ?2次下載
    EVAL-ADP5588:ADP5588鍵盤<b class='flag-5'>I</b>/<b class='flag-5'>O</b>擴展器<b class='flag-5'>評估</b>板

    單片機I/O控制方式

    單片機如何實現(xiàn)當(dāng)一個程序在訪問一個I/O設(shè)備時,而不占用CPU呢?對于這個問題,我們先了解一下單片機I/O設(shè)備有哪幾種主要的控制方式;程序循
    發(fā)表于 12-01 16:21 ?10次下載
    單片機<b class='flag-5'>I</b>/<b class='flag-5'>O</b>控制方式

    I/O虛擬化及Virtio接口介紹

    I/O虛擬化是計算機虛擬化最復(fù)雜的部分,因為涉及到CPU、操作系統(tǒng)、Hypervisor以及I/O
    的頭像 發(fā)表于 10-26 17:21 ?4470次閱讀

    Linux性能工具分享

    性能工具譜圖 * CPU 性能工具 * 內(nèi)存性能工具 * 磁盤 I/
    的頭像 發(fā)表于 05-12 10:29 ?660次閱讀
    Linux<b class='flag-5'>性能</b>工具分享

    虛擬化技術(shù)—CPU虛擬化

    物理機器是由CPU內(nèi)存I/O設(shè)備等一組資源構(gòu)成的實體。虛擬機也一樣,由虛擬CPU,虛擬內(nèi)存
    的頭像 發(fā)表于 06-06 15:47 ?2261次閱讀

    jmap dump內(nèi)存命令

    空間的詳細(xì)信息的文件。通過分析堆內(nèi)存快照,可以幫助我們進行內(nèi)存泄漏和性能問題的定位和分析,以及優(yōu)化代碼和內(nèi)存使用。 使用jmap dump
    的頭像 發(fā)表于 12-05 10:38 ?3292次閱讀

    jvm內(nèi)存分析命令和工具

    介紹JVM內(nèi)存分析命令和工具,并詳細(xì)介紹它們的使用方法和功能。 一、JVM內(nèi)存分析命令 jps命令
    的頭像 發(fā)表于 12-05 11:07 ?1284次閱讀

    I/O接口與I/O端口的區(qū)別

    在計算機系統(tǒng)中,I/O接口與I/O端口是實現(xiàn)CPU與外部設(shè)備數(shù)據(jù)交換的關(guān)鍵組件,它們在功能、結(jié)構(gòu)
    的頭像 發(fā)表于 02-02 16:00 ?311次閱讀
    主站蜘蛛池模板: 女bbbbxxxx毛片视频 | 亚洲欧美综合一区 | 日本在线黄色 | 欧美电影一区二区 | 亚洲人成电影在在线观看网色 | 国产无圣光高清一区二区 | 永久在线观看 | 国产精品欧美激情在线播放 | 久久这里只有精品1 | 色88888久久久久久影院 | 一级特黄性生活大片免费观看 | www.九色视频| 成人影院在线观看视频 | 色福利网| a级黄色毛片三个搞一 | 亚洲第一在线 | 久久香蕉国产精品一区二区三 | 国产成人精品免费视频大全可播放的 | 色在线观看视频 | 黄色男人的天堂 | 欧美日韩高清一区 | 91久久另类重口变态 | 网站四虎1515hhcom | 日本高清中文字幕在线观穿线视频 | 免费在线黄色网址 | 福利在线看片 | 亚洲欧美高清在线 | 在线成人aa在线看片 | 日本福利网址 | 亚洲91| 午夜免费福利视频 | 一本大道高清在线视频 视频 | 511韩国理论片在线观看 | 国产亚洲精品久久久极品美女 | 青草视频久久 | 久久久精品免费热线观看 | 午夜免费免费啪视频观看 | 手机看片福利永久 | 片黄免费 | 九九热re | 九色视频在线看 |