相信很多在linux平臺(tái)工作的童鞋, 都很熟悉管道符 '|', 通過它, 我們能夠很靈活的將幾種不同的命令協(xié)同起來完成一件任務(wù)
不過這次咱們不來說這些用法, 而是來探討一些更加有意思的, 那就是管道兩邊的數(shù)據(jù)流"實(shí)時(shí)性"和管道使用的小提示.
其實(shí)我們?cè)诶霉艿赖臅r(shí)候, 可能會(huì)不經(jīng)意的去想, 我前一個(gè)命令的輸出, 是全部處理完再通過管道傳給第二個(gè)命令, 還是一邊處理一邊輸出呢? 可能在大家是試驗(yàn)中或者工作經(jīng)驗(yàn)中, 應(yīng)該是左邊的命令全部處理完再一次性交給右邊的命令進(jìn)行處理, 不光是大家, 我在最初接觸管道時(shí), 也曾有這么一個(gè)誤會(huì), 因?yàn)槲覀兺ㄟ^現(xiàn)象看到的就是這樣.
但其實(shí)只要有簡單了解過管道這工具, 應(yīng)該都不難得出解釋:
管道是兩邊是同時(shí)進(jìn)行, 也就是說, 左邊的命令輸出到管道, 管道的右邊將馬上進(jìn)行處理.
管道的定義
管道是由內(nèi)核管理的一個(gè)緩沖區(qū),相當(dāng)于我們放入內(nèi)存中的一個(gè)紙條。管道的一端連接一個(gè)進(jìn)程的輸出。這個(gè)進(jìn)程會(huì)向管道中放入信息。管道的另一端連接一個(gè)進(jìn)程的輸入,這個(gè)進(jìn)程取出被放入管道的信息。一個(gè)緩沖區(qū)不需要很大,它被設(shè)計(jì)成為環(huán)形的數(shù)據(jù)結(jié)構(gòu),以便管道可以被循環(huán)利用。當(dāng)管道中沒有信息的話,從管道中讀取的進(jìn)程會(huì)等待,直到另一端的進(jìn)程放入信息。當(dāng)管道被放滿信息的時(shí)候,嘗試放入信息的進(jìn)程會(huì)堵塞,直到另一端的進(jìn)程取出信息。當(dāng)兩個(gè)進(jìn)程都終結(jié)的時(shí)候,管道也自動(dòng)消失。
管道工作流程圖
通過上面的解釋可以看到, 假設(shè) COMMAND1 | COMMAND2, 那么COMMAND1的標(biāo)準(zhǔn)輸出, 將會(huì)被綁定到管道的寫端, 而COMMAND2的標(biāo)準(zhǔn)輸入將會(huì)綁定到管道的讀端, 所以當(dāng)COMMAND1一有輸出, 將會(huì)馬上通過管道傳給COMMAND2, 我們先來做個(gè)實(shí)驗(yàn)驗(yàn)證下:
#1.pyimporttimeimportsyswhile1:print'1111'time.sleep(3)print'2222'time.sleep(3)
[root@iZ23pynfq19Z~]#python1|cat
在上面的命令, 我們可以猜測(cè)下輸出結(jié)果: 究竟是 睡眠6秒之后, 輸出"1111222", 還是輸出 "1111" 睡眠3秒, 再輸出 "2222", 然后再睡眠3秒, 再輸出"1111" 呢? 答案就是: 都不是! what! 這不可能, 大家可以嘗試下, 我們會(huì)看到終端沒反應(yīng)了, 為什么呢? 這就要涉及到文件IO的緩沖方式了,關(guān)于文件IO, 可以參考我的另一篇文章:淺談文件描述符1和2, 在最下面的地方提到文件IO的三種緩沖方式:
全緩沖:直到緩沖區(qū)被填滿,才調(diào)用系統(tǒng)I/O函數(shù), (一般是針對(duì)文件)
行緩沖: 遇到換行符就輸出(標(biāo)準(zhǔn)輸出)
無緩沖:沒有緩沖區(qū),數(shù)據(jù)會(huì)立即讀入或者輸出到外存文件和設(shè)備上(標(biāo)準(zhǔn)錯(cuò)誤
因?yàn)閜ython是默認(rèn)采用帶緩沖的fputs(參考py27源碼: fileobject.c: PyFile_WriteString函數(shù)),又因?yàn)闃?biāo)準(zhǔn)輸出被改寫到管道, 所以將會(huì)采取全緩沖的方式(shell 命令具體要看實(shí)現(xiàn), 因?yàn)橛行┦怯貌粠Ь彌_write實(shí)現(xiàn),如果不帶緩沖區(qū),會(huì)直接寫入管道), 所以將會(huì)采取全緩沖的方式, 也就是說, 直到緩沖區(qū)被填滿, 或者手動(dòng)顯示調(diào)用flush刷入,才能看到輸出.那我們可以將代碼改寫成下面兩種方式吧
#方式1:填滿緩沖區(qū),我這邊大小是4096字節(jié),你們也可以試下這個(gè)值,估計(jì)都一樣importtimeimportsyswhile1:print'1111'*4096time.sleep(3)print'2222'*4096time.sleep(3)#方式2:手動(dòng)刷入寫隊(duì)列importtimeimportsyswhile1:print'1111'sys.stdout.flush()//因?yàn)槭菢?biāo)準(zhǔn)輸出,所以直接通過sys的接口去flushtime.sleep(3)print'2222'sys.stdout.flush()time.sleep(3)
輸出結(jié)果:
#第一種方式:[root@iZ23pynfq19Z~]#python1|cat1111.....(超多1,刷屏了..)睡眠3秒..2222.....(超多2,刷屏了..)#第二種方式:[root@iZ23pynfq19Z~]#python1|cat1111睡眠3秒..2222睡眠3秒..1111....
在這里我們已經(jīng)能夠得出結(jié)果, 如果像我們以前所想的那樣, 要等到COMMAND1全部執(zhí)行完才一次性輸出給COMMAND2, 那么結(jié)果應(yīng)該是無限堵塞..因?yàn)槲业某绦蛞恢睕]有執(zhí)行完..這樣應(yīng)該是不符合老前輩們?cè)O(shè)計(jì)初衷的, 因?yàn)檫@樣可能會(huì)導(dǎo)致管道越來越大..然而管道也是有大小的~ 具體可以去看posix標(biāo)準(zhǔn), 所以我們得出結(jié)論是: 只要COMMAND1的輸出寫入管道的寫端(不管是緩沖區(qū)滿還是手動(dòng)flush), COMMAND2都將立刻得到數(shù)據(jù)并且馬上處理.
那么管道兩邊的數(shù)據(jù)流"實(shí)時(shí)性"討論到就先暫告一段落, 接下來將在這個(gè)基礎(chǔ)上繼續(xù)討論:管道使用的小提示.
在開始討論前, 我想先引入一個(gè)專業(yè)術(shù)語, 也是我們偶爾會(huì)遇到的, 那就是:SIGPIPE或者是一個(gè)更加具體的描述:broken pipe (管道破裂)
上面的專業(yè)術(shù)語都是跟管道讀寫規(guī)則息息相關(guān)的, 那咱們來看下 管道的讀寫規(guī)則吧:
當(dāng)沒有數(shù)據(jù)可讀時(shí)
O_NONBLOCK (未設(shè)置):read調(diào)用阻塞,即進(jìn)程暫停執(zhí)行,一直等到有數(shù)據(jù)來到為止。
O_NONBLOCK ( 設(shè)置 ) :read調(diào)用返回-1,errno值為EAGAIN。
當(dāng)管道滿的時(shí)候
O_NONBLOCK (未設(shè)置):write調(diào)用阻塞,直到有進(jìn)程讀走數(shù)據(jù)
O_NONBLOCK ( 設(shè)置 ):調(diào)用返回-1,errno值為EAGAIN
如果所有管道寫端對(duì)應(yīng)的文件描述符被關(guān)閉,則read返回0
如果所有管道讀端對(duì)應(yīng)的文件描述符被關(guān)閉,則write操作會(huì)產(chǎn)生信號(hào)SIGPIPE
當(dāng)要寫入的數(shù)據(jù)量不大于PIPE_BUF時(shí),linux將保證寫入的原子性。
當(dāng)要寫入的數(shù)據(jù)量大于PIPE_BUF時(shí),linux將不再保證寫入的原子性。
在上面我們可以看到, 如果我們收到SIGPIPE信號(hào), 那么一般情況就是讀端被關(guān)閉, 但是寫端卻依舊嘗試寫入
咱們來重現(xiàn)下SIGPIPE
#!/usr/bin/pythonimporttimeimportsyswhile1:time.sleep(10)#手速不夠快的童鞋可以將睡眠時(shí)間設(shè)置長點(diǎn)print'1111'sys.stdout.flush()
這次執(zhí)行命令需要考驗(yàn)手速了, 因?yàn)槲覀円s在py醒過來之前, 將讀端進(jìn)程殺掉
python1|cat------------------------#另一個(gè)終端[root@iZ23pynfq19Z~]#ps-fe|grep-P'cat|python'root107754074000:05pts/200:00:00python1root107764074000:05pts/200:00:00cat#讀端進(jìn)程root1083332581000:06pts/000:00:00grep-Pcat|python[root@iZ23pynfq19Z~]#kill10776
輸出結(jié)果
[root@iZ23pynfq19Z~]#python1|catTraceback(mostrecentcalllast):File"1",line6,insys.stdout.flush()IOError:[Errno32]BrokenpipeTerminated
從上圖我們可以驗(yàn)證兩個(gè)點(diǎn):
當(dāng)我們殺掉讀端時(shí), 寫端會(huì)收到SIGPIPE而默認(rèn)退出, 管道結(jié)束
當(dāng)我們殺掉讀端時(shí), 寫端的程序并不會(huì)馬上收到SIGPIPE, 相反的, 只有真正寫入管道寫端時(shí)才會(huì)觸發(fā)這個(gè)錯(cuò)誤
如果寫入一個(gè) 讀端已經(jīng)關(guān)閉的管道, 將會(huì)收到一個(gè)SIGPIPE, 那讀一個(gè)寫端已經(jīng)關(guān)閉的管道又會(huì)這樣呢?
importtimeimportsys#這次我們不需要死循環(huán),因?yàn)槲覀兿胍獙懚丝禳c(diǎn)關(guān)閉退出time.sleep(5)print'1111'sys.stdout.flush()
#因?yàn)槲覀兿胍x端等到足夠長的時(shí)間,讓寫端關(guān)閉,所以我們需要利用awk先睡眠10秒[root@iZ23pynfq19Z~]#python1.py|awk'{system("sleep10");print123}'------------------------[root@iZ23pynfq19Z~]#ps-fe|grep-P'awk|python'root117174074000:20pts/200:00:00python1.pyroot117184074000:20pts/200:00:00awk{system("sleep10");print123}root1172132581000:20pts/000:00:00grep-Pawk|python#5秒過后[root@iZ23pynfq19Z~]#ps-fe|grep-P'awk|python'root116854074000:20pts/200:00:00awk{system("sleep10");print123}root1169832581000:20pts/000:00:00grep-Pawk|python#10秒過后[root@iZ23pynfq19Z~]#python1|awk'{system("sleep10");print123}'123
在上面也已經(jīng)證明了上文提到的讀寫規(guī)則: 如果所有管道寫端對(duì)應(yīng)的文件描述符被關(guān)閉,將產(chǎn)生EOF結(jié)束標(biāo)志,read返回0, 程序退出。
總結(jié)
通過上面的理論和實(shí)驗(yàn), 我們知道在使用管道時(shí), 兩邊命令的數(shù)據(jù)傳輸過程, 以及對(duì)管道讀寫規(guī)則有了初步的認(rèn)識(shí), 希望我們以后在工作時(shí), 再接觸管道時(shí), 能夠更加有把握的去利用這一強(qiáng)大的工具。
-
Linux
+關(guān)注
關(guān)注
87文章
11497瀏覽量
213288 -
管道
+關(guān)注
關(guān)注
3文章
146瀏覽量
18180
原文標(biāo)題:聊聊 Linux 的匿名管道
文章出處:【微信號(hào):LinuxHub,微信公眾號(hào):Linux愛好者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
大眾數(shù)據(jù)流分析
探測(cè)小提示
部署實(shí)時(shí)數(shù)據(jù)流平臺(tái)面臨的挑戰(zhàn)有哪些?
LabVIEW數(shù)據(jù)流控制方法研究
基于數(shù)據(jù)流的Java字節(jié)碼分析
網(wǎng)絡(luò)數(shù)據(jù)流存儲(chǔ)算法分析與實(shí)現(xiàn)

基于FPGA芯片的數(shù)據(jù)流結(jié)構(gòu)分析
數(shù)據(jù)流編程模型優(yōu)化

大數(shù)據(jù)環(huán)境下的分布式數(shù)據(jù)流處理關(guān)鍵技術(shù)探析

數(shù)據(jù)流的網(wǎng)絡(luò)實(shí)時(shí)入侵檢測(cè)

時(shí)間數(shù)據(jù)流的并行檢測(cè)算法

數(shù)據(jù)流是什么
控制流和數(shù)據(jù)流的區(qū)別
示波器探頭的探測(cè)小提示

評(píng)論