一、前言
Linux的中斷宏觀分為兩種:軟中斷和硬中斷。聲明一下,這里的軟和硬的意思是指和軟件相關(guān)以及和硬件相關(guān),而不是軟件實(shí)現(xiàn)的中斷或硬件實(shí)現(xiàn)的中斷。
軟中斷就是"信號(hào)機(jī)制"。軟中不是軟件中斷。Linux通過(guò)信號(hào)來(lái)產(chǎn)生對(duì)進(jìn)程的各種中斷操作,我們現(xiàn)在知道的信號(hào)共有31個(gè),其具體內(nèi)容這里略 過(guò),感興趣讀者可參看相關(guān)參考文獻(xiàn)[1]。一般來(lái)說(shuō),軟中斷是由內(nèi)核機(jī)制的觸發(fā)事件引起的(例如進(jìn)程運(yùn)行超時(shí)),但是不可忽視有大量的軟中斷也是由于和硬 件有關(guān)的中斷引起的,例如當(dāng)打印機(jī)端口產(chǎn)生一個(gè)硬件中斷時(shí),會(huì)通知和硬件相關(guān)的硬中斷,硬中斷就會(huì)產(chǎn)生一個(gè)軟中斷并送到操作系統(tǒng)內(nèi)核里,這樣內(nèi)核就會(huì)根據(jù) 這個(gè)軟中斷喚醒睡眠在打印機(jī)任務(wù)隊(duì)列中的處理進(jìn)程。
硬中斷就是通常意義上的"中斷處理程序",它是直接處理由硬件發(fā)過(guò)來(lái)的中斷信號(hào)的。當(dāng)硬中斷收到它應(yīng)當(dāng)處理的中斷信號(hào)以后,就回去自己驅(qū)動(dòng)的設(shè) 備上去看看設(shè)備的狀態(tài)寄存器以了解發(fā)生了什么事情,并進(jìn)行相應(yīng)的操作。對(duì)于軟中斷,我們不做討論,那是進(jìn)程調(diào)度里要考慮的事情。由于我們討論的是設(shè)備驅(qū)動(dòng) 程序的中斷問(wèn)題,所以焦點(diǎn)集中在硬中斷里。我們這里討論的是硬中斷,即和硬件相關(guān)的中斷。
二、中斷產(chǎn)生
要中斷,是因?yàn)橥庠O(shè)需要通知操作系統(tǒng)她那里發(fā)生了一些事情,但是中斷的功能僅僅是一個(gè)設(shè)備報(bào)警燈,當(dāng)燈亮的時(shí)候中斷處理程序只知道有事情發(fā)生 了,但發(fā)生了什么事情還要親自到設(shè)備那里去看才行。也就是說(shuō),當(dāng)中斷處理程序得知設(shè)備發(fā)生了一個(gè)中斷的時(shí)候,它并不知道設(shè)備發(fā)生了什么事情,只有當(dāng)它訪問(wèn) 了設(shè)備上的一些狀態(tài)寄存器以后,才能知道具體發(fā)生了什么,要怎么去處理。
設(shè)備通過(guò)中斷線向中斷控制器發(fā)送高電平告訴操作系統(tǒng)它產(chǎn)生了一個(gè)中斷,而操作系統(tǒng)會(huì)從中斷控制器的狀態(tài)位知道是哪條中斷線上產(chǎn)生了中斷。PC機(jī) 上使用的中斷控制器是8259,這種控制器每一個(gè)可以管理8條中斷線,當(dāng)兩個(gè)8259級(jí)聯(lián)的時(shí)候共可以控制15條中斷線。這里的中斷線是實(shí)實(shí)在在的電路, 他們通過(guò)硬件接口連接到CPU外的設(shè)備控制器上。
三、IRQ
并不是每個(gè)設(shè)備都可以向中斷線上發(fā)中斷信號(hào)的,只有對(duì)某一條確定的中斷線勇有了控制權(quán),才可以向這條中斷線上發(fā)送信號(hào)。由于計(jì)算機(jī)的外部設(shè)備越 來(lái)越多,所以15條中斷線已經(jīng)不夠用了,中斷線是非常寶貴的資源。要使用中斷線,就得進(jìn)行中斷線的申請(qǐng),就是IRQ(Interrupt Requirement),我們也常把申請(qǐng)一條中斷線成為申請(qǐng)一個(gè)IRQ或者是申請(qǐng)一個(gè)中斷號(hào)。
IRQ是非常寶貴的,所以我們建議只有當(dāng)設(shè)備需要中斷的時(shí)候才申請(qǐng)占用一個(gè)IRQ,或者是在申請(qǐng)IRQ時(shí)采用共享中斷的方式,這樣可以讓更多的設(shè)備使用中斷。
無(wú)論對(duì)IRQ的使用方式是獨(dú)占還是共享,申請(qǐng)IRQ的過(guò)程都是一樣的,分為3步:
1.將所有的中斷線探測(cè)一遍,看看哪些中斷還沒(méi)有被占用。從這些還沒(méi)有被占用的中斷中選一個(gè)作為該設(shè)備的IRQ。
2.通過(guò)中斷申請(qǐng)函數(shù)申請(qǐng)選定的IRQ,這是要指定申請(qǐng)的方式是獨(dú)占還是共享。
3.根據(jù)中斷申請(qǐng)函數(shù)的返回值決定怎么做:如果成功了萬(wàn)事大吉,如果沒(méi)成功則或者重新申請(qǐng)或者放棄申請(qǐng)并返回錯(cuò)誤。
申請(qǐng)IRQ的過(guò)程,在參考書(shū)的配的源代碼里有詳細(xì)的描述,讀者可以通過(guò)仔細(xì)閱讀源代碼中的short一例對(duì)中斷號(hào)申請(qǐng)由深刻的理解。
四、中斷處理程序
Linux中的中斷處理程序很有特色,它的一個(gè)中斷處理程序分為兩個(gè)部分:上半部(tophalf)和下半部(bottom half)。之所以會(huì)有上半部和下半部之分,完全是考慮到中斷處理的效率。
上半部的功能是"登記中斷"。當(dāng)一個(gè)中斷發(fā)生時(shí),他就把設(shè)備驅(qū)動(dòng)程序中中斷例程的下半部掛到該設(shè)備的下半部執(zhí)行隊(duì)列中去,然后就沒(méi)事情了--等 待新的中斷的到來(lái)。這樣一來(lái),上半部執(zhí)行的速度就會(huì)很快,他就可以接受更多她負(fù)責(zé)的設(shè)備產(chǎn)生的中斷了。上半部之所以要快,是因?yàn)樗峭耆帘沃袛嗟模绻?她不執(zhí)行完,其它的中斷就不能被及時(shí)的處理,只能等到這個(gè)中斷處理程序執(zhí)行完畢以后。所以,要盡可能多得對(duì)設(shè)備產(chǎn)生的中斷進(jìn)行服務(wù)和處理,中斷處理程序就 一定要快。
但是,有些中斷事件的處理是比較復(fù)雜的,所以中斷處理程序必須多花一點(diǎn)時(shí)間才能夠把事情做完。可怎么樣化解在短時(shí)間內(nèi)完成復(fù)雜處理的矛盾呢,這時(shí)候Linux引入了下半部的概念。下半部和上半部最大的不同是下半部是可中斷的,而上半部是不可中斷的。
下半部幾乎做了中斷處理程序所有的事情,因?yàn)樯习氩恐皇菍⑾掳氩颗诺搅怂麄兯?fù)責(zé)的設(shè)備的中斷處理隊(duì)列中去,然后就什么都不管了。下半部一般所 負(fù)責(zé)的工作是察看設(shè)備以獲得產(chǎn)生中斷的事件信息,并根據(jù)這些信息(一般通過(guò)讀設(shè)備上的寄存器得來(lái))進(jìn)行相應(yīng)的處理。如果有些時(shí)間下半部不知道怎么去做,他 就使用著名的鴕鳥(niǎo)算法來(lái)解決問(wèn)題--說(shuō)白了就是忽略這個(gè)事件。
由于下半部是可中斷的,所以在它運(yùn)行期間,如果其它的設(shè)備產(chǎn)生了中斷,這個(gè)下半部可以暫時(shí)的中斷掉,等到那個(gè)設(shè)備的上半部運(yùn)行完了,再回頭來(lái)運(yùn) 行它。但是有一點(diǎn)一定要注意,那就是如果一個(gè)設(shè)備中斷處理程序正在運(yùn)行,無(wú)論她是運(yùn)行上半部還是運(yùn)行下半部,只要中斷處理程序還沒(méi)有處理完畢,在這期間設(shè) 備產(chǎn)生的新的中斷都將被忽略掉。因?yàn)橹袛嗵幚沓绦蚴遣豢芍厝氲模粋€(gè)中斷處理程序是不能并行的。
在Linux Kernel 2.0以前,中斷分為快中斷和慢中斷(偽中斷我們這里不談),其中快中斷的下半部也是不可中斷的,這樣可以保證它執(zhí)行的快一點(diǎn)。但是由于現(xiàn)在硬件水平不斷 上升,快中斷和慢中斷的運(yùn)行速度已經(jīng)沒(méi)有什么差別了,所以為了提高中斷例程事務(wù)處理的效率,從Linux kernel 2.0以后,中斷處理程序全部都是慢中斷的形式了--他們的下半部是可以被中斷的。
但是,在下半部中,你也可以進(jìn)行中斷屏蔽--如果某一段代碼不能被中斷的話。你可以使用cti、sti或者是save_flag、restore_flag來(lái)實(shí)現(xiàn)你的想法。至于他們的用法和區(qū)別,請(qǐng)參看本文指定參考書(shū)中斷處理部分。
進(jìn)一步的細(xì)節(jié)請(qǐng)讀者參看本文指定參考書(shū),這里就不再所說(shuō)了,詳細(xì)介紹細(xì)節(jié)不是我的目的,我的目的是整理概念。
五、置中斷標(biāo)志位
在處理中斷的時(shí)候,中斷控制器會(huì)屏蔽掉原先發(fā)送中斷的那個(gè)設(shè)備,直到她發(fā)送的上一個(gè)中斷被處理完了為止。因此如果發(fā)送中斷的那個(gè)設(shè)備載中斷處理期間又發(fā)送了一個(gè)中斷,那么這個(gè)中斷就被永遠(yuǎn)的丟失了。
之所以發(fā)生這種事情,是因?yàn)橹袛嗫刂破鞑⒉荒芫彌_中斷信息,所以當(dāng)前一個(gè)中斷沒(méi)有處理完以前又有新的中斷到達(dá),他肯定會(huì)丟掉新的中斷的。但是這 種缺陷可以通過(guò)設(shè)置主處理器(CPU)上的"置中斷標(biāo)志位"(sti)來(lái)解決,因?yàn)橹魈幚砥骶哂芯彌_中斷的功能。如果使用了"置中斷標(biāo)志位",那么在處理 完中斷以后使用sti函數(shù)就可以使先前被屏蔽的中斷得到服務(wù)。
六、中斷處理程序的不可重入性
上一節(jié)中我們提到有時(shí)候需要屏蔽中斷,可是為什么要將這個(gè)中斷屏蔽掉呢?這并不是因?yàn)榧夹g(shù)上實(shí)現(xiàn)不了同一中斷例程的并行,而是出于管理上的考 慮。之所以在中斷處理的過(guò)程中要屏蔽同一IRQ來(lái)的新中斷,是因?yàn)橹袛嗵幚沓绦蚴遣豢芍厝氲模圆荒懿⑿袌?zhí)行同一個(gè)中斷處理程序。在這里我們舉一個(gè)例 子,從這里子例中可以看出如果一個(gè)中斷處理程序是可以并行的話,那么很有可能會(huì)發(fā)生驅(qū)動(dòng)程序鎖死的情況。當(dāng)驅(qū)動(dòng)程序鎖死的時(shí)候,你的操作系統(tǒng)并不一定會(huì)崩 潰,但是鎖死的驅(qū)動(dòng)程序所支持的那個(gè)設(shè)備是不能再使用了--設(shè)備驅(qū)動(dòng)程序死了,設(shè)備也就死了。
其中激發(fā)PS1的事件會(huì)使A1產(chǎn)生一個(gè)中斷,然后B1去讀R1中已有的數(shù)據(jù),然后代碼C1向R2中寫(xiě)數(shù)據(jù)。而激發(fā)PS2的事件會(huì)使A2產(chǎn)生一個(gè)中斷,然后B2刪除R1中的數(shù)據(jù),然后C2讀去R2中的數(shù)據(jù)。
如果PS1先產(chǎn)生,且當(dāng)他執(zhí)行到A1和B1之間的時(shí)候,如果PS2產(chǎn)生了,這是A2會(huì)產(chǎn)生一個(gè)中斷,將PS2中斷掉(掛到任務(wù)隊(duì)列的尾部),然 后刪除了R1的內(nèi)容。當(dāng)PS2運(yùn)行到C2時(shí),由于C1還沒(méi)有向R2中寫(xiě)數(shù)據(jù),所以C2將會(huì)在這里被掛起,PS2就睡眠在代碼C2上,直到有數(shù)據(jù)可讀的時(shí)候 被信號(hào)喚醒。這是由于PS1中的B2原先要讀的R1中的數(shù)據(jù)被PS2中的B2刪除了,所以PS1頁(yè)會(huì)睡眠在B1上,直到有數(shù)據(jù)可讀的時(shí)候被信號(hào)喚醒。這樣 一來(lái),喚醒PS1和PS2的事件就永遠(yuǎn)不會(huì)發(fā)生了,因此PS1和PS2之間就鎖死了。
由于設(shè)備驅(qū)動(dòng)程序要和設(shè)備的寄存器打交道,所以很難寫(xiě)出可以重入的代碼來(lái),因?yàn)樵O(shè)備寄存器就是全局變量。因此,最簡(jiǎn)潔的辦法就是禁止同一設(shè)備的中斷處理程序并行,即設(shè)備的中斷處理程序是不可重入的。
有一點(diǎn)一定要清楚:在2.0版本以后的Linux kernel中,所有的上半部都是不可中斷的(上半部的操作是原子性的);不同設(shè)備的下半部可以互相中斷,但一個(gè)特定的下半部不能被它自己所中斷(即同一個(gè)下半部不能并行)。
由于中斷處理程序要求不可重入,所以程序員也不必為編寫(xiě)可重入的代碼而頭痛了。以我的經(jīng)驗(yàn),編寫(xiě)可重入的設(shè)備驅(qū)動(dòng)程序是可以的,編寫(xiě)可重入的中斷處理程序是非常難得,幾乎不可能。
七、避免競(jìng)爭(zhēng)條件的出現(xiàn)
我們都知道,一旦競(jìng)爭(zhēng)條件出現(xiàn)了,就有可能會(huì)發(fā)生死鎖的情況,嚴(yán)重時(shí)可能會(huì)將整個(gè)系統(tǒng)鎖死。所以一定要避免競(jìng)爭(zhēng)條件的出現(xiàn)。這里我不多說(shuō),大家 只要注意一點(diǎn):絕大多數(shù)由于中斷產(chǎn)生的競(jìng)爭(zhēng)條件,都是在帶有中斷的內(nèi)核進(jìn)程被睡眠造成的。所以在實(shí)現(xiàn)中斷的時(shí)候,一定要相信謹(jǐn)慎的讓進(jìn)程睡眠,必要的時(shí)候 可以使用cli、sti或者save_flag、restore_flag。具體細(xì)節(jié)請(qǐng)參看本文指定參考書(shū)。
八、實(shí)現(xiàn)
如何實(shí)現(xiàn)驅(qū)動(dòng)程序的中斷例程,是各位讀者的事情了。只要你們仔細(xì)的閱讀short例程的源代碼,搞清楚編寫(xiě)驅(qū)動(dòng)程序中斷例程的規(guī)則,就可以編寫(xiě) 自己的中斷例程了。只要概念正確,在正確的規(guī)則下編寫(xiě)你的代碼,那就是符合道理的東西。我始終強(qiáng)調(diào),概念是第一位的,能編多少代碼是很其次的,我們一定要 概念正確,才能進(jìn)行正確的思考。
評(píng)論