Linux操作系統,可以說它就是程序猿的代碼天堂;這不僅僅因為它是開源的,更多的是因為它的誕生,是由世界上無數的代碼天才共同締造而來;跑在它上面的Linux內核,經受了世界上各式各樣的服務器壓力測試,始終保持著高效、穩定、安全的特性,一如既往地服務全人類。甚至可以說Linux操作系統造福了人類,很難想象,當Linux操作系統消失了,這個世界會變得怎么樣?
? 作為Linux操作系統的忠實粉絲,筆者自大學時期就開始研究和使用Linux操作系統,出來工作了好幾年,幾乎每天都要跟Linux系統打交道,甚至毫不夸張的是,白天不在Linux系統命令行下敲幾行命令,晚上都會失眠。
? 學習和使用了Linux系統這么些年,一直想找個機會,對Linux的知識做一番梳理,無奈之前礙于各種時間因素和自我的惰性,遲遲未有實質性的進展。最近才開始狠狠地下定決心,必須邁出扎實的一步,爭取做出更多的分享,充實自我的同時,也給同行帶來更多的視野和思路,何樂而不為呢?
? 本文打算從一個很小的代碼設計,試圖從中窺探一下Linux內核代碼的精妙設計。它的名字就叫 max宏定義,請跟隨筆者的思路一步步解開它神秘的面紗。
? 先來一個它的全貌:
#define max(a, b) ({\
typeof(a) _max1 = (a);\
typeof(b) _max2 = (b);\
(void)(&_max1 == &_max2);\
_max1 > _max2 ? _max1 : _max2; })
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-AQSFb6aB-1661923667090)(data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)]
? 我們先不一下子就把這段代碼剖析徹底,換個思維,假設我們是Linux內核的設計者,要解決比較2個數的大小,代碼應該怎么樣入手。我想很多C語言工作者,甚至是初學C語言的碼農也可以寫出這樣的如下代碼:
#define max(a, b) a > b ? a : b
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-jvjzDDsR-1661923667093)(data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)]
? 初看這個宏定義,似乎沒有問題;細細一看,用個測試案例一測試就發現端倪了:
/* 假設有如下的調用代碼 */
{
printf("result = %d\n", max(9!=9, 0==0));
/* 宏定義展開后是 9!=9 > 0==0 ? 9!=9 : 0==0*/
/* 輸出結果是 0*/
}
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-59Bp6ggT-1661923667094)(data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)]
? 很明顯正確答案應該是輸出1,細心者就很快發現,給a和b加上括號試試看:
#define max(a, b) (a) > (b) ? (a) : (b)
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-k7e0TQdq-1661923667097)(data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)]
? 調用代碼測試下:
/* 假設有如下的調用代碼 */
{
printf("result = %d\n", max(9!=9, 0==0));
/* 宏定義展開后是 (9!=9) > (0==0) ?(9!=9):(0==0)*/
/* 輸出正確結果 1*/
printf("result = %d\n", 9 + max(9!=9, 0==0));
/* 宏定義展開后是 9 + (9!=9) > (0==0) ?(9!=9 :(0==0)*/
/* 輸出結果是0, 正確的期望值輸出,應該是10 (=9+1) */
}
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-m705RxoN-1661923667114)(data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)]
? 于是又有了下面的改進:
#define max(a, b) ((a) > (b) ? (a) : (b))
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-xriR0pv8-1661923667116)(data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)]
? 這個版本,也是我們日常寫代碼最經常看到的版本,我們使用測試代碼測試下看看:
/* 假設有如下的調用代碼 */
{
printf("result = %d\n", 9 + max(9!=9, 0==0));
/* 宏定義展開后是 9 + ((9!=9) > (0==0) ?(9!=9):(0==0))*/
/* 輸出正確的期望值10 (=9+1) */
int a = 8;
int b = 9;
printf("result = %d\n", max(a++, b++));
/* 宏定義展開后是 ((a++) > (b++) ?(a++):(b++))*/
/* 輸出結果是10;而正確的期望值輸出,應該是9 */
}
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-2JAec1EG-1661923667122)(data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)]
? 很遺憾,經測試,這個版本依然有問題,這是因為宏定義中的++操作干擾了比較結果的輸出,我們需要再次改進這個宏定義。應該怎么樣改進呢?既然是++操作干擾了輸出,那么我們使用2個中間變量來中轉下不就ok了嗎?于是有了下面的版本:
#define max(a, b) ({\
int _a = (a);\
int _b = (b);\
_a > _b ? _a : _b;\
})
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-t7VD8Szr-1661923667123)(data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)]
? 這樣的寫法,已經有點接近Linux內核定義的模樣了。再次使用上面的測試代碼執行測試:
/* 假設有如下的調用代碼 */
{
int a = 8;
int b = 9;
printf("result = %d\n", max(a++, b++));
/* 宏定義展開后是 ({int _a=a++; int _b=b++; _a > _b ? _a : _b;})*/
/* 輸出正確的期望值9 */
}
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-dpinR0OT-1661923667125)(data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)]
? 雖然上面版本的定義解決了++操作符引起的輸出結果錯誤的問題,但是由于宏定義內部使用了int型的_a和_b作為中間變量,這就是限制了max宏定義只能用于2個int型的數據做比較,這將大大限制了它的使用范圍。于是,很容易想到一個解決辦法,將int這個數據類型使用type變量傳進去,于是有了下面的版本:
#define max(type, a, b) ({\
type _a = (a);\
type _b = (b);\
_a > _b ? _a : _b;\
})
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-WVFbRavF-1661923667126)(data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)]
? 這樣的確是解決了如上數據類型問題的困惑,但是這樣我們的宏定義是以多一個參數輸入為犧牲代價的。那么,我們有沒有什么辦法,可以不將type輸入,而直接從輸入的a和b中獲取它們的數據類型呢?答案是肯定有的!
? GNU C作為C語言的擴展版本,增加了若干非常有用的擴展語法,其中typeof關鍵字就是其中的一個。比如定義一個變量int a; 則typeof(a)就可以取得a變量的類型,即int;比如直接使用typeof(unsigned char *),得到的輸出就是數據類型unsigned char *,非常的實用。于是我們將typeof應用到max宏中,于是就有下面的優良版本:
#define max(a, b) ({\
typeof(a) _a = (a);\
typeof(a) _b = (b);\
_a > _b ? _a : _b;\
})
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-KTnbdo0C-1661923667127)(data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)]
? 這樣的寫法,雖然避免了我們傳遞a和b變量的數據類型進去,但是,如下的測試代碼,結果會怎么樣呢?
/* 假設有如下的調用代碼 */
{
int a = 8;
float b = 9.0;
printf("result = %d\n", max(a, b));
/* 這樣能比較嗎?*/
int a = 8;
float b = 9.0;
float *p = &b;
printf("result = %d\n", max(a, p));
/* 這樣又能比較嗎?*/
}
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-j0v9A1VG-1661923667128)(data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)]
? 很明顯,當a是int型,而b是float型,內核執行比較是可以的;但是如果拿一個int型的變量跟一個float *變量做比較,或者兩個奇奇怪怪的struct類型變量做計較,這樣肯定是不行的。所以,我們在設計max宏定義的時候,需要將這種可能出現的問題盡可能地在編譯階段就暴露出來,于是有了Linux內核max宏定義的最佳版本:
#define max(a, b) ({\
typeof(a) _a = (a);\
typeof(a) _b = (b);\
(void) &_a == &_b;\
_a > _b ? _a : _b;\
})
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-YVJm8AAy-1661923667129)(data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==)]
? 我們注意,宏定義的第4行,(void) &_a == &_b; 意思是對_a和_b的地址做比較,實際上從運行結果上,這個肯定是不等的,但是我們關心的并不是兩者比較的結果,而是兩者能不能用==比較的問題。當_a和_b的數據類型一致時,代碼編譯不會有任何警告;反之,當兩者的數據類型不一致時,比如之前的a是int型,而b是float型,那么這條語句就會報出編譯警告,如果在嚴格的編譯選項下,這個警告還可以轉換為錯誤,要求代碼調用者去確認結果,是否對兩個不同類型的數據執行max比較的動作,從而將隱患消除,提升代碼質量。
? 通過跟隨筆者的思路,我們可以細細地體會到,內核設計者在設計這個max宏時,相信也是走了不少的彎路,從一開始最簡版本,接著遇到各式各樣的問題,然后一步步解決,一步步完善設計,最終才有最優秀的max宏呈現在我們面前。如此之類的代碼設計,在Linux內核設計代碼中比比皆是,今后筆者也會集中整理此類的優秀設計,致力于將更多的優秀內核代碼分享給讀者,敬請關注。文中提及的觀點,均為筆者愚見,如有紕漏之處,還望誠心指正,謝謝。
-
內核
+關注
關注
3文章
1382瀏覽量
40423 -
Linux
+關注
關注
87文章
11345瀏覽量
210395 -
操作系統
+關注
關注
37文章
6895瀏覽量
123745
發布評論請先 登錄
相關推薦
評論