Linux 內核驅動中的奇怪語法
大家在看一些 GNU 開源軟件,或者閱讀 Linux 內核、驅動源碼時會發現,在 Linux 內核源碼中,有大量的 C 程序看起來“怪怪的”。說它是C語言吧,貌似又跟教材中的寫法不太一樣;說它不是 C 語言呢,但是這些程序確確實實是在一個 C 文件中。此時,你肯定懷疑你看到的是一個“假的 C 語言”!
比如,下面的宏定義:
#define mult_frac(x, numer, denom)({\\
typeof(x) quot = (x) / (denom);\\
typeof(x) rem = (x) % (denom);\\
(quot * (numer)) + ((rem * (numer)) / (denom));\\
})
#define ftrace_vprintk(fmt, vargs)\\
do {\\
if (__builtin_constant_p(fmt)) {\\
static const char *trace_printk_fmt __used \\
__attribute__((section("__trace_printk_fmt"))) = \\
__builtin_constant_p(fmt) ? fmt : NULL; \\
__ftrace_vbprintk(_THIS_IP_, trace_printk_fmt, vargs);\\
}
else \\
__ftrace_vprintk(_THIS_IP_, fmt, vargs);\\
} while (0)
字符驅動的填充:
static const struct
file_operations
lowpan_control_fops = {
.open =lowpan_control_open,
.read = seq_read,
.write=lowpan_control_write,
.llseek = seq_lseek,
.release = single_release,
};
內核中實現打印功能的宏定義:
#define pr_info(fmt, ...)\\
__pr(__pr_info, fmt, ##__VA_ARGS__)
#define pr_debug(fmt, ...)\\
__pr(__pr_debug, fmt, ##__VA_ARGS__)
你沒有看錯,這些其實也是 C 語言,但并不是標準的 C 語言語法,而是我們 Linux 內核使用的 GNU C 編譯器擴展的一些 C 語言語法。這些語法在 C 語言教材或資料中一般不會提及,所以你才會似曾相識而又感到陌生,看起來感覺“怪怪的”。我們在做 Linux 驅動開發,或者閱讀 Linux 內核源碼過程中,會經常遇到這些“稀奇古怪”的用法,如果不去了解這些特殊語法的具體含義,可能就對代碼的理解造成一定障礙。
本文和接下來的幾篇文章,將帶領大家一起去了解 Linux 內核或者 GNU 開源軟件中,常用的一些 C 語言特殊語法擴展,掃除閱讀 Linux 內核或 GNU 開源軟件時,這些擴展特性帶給我們的語法閱讀障礙和困惑。
C 語言標準和編譯器
在進入正式學習之前,先給大家普及一下 C 標準的概念。在學習 C 語言時,大家在教材或資料上,或多或少可能見到過“ANSI C”的字眼。可能當時沒有太在意,其實“ANSI C” 表示的就是 C 語言標準。
什么是 C 語言標準呢?我們生活的現實世界,就是由各種標準構成的,正是這些標準,我們的社會才會有條不紊的運行。比如我們過馬路,遵循的交通規則就是一個標準:紅燈停,綠燈行,黃燈亮了等一等。當行人和司機都遵循這個默認的標準時,我們的交通系統才會順暢運行。電腦中的 USB 接口也是一種標準,當大家生產的 USB 產品都遵循 USB 協議這種通信標準時,我們的手機、U 盤、USB 攝像頭、USB 網卡才可以在各種電腦設備上互插互拔。2G、3G、4G 也是一種標準,當不同廠家生產的基帶芯片都遵循這種通信標準,我們所用的不同品牌、不同操作系統的手機才可能互相打電話、互相發微信、互相給對方點贊。
同樣,C 語言也有它自己的標準。我們知道,C 語言程序需要通過編譯器,編譯生成二進制指令,才能在我們的電腦上運行。在 C 語言剛發布的早期,各大編譯器廠商開發自己的編譯器時,各自開發,各自維護,時間久了,就會變得比較混亂。這就會造成這樣一種局面:程序員寫的程序,在一個編譯器上編譯通過,在另一個編譯器編譯通不過。大家按各自的習慣來,誰也不服誰,就像春秋戰國時代:不同的貨幣、不同的度量衡,不同的文字,都是中國人,因為標準不統一,所以交流起來很麻煩,這樣下去也不是辦法啊。
后來 ANSI(AMERICAN NATIONAL STANDARDS INSTITUTE: 美國國家標準協會,簡稱 ANSI)出山了,聯合 ISO(國際化標準組織)召集各個編譯器廠商大佬,各種技術團體,一起喝個茶、開個碰頭會,開始啟動 C 語言的標準化工作。期間各種大佬之間也是矛盾重重,充滿各種爭議,但功夫不負有心人,經過艱難的磋商,終于在1989年達成一致,發布了 C 語言標準,后來第二年又做了一些改進。于是,就像秦始皇統一六國、統一文字和度量衡一樣,C 語言標準終于問世了!因為是在 1989 年發布的,所以人們一般稱其為 C89 或 C90 標準,或者叫做 ANSI C。
C 標準內容
C 標準里主要講了什么?
C 標準英文文檔,洋洋灑灑幾百頁,講了很多東西,但總體歸納起來,主要就是 C 語言編程的一些語法慣例,比如:
- 定義各種關鍵字、數據類型
- 定義各種運算規則
- 各種運算符的優先級和結合性
- 數據類型轉換
- 變量的作用域
- 函數原型
- 函數嵌套層數
- 函數參數個數限制
- 標準庫函數
C 標準發布后,大家都遵守這個標準:程序員開發程序時,按照這種標準寫;編譯器廠商開發編譯器時,也按照這種標準去解析、翻譯程序。不同的編譯器廠商支持統一的標準,這樣大家寫的程序,使用不同的編譯器,都可以正確編譯、運行,大大提高程序的開發效率,推動了 IT 行業的發展。
C 標準的發展過程
C 標準并不是永遠不變的,就跟移動通信一樣,也是從 2G、3G、4G 到 5G 不斷發展變化的。C 標準也經歷了下面四個階段:
- K&R C
- ANSI C
- C99
- C11
K&R C
K&R C 一般也稱為傳統 C。在 C 標準沒有統一之前,C 語言的作者 Dennis Ritchie 和 Brian Kernighan 合作寫了一本書《C 程序設計語言》。早期程序員編程,這本書可以說是絕對權威。這本書很薄,內容精煉,主要介紹了 C 語言的基本使用方法。后來《C 程序設計語言》第二版問世,做了一些修改:比如新增 unsigned int、long int、struct 等數據類型;把運算符 =+/=- 修改為 +=/-=,避免運算符帶來的一些歧義和 Bug。這本書可以看作是 ANSI 標準的雛形。但早期的 C 語言還是很簡單的,比如還沒有定義標準庫函數、沒有預處理命令等。
ANSI C
ANSI C 是 ANSI(美國國家標準協會)在 K&R C 的基礎上,統一了各大編譯器廠商的不同標準,并對 C 語言語法和特性做了一些擴展,而發布的一個標準。這個標準一般也叫做 C89/C90,也是目前各種編譯器默認支持的 C 語言標準。ANSI C 主要新增了以下特性:
- 增加 signed、volatile、const 關鍵字
- 增加 void* 數據類型
- 增加預處理器命令
- 增加寬字符、寬字符串
- 定義了 C 標準庫
- ……
C99 標準
C99 標準是 ANSI 1999 年在 C89 標準的基礎上新發布的一個標準,該標準對 ANSI C 標準做了一些擴充,比如新增一些關鍵字,支持新的數據類型:
- 布爾型:_Bool
- 復數:_Complex
- 虛數:_Imaginary
- 內聯:inline
- 指針修飾符:restrict
- 支持long long、long double數據類型
- 支持變長數組
- 允許對結構體特定成員賦值
- 支持16進制浮點數、float _Complex等數據類型
- ……
除此之外,C99 標準也借鑒其它語言的一些優點,對語法和函數做了一系列改進,大大方便了程序員開發程序,比如:
- 變量聲明可以放代碼塊的任何地方。ANSI C 規定變量的聲明要全部寫在函數語句的最前面,否則就會報編譯錯誤?,F在不需要這樣寫了,哪里需要使用變量,在哪里直接聲明使用即可;
- 源程序每行最大支持4095個字節。這個貌似足夠用了,沒有什么程序能復雜到一行程序有4KB個字符;
- 支持//單行注釋。ANSI C使用/**/沒有C++的//注釋方便,所以 C99 新標準借鑒過來了,也開始支持這種注釋方式;
- 標準庫新增了一些頭文件:如 stdbool.h、complex.h、stdarg.h、fenv.h 等。大家在 C 語言中經常返回的 true、false,其實這也是 C++ 里面定義的 bool 類型。那為什么我們經常這樣寫,而編器編譯程序時沒有報錯呢,這是因為早期大家編程使用的都是 VC++6.0 系列,是 C++ 編譯器。還有一種可能就是有些 IDE 對這個數據類型的數據做了封裝。
C11 新標準
C11 標準是2011年發布的最新 C 語言標準,修改了 C 語言標準的一些 Bug、新增了一些特性:
- 增加 _Noreturn,聲明函數無返回值;
- 增加_Generic:支持泛型編程;
- 修改了標準庫函數的一些 Bug:如 gets( )函數被 gets_s() 函數代替;
- 新增文件鎖功能;
- 支持多線程;
- ……
從 C11 標準的修改內容來看,也慢慢察覺到 C 語言未來的發展趨勢:C 語言現在也在借鑒現在編程語言的優點,不斷添加到自己的標準里面。比如現代編程語言的多線程、字符串、泛型編程等,C 語言最新的標準都支持。但是這樣下去,C 語言是不是還能保持她“簡單就是美”的優雅特色呢,我們只能慢慢期待了。但至少目前我們不用擔心這些,因為 C11 新發布的標準,目前絕大多數編譯器還不支持,所以我們暫時還用不到。
編譯器對 C 標準的支持
標準是一回事,各種編譯器支不支持是另一回事,這一點,大家要搞清楚。這就跟手機一樣,不同時期發布的手機對通信標準支持也不一樣。早期的手機可能只支持 2G 通信,后來支持 3G,現在發布的新款手機基本上都支持 4G了,而且可以兼容 2G/3G。
現在 5G 標準正在研發,快發布了,據說 2019 年發布,2020 年商用。但是目前還沒有手機支持 5G 通信,就跟現在沒有編譯器支持 C11 標準一樣。
不同編譯器,甚至對 C 標準的支持也不一樣。有的編譯器只支持 ANSI C,這是目前默認的 C 標準。有的編譯器可以支持 C99,或者支持 C99 標準的部分特性。目前對 C99 標準支持最好的是 GNU C 編譯器,據說可以支持 C99標準99%的新增特性。
編譯器對 C 標準的擴展
不同編譯器,出于開發環境、硬件平臺、性能優化的需要,除了支持 C 標準外,還會自己做一些擴展。
在51單片機上用 C 語言開發程序,我們經常使用 Keil for C51 集成開發環境。你會發現 Keil for C51 或其他 IDE 里的 C 編譯器會對 C 語言標準作很多擴展。比如增加各種關鍵字:
- data:RAM 的低128B空間,單周期直接尋址;
- code:表示程序存儲區;
- bit:位變量,常用來定義單片機的 P0~P3 管腳;
- sbit:特殊功能位變量;
- sfr:特殊功能寄存器;
- reentrant:重入函數聲明。
如果你在程序中使用以上這些關鍵字,那么你的程序就只能使用51編譯器來編譯運行,你使用其它的編譯器,比如 VC++6.0,是編譯通不過的。
同樣的道理,GCC 編譯器,也對 C 標準做了很多擴展:
- 零長度數組
- 語句表達式
- 內建函數
- __attribute__特殊屬性聲明
- 標號元素
- case 范圍
- ...
比如支持零長度數組。這些新增的特性,C 標準目前是不支持的,其它編譯器也不支持。如果你在程序中定義一個零長度數組:
int a[0];
只能使用 GCC 編譯器才能正確編譯,使用 VC++ 6.0編譯器編譯可能就通不過,因為微軟的 C++ 編譯器不支持這個特性。
本教程主要內容
本文是《C語言嵌入式Linux高級編程》第5期:Linux內核中GNU C語法擴展視頻教程的文本預覽版,如果想系統學習一下C語言標準及Linux內核中的GNU C擴展語法,可以到51CTO學院或CSDN學院搜索講師名字:“王利濤”,即可觀看相關教程?;蛘咴诎俣戎校苯铀阉鳌巴趵麧币部梢哉业较嚓P視頻教程。
在 GNU 開源軟件、Linux 內核中會大量使用 GCC 自己擴展的語法,這會對我們理解開源軟件、Linux 內核代碼帶來一定障礙和困擾。本教程主要介紹 GNU C 對 C 標準擴展的一些常用語法和使用。終極目標是看懂 Linux 內核驅動、GNU 開源軟件中這些特殊語法的應用,掃除這些特殊語法對我們理解內核代碼帶來的困擾和障礙。
本教程需要的學習環境
在本教程講解中,會使用一些 arm-linux-gnueabi-gcc 等命令用來編譯和反匯編程序。所以在學習本教程之前,確保你的電腦上有如下 Linux 環境或源代碼:
- Linux學習環境:Ubuntu、Fedora等皆可;
- arm-linux-gnueabi-gcc 交叉編譯工具;
- Linux 內核源碼:Linux 4.4.x
- U-boot-2016.09 源代碼
備注
本教程是《C語言嵌入式Linux高級編程》第5期:Linux內核中的GNU C語法擴展,文本預覽版,如果想系統學習Linux內核中的各種GNU C擴展及使用技巧,可百度搜索:“王利濤”,到51CTO學院或CSDN學院點擊相關課程即可開始系統學習。
如果您手頭暫時沒有 Linux 學習環境,也可以在 Windows 環境下安裝 C-Free 學習。教程中的 C 語言示例程序在 C-Free 環境下面也能編譯通過。當然在這里,還是建議您使用虛擬機安裝一個 Linux 學習環境,一個良好的環境更有利于我們的學習,在安裝過程有什么疑惑,可以通過郵件(3284757626@qq.com)聯系,也可以加入QQ群(475504428),參與技術討論。
微信公眾號:宅學部落
-
C語言
+關注
關注
180文章
7618瀏覽量
138709 -
LINUX內核
+關注
關注
1文章
316瀏覽量
21867 -
GNU
+關注
關注
0文章
143瀏覽量
17598
發布評論請先 登錄
相關推薦
評論