大家好,有很多同學問能不能發下之前的文章,后續我會找一些之前閱讀量不錯的發下,本文首發于2021年12月,以下是正文。
假定給你一塊非常小的內存,這塊內存只有8字節,這里也沒有高級語言,沒有操作系統,你操作的數據單位是單個字節,你該怎樣讀寫這塊內存呢?
注意這里的限定,再讀一遍,沒有高級語言,沒有操作系統,在這樣的限制之下,你必須直面內存讀寫的本質。
這個本質是什么呢?
本質是你需要意識到內存就是一個一個裝有字節的小盒子,這些小盒子從0到N編好了序號。
這時如果你想計算1+2,那么你必須先把1和2分別放到兩個小盒子中,假設我們使用Store指令,把數字1放到第6號小盒子,那么用指令表示就是這樣:
store 1 6
注意看這條指令,這里出現了兩個數字:1和6,雖然都是數字,但這兩個數字的含義是不同的,一個代表數值,一個代表內存地址。
與寫對應的是讀,假設我們使用load指令,就像這樣:
load r1 6
現在依然有一個問題,這條指令到底是數字6寫入r1寄存器還是把第6號小盒子中裝的數字寫入r1寄存器?
可以看到,數字在這里是有歧義的,它既可以表示數值也可以表示地址,為加以區分我們需要給數字添加一個標識,比如對于前面加上$符號的就表示數值,否則就是地址:
store $1 6 load r1 6這樣就不會有歧義了。
現在第6號內存中裝入了數值1:
即地址6代表數字1:
地址6 -> 數字1
但“地址6”對人類來說太不友好了,人類更喜歡代號,也就是起名字,假設我們給“地址6”換一個名字,叫做a,a代表的就是地址6,a中存儲的值就是1,用人類在代數中直觀的表示就是:
a = 1
就這樣所謂的變量一詞誕生了。
我們可以看到,從表面上看變量a等價于數值1,但背后還隱藏著一個重要的信息,那就是變量a代表的數字1存儲在第6號內存地址上,即變量a或者說符號a背后的含義是:
表示數值1
該數值存儲在第6號內存地址
到現在為止第2個信息好像不太重要,先不用管它。
既然有變量a,就會有變量b,如果有這樣一個表示:
b = a
把a的值給到b,這個賦值在內存中該怎么表示呢?
很簡單,我們為變量b也找一個小盒子,假設變量b放在第2號小盒子上:
可以看到,我們完全copy了一份變量a的數據。
現在有了變量,接下來讓我們升級一下,假設變量a不僅僅可以表示占用1個字節的數據,也可以表示占用任意多內存的數據,就像這樣:
現在變量a占據5個字節,足足占用了整個內存的一大半空間,此時如果我們依然想要表示b = a會怎樣呢?
如果你依然采用copy 的方法會發現我們的內存空間已經不夠用了,因為整個內存大小就8字節,采用copy的方法僅這兩個變量代表的數據就將占據10字節。
怎么辦呢?
不要忘了變量a背后可是有兩個含義的,再讓我們看一下:
表示數值1
該數值存儲在第6號內存地址
重點看一下第2個含義,這個含義告訴我們什么呢?
它告訴我們不管一個變量占據多少內存空間,我們總可以通過它在內存中地址找到該數據,而內存地址僅僅就是一個數字,這個數字和該數據占用空間的大小無關。
啊哈,現在變量的第2個含義終于排上用場了,如果我們想用變量b也去指代變量a,干嘛非要直接copy一份數據呢?直接使用地址就不好了,就像這樣:
變量a在內存中地址為3,因此變量b中我們可以僅僅存儲3這個數字即可。
現在變量b就開始變得非常有趣了。
首先變量b沒什么特殊的,只不過變量b存儲的東西我們不可以按照數值來解釋,而是必須按照地址來解釋。
當一個變量不僅僅可以用來保存數值也可以保存內存地址時,指針誕生了。
有很多資料僅僅說指針就是地址,但小風哥認為這是一種偷懶的解釋,僅僅停留在匯編層面來理解,有失偏頗,在高級語言中,指針首先是一個變量,只不過這個變量保存的恰好是地址而已,指針是內存地址的更高一級抽象。
如果僅僅把指針理解為內存地址的話你就必須知道所謂的間接尋址。
這是什么意思呢?
如果使用匯編語言來加載變量a的值該怎么寫呢?
load r1 1
想一想,這是不是會有問題,因此這樣的話該指令會把數值3加載到r1寄存器中,然而我們想要把內存地址1中保存的數值也解釋為內存地址,這時必須為1再次添加一個標識,比如@:
load r1 @1
這時該指令會首先把內存地址1中保存的值讀取出來發現是3,然后再次把3按照內存地址進行解釋,3指向的數據就是變了a:
地址1 -> 地址3 -> 數據a
這就是所謂的間接尋址,Indirect addressing,在匯編語言下你必須能意識到這一層間接尋址,因為在匯編語言中是沒有變量這個概念的。
然而高級語言則不同,這里有變量的概念,此時地址1代表變量b,但使用變量的一個好處就在于很多情況下我們只需要關心其第一個含義,也就是說我們只需要關心變量b中保存了地址3,而不需要關心變量b到底存儲在哪里,這樣使用變量b時我們就不需在大腦里想一圈間接尋址這一問題了,在程序員的大腦里變量b直接指向數據a:
b -> 數據a再來對比一下:
地址1->地址3->數據a#匯編語言層面 變量b->數據a#高級語言層面
這就是為什么我說指針其實是內存地址的更高級抽象,這個抽象的目的就在于屏蔽間接尋址。
當變量不僅僅可以存值也可以存放地址時,一個全新的時代到來了:看似松散的內存在內部竟然可以通過指針組織起來,同時這也讓程序直接處理復雜的數據結構成為可能,比如就像下圖這樣:
這就是所謂的鏈表了。
指針這個概念首次出現在 PL/I 語言中,當時是為了增加鏈表處理能力,大家不要以為鏈表這種數據結構是非常司空見慣的,這在1964年左右并不是一件容易的事情,關于鏈表你還可以參考這篇《徹底理解鏈表》。
值得一提的是,Multics操作系統就是 PL/I 語言實現的,這也是第一個用高級語言實現的操作系統,然而Multics操作系統在商業上并不成功,參與該項目的Ken Thompson, Dennis Ritchie后來決定自己寫一個更簡單的,Unix以及C語言誕生了,或許是在開發Multic時見識到了PL/I語言中指針的威力,C語言中也有指針的概念。
審核編輯:湯梓紅
-
嵌入式
+關注
關注
5096文章
19214瀏覽量
308491 -
C語言
+關注
關注
180文章
7617瀏覽量
138093 -
函數
+關注
關注
3文章
4350瀏覽量
63084 -
指針
+關注
關注
1文章
482瀏覽量
70636
原文標題:徹底理解C語言中的指針
文章出處:【微信號:良許Linux,微信公眾號:良許Linux】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
C語言中指針的定義

評論