?
Java從誕生以來以其在網絡應用開發上獨特的魅力以及“一次開發,隨處運行”的可移植性引起了人們極大的興趣。Java與以往的高級語言如C/C++相比,在開發方面具有很大的優勢,其中以對象內存管理機制中的垃圾處理機制(GC)最為突出。
1 C/C++與Java對象內存管理差別
C/C++將內存劃分成四部分:數據區、代碼區、棧區、堆區。Java則把內存劃分成三部分即代碼區、棧區、堆區,代碼區主要用于存放程序的代碼,棧區主要用于存放局部變量、內部變量等中間性變量,堆區主要用來存放對象。
C/C++中的對象內存管理是通過語句new()/delete()或malloc()/free()進行申請和釋放的。用new()或malloc()申請內存后,若不使用delete()或free()進行釋放,則所申請的內存一直被占用,即使不使用也不能自動釋放,必須人為釋放,導致編程工作很繁瑣。
Java中的對象內存管理則改進了對內存的釋放過程,使用new()或其他方法申請的內存在不使用時,可以自動進行垃圾處理,釋放內存,從而節省內存,使內存的使用更加高效、合理。
Java中可以通過三種方法來銷毀對象實現內存釋放,這三種方法被稱為Java銷毀對象的三把利劍:垃圾回收器;finalize方法;利用System.gc方法強制啟動垃圾回收器。
垃圾回收是一種動態存儲管理技術,它自動地釋放不再被程序引用的對象,按照特定的垃圾收集算法實現資源自動回收的功能系統,會自動進行GC策略。
2 GC概述
Java垃圾處理主要是針對堆的管理,對堆中不使用的空間進行回收處理。判斷一個對象的內存空間是否無用的標準是:如果該對象不能再被程序中任何一個“活動的部分”所引用,此時該對象的內存空間已經無用。所謂“活動的部分”,是指程序中某部分參與程序的調用,正在執行過程中,尚未執行完畢。
具體以下兩例予以說明:
實例1:
int [][]matrix=new int [2][3];
matrix=null;
此例中,第一句是用new語句在堆中為數組申請了一個空間,然后用matrix來引用此空間的對象(這里數組可以理解為對象),此時這個內存空間就是有用的。第二句是給matrix賦空值,matrix則不再引用此數組。此時,這個空間就是無用的。
實例2:
int [][] m1=new int[2][3];
int [][] m2=new int[2][3];
m1=m2;
此例中,第一句是用new語句在堆中為數組申請了一個空間,用m1引用這個數組。第二句是用new語句在堆中為數組申請了一個空間,用m2引用這個數組。第三句是改變引用對象,把m2的引用賦給m1,則此時m1也引用m2引用的對象數組,因此,m1原來引用的數組無人引用,成為垃圾。
3 傳統收集器簡介
Java依托于垃圾收集GC機制,可以自動回收垃圾即釋放堆空間,讓其他對象可以使用此部分空間。而采用了某種 GC 算法的收集器(Collector)稱之為某某垃圾收集器(Garbage Collector)。目前 Java中采用的垃圾收集器一般包括:引用計數法(Reference Counting Collector)、 Tracing算法(Tracing Collector)、Compacting算法(Compacting Collector)、Coping算法(Coping Collector)、Generation算法(Generational Collector)、Adaptive算法(Adaptive Collector)。
3.1 引用計數法
引用計數法是唯一沒有使用根集的垃圾回收的方法,該算法使用引用計數器來區分存活對象和不再使用的對象。一般來說,堆中的每個對象對應一個引用計數器。當每一次創建一個對象并賦給一個變量時,引用計數器置為1。當對象被賦給任意變量時,引用計數器每次加1,當對象出了作用域后(該對象丟棄不再使用),引用計數器減1,一旦引用計數器為0,對象就滿足了垃圾收集的條件。
基于引用計數器的垃圾收集器運行較快,不會長時間中斷程序執行,必須適宜地實時運行的程序。但引用計數器增加了程序執行的開銷,因為每次對象賦給新的變量,計數器加1,而每次現有對象出了作用域,計數器減1。
3.2 Tracing算法
Tracing算法是為了解決引用計數法的問題而提出,它使用了根集的概念。基于Tracing算法的垃圾收集器從根集開始掃描,識別出哪些對象可達,哪些對象不可達,并用某種方式標記可達對象,例如對每個可達對象設置一個或多個位。在掃描識別過程中,基于Tracing算法的垃圾收集也稱為標記和清除(mark-and-sweep)垃圾收集器。
3.3 Compacting算法
為了解決堆碎片問題,基于tracing的垃圾回收吸收了Compacting算法的思想,在清除的過程中,算法將所有對象移到堆的一端,堆的另一端就變成了一個相鄰的空閑內存區,收集器會對它移動的所有對象的所有引用進行更新,使得這些引用在新的位置能識別原來 的對象。在基于Compacting算法的收集器的實現中,一般增加句柄和句柄表。
3.4 Coping算法
Coping算法的提出是為了克服句柄的開銷和解決堆碎片的垃圾回收。它開始時把堆分成一個對象面和多個空閑面, 程序從對象面為對象分配空間,當對象滿了,基于Coping算法的垃圾收集就從根集中掃描活動對象,并將每個活動對象復制到空閑面(使得活動對象所占的內存之間沒有空閑洞),這樣空閑面變成了對象面,原來的對象面變成了空閑面,程序會在新的對象面中分配內存。
一種典型的基于Coping算法的垃圾回收是stop-and-copy算法,它將堆分成對象面和空閑區域面,在對象面與空閑區域面的切換過程中,程序暫停執行。
3.5 Generation算法
stop-and-copy垃圾收集器的一個缺陷是收集器必須復制所有的活動對象,這增加了程序等待時間,這是Coping算法低效的原因。在程序設計中有這樣的規律:多數對象存在的時間比較短,少數的存在時間比較長。因此,Generation算法將堆分成兩個或多個,每個子堆作為對象的一代(Generation)。由于多數對象存在的時間比較短,隨著程序丟棄不使用的對象,垃圾收集器將從最年輕的子堆中收集這些對象。在分代式的垃圾收集器運行后,上次運行存活下來的對象移到下一最高代的子堆中,由于老一代的子堆不會經常被回收,因而節省了時間。
3.6 Adaptive算法
在特定的情況下,一些垃圾收集算法會優于其他算法。基于Adaptive算法的垃圾收集器就是監控當前堆的使用情況,并將選擇適當算法的垃圾收集器。
4 GC新算法概述
基于上述對幾種收集器算法優缺點的對比分析,提出一種既可以滿足程序對實時性的要求,同時也能避免內存泄漏的較完全的垃圾處理算法。
4.1算法描述
4.1.1內存劃分
(1)把一個堆內存劃分成兩大塊,一塊是活躍區,占堆大小的2/3,活躍區劃分成大小相同的8個塊,并且為每個塊設置一個計數器int cnt[x](x取1~8),用來記錄每塊內存中動態分配的被引用對象總數。另一塊是保留區,占堆大小的1/3,設置兩個常數min和max,分別用來表示保留區的初始大小和最大可增加到的大小。(min的值小于堆大小的1/3,max的值可以自行設置但最大值不超過堆大小的1/3)。
(2)為堆中的每個對象設置一個標記位(標記位放在一個專用數組cnt[x](x取1~8)中)以表示其是否被引用,在對象被引用時計數器就開始動態地統計計數,記錄本塊中被引用的對象個數。
(3)通過比較計數器值的大小來判斷應該掃描哪個塊,而不是利用搜索所有對象的方法。具體結構如圖1。
![](/uploads/allimg/110511/10552353Q-0.gif)
?
4.1.2具體算法
(1)程序開始運行,對象動態地申請堆區,這時,每個塊的計數器啟動,根據引用對象的標記位情況來改變計數器的值,為1則計數器加1,8個計數器值放在數組里,并比較8個計數器值的大小,選取最大的計數器所在塊,進行掃描。
(2)掃描出的垃圾轉移到刪除區,等待被刪除。
(3)繼續比較計數器值,但已經進行掃描的塊不參加此后的比較,待刪除的垃圾占的空間達到min值時,垃圾器開始對活躍區壓縮內存碎片,并且在刪除區同時開始進行垃圾刪除申請。
(4)當刪除區的空間達到了max值時,刪除區的垃圾還沒有被刪除,這時停止活躍區的掃描,等待刪除區進行垃圾刪除。
4.2 實例分析
看下面一段程序:
int [][] m1=new int[2][3];
int [][] m2=new int[2][3];
m1=m2;
此例中,第一句是用new語句在堆中為數組申請了一個空間,然后用matrix引用此空間的對象(這里數組可以理解為對象),此時這個內存空間就是有用的。第二句是給matrix賦空值,matrix則不再引用此數組。此時,這個空間就是無用的。
對于原來的算法,m1引用的數組在堆中是隨機存放的,若要查找垃圾,則會遍歷整個堆內存,先標記,然后再清理垃圾。設耗費時間為Ta。
m1引用的數組在堆中是隨機存放的,所以假設其放在活躍區中的cnt[x]區(x取值為0~7之一),下面分兩種情況來考慮:
(1)最好的情況,m1原來引用的數組放在cnt1中為數組cnt[x]中最大的數,則查找到這個垃圾的時間為: T8+cnt[x]。
![](/uploads/allimg/110511/1055235622-1.gif)
?
由此可以節省7Ta/16的時間。此新算法可以大大減少垃圾處理所需的時間。
Java語言對垃圾的處理是利用Java的垃圾處理器自動進行的,JVM雖然沒有明確程序員必須了解垃圾處理器的過程和實質,但是,一個優秀的Java程序員應該掌握和熟悉垃圾處理器的工作機制,充分利用好內存空間,減少不必要的空間浪費,從而使程序更好地運行。
評論