在 C# 中 Object 是所有類的基類,所有的結(jié)構(gòu)和類都直接或間接的派生自它。前面這段話可以說所有的 C# 開發(fā)人員都知道,但是我相信其中有一部分程序員并不清楚甚至不知道我們常用的 ToString 、 Equals 和 GetHashCode 虛方法都來自于 Object 類,并且我們可以對(duì)它們進(jìn)行重寫。重寫這三個(gè)虛方法可以說在項(xiàng)目開發(fā)中經(jīng)常用到,只不過大部分開發(fā)人員并未留意這三個(gè)虛方法可以重寫,而是自己寫方法來實(shí)現(xiàn)。
下面我就來具體講解一下它們?nèi)齻€(gè)應(yīng)該怎么重寫。在這里我需要說明的是本篇文章會(huì)大量涉及到設(shè)計(jì)規(guī)范和設(shè)計(jì)要求,代碼只是作為輔助理解的形式出現(xiàn),因此文章中的所有代碼將會(huì)以代碼段的形式出現(xiàn)。
一、ToString
ToString 重寫是這三種方法中重寫最簡(jiǎn)單的,也是最常用的。但是有一部分開發(fā)人員認(rèn)為重寫 ToString 方法意義不大,那么我在這里要說的是這種想法是錯(cuò)誤的。當(dāng)我們?cè)趯?duì)象上調(diào)用 ToString 時(shí)默認(rèn)返回的是類的完全限定名稱,比如說我們?cè)?System.IO.File 對(duì)象上調(diào)用這個(gè)方法,就會(huì)返回字符串 System.IO.File ,這個(gè)結(jié)果往往并不是我們所需要的結(jié)果并且這個(gè)結(jié)果也沒有什么意義。例如我們?cè)谝粋€(gè) User 類中重寫 ToString 方法,每次調(diào)用 User.ToString() 時(shí)返回 “XXX今年XX歲”,如果我們不重寫 ToString 方法的話就得不到我們想要的結(jié)果。因此我們必須重寫,這時(shí)我們就可以這么寫。
public class User
{
public int Id {get;set;}
public string Name {get;set;}
public int Age {get;set;}
public string Sex {get;set;}
public override string ToString()
{
return $“{Name}今年{Age}歲!”;
}
}
重寫之后我們就可以得到我們想要的輸出內(nèi)容了。雖然重寫 ToString 可以得到我們想要的內(nèi)容,但是我們不能在任何情況下都重寫 ToString, 只有在以下三種情況下方可重寫 ToString :
代碼面對(duì)的最終用戶是開發(fā)人員;
需要寫入日志;
IDE調(diào)試輸出。
在上面三種情況下重寫 ToString 我們還需要遵循一些設(shè)計(jì)規(guī)范,這些設(shè)計(jì)規(guī)范并不是微軟所定義的,而是開發(fā)人員在開發(fā)過程中總結(jié)出來的:
ToString 返回的字符串長(zhǎng)度應(yīng)該簡(jiǎn)短,內(nèi)容描述應(yīng)該清晰;
不要從 ToString 方法中返回 “”,而要返回 null ;
不要再 ToString 方法中引發(fā)并拋出異常,針對(duì)異常應(yīng)該及時(shí)捕獲并處理;
如果返回值存在地域文化(比如語(yǔ)言)或存在格式化要求,那么就必須重寫 ToString 方法;
ToString 重寫后必須返回獨(dú)一無(wú)二的字符串來標(biāo)識(shí)實(shí)例對(duì)象。
到這里為止我們講解完了 ToString 重寫的方法以及規(guī)則。相對(duì)來說 ToString 方法重寫是 Object 虛方法重寫中十分簡(jiǎn)單的部分,作為開發(fā)人員只需按照我前面多說的規(guī)則、方法以及實(shí)際情況來重寫即可。
二、 Equals 和 ReferenceEquals
在 C# 中如果對(duì)兩個(gè)對(duì)象進(jìn)行相等判斷,一共有兩種情況分別是:判斷兩者的值相等 或者 判斷兩者的引用地址相同 。一般情況下我們需要對(duì)值類型對(duì)象判斷值相等,對(duì)引用類型對(duì)象判斷指向地址相同。Equals 就是用來對(duì)引用類型對(duì)象判斷指向地址是否相同的。對(duì)于重寫 Equals 方法,很多開發(fā)人員認(rèn)為易如反掌,但是在開發(fā)中往往忘記一些很重要的細(xì)節(jié),這些細(xì)節(jié)對(duì)于程序來說至關(guān)重要,下面我將一一進(jìn)行詳細(xì)講解。
同一和相等 所謂的同一指的是兩個(gè)對(duì)象如果引用的是同一個(gè)實(shí)例,那么我們就說這兩個(gè)對(duì)象具有同一性。在 C# 中我們可以利用 object 類或者它的派生類中的 ReferenceEquals 靜態(tài)方法來判斷對(duì)象之間的同一性。但是同一只是相等的一種,因?yàn)樵谀承┣闆r下兩個(gè)對(duì)象的部分值或者全部值相等但引用不同,我們也可以說它們具有相等性。下面我們來看一個(gè)例子,這個(gè)例子通過重寫相等性來實(shí)現(xiàn)兩個(gè)對(duì)象的相等性。
class Program
{
static void Main(string[] args)
{
Student s1 = new Student
{
Age = 12,
Id = 1,
Name = “小明”
};
Student s2 = new Student
{
Age = 13,
Id = 1,
Name = “小明”
};
if (Student.ReferenceEquals(s1, s2))
{
Console.WriteLine(“是同一個(gè)學(xué)生”);
}
else
{
Console.WriteLine(“不是同一個(gè)學(xué)生”);
}
Console.Read();
}
}
class Student
{
public int Id { get; set; }
public string Name { get; set; }
public int Age { get; set; }
public static bool ReferenceEquals(Student s1, Student s2)
{
if (s1.Equals(s2) ||
object.ReferenceEquals(s1, s2) ||
s1.Id==s2.Id
s1==s2)
{
return true;
}
else
{
return false;
}
}
}
從上述代碼中我們可以看出,雖然 s1 和 s2 引用是不相等的,但是這兩個(gè)對(duì)象使用了相同的 Id ,因此我們認(rèn)為 Id 相同的學(xué)生就是同一個(gè)學(xué)生。這么做可以確保數(shù)據(jù)庫(kù)中不會(huì)出現(xiàn)重復(fù)的錄入。
Tip:只有引用類型才會(huì)可能出現(xiàn)引用相等的情況,對(duì)于值類型來說調(diào)用 ReferenceEquals 方法永遠(yuǎn)返回的是 false ,因?yàn)橹殿愋娃D(zhuǎn)換成 object 時(shí)是需要裝箱的,即是傳遞的兩個(gè)參數(shù)是同一個(gè)值,也會(huì)返回 false 。
Equals 判斷兩個(gè)對(duì)象是否相等,可以使用 Equals ,通過它可以判斷出兩個(gè)對(duì)象是否具有相同的數(shù)據(jù)。在 object 中這個(gè)方法只是調(diào)用了 ReferenceEquals 方法來判斷同一性,因此在必要的時(shí)候我們必須重寫 Equals 方法。一般來說重寫 Equals 方法常用的步驟如下:
檢查對(duì)象是否為 null ;
判斷是否是引用類型,如果是就判斷引用是否相等;
判斷數(shù)據(jù)類型是否相等;
調(diào)用具體類型的輔助方法,參數(shù)必須是要比較的類型;
判斷哈希碼是否相等,這一步需進(jìn)行短路操作和字段比較;
在基類的 Equals 方法被重寫的前提下,必須檢查基類的 Equals 方法;
判斷關(guān)鍵字段的值是否相等;
重寫 GetHashCode 方法;
重寫 == 、 != 操作符。
Tip: 如果類型是密封類型,那么第三步可以省略掉。
我們不僅需要按照上述的步驟重寫 Equals 方法,還需要注意如下幾點(diǎn):
GetHashCode 方法不一定返回的是獨(dú)一無(wú)二的值,因此我們不能僅僅依賴它的返回值來判斷兩個(gè)對(duì)象是否相等;
我們不能在 GetHashCode 和 Equals 中引發(fā)任何異常;
必須保證對(duì)象之間可以隨意比較,且不能觸發(fā)任何異常;
必須實(shí)現(xiàn)重寫 Equals 、 GetHashCode 、 == 和 != ,且重寫的算法必須相同;
盡量不要在可變類型上重寫相等性操作符。
三、 GetHashCode
在上一小節(jié)中我們也注意到在重寫 Equals 過程中我們需要重寫 GetHashCode 方法。 所謂 Hash Code 就是用來生成和對(duì)象值對(duì)應(yīng)的數(shù)字,從而高效的平衡哈希表的作用。 重寫 GetHashCode 方法是比較困難的,下面我就來詳細(xì)講解一下重寫規(guī)則、方法和注意事項(xiàng)。重寫 GetHashCode 方法需要從性能、安全方面考慮,同時(shí)也需要滿足一些要求。
性能 由于哈希碼的返回值是 int 類型,因此會(huì)出現(xiàn)部分對(duì)象包含的值比 int 取值范圍大的情況,這時(shí)哈希碼就肯定會(huì)存在重復(fù)的情況,所以這時(shí)我們要保證哈希碼的返回值盡可能的唯一。此外針對(duì)哈希碼的算法我們要盡可能的保證返回的哈希碼應(yīng)當(dāng)在 int 類型取值范圍內(nèi)平均分布。在 Equals 中利用 GetHashCode 方法進(jìn)行短路操作時(shí)我們必須對(duì)算法的性能進(jìn)行優(yōu)化,避免將類型作為字典集合中的鍵類型使用,因?yàn)檫@會(huì)導(dǎo)致頻繁的調(diào)用 GetHashCode 方法。在設(shè)計(jì) GetHashCode 的算法時(shí)應(yīng)保證良好的平衡性,即無(wú)論哈希表如何對(duì)哈希值進(jìn)行 bucketing,也不會(huì)破壞平衡性。一般來說最理想的狀態(tài)是兩個(gè)對(duì)象間 1 bit 的差異應(yīng)該造成哈希碼 16 bit 的差異。
安全 在安全性這方面首先應(yīng)該遵循的是難以偽造哈希碼對(duì)象,一般來說攻擊者會(huì)向哈希表中寫入大量哈希值相同的數(shù)據(jù),這時(shí)如果哈希表實(shí)現(xiàn)效率不高將會(huì)收到拒絕服務(wù)攻擊。我們一般會(huì)向來自相關(guān)類型的哈希碼使用異或操作,且保證操作數(shù)不相近或者相等。如果出現(xiàn)操作數(shù)相近或者相等的情況,那么應(yīng)該考慮使用位移和加法操作。但是多次使用 and 操作符會(huì)出現(xiàn)哈希值為 0 的情況,而多次使用 or 操作符則會(huì)出現(xiàn)哈希值為 1 的情況,這一點(diǎn)需要注意一下。更進(jìn)一步的做法是,我們?cè)陂_發(fā)中應(yīng)該使用移位操作符來分解比 int 大的類型。
要求 要求是性能和安全的基礎(chǔ),只要完全符合了要求的規(guī)定,性能和安全才能很好的起作用。要求的第一點(diǎn)也是最基礎(chǔ)的優(yōu)點(diǎn),相等的對(duì)象它們的哈希碼也相等,其次在特定的生命周期內(nèi),特定對(duì)象的 GetHashCode 的返回值始終是一樣的,最后 GetHashCode 不能引發(fā)任何異常,如果其中出現(xiàn)異常也必須返回一個(gè)值來表示內(nèi)部出現(xiàn)異常。
四、總結(jié)
本篇文章主要講解了重寫 object 中虛方法的知識(shí),其中涉及到了很多 C# 核心內(nèi)容,這些內(nèi)容和知識(shí)在實(shí)際開發(fā)中用的很多,但是大多數(shù)開發(fā)人員并不在意,因此我希望讀者閱讀完我這篇文章后能對(duì)這些內(nèi)容和知識(shí)有初步的了解。
責(zé)任編輯:Ct
評(píng)論