一文讀懂雙機熱備份和單機容錯的區(qū)別
目前主流應(yīng)用的服務(wù)器容錯技術(shù)有三類,它們分別是:服務(wù)器群集技術(shù)、雙機熱備份技術(shù)和單機容錯技術(shù)。它們各自所對應(yīng)的容錯級別是從低到高的,也就是說服務(wù)器群集技術(shù)容錯級別最低,而單機容錯技術(shù)級別最高。由此可知它們各自應(yīng)用的行業(yè)容錯級別需求也是從低到高的。本文主要介紹后兩種容錯技術(shù),先來看一下雙機熱備份容錯技術(shù)。
一、雙機熱備份技術(shù)
雙機熱備份技術(shù)是一種軟硬件結(jié)合的較高容錯應(yīng)用方案。該方案是由兩臺服務(wù)器系統(tǒng)和一個外接共享磁盤陣列柜(也可沒有,而是在各自的服務(wù)器中采取RAID卡)及相應(yīng)的雙機熱備份軟件組成,如圖1所示。
圖1
在這個容錯方案中,操作系統(tǒng)和應(yīng)用程序安裝在兩臺服務(wù)器的本地系統(tǒng)盤上,整個網(wǎng)絡(luò)系統(tǒng)的數(shù)據(jù)是通過磁盤陣列集中管理和數(shù)據(jù)備份的。數(shù)據(jù)集中管理是通過雙機熱備份系統(tǒng),將所有站點的數(shù)據(jù)直接從中央存儲設(shè)備讀取和存儲,并由專業(yè)人員進行管理,極大地保護了數(shù)據(jù)的安全性和保密性。用戶的數(shù)據(jù)存放在外接共享磁盤陣列中,在一臺服務(wù)器出現(xiàn)故障時,備機主動替代主機工作,保證網(wǎng)絡(luò)服務(wù)不間斷。
雙機熱備份系統(tǒng)采用“心跳”方法保證主系統(tǒng)與備用系統(tǒng)的聯(lián)系。所謂“心跳”,指的是主從系統(tǒng)之間相互按照一定的時間間隔發(fā)送通訊信號,表明各自系統(tǒng)當前的運行狀態(tài)。一旦“心跳”信號表明主機系統(tǒng)發(fā)生故障,或者備用系統(tǒng)無法收到主機系統(tǒng)的“心跳” 信號,則系統(tǒng)的高可用性管理軟件認為主機系統(tǒng)發(fā)生故障,主機停止工作,并將系統(tǒng)資源轉(zhuǎn)移到備用系統(tǒng)上,備用系統(tǒng)將替代主機發(fā)揮作用,以保證網(wǎng)絡(luò)服務(wù)運行不間斷。
雙機熱備份方案中,根據(jù)兩臺服務(wù)器的工作方式可以有三種不同的工作模式,即:雙機熱備模式、雙機互備模式和雙機雙工模式。下面分別予以簡單介紹。
雙機熱備模式即目前通常所說的active/standby 方式,active服務(wù)器處于工作狀態(tài);而standby 服務(wù)器處于監(jiān)控準備狀態(tài),服務(wù)器數(shù)據(jù)包括數(shù)據(jù)庫數(shù)據(jù)同時往兩臺或多臺服務(wù)器寫入(通常各服務(wù)器采用RAID磁盤陣列卡),保證數(shù)據(jù)的即時同步。當active服務(wù)器出現(xiàn)故障的時候,通過軟件診測或手工方式將standby機器激活,保證應(yīng)用在短時間內(nèi)完全恢復正常使用。典型應(yīng)用在證券資金服務(wù)器或行情服務(wù)器。這是目前采用較多的一種模式,但由于另外一臺服務(wù)器長期處于后備的狀態(tài),從計算資源方面考量,就存在一定的浪費。
雙機互備模式,是兩個相對獨立的應(yīng)用在兩臺機器同時運行,但彼此均設(shè)為備機,當某一臺服務(wù)器出現(xiàn)故障時,另一臺服務(wù)器可以在短時間內(nèi)將故障服務(wù)器的應(yīng)用接管過來,從而保證了應(yīng)用的持續(xù)性,但對服務(wù)器的性能要求比較高。配置相對要好。
雙機雙工模式:是目前cluster(群集)的一種形式,兩臺服務(wù)器均為活動,同時運行相同的應(yīng)用,保證整體的性能,也實現(xiàn)了負載均衡和互為備份,需要利用磁盤柜存儲技術(shù)(最好采用San方式)。WEB服務(wù)器或FTP服務(wù)器等用此種方式比較多。
二、單機容錯技術(shù)
從上面的分析我們知道,雙機熱備份技術(shù)所采用的是兩臺配置完全一樣的服務(wù)器系統(tǒng),其實服務(wù)器群集方案中的容錯技術(shù)也是一種多服務(wù)器容錯技術(shù)。而本節(jié)所要介紹的單機容錯技術(shù)則是在一臺服務(wù)器實現(xiàn)高性能容錯的,它的容錯能力要遠比服務(wù)器群集和雙機熱備份中容錯能力要高,所以更加適合那些如證券、電信、金融、醫(yī)療等對容錯能力特別苛刻的行業(yè)。
以往的集群系統(tǒng)在出現(xiàn)故障的情況下,需要中斷服務(wù)器的運行,然后用一定的時間切換至備用的服務(wù)器上面進行運行,才能進行維修和恢復,這其中所付出的成本和帶來的損失是用戶最不愿意看到的。具有容錯技術(shù)的容錯服務(wù)器,最大的優(yōu)勢就在于它能夠自動分離故障模塊,在不中斷運行的情況下,進行模塊調(diào)換,對損壞的部件進行維護,并且在一切物理故障消除后,系統(tǒng)會自動重新同步運行,從而有效的解決了客戶的后顧之憂。正因如此,具有容錯技術(shù)的容錯服務(wù)器,正在沖擊前幾年興起的雙機熱備份和集群技術(shù),越來越被人們所關(guān)注。同時,更為難得的是它可以在采用符合工業(yè)標準部件的服務(wù)器中實現(xiàn)(IA架構(gòu)服務(wù)器),極具競爭力的成本優(yōu)勢,更使得容錯服務(wù)器令人刮目相看。
容錯服務(wù)器是通過CPU時鐘鎖頻,通過對系統(tǒng)中所有硬件的備份,包括CPU、內(nèi)存和I/O總線等的冗余備份;通過系統(tǒng)內(nèi)所有冗余部件的同步運行,實現(xiàn)真正意義上的容錯。系統(tǒng)任何部件的故障都不會造成系統(tǒng)停頓和數(shù)據(jù)丟失。目前很多容錯系統(tǒng)是基于IA架構(gòu)的服務(wù)器,與 Windows 2000完全兼容,實現(xiàn)以前只有在RISC系統(tǒng)上才能實現(xiàn)的容錯。這種容錯技術(shù)在IA服務(wù)器上的實現(xiàn),將IA服務(wù)器的可靠性提高到了99.999%,同時服務(wù)器的運行是不間斷的。
雙機熱備份和容錯服務(wù)器的定位稍微有些不同,這是由兩者實現(xiàn)的可用性差別決定的。雙機熱備份一般可以實現(xiàn)99.9%的可用性,容錯服務(wù)器卻可以實現(xiàn)99.999%的可用性。這樣,雙機熱備份大多應(yīng)用在業(yè)務(wù)連續(xù)性不是很嚴格的行業(yè),比如說公安系統(tǒng)、部隊系統(tǒng)或者個別的制造企業(yè),這些行業(yè)的應(yīng)用允許數(shù)據(jù)有一小段時間的中斷。而如電信、金融、證券和醫(yī)療等要求高的行業(yè)則是容錯服務(wù)器的天下。還要注意的一點是雙機熱備份與服務(wù)器群集并不一樣,雙機熱備份通常要求兩對路服務(wù)器的配置完全一樣,而服務(wù)器群集則沒有這方面的嚴格要求,這也是許多讀者容易混淆的。
另外,雙機熱備份方式由于需要至少2臺服務(wù)器,導致在軟件采購(操作系統(tǒng)、中間件、雙機備份軟件等)、軟件維護升級、系統(tǒng)硬件升級都需要比單機容錯方式多1倍的額外投入,而且在雙機備份軟件出現(xiàn)故障后,其維修的難度較高,對客戶會帶來較大困難。因此雖然單機容錯服務(wù)器的硬件成本高于雙機備份方式的硬件投入,而其總成本(TCO)卻遠遠低于雙機備份方式的成本。但是就其靈活配置方面,雙機熱備份方案更具優(yōu)勢,許多熱備份方案都是由一些系統(tǒng)集成商組合不同廠家服務(wù)器產(chǎn)品進行的,可以滿足不同客戶需求。但總體來說,容錯服務(wù)器是未來發(fā)展的趨勢。
非常好我支持^.^
(16) 100%
不好我反對
(0) 0%
相關(guān)閱讀:
- [電子說] 亞馬遜云科技宣布Amazon Trainium2實例正式可用 2024-12-06
- [電子說] 虛擬化數(shù)據(jù)恢復—VMware ESX服務(wù)器常見故障的數(shù)據(jù)恢復方案 2024-12-05
- [電子說] 常用的服務(wù)器負載均衡多少錢一臺? 2024-12-05
- [電子說] 兆芯亮相2024數(shù)字科技生態(tài)大會 2024-12-05
- [電子說] 浪涌保護器在數(shù)據(jù)中心的重要性 2024-12-05
- [電子說] 服務(wù)器數(shù)據(jù)恢復—RAID5陣列熱備盤同步數(shù)據(jù)失敗的數(shù)據(jù)恢復案例 2024-12-04
- [電子說] UPS不間斷電源能保護哪些設(shè)備 2024-12-04
- [電子說] 不同配置云服務(wù)器及硬盤費用一覽 2024-12-04
( 發(fā)表人:黃飛燕 )