數(shù)據(jù)中心管理工作需要你定期學(xué)習(xí)新知識,這會使你的工作變得有趣或緊張–取決于在探索新主題時你所擁有的資源。
下面讓我們看看2020年最受歡迎的SearchDataCenter技巧,這些技巧可幫助你獲得知識并深入研究新的興趣領(lǐng)域。
分析服務(wù)器故障的主要原因
如果沒有服務(wù)器,任何數(shù)據(jù)中心基礎(chǔ)架構(gòu)都無法運行。這意味著我們必須嘗試預(yù)測可能導(dǎo)致代價高昂的停機時間的任何潛在問題或事件—特別是對于關(guān)鍵任務(wù)硬件。
服務(wù)器故障的主要原因包括電源中斷、灰塵阻塞和溫度調(diào)節(jié)不良、固件過時、硬件配置問題和網(wǎng)絡(luò)攻擊。
面對這么多可能導(dǎo)致服務(wù)器故障的情況,重要的是部署有效的備用電源硬件;定期進行物理維護并使用ASHRAE準(zhǔn)則設(shè)置溫度;部署定期軟件更新策略;持續(xù)檢查電纜設(shè)置;并遵守安全協(xié)議。
對于總體規(guī)劃,你的團隊?wèi)?yīng)確保所有備用電源設(shè)置都可以正常工作,并且,制定災(zāi)難恢復(fù)計劃,以防所有數(shù)據(jù)中心意外脫機的情況。
了解Linux
Linux是服務(wù)器和數(shù)據(jù)中心管理的行業(yè)標(biāo)準(zhǔn),但是對于它的確切含義以及它在數(shù)據(jù)中心中的功能,仍然存在疑問。在最基本的級別上,Linux是操作系統(tǒng),你可以在基礎(chǔ)架構(gòu)中的服務(wù)器上運行。
但Linux又很不尋常,因為它是開源操作系統(tǒng),這會影響許可。GNU通用公共許可證有條款說明你可以在何種情況下使用、修改和分發(fā)該操作系統(tǒng)。在這種許可模式下,其想法是該操作系統(tǒng)仍是開源的,可供所有人免費使用。
Linux與macOS和Windows OS的另一個主要區(qū)別是內(nèi)核。由于開源社區(qū)不斷維護和更新內(nèi)核,因此它是需要實時維護的服務(wù)器基礎(chǔ)結(jié)構(gòu)的理想選擇。Linux內(nèi)核包含用于內(nèi)存管理、進程管理、網(wǎng)絡(luò)堆棧、虛擬文件系統(tǒng)和系統(tǒng)調(diào)用接口的子系統(tǒng),以及架構(gòu)和設(shè)備驅(qū)動程序。
設(shè)置IT更新策略
根據(jù)你企業(yè)的規(guī)模,你可能會參與IT預(yù)算或采購策略。每當(dāng)高層管理人員決定采購新技術(shù)時,重要的是要考慮業(yè)務(wù)原因,即為什么要臨時更新其基礎(chǔ)架構(gòu)。
升級任何技術(shù)的最大原因是服務(wù)器硬件(對任何數(shù)據(jù)中心來說都是必不可少的部分)隨著時間推移而變得越來越不可靠。IDC研究指出,服務(wù)器性能平均每年下降14%。
另外,如果你每年或每兩年更新服務(wù)器硬件,則你的團隊可以了解更準(zhǔn)確的整體預(yù)計支出。這意味著你可以預(yù)測企業(yè)將花多少錢來升級硬件,而不用處理因過載或過度運行硬件帶來的任何意外費用。
除服務(wù)器技術(shù)外,更新策略還使你的企業(yè)有機會使用更環(huán)保更節(jié)能的硬件來降低總體運營成本。
購買更新的硬件是整合基礎(chǔ)架構(gòu)并簡化數(shù)據(jù)中心管理的一種方法,無論你只是需要更少的計算機還是決定運行更多的虛擬或基于云的應(yīng)用程序。
解決內(nèi)核恐慌問題
沒有人喜歡系統(tǒng)全面停機。就像Window的藍(lán)屏死機一樣,內(nèi)核恐慌是指某些情況會突然使你的OS崩潰,例如內(nèi)存不足、惡意軟件、軟件錯誤或驅(qū)動程序崩潰。
為了弄清楚如何使操作系統(tǒng)恢復(fù)在線狀態(tài),可以使用kdump崩潰工具。通過此過程,你可以使用kdump工具在崩潰時收集所有系統(tǒng)信息,并執(zhí)行根本原因分析,以對Linux內(nèi)核進行故障排除。
通過Linux發(fā)行版、兩個VM客戶端和網(wǎng)絡(luò)文件系統(tǒng),你可以使用一系列命令來安裝網(wǎng)絡(luò)文件系統(tǒng)、確定要在何處存儲系統(tǒng)日志,然后模擬內(nèi)核崩潰。通過此設(shè)置,你可以確定崩潰期間運行了哪些進程、打開了哪些文件以及存儲在虛擬內(nèi)存中的內(nèi)容。
這些信息以及kdump崩潰工具是執(zhí)行任何分析并使Linux內(nèi)核恢復(fù)正常的必經(jīng)之路。
正確停用大型機
在醫(yī)療保健和金融等行業(yè),大型機技術(shù)仍然具有相關(guān)性。盡管隨著新基礎(chǔ)架構(gòu)出現(xiàn)以及人員退休,你的企業(yè)可能沒有專業(yè)技能或需要運行這些大規(guī)模計算設(shè)置。
如果你考慮停用大型機,第一步是讓你的團隊決定哪些數(shù)據(jù)應(yīng)保留在企業(yè)內(nèi)以及大型機應(yīng)支持的軟件。這將幫助你運行應(yīng)用程序清單,從而確定企業(yè)仍需要或可停用的應(yīng)用程序。
你可以調(diào)查大型機的外包業(yè)務(wù),但這可能非常昂貴,盡管這是最簡單的選擇。這樣做可以使過渡更加順暢,并消除有關(guān)物理硬件處理的問題。
還可以選擇重新構(gòu)建大型機應(yīng)用程序,使其可在x86硬件運行,以便你可以將軟件托管在自己的數(shù)據(jù)中心或云端。只要沒有重大代碼更改,此選項就很容易,但是當(dāng)該軟件脫離大型機,你需要使用應(yīng)用程序數(shù)據(jù)的頻率可能會影響你決定將其托管的位置。你還必須查看你的團隊必須采用哪些新應(yīng)用程序來應(yīng)對大型機不再可用這一事實。
最后,還有大型機的物理處置,這不是簡單的事情。為了正確安全地進行移除,你應(yīng)該遷移所有必要的數(shù)據(jù),對存儲進行消磁或銷毀任何硬盤驅(qū)動器。
責(zé)編AJX
-
Linux
+關(guān)注
關(guān)注
87文章
11401瀏覽量
212041 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9547瀏覽量
86830 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
5039瀏覽量
72957
發(fā)布評論請先 登錄
相關(guān)推薦
評論