對于人類社會而言,最有價值的是人才,對于數字世界而言,最有價值的是數據,對于承載數據的存儲而言,最重要的是穩定。 日前,在SPC-1評測最新數據中,浪潮存儲再奪SPC-1評測全球性能冠軍,全球領跑,AS5600G2以超752萬IOPS,AS5500G5以超330萬IOPS,均在各領域居全球第一。除了性能表現優異之外,讓人印象深刻的還有的浪潮存儲的穩定性。 下面我們就來解析一下浪潮存儲在SPC-1里的極致穩定表現。 SPC-1是存儲行業最專業的測試機構,對于運行在線類業務的存儲,推出了SPC-1測試規范,測試內容主要包括metrics(包含Sustain長穩測試、Repeat壓力測試)、persistence測試,其中metrics主要關注存儲系統的性能和穩定性,persistence主要關注數據一致性和系統可靠性。測試流程如下圖:
SPC-1測試流程 SPC-1的負載由3個ASU(應用存儲單元組成),3個ASU模擬了不同的應用存儲區域,包括臨時存儲區域ASU1、固定存儲區域ASU2、日志存儲區域ASU3,一共對應8個IO stream,業務模型如下圖:
整個SPC-1測試既非常科學,又非常嚴格,涵蓋了存儲系統會遇到的各種壓力模型,最真實的反映了客戶在線業務的需求,除了性能這一指標外,在系統穩定性和可靠性上也提出了極高的要求: 比如8小時的持續烤機測試,不同負載下的穩定性測試、靜默測試、循環壓力測試、反復掉電測試等,中間不能出現任何問題,浪潮存儲經受住了嚴格考驗,交出了一份令人滿意的答卷。浪潮存儲如何做到極致穩定的? 下面我們就從方案架構、軟件架構、硬件架構、可靠性測試等方面來逐一剖析。 需要特別說明的是,我們關注存儲穩定性的時候,許多人只是注意到存儲方案和軟件架構,實際上存儲硬件,如架構、設計、工藝,是否能經受嚴苛的環境和極限的考驗,也同樣重要,在本文的后面會詳細闡述浪潮存儲從架構及軟硬件方面如何確保穩定性的。
1
如何從存儲方案上做到極致穩定? 首先從方案架構來講,浪潮存儲提供了業界最為豐富的方案級存儲保護策略,比如同步異步復制、雙活、兩地三中心等功能。 在短距離(<300公里)場景下,浪潮存儲提供存儲雙活和同步復制解決方案,并且在業內創新性的實現了免網關雙活(如下圖右所示),減少了IO路徑,降低了時延,更重要的是,減少了故障點,提高了系統穩定性,兩種方案對比如下圖: ?
左:業界網關雙倍 右:浪潮存儲免網關雙活 在遠距離場景下(>300公里),浪潮存儲提供異步遠程容災方案,利用高性能磁盤陣列的高級數據復制功能,實現超遠距離的數據遠程復制。
浪潮存儲的異步遠程容災方案 針對最關鍵的業務,業務連續性和數據安全性要求非常高,浪潮提供了兩地三中心存儲解決方案,在生產機房做雙活高可用,同時在異地做遠程數據容災,最大程度的保障了業務連續性和數據安全性。
兩地三中心存儲解決方案
2
如何從軟件架構上做到極致穩定? 從軟件架構講,為了做到極致穩定,浪潮存儲采用了統一、極簡的平臺,可以在一套軟件棧上實現SAN和NAS的統一,實現基于機箱帶內管理和帶外管理的統一;獨立機頭和盤框一體架構的統一;本地存儲和異構存儲的統一,除此之外,浪潮在很多軟件特性上也做了獨有的創新:
浪潮存儲采用統一、極簡的存儲軟件棧 1、 所有功能模塊,均采用輕量級用戶態模式,減少了用戶態與內核態的直接交互,大大降低了對內核的影響。一旦進程發生故障,可以在用戶態進行進程重新拉起,進行輕量級的故障恢復,不必進行控制器復位操作,從而實現系統的IO連續、不中斷,提高了系統的穩定性; 2、 采用分布式Raid,無單獨的熱備盤,硬盤故障時其他所有硬盤同時參與重構,大大降低了硬盤重構時間,降低了二次故障帶來數據丟失的風險; 3、 所有固件可在線升級(比如BIOS、CPLD、Oses、FW、BMC等),確保客戶業務平穩運行,最大程度的降低了升級操作對客戶業務的影響; 4、 豐富的故障檢測手段,比如軟件版本檢測、誤碼檢測、帶寬檢測、速率檢測、慢盤檢測等,可以確保系統在出現任何故障的時候,能第一時間找到問題根因,快速更換故障部件,盡快使系統恢復穩定; 5、 豐富的存儲安全特性,比如本地復制、克隆、快照、鏡像等,確保存儲安全穩定; 6、 針對SSD的應用,業界一直有個難題,就是如何在SSD上實現數據均衡分配,浪潮存儲針對SSD進行單獨的固件優化,會選擇較新的顆粒進行擦寫,較老的隨后擦寫,實現全局智能動態均衡,延長SSD壽命; 7、 端到端的數據一致性保障,數據在存儲系統傳輸中,經過了多個部件、多種傳輸通道和復雜的軟件處理過程,其中任意一個環節發生錯誤都可能會導致數據錯誤。浪潮存儲提供了從主機HBA卡到存儲陣列再到硬盤的T10 PI校驗,保證了數據完整性; 8、 有很多客戶在做IT規劃時,總是會不免擔心電源不穩的情況,而這在生產環境不可避免,浪潮存儲也提前考慮到這種場景,并采用業界領先的AC電源防抖技術,在市電短暫掉電時(<5s),存儲仍能對外提供業務,大大提高了系統的可用性。 ? ? ?
3
如何從硬件架構上做到極致穩定? 從硬件架構講,浪潮存儲沿用和創新了業界先進的技術和理念,從整機部件,到硬件工程,到高速互聯,到電源、固件,浪潮都有大量的專利,積淀了非常豐富的實踐經驗,并創新性的應用到存儲產品里:
浪潮存儲具備從材料到整機,全方位硬件設計能力 1、 部件在線自檢,及時發現隱藏故障,做好提前預防,比如針對BBU,系統每隔一段時間會進行一次故障模擬測試,以便隱藏的故障能及時發現; 2、 豐富全面的溫度感知能力,從芯片,到部件,到板卡,再到機箱,存儲提供了最為豐富的溫度感應系統,可以感知到任何一個芯片,任何一個部件出現的任何溫度異常,以便能第一時間找出故障點,盡快使系統恢復穩定; 3、 所有元器件及模塊均采用業界最嚴格的可靠性設計標準,比如電阻、電容等元器件的耐壓值大于額定工作電壓的2倍,電源模塊實際功耗不超過額定功率的70%,大大降低了超規格使用帶來的失效風險,有效提升了系統的穩定性; 4、 背板采用無源設計,最大程度的減小了元器件失效帶來的整體故障風險,大大降低了故障率,保障業務長期穩定運行; 5、 所有部件均提供冗余,控制器、電源、風扇、BBU等主要部件均有冗余,以確保在出現任何單一部件故障的時候,不會影響客戶業務;
4
如何利用可靠性測試做到極致穩定? 除了架構及軟硬件上的設計確保存儲的穩定可靠,浪潮在研發和生產中還做了很多“臟活”,正是這些“臟活”,進一步確保了浪潮存儲的極致穩定,比如: 在研發過程中,所有產品都會經過嚴格的環境測試,比如高低溫極限測試、震動極限測試、八角測試(溫度、電壓、時鐘頻率的任意拉偏組合)、溫循測試、濕度測試等業界最苛刻的應力測試,在八角測試里,會特地將相關參數拉偏,比如溫度下降到-10度或上升到50度(正常運行是20度左右),電壓拉低到3.2V或拉高到3.4V(正常運行是3.3V),頻率拉低到24.99M或拉高到25.01M(正常25M),實現三種參數的任意組合,進而找到系統的最薄弱點。
極限震動測試 存儲和其他電子產品一樣,其故障模型也會遵循浴盆曲線,在產品剛上市時,故障出現概率較大,度過早期運行后,故障出現的概率會大大降低,因此為了讓產品在客戶處穩定運行,必須把早期故障篩選出來,浪潮存儲在出貨前,會經過老化測試、常穩測試等烤機測試,以確保早期故障能在出貨前有效攔截,降低產品在客戶處的故障率,提升產品在現網運行的穩定性
電子器件故障浴盆曲線
硬盤是易故障部件,也是各存儲廠家和客戶最為困惑的難題,為了解決這一難題,浪潮在生產出貨前會經過嚴格的性能和穩定性測試,比如帶寬測試、訪問時延測試,可以確保所有出貨硬盤的質量得到有效保證,據統計,浪潮存儲的硬盤平均故障率不到0.1%(即1000塊盤,一年內最多有一塊盤故障),大大低于業內平均水平。存儲是一個極為復雜的系統,不僅要有成熟的方案架構和軟硬件架構,更要有匠心般的追求,在最細微處也要做到極致,才能給客戶提供最為穩定可靠的系統,浪潮存儲很好的踐行了這一理念!
-
存儲
+關注
關注
13文章
4520瀏覽量
87277 -
浪潮
+關注
關注
1文章
475瀏覽量
24610
原文標題:【科技放大鏡】登頂SPC-1,兼顧“性能”與“可靠”的雙料王者
文章出處:【微信號:inspurstorage,微信公眾號:浪潮存儲】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
華為企業級Wi-Fi 7產品再奪全球雙冠
2025年第一季度聯想moto繼續領跑全球小折疊手機市場
長城炮全球化進程再提速
曙光存儲FlashNexus登頂SPC-1基準測評
阿詩特能源六連冠!再度斬獲HTW Berlin全球能效檢測雙料冠軍

浪潮信息存儲SATA SSD:技術創新引領數據存儲新時代
浪潮信息存儲SATA SSD:以技術創新,開啟數據存儲新篇章
華為企業級Wi-Fi 7持續領跑全球
鐵威馬全球發售新品,F6-424 Max領跑高性能NAS市場
云知聲山海大模型多項能力全球領跑

奕斯偉計算加入RISE全球性合作項目
浪潮信息AS13000G7榮獲MLPerf? AI存儲基準測試五項性能全球第一

評論