在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

詳談SSD故障預測技術

架構師技術聯盟 ? 來源:SCS存儲專委 ? 2023-01-03 14:27 ? 次閱讀

在上篇文章“企業級存儲盤中的操作特性”中,基于一家主要存儲供應商的近200萬個SSD的大量企業存儲系統,對生產使用中SSD的關鍵操作特性進行了大規模的現場研究。今天接著分享SSD故障預測技術。

固態驅動器(SSD)故障很可能導致系統級故障,從而導致停機,從而使SSD故障預測對大規模SSD部署至關重要。現有的SSD故障預測研究大多基于定制的SSD,具有專有的監控指標,難以重現。為了支持不同驅動器模型和供應商的一般SSD故障預測,本文提出了一種向外更新集成特征排序(WEFR),以自動化、魯棒的方式選擇智能屬性作為學習特征。WEFR結合了不同的特征排序結果,根據復雜度度量和磨損程度的變化點檢測,自動生成最終的特征選擇。

01 背景及動機

一、數據收集

本文從阿里巴巴的五個基于ssd的數據中心收集數據。該數據集涵蓋了從2018年1月到2019年12月的為期兩年的、來自三個供應商的6個驅動器模型的近500Kssd。本文將這三個供應商稱為MA、MB和MC,每個供應商都包括兩個驅動器模型(用供應商后面的數字表示)。本文的數據集包括兩種數據類型:SMART日志和故障票據。

SMART日志。SMART是一種廣泛采用的監視磁盤驅動器狀態(稱為屬性)的工具。SMART屬性是特定于供應商的。它們每個都有原始的和標準化的數值(在SMART屬性名稱之后分別用“R”和“N”表示)。本文每天收集每個SSD的智能屬性。表一顯示了為每個驅動器模型收集的SMART屬性的概述。該數據集總共跨越了22個SMART屬性。

故障記錄。本文的維護系統在每個服務器上部署監視守護進程,定期執行基于規則的檢測,以檢查異常行為和故障。一旦檢測到異常行為和故障,維護系統就會生成故障報告(稱為故障記錄單)。每個故障記錄單記錄驅動器ID和故障發生的時間戳。該數據集總共涵蓋了7K個SSD故障的故障記錄單。

二、故障預測

本文將SSD故障預測作為一個離線分類問題,以預測SSD是否會在未來一段時間內(例如,在未來30天內)失敗。本文將每個SMART屬性的原始值和標準化值視為兩個學習特征,并將一個學習特征的向量稱為輸入變量。本文將驅動器狀態視為一個指標變量(稱為目標變量)(0表示健康狀態,1表示失敗)。本文將每天SSD的學習特性和驅動狀態作為樣本。本文將出現失敗ssd和健康ssd對應的樣本分別稱為陽性樣本和陰性樣本。離線故障預測的工作流程包括數據預處理、特征選擇、特征生成、預測模型訓練、預測模型驗證和預測。

三、特征選擇方法

本文考慮了五種最先進的SSD故障預測的特征選擇方法。

皮爾遜相關度量學習特征與目標變量之間的線性關系。

斯皮爾曼相關性測量了學習特征和目標變量之間的單調關系(不僅僅是線性關系)。它被之前的工作用于SSD故障預測。

J-index使用分類任務來衡量一個學習特征對目標變量的類別進行正確分類的能力。它被之前的工作用于預測HDD故障。

隨機森林提供特征重要性評估,它衡量在學習特征中添加噪聲后分類精度的降低程度。特征重要性得分較高的特征對HDD故障預測精度的影響較大。之前的工作也將隨機森林用于預測SSD故障。

XGBoost還提供了特征重要性評估,它測量了訓練具有學習特征的所有增強樹的分割數,以及在樹中使用該特征的平均增益。

02 特征重要性研究

一、特性對SSD故障預測的重要性

c40215ba-8941-11ed-bfe3-dac502259ad0.png

表三顯示了預測每個驅動器模型的SSD故障的頂部和最后三個重要的學習特征。除了重要的學習特征外,本文還觀察到存在一些瑣碎的特征(例如,PSCN和MA2的特征重要性得分和PMSCR的特征重要性得分僅為0.001)。這種瑣碎的學習特征可能會降低作為噪聲的SSD預測精度。因此,特征選擇對于預測SSD故障是必要的。

二、使用不同選擇方法的特征重要性

表4顯示,MC1的前5個重要學習特征的排名因特征選擇方法的不同而不同。這一發現也適用于其他驅動器模型(表中未顯示)。這種不同的排名帶來了以下問題:(i)哪種特征選擇方法對SSD故障預測更有效?(ii)本文應該選擇多少個重要的功能?

c437999c-8941-11ed-bfe3-dac502259ad0.png

三、在不同的磨損程度下的特征重要性

c45f34a2-8941-11ed-bfe3-dac502259ad0.png

表五顯示出在不同的磨損程度下,相同的使用隨機森林在同一數據集中進行特征選擇卻出現了不同的結果。這提示本文不同磨損階段是否有著不同的表現。

c47d0da6-8941-11ed-bfe3-dac502259ad0.png

圖1顯示了六種驅動模型的存活率與MWIN之間的關系。本文觀察到,MA1、MA2、MC1和MC2的存活率隨MWIN的變化而變化,而MB1和MB2的存活率由于變化范圍較小而沒有明顯的變化趨勢。具體來說,對于MA1、MA2和MC1的存活率隨著MWIN的降低而降低,而對于MC2,隨著MWIN的降低,MWIN的存活率首先增加到70左右,然后由于固件逐漸固定的一些問題而降低。這表明,SSD的特性可能會隨著磨損程度的變化而變化。因此,特征的重要性也可能隨著MWIN值的不同而改變。

03 磨損更新的集成特征選擇

本文提出了磨損更新集成特征排序(WEFR),這是一種實用的特征排序方法,在自動和穩健的屬性中選擇學習特征,從而推廣不同模型和供應商的SSD故障預測。WEFR解決了在SSD故障預測的特征選擇方面面臨的以下挑戰:

健壯的功能選擇。不同的特征選擇方法可以選擇不同的學習特征。此外,特征選擇方法并不總是最優的各種驅動模型。因此,WEFR應該結合特征選擇方法,以一種穩健的方式來選擇特征。

正在更新功能選擇。選擇的特性不同具有不同磨損程度的SSD。此外,ssd的磨損程度也隨時間的增加而增加。因此,WEFR應該為MWIN值的ssd選擇學習特征,并隨著時間的推移更新所選特征。

算法概述:

算法1顯示了WEFR的工作流程。具體來說,它將來自相同驅動器模型的SMART屬性的學習特征作為輸入。它采用常用的特征選擇方法進行初步的特征選擇,并根據特征的重要性對學習特征進行排序。為了防止某些方法的偏差(即無效的特征選擇),它刪除了與其他方法偏差較大的排名,并通過排名的平均值(排名行1-7)獲得最終排名。它根據最終的排名自動確定特征計數,并選擇最終的學習特征(第8行)。如果它檢測到MWIN的存活率的變化點,它將更新具有不同MWIN組的SSD組的所選特征(第9-15行)。最后,它輸出在同一驅動器模型中的所有ssd或每一組MWIN的學習的學習特性。

c4a75fc0-8941-11ed-bfe3-dac502259ad0.png

偏差的計算如下圖所示:

c4c3705c-8941-11ed-bfe3-dac502259ad0.png

04 實驗結果

一、魯棒特征選擇的有效性

c4d2cfa2-8941-11ed-bfe3-dac502259ad0.png

本文比較了沒有特征選擇(即使用所有學習特征)和五種最先進的特征選擇方法(第II-C節)的WEFR的預測精度。對于五種最先進的特征選擇方法,本文將所選特征的百分比從10%線性調整到100%,以找到最高的預測精度。表VI顯示,與沒有特征選擇相比,WEFR對MA1、MA2、MB1、MB2、MC1和MC2的固定召回率分別提高了13%(8%)、18%、18%(12%)、17%(10%)、25%(13%)、12%(6%)和13%(6%)。總的來說,與所有驅動模型沒有特征選擇相比,WEFR將精度(f0.5分數)提高了22%(10%),證實了特征選擇對SSD故障預測的重要性。

二、自動特征選擇的有效性

本文評估了WEFR中自動特征選擇的有效性,并將其與使用固定百分比的被選擇特征(從10%線性增加到100%)進行比較。圖2顯示,當確定6個驅動器模型的所選特性的百分比時,WEFR的F0.5-score始終高于或等于最高的F0.5-score。具體來說,WEFR自動確定的MA1、MA2、MB1、MB2、MC1、MC2所選擇的特征的百分比分別為31%、34%、28%、26%、63%和28%,在確定所選特征的百分比時,與最高F0.5-score對應的所選特征的百分比接近。請注意,使用自動特性選擇也比調優生產中選定特性的適當百分比更靈活。

c500010c-8941-11ed-bfe3-dac502259ad0.png

三、更新特征選擇的有效性

從表7中可以看出,與不更新特征選擇相比,WEFR通過更新MA1、MA2、MC1和MC2的選定特征,提高了精度和F0.5-score。具體來說,與WEFR(無更新)相比,WEFR將MA1、MA2、MC1和MC2的精度(F0.5-score)分別提高了6%(4%)、4%(2%)、5%(2%)和6%(2%)。

c51c41aa-8941-11ed-bfe3-dac502259ad0.png

對于低MWIN的ssd,與WEFR(無更新)相比,WEFR對MA1、MA2、MC1和MC2的精度(f0.5分數)分別提高了13%(9%)、12%(8%)、13%(6%)和13%(6%)。這證實了特征的重要性隨著MWIN的變化而變化,有必要用MWIN更新所選的特征。高MWIN的WEFR和WEFR之間的F0.5-score(無更新)差異不顯著,且在1%以內(未見表七)。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 存儲
    +關注

    關注

    13

    文章

    4355

    瀏覽量

    86175
  • SSD
    SSD
    +關注

    關注

    21

    文章

    2887

    瀏覽量

    117860
  • 故障預測
    +關注

    關注

    0

    文章

    6

    瀏覽量

    6676
  • 固態驅動器
    +關注

    關注

    0

    文章

    12

    瀏覽量

    10441

原文標題:收藏:詳談SSD故障預測技術

文章出處:【微信號:架構師技術聯盟,微信公眾號:架構師技術聯盟】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    EMC難不難做?帶你讀懂EMC 詳談EMC

    讀懂EMC:詳談EMC
    的頭像 發表于 07-31 11:23 ?2770次閱讀
    EMC難不難做?帶你讀懂EMC <b class='flag-5'>詳談</b>EMC

    SSD是什么意思,什么是SSD

    100MB/S,高于市面上60 MB/S的速度。每一個新生事物的出現總會遇到價格偏高的問題,SSD也因其研發成本、技術含量等問題,價格相對于其他存儲設備來說要高,但其優勢也還是非常明顯的。有專家預測,到2010年
    發表于 03-25 16:20

    采用nvSRAM確保企業級SSD故障時電源可靠性

      SSD技術概覽  固態驅動器(SSD)是采用固態半導體存儲器(如NAND閃存)而非傳統硬盤驅動器(HDD)中磁性元件來永久存儲信息的一種數據存儲設備。由于數據可隨機存取,不像HDD那樣受磁盤轉動
    發表于 09-26 09:44

    關于電機的深度學習故障預測簡析

    故障預測數據數據獲取數據預處理模型CNNLSTMGAN具體情況特殊處理數據量較大數據量不足特征雜糅
    發表于 09-13 07:23

    詳談服務器電源

    詳談服務器電源 在服務器各個部件中,電
    發表于 12-26 17:23 ?2592次閱讀

    旋轉機械的故障預測方法綜述

    介紹了各種方法的實際應用情況。最后,探討了旋轉機械故障預測技術的難點問題以及發展趨勢。
    發表于 03-05 09:13 ?2015次閱讀

    Linux內核編譯詳談

    Linux內核編譯詳談
    發表于 10-30 09:51 ?7次下載
    Linux內核編譯<b class='flag-5'>詳談</b>

    支持向量機的故障預測模型

    針對現有的故障預測技術無法從整體上反映系統性能下降趨勢等問題,提出一種基于健康度分析的故障預測方法。首先,在支持向量機回歸算法基礎上構造多輸
    發表于 12-29 11:24 ?0次下載

    三星FIP故障定位技術,讓SSD的壽命提升

    三星最近開發了一種可以檢測NAND芯片故障技術,該技術可以提升SSD的壽命和可靠性,并且宣布將在即將發布的PCIe 4.0 SSD產品中使
    的頭像 發表于 11-18 15:53 ?3464次閱讀

    SSD硬盤的故障分析以及解決辦法

    SSD硬盤故障是否曾讓你感覺到困擾呢?今天快快小編就來給大家詳細介紹SSD硬盤故障的4大原因,并附上解決措施,希望對小伙伴們有幫助。
    的頭像 發表于 04-02 14:54 ?8030次閱讀

    詳談數組和指針的區別與聯系

    詳談數組和指針的區別與聯系
    的頭像 發表于 06-29 15:18 ?2.3w次閱讀
    <b class='flag-5'>詳談</b>數組和指針的區別與聯系

    SSD故障的四個主要原因及解決辦法

    與硬盤驅動器相比,SSD更加可靠;然而,并沒有完美的存儲技術。即使是最新的NVMeSSD,也可能會突然或逐漸出現故障
    發表于 12-08 11:01 ?1.1w次閱讀

    基于RNN的GIS故障預測算法及系統設計

    基于RNN的GIS故障預測算法及系統設計
    發表于 07-01 15:38 ?30次下載

    SSD故障排查與解決方案

    隨著固態硬盤(SSD)的普及,越來越多的用戶選擇使用SSD作為電腦的主要存儲設備。然而,SSD在使用過程中也可能會出現各種故障。 一、SSD
    的頭像 發表于 11-11 11:11 ?1593次閱讀

    MVTRF:多視圖特征預測SSD故障

    固態硬盤( Solid State Drive,SSD )在大型數據中心中發揮著重要作用。SSD故障會影響存儲系統的穩定性,造成額外的維護開銷。為了提前預測和處理
    的頭像 發表于 12-30 11:04 ?208次閱讀
    MVTRF:多視圖特征<b class='flag-5'>預測</b><b class='flag-5'>SSD</b><b class='flag-5'>故障</b>
    主站蜘蛛池模板: 精品国产午夜久久久久九九 | 午夜国产福利在线 | bt天堂网在线资源www | 久久综合九色婷婷97 | 国产一区二区在线视频播放 | 午夜小视频网站 | 在线 你懂的 | 久久久久九九精品影院 | 狠狠狠色丁香婷婷综合激情 | 欧美极品另类 | www.射射| 日韩在线视频一区二区三区 | 在线a免费| 成人欧美精品久久久久影院 | 亚洲福利一区二区 | 手机视频在线播放 | 欧美性狂猛bbbbbxxxxx | 色综合成人网 | 第三级视频在线观看 | 欧美日本一区 | 午夜宅男在线 | 久久久噜噜噜久久中文字幕色伊伊 | 丁香激情综合网 | 五月婷婷爱 | 校园激情综合网 | 黄色一级日本 | 四虎影院2022 | 天天视频免费入口 | mm131美女肉体艺术图片 | 亚洲综合色婷婷中文字幕 | 综合激情婷婷 | 激情都市亚洲 | 国产裸露片段精华合集链接 | 欧美不卡一区 | 天天爽天天 | free性乌克兰高清videos | 狠狠色丁香婷婷久久综合不卡 | 在线观看国产日本 | 亚洲午夜久久久精品影院视色 | 色婷婷狠狠久久综合五月 | 一区二区三区久久 |