在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何減少數據中心中最嚴重硬件故障?

lhl545545 ? 來源:千家網 ? 作者:千家網 ? 2021-02-25 16:40 ? 次閱讀

硬件故障在大型數據中心和云服務基礎設施中非常普遍,這些故障可能導致違反服務水平協議(SLA)并造成巨大經濟損失。

內存故障是當今數據中心中最嚴重的硬件故障之一,眾所周知,它嚴重影響了系統的可靠性、可用性和可維護性(RAS)。這些故障可能是由超出正常使用范圍的多種因素引起的,包括制造缺陷以及極端的環境或操作條件。

雖然普遍接受的技術,例如,糾錯碼(ECC)和可糾正錯誤,基于閾值的預測性故障分析(PFA))可克服雙列直插式內存模塊(DIMM)的一些可糾正錯誤,但它們具有成本、可靠性、覆蓋范圍和性能方面的影響。

可糾正錯誤數量的激增可能導致服務器性能下降,甚至導致拒絕服務。此外,ECC和基于閾值的可糾正錯誤的PFA不能幫助克服無法糾正的錯誤,如災難性故障通常導致崩潰。

對于嚴重依賴服務器可靠性、可用性和可維護性的組織,英特爾內存故障預測(Intel MFP)是理想的解決方案。對于當今的數據中心而言,提前預測未來的內存故障已變得至關重要。通過分析歷史數據以預測潛在的災難性事件,英特爾?MFP可以在內存故障事件發生之前對其進行預測。

該解決方案具有多項創新和原始功能。它基于歷史數據來預測行、列和單元格中的微型故障,并使用低開銷的在線學習方法來提高其預測精度并避免干擾關鍵的計算任務。

這也使Intel MFP能夠為主動內存故障管理生成估計的內存運行狀況評分,從而使用戶能夠采取相應的措施。英特爾MFP與供應商無關,并且可以與其他數據中心管理解決方案(包括英特爾數據中心管理器(Intel DCM))一起使用。

將與內存故障相關的服務器崩潰減少40%

在騰訊的一個案例研究中,英特爾MFP算法的初步協作測試顯示出快速的結果,并將內存故障和系統停機時間減少了五倍。合作伙伴還通過在操作系統級別明智地避免出現內存故障,直到更換了該內存模塊為止,從而擴展了此支持。

在與美團的類似案例研究中,該公司發現由于內存錯誤導致的服務器崩潰減少了40%。該公司通過將Intel MFP集成到其現有數據中心管理解決方案中,監控了服務器內存模塊的運行狀況。通過分析以前由其數據中心管理軟件收集的數據,他們能夠為每個DRAM模塊生成預測分數,然后采取適當的措施來維護其SLA并最大化服務正常運行時間。

借助新功能,英特爾與全球領先的AMI合作,通過其BIOS、BMC和安全解決方案為全球互聯數字基礎架構提供電源、管理和保護,并決心將這種支持擴展到整個行業。

因為捕獲和分析內存錯誤需要UEFI和BMC固件之間緊密的聯系,所以AMI致力于使Intel MFP易于被現有和將來的服務器平臺采用。

捕獲錯誤后,它們將由BIOS記錄,然后某些元數據信息將傳遞到BMC固件。然后,BMC固件將獲取此元數據,并通過Intel MFP引擎運行,以計算內存模塊的運行狀況得分。當檢測到新的錯誤時,AMI解決方案將跟蹤每個內存模塊的運行狀況評分,并公開結果供系統管理員進行分析。

AMI的默認實現在BUI的Web UI中提供當前的內存模塊運行狀況得分信息,并通過遵循DMTF Redfish標準的RESTful API公開相同的內存運行狀況得分信息。

RESTful API可輕松與現有數據中心管理軟件集成。但是,對于那些不太愿意與自己的軟件集成的數據中心,AMI提供了一個稱為AMI Composer的數據管理工具,該工具開發為完全符合Intel Rack Scale Design和DMTF Redfish標準,它將匯總所有信息并通過一個基于Web的儀表板。

為數據中心和云服務提供商帶來的直接好處

當然,在創建機器學習算法時,它實際上永遠不會完成。當前的Intel MFP模型支持在具有Intel Xeon可擴展處理器的平臺上運行的DDR4內存模塊,并且Intel繼續收集有關內存錯誤和內存模塊故障的更多信息,以改進模型。

此外,當新的內存模塊類型引入行業或對現有技術進行改進時,英特爾?MFP將為它們提供支持。

最重要的是,將對所有更新進行適當的分析以包含在MFP模型中,以便在英特爾更新MFP模型時,AMI將為提供給行業合作伙伴的現有技術提供易于實現的更新。

對于數據中心和云服務提供商而言,在Aptio V UEFI固件和MegaRAC BMC固件中添加Intel MFP支持的好處顯而易見。改進了數據中心SLA。通過主動的內存運行狀況評估和增強的內存頁面脫機策略,可以降低DIMM故障率。

而且,最重要的是,更高的DIMM性能和可靠性可優化工作負載和虛擬機(VM)遷移決策,從而提高效率和靈活性,同時降低總擁有成本。

對于希望在配備AMI Aptio V UEFI BIOS和MegaRAC BMC固件的系統上利用英特爾MFP的公司,建議他們要求其系統制造商將AMI連同用于MegaRAC BMC固件的帶有Intel MFP選件包的AMI和具有英特爾內存故障預測功能的AMI一起包括在內。適用于Aptio UEFI固件的eModule。
責任編輯:pj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10183

    瀏覽量

    174147
  • 服務器
    +關注

    關注

    13

    文章

    9730

    瀏覽量

    87445
  • 數據中心
    +關注

    關注

    16

    文章

    5171

    瀏覽量

    73287
  • 騰訊
    +關注

    關注

    7

    文章

    1678

    瀏覽量

    50185
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    小型數據中心晶振選型關鍵參數全解

    。建議使用良好的接地設計和低阻抗走線來減少干擾。 總結 在小型數據中心中,差分晶體振蕩器(DCO)扮演著至關重要的角色,尤其是在交換機、路由器、網絡接口卡(NIC)、存儲設備和光纖通信設備等高速、精密
    發表于 06-11 13:37

    曙光數創SLiquid智能運維系統解決數據中心運維難題

    面對數字時代的海量需求,傳統數據中心正遭遇系統性挑戰:告警風暴引發的故障定位遲滯、能效困局導致的PUE優化瓶頸、資產迷霧造成的資源錯配、容量盲區引發的規劃失焦。這些問題嚴重阻礙了數據中心
    的頭像 發表于 06-03 10:21 ?289次閱讀

    適用于數據中心和AI時代的800G網絡

    。 高可靠性與低延遲 飛速(FS)800G光模塊具有超低功耗和高信號完整性特性,有助于減少數據中心的能源消耗,同時保障數據傳輸的低延遲和高可靠性。 靈活擴展與兼容性 飛速(FS)800G光
    發表于 03-25 17:35

    優化800G數據中心:高速線纜、有源光纜和光纖跳線解決方案

    廣泛應用于網卡、交換機、服務器、超級計算機、云計算和數據中心的短距離互連。 800G高速線纜 隨著大規模和超大規模數據中心的興起,服務器機架的功耗顯著增加,垂直布線距離減少。因此,800G
    發表于 03-24 14:20

    數據中心中的FPGA硬件加速器

    ? 再來看一篇FPGA的綜述,我們都知道微軟包括國內的云廠商其實都在數據中心的服務器中部署了FPGA,所以這篇論文就以數據中心的視角,來看下FPGA這個硬件加速器。 還是一樣,想要論文原文的可以私信
    的頭像 發表于 01-14 10:29 ?574次閱讀
    <b class='flag-5'>數據中心中</b>的FPGA<b class='flag-5'>硬件</b>加速器

    亞馬遜云科技發布全新數據中心組件

    近日,亞馬遜云科技宣布了一項重大創新,推出了一系列全新的數據中心組件。這些組件旨在滿足新一代人工智能(AI)創新的需求,并幫助客戶應對日益復雜且多變的應用場景。 亞馬遜云科技通過對電源、冷卻以及硬件
    的頭像 發表于 12-24 15:05 ?511次閱讀

    浪涌保護器在數據中心的應用

    在現代數據中心中,電力系統是至關重要的基礎設施,它需要確保服務器、存儲設備和網絡設備等關鍵組件的穩定運行。然而,電力供應并不總是穩定的,可能會受到各種干擾,如雷電、電網波動、設備故障等。這些干擾可能
    的頭像 發表于 11-07 09:28 ?682次閱讀

    英特爾和阿里云開發DDR5內存故障預測和預防解決方案

    在阿里云數據中心,內存故障是服務器穩定運行面臨的主要挑戰之一。大規模數據中心中的內存故障,不僅會降低服務器的可靠性,還可能中斷數據中心的服務
    的頭像 發表于 10-12 10:34 ?1765次閱讀
    英特爾和阿里云開發DDR5內存<b class='flag-5'>故障</b>預測和預防解決方案

    能耗管理 能源分析為什么要在數據中心中進行管理呢?

    電氣工程師:18721098782 王盼盼 可能有很多人還不太明白能耗的管理為什么對數據中心來說如此重要,那首先來說因為數據中心擁有能量密集和高耗能的標簽,耗能是很大的。所以,數據中心的能耗問題也
    的頭像 發表于 09-10 11:00 ?432次閱讀
    能耗管理  能源分析為什么要在<b class='flag-5'>數據中心中</b>進行管理呢?

    淺析如何降低數據中心電力能耗

    ,如何減少數據中心的電力消耗成為了焦點問題。 ? 1 IT設備能耗的降低 數據中心的能耗主要源自IT設備。這些設備的直接能耗不僅增加了電費成本,而且還需要配備相應的電源和冷卻系統,這些系統同樣消耗大量電力,從而進一步增加
    的頭像 發表于 09-02 12:31 ?553次閱讀
    淺析如何降低<b class='flag-5'>數據中心</b>電力能耗

    怎樣保障數據中心不間斷電源不斷電 提供可靠安全的供配電#數據中心

    數據中心配電系統
    安科瑞王金晶
    發布于 :2024年08月29日 14:51:36

    非穩壓中間總線轉換器在數據中心中的應用

    隨著數據中心的供電需求不斷攀升,尤其是那些致力于滿足于AI算力需求的數據中心,電源系統不僅必須要持續提供更高的效率,還要提供更高的功率密度。
    的頭像 發表于 08-22 09:14 ?1362次閱讀
    非穩壓中間總線轉換器在<b class='flag-5'>數據中心中</b>的應用

    半導體存儲器在數據中心中的應用

    半導體存儲器在數據中心中的應用是極其重要且廣泛的,它們不僅是數據中心存儲系統的核心組件,還直接關系到數據處理的效率、可靠性和安全性。以下將詳細闡述半導體存儲器在數據中心中的具體應用,包
    的頭像 發表于 08-20 10:17 ?1237次閱讀

    數據中心使用智能負載組是個好主意#負載 #負載組

    數據中心
    深圳崧皓電子
    發布于 :2024年08月19日 07:43:30

    混合冷卻在數據中心中仍將是必不可少的#混合冷卻

    數據中心
    深圳崧皓電子
    發布于 :2024年08月06日 06:58:06
    主站蜘蛛池模板: 香蕉视频网站在线播放 | 美女性色 | 久久久久免费 | 国产成人啪精品午夜在线播放 | 免费播放特黄特色毛片 | 女人大毛片一级毛片一 | 午夜色图 | 干得好爽| 色综合久久网 | 美女被免费视频的网站 | 亚洲 另类 在线 欧美 制服 | 亚洲天堂视频在线播放 | 亚洲一级免费毛片 | 特级毛片免费视频 | 国产h在线播放 | 色综合97天天综合网 | 天天爱天天操 | 精品视频在线观看视频免费视频 | 国产美女亚洲精品久久久综合 | 日韩一级黄色录像 | 亚洲一区 在线播放 | 97青草| 哪个网站可以看av | 国产精品永久免费 | 中文字幕va| 波多久久夜色精品国产 | 大色综合色综合资源站 | 青青热久免费精品视频在线观看 | 奇米影视欧美 | 二区中文字幕 | 欧美 日韩 中文字幕 | 亚洲视频黄 | 你懂的在线免费观看 | 狠狠乱| 大片毛片女女女女女女女 | 久草干| 色屋在线 | 免费网站在线视频美女被 | 亚洲人成网i8禁止 | 你懂的福利 | 在线观看亚洲专3333 |