遠程管理功能(包括帶外管理)是 IT 管理員的標準功能。這些功能包括監(jiān)控系統(tǒng)功能、安裝新的更新和補丁以及解決問題,而無需實際出現在服務器機房中。
許多 IT 服務提供商遠程訪問客戶的本地服務器或將它們托管在云中的某個位置是標準做法。隨著新的 PICMG COM-HPC 接口規(guī)范(圖 1)的到來,支持這種久經考驗的實踐的遠程管理能力將擴展到邊緣服務器和網關層技術。實現數字化和 IIoT、邊緣服務器和網關層技術需要遠程管理能力來克服企業(yè)級 IT 和工業(yè)級運營技術 (OT) 之間的差距。COM-HPC 標準是為新的分布式邊緣計算層設計的。因此,這一新 IT 層的服務提供商需要類似于分布式本地或云設備的全面遠程管理功能。
基于計算機模塊設計邊緣層平臺的工程師通常希望以可以根據特定需求定制的方式實現這些功能。針對這一需求,PICMG 引入了用于系統(tǒng)管理的 COM-HPC 子規(guī)范。為了不重新發(fā)明輪子,COM-HPC 子規(guī)范的部分內容將借鑒智能平臺管理接口 (IPMI) 規(guī)范。
讓我們深入研究專用于系統(tǒng)管理接口的 COM-HPC 子規(guī)范,以了解它如何使 COM-HPC 設計受益。
壽命和穩(wěn)定性很重要
改進邊緣服務器 QoS 的工作落到了 IPMI 身上,因為它自 1998 年以來一直存在,在 2001 年和 2004 年發(fā)布的附加修訂后達到了穩(wěn)健的狀態(tài),并得到普遍接受。PICMG 小組委員會還使用了 Redfish 規(guī)范,該規(guī)范基于 Representational State Transfer (RESTful) API 并繼續(xù)發(fā)布新功能。
IPMI 規(guī)范定義了用于監(jiān)視和管理計算機子系統(tǒng)的協議、接口和體系結構(圖 2)。IPMI 標準化了描述低級硬件的格式以及從板管理控制器 (BMC) 發(fā)送和接收消息的格式。
圖 2. IPMI 調用可以通過網絡發(fā)送到遠程系統(tǒng)或本地子系統(tǒng)。在大多數情況下,系統(tǒng)的模塊化是將 IPMI 功能擴展到子系統(tǒng)(例如計算機模塊)的原因。
IPMI 消息可以通過網絡發(fā)送到遠程系統(tǒng)的 BMC,也可以從 BMC 發(fā)送到本地子系統(tǒng),例如電源。這種關于發(fā)送 IPMI 消息的多功能性使得可以將復雜的管理任務劃分為幾個子區(qū)域。
這些消息可以查詢硬件的當前狀態(tài)或指示 BMC 采取行動——例如,指示 BMC 增加系統(tǒng)冷卻、告訴系統(tǒng)重新啟動或讀取傳感器。將管理任務卸載到專用的物理硬件組件可以減輕主機硬件和操作系統(tǒng)的負擔。IPMI 規(guī)范還將系統(tǒng)管理與目標平臺分離,以便即使在目標平臺關閉時也可以啟動系統(tǒng)管理功能。
所有這些功能使 IPMI 規(guī)范成為管理服務器硬件的事實標準。規(guī)范的壽命得到了保證,因為規(guī)范的開發(fā)者故意使所需的命令非常簡單,不留任何誤解的余地。
IPMI 規(guī)范的靈活框架支持在原始規(guī)范的強制和可選命令之外添加新的網絡功能 (NetFn) 和指令。各種行業(yè)工作組已經從這種自由中受益,并定義了自己的特定網絡功能和命令來處理規(guī)范創(chuàng)建期間未考慮的技術和特性。
許多遠程管理選項
對于模塊化計算機系統(tǒng),靈活的框架簡化了添加遠程管理所需的調整。一項調整涉及 COM-HPC 嵌入式 EEPROM (EEEP)。EEEP 包含有關供應商、內存插槽、網絡功能等的信息。其中大部分信息與存儲在 IPMI 現場可更換單元 (FRU) 中的信息相同。為避免重復此數據,COM-HPC 遠程管理功能包括有關 IPMI 設備應如何使用 EEEP 設備中包含的信息填充 FRU 的建議。
鑒于 COM-HPC 模塊的市場范圍很廣,包括遠程數據中心、霧/邊緣服務器和遠程安裝,擁有靈活的遠程管理選項范圍很重要。開發(fā)人員還必須考慮到該標準為模塊和載板指定了非常不同的 IPMI 支持成熟度級別。
模塊的 IPMI 成熟度級別從非托管模塊 (MU) 和基本托管模塊 (MB) 到完全托管模塊 (MF)。載板級別范圍從非托管 (CU) 到托管載板 (CM)。規(guī)范中詳細解釋了這些差異,但在這個階段最重要的是要知道所有這些模塊和載板仍然可以互操作。
COM-HPC IPMI 規(guī)范允許所有類型的載板與所有類型的模塊一起正確運行。
平臺靈活管控
PICMG COM-HPC IPMI 小組委員會意識到,需要基本管理功能的各種場景無法通過一刀切的解決方案提供服務。因此,多種模塊和載體設計組合可用于諸如打開和關閉系統(tǒng)電源或告訴系統(tǒng)獲取網絡信息等任務。
例如,當使用最多四個模塊的單個載板時,每個模塊具有獨立的完整管理能力會更有效。然而,不同的場景可能會受益于載板上成熟的 IPMI 實施,無論模塊是托管還是非托管,都可以針對特定功能進行定制(圖 3)。
圖 3. 模塊和載板可以具有不同的 IPMI 支持成熟度級別,但仍可相互操作,從而實現各種系統(tǒng)設置——從具有四個托管模塊的單個非托管載體到具有非托管模塊的托管載體。
總會有系統(tǒng)設計者不想要管理功能。并且總會有系統(tǒng)設計人員需要最少的管理功能。因此,重要的是優(yōu)先考慮所有模塊管理層之間的互操作性。但設計師能夠訪問盡可能多的資源也很重要。
授予對系統(tǒng)資源的訪問權限越多,IPMI 就越強大。訪問和權力之間的這種關系就是為什么新的 COM-HPC 規(guī)范有一些特定的接口來提供最全面的系統(tǒng)管理功能。其中首先是智能平臺管理總線 (IPMB) 接口,它允許載板 BMC 訪問模塊管理控制器 (MMC)。
但規(guī)范不限于此總線。一種專門用于載板 BMC 的新接口是專用的獨立 PCI Express 通道,它包括并驅動一個圖形控制器。
IPMI 專用的其他接口是 I2C 接口、USB 端口和電源按鈕控件。通過這些專用 IPMI 通道(也可通過 BMC 遠程訪問),系統(tǒng)管理員可以控制幾乎整個平臺行為,以實現最佳 QoS、最短停機時間和最有效的遠程維護。
舉幾個例子:
I2C 接口可用于訪問模塊上的 EEEP 數據。
USB 端口可用于模擬 USB 設備,例如鍵盤和鼠標或 DVD 驅動器。
電源控制可用于遠程打開/關閉系統(tǒng)。
電源控制可用于延遲系統(tǒng)啟動,同時 BMC 執(zhí)行額外的平臺初始化。
因此,新的 PICMG COM-HPC 子規(guī)范為全面的 IPMI 平臺管理功能鋪平了道路。工程師可以開始考慮實施 IPMI 的硬件設計原理圖。同時,模塊供應商及其合作伙伴可以開展 BMC 和 MMC 實施,例如利用 SP-X 和/或 OpenBMC 等開放標準固件(圖 4)。
圖 4. 市場上第一款康佳特 COM-HPC 客戶端模塊配備了 11 種 Intel Xeon、Core 和 Celeron 處理器(代號為 Tiger Lake U 和 Tiger Lake H)。帶有評估載板和冷卻解決方案的康佳特入門套件已經過功能驗證。按需支持客戶特定的 COM-HPC PMI 實施變體。
OpenBMC 是用于服務器、架頂式交換機、RAID 設備和其他設備的管理控制器的 Linux 發(fā)行版。OpenBMC 使用 Yocto、OpenEmbedded、systemd 和 D-Bus 來輕松定制平臺。它完全符合 DCMI 的 IPMI 2.0 標準,并具有主機管理功能,例如電源、冷卻、LED、庫存、事件和看門狗。
OpenBMC 還提供廣泛的界面選擇,從遠程 KVM、基于 SSH 的 SOL 和基于 Web 的用戶界面,到基于 REST 和 D-Bus 的界面。工程師受益于硬件模擬以及自動化測試功能。對多個 BMC/BIOS 映像的代碼更新支持完善了最近的功能集。
結論
系統(tǒng)構建者的一個主要好處是,盡管 PICMG COM-HPC 計算機模塊規(guī)范是全新的,但它包含了經過驗證的 IPMI 和 Redfish 管理技術,可以在此基礎上進行創(chuàng)新。
作者:Jessica Isquith,Aaron Pop,David Wise
審核編輯:郭婷
-
控制器
+關注
關注
112文章
16448瀏覽量
179467 -
Linux
+關注
關注
87文章
11345瀏覽量
210403 -
服務器
+關注
關注
12文章
9308瀏覽量
86071
發(fā)布評論請先 登錄
相關推薦
評論