北京2024年9月5日/美通社/ -- 近年來隨著云計算、大數據特別是大模型的快速發展,數據中心規模不斷擴張,產生了更多的服務器管理需求。傳統BMC雖然可以實現部分管理,但是在快速迭代的當今尤其是在AI技術的驅動下,存在開發周期長、交付困難、應用單一等難題,并且由于其代碼閉源也會導致隱藏的安全漏洞無法及時識別,限制了用戶定制開發。OpenBMC憑借領先的開源理念、可擴展的軟件架構,被大型互聯網廠商廣泛應用,并帶動了產業連上下游共同探索,逐步成為服務器固件發展的"事實標準"。
在日前召開的2024開放計算中國峰會上,來自阿里云、字節跳動、浪潮信息、英特爾以及電子標準院的專家,從自身探索和實踐的角度,現身說法各家在OpenBMC方面的最新進展及未來規劃。
OpenBMC大幅降低采購成本 阿里云新增修改10萬+行自研代碼庫
隨著云計算、大數據、AI等技術的發展,阿里云服務器規模已經達到數百萬臺,如何有效管理是擺在阿里云面前的現實問題。
而傳統的BMC無法滿足新興運維需求,首先是龐大的服務器數量涵蓋了多個品牌不同廠家,各廠家都基于某個IBV建立基礎BMC能力再在上層定制開發,因此日常問題的解決需要拉通多方BMC軟件規格和能力,帶來時間和資源的大量浪費,效率低下;其次,不同品牌的服務器BMC代碼也不盡相同,存在巨大的適配成本;第三是應用成本問題,傳統BMC基礎軟件源代碼和授權license都需要購買,后續還需要軟件維護升級費用,成本較高。
OpenBMC迎合了當下軟件質量發展和行業趨勢,2020年左右OpenBMC軟件逐步走向成熟,在北美一些CSP率先采用。阿里云服務器研發固件團隊負責人李羿介紹,阿里云自2020年逐步采用OpenBMC產品,經過4年時間的探索與實踐,已經形成行業一支領先的專業OpenBMC技術開發和交付團隊,不僅可以在完成交付任務的同時結合云業務自身特點,還不斷的回饋社區、貢獻伙伴,在多個層面實現了行業領先。
如今,阿里云已經成功在x86、ARM等主流平臺中實現了OpenBMC的替代,未來也將探索基于RISC-V等多元芯片平臺的可能性。得益于OpenBMC的平臺化優勢,不同架構下的代碼絕大部分都是相同的,只是針對不同平臺略有微調。李羿表示,阿里云已經在實現代碼的歸一化,目前已經提交超過10萬行代碼,未來有望針對不同產品形態實現全面支持。
字節跳動打造OpenBMC應用新范式 問題分析定位效率大幅提升
從抖音到新晉AI工具"豆包",隨著應用覆蓋范圍的進一步擴大、用戶群體的持續增多,字節跳動需要維護的服務器數量已達百萬級別,并且仍有不斷增長的態勢。如何高效、穩定且安全的管理服務器,成為運維團隊面臨的首要問題。
字節跳動固件架構師郟春輝介紹,傳統BMC在解決固件運維難題上存在局限性,難以在服務器需求多樣化的情況下滿足快速交付的需求。開源OpenBMC能夠吸納先進理念和應用,提供了架構靈活、兼容性強的新選擇,非常適合當下互聯網與數字化的應用需求。
為了更好地解決固件運維的問題,字節跳動在OpenBMC固件運維能力基礎上,不斷進行技術創新,致力于提升OpenBMC固件的可觀測性,對固件的運行狀態、性能表現及內部各種活動進行全方位的監控和解析。通過加強對固件運行時軟硬件狀態的深入觀察和理解,能夠更快速地捕捉問題發生時的細節,從而實現高效精準的問題定位和處理。這種深入的可觀測性不僅有助于提升系統的穩定性與可靠性,也為業務優化提供了寶貴的數據支持。
事實證明,這種方法非常有效。在引入了Perfetto和Kernel trace以后,問題定位分析時間,由原有的數小時乃至數天,降低至平均1小時以下;問題一次定位分析準確率,由40%提升至80%以上,效率提升非常明顯。未來字節還計劃在問題分析定位層面更進一步,借助AI技術和大數據分析,細化不同場景下的問題定位,充分發揮自動化優勢,讓故障無處遁形。
浪潮信息提供差異化方案滿足不同需求下一代產品全面切換OpenBMC
當然,并非所有的企業都有阿里云、字節這樣的技術積淀,對于中國市場來說,絕大部分企業用戶并沒有自研的能力,更傾向于選擇表現穩定、安全的商業版本。對于這些企業來說,浪潮信息就是不錯的合作伙伴。
去年,浪潮信息就發布了基于OpenBMC的InBry管理固件平臺,采用更先進、更高效、更開放的創新架構和開發模式,快速適配各種算力場景,為用戶提供開放、穩定、可靠的BMC管理固件,支撐多元算力時代的各類創新應用。"如果說前兩年OpenBMC還只是一個趨勢,現在則已經是大行其道了",浪潮信息服務器固件研發負責人王興隆表示。
除了功能更豐富、應用更高效之外,開源版本的優勢還在于開放性以及由此產生的安全性,后者也是當下企業關注的重點。對此,王興隆表示,首先,開源社區采用的是最先進的Linux版本,相比傳統BMC應用來說在代碼上更完善,成熟性更高。其次,開源社區的代碼上傳需要多為行業專家的聯合評審,接受更多社區參與者隨時的監督與審查,所以質量更高。第三,基于開源和可擴展的軟件架構,用戶也可以將自身使用的安全模型、軟件庫移植到OpenBMC,這樣就能打造符合自身需求的業務安全模型,所以更安全。
如今,浪潮信息更提出了"分層解耦"的理念,在技術上通過硬件層、中間層、應用層的劃分實現自動適配、自動識別,達到技術賦能的多元化。此外,浪潮信息也正在與英特爾、英偉達、AMD等業界領軍企業合作,實現多元化平臺的適配,為產業界提供更低成本、更高效的選擇。
"在技術上,我們要基于OpenBMC實現創新,讓更多企業享受開源應用的技術紅利;產品上,我們將逐步在下一代平臺全面切換到OpenBMC,打造更好的商業化版本;社區層面,我們也要建設更好的生態環境,讓更多伙伴參與其中達成貢獻,打造多元化的服務",王興隆表示。
英特爾社區貢獻名列前茅 持續推動OpenBMC技術創新
作為平臺公司,英特爾也在推動OpenBMC發展中扮演了重要角色。每一代英特爾處理器平臺的升級對于BMC固件適配來說都是不小的變革,而這些變革都朝著更便捷、更優化的方向來發展。從最初創立OpenBMC到今天,英特爾對于組織的貢獻一直排在前列,每一代產品都會經歷一年甚至更長時間的測試,以保證在性能、可靠性、穩定性等多方面的品質。
針對不同的應用場景,英特爾也會為客戶提供接口實現功能上的定制化需求,這樣可以通過代碼或者軟件的微調更適配于客戶業務。同時,英特爾也提供了PFR固件保護功能(Platform Firmware Resilience),為保護企業服務器固件提供了一種全新的方法,可全面防止對服務器所有固件的攻擊。
除了安全性的優化之外,如何有效降低服務器能耗也是OpenBMC固件優化的重點。從傳統BMC到OpenBMC,其實服務器節能會變得更精準、更低碳。對此,英特爾在節點管理中就提供了能耗管理,并可以根據不同部件進行精細化運維。
從OpenBMC的投入上可以看出,這不僅僅是硬件層面的創新,更多需要融合軟件、AI、生態等多個維度,而英特爾也需要扮演行業引領者的角色,為更多生態伙伴提供平臺化、系統化的支持。
AI為OpenBMC發展注入活力 正在成為服務器固件"事實標準"
AI技術的出現帶來了計算架構的變化,而BMC就勢必需要針對這些多元異構的應用變化進行調整。與此同時,AI技術的出現也讓大量傳統的數據監測、分析變得更加高效,配合數據模型的構建,可以為未來的智能化管理提供技術支持,這也是AI對于OpenBMC帶來的全新改變。
"事實上,OpenBMC正在解決傳統BMC的瓶頸問題,包括兼容性問題、存在隱藏的代碼故障、定制化需求等,已逐步成為了服務器固件的'事實標準'。" 中國電子技術標準化研究院技術總監、固件產業技術創新聯盟標測組組長鐘偉軍表示。
如今,OpenBMC在國內的應用生產已經初具雛形。在相關社區中,已經形成了比較完備和穩定的基礎代碼,包括阿里云、浪潮信息等30多家公司也在不斷提交代碼貢獻。
未來,希望能夠有更多的產業界的伙伴參與到社區建設當中,把自身的優勢、經驗貢獻到社區,讓社區擁有更加完備的基礎代碼,讓產業界上下游共享社區成果,有助于產業鏈生態的繁榮,形成合作共贏的局面。
審核編輯 黃宇
-
英特爾
+關注
關注
61文章
10011瀏覽量
172363 -
服務器
+關注
關注
12文章
9317瀏覽量
86084 -
浪潮
+關注
關注
1文章
469瀏覽量
23950 -
字節
+關注
關注
0文章
41瀏覽量
13810 -
阿里云
+關注
關注
3文章
976瀏覽量
43238
發布評論請先 登錄
相關推薦
浪潮信息與智源研究院攜手共建大模型多元算力生態
英特爾帶您解鎖云上智算新引擎
中國邊緣服務器市場持續兩位數增長,浪潮信息蟬聯第一
![中國邊緣<b class='flag-5'>服務器</b>市場持續兩位數增長,<b class='flag-5'>浪潮信息</b>蟬聯第一](https://file1.elecfans.com//web2/M00/0B/FC/wKgaomcstMSAHR7sAABBFXaWUg8550.jpg)
英特爾發布至強6處理器產品
英特爾與阿里云攜手共創數智新紀元
讓服務器開機遠離飛機起飛!浪潮信息首創3秒智能控溫技術,降噪30.4%
![讓<b class='flag-5'>服務器</b>開機遠離飛機起飛!<b class='flag-5'>浪潮信息</b>首創3秒智能控溫技術,降噪30.4%](https://file1.elecfans.com//web2/M00/02/C2/wKgZoma9ttiAQly7AAAq5ogUdf4955.jpg)
浪潮信息分布式存儲AS13000完成英特爾至強6能效核處理器適配
![<b class='flag-5'>浪潮信息</b>分布式存儲AS13000完成<b class='flag-5'>英特爾</b>至強6能效核處理<b class='flag-5'>器</b>適配](https://file1.elecfans.com/web2/M00/F1/2E/wKgaomZyPRWAZ-ZtAAATAuwWalE093.jpg)
浪潮信息推出業界首個支持50℃進液溫度的服務器
浪潮信息突破浸沒式液冷服務器設計極限 業界首個支持50℃進液溫度
![<b class='flag-5'>浪潮信息</b>突破浸沒式液冷<b class='flag-5'>服務器</b>設計極限 業界首個支持50℃進液溫度](https://file1.elecfans.com//web2/M00/E0/EF/wKgZomY40T6AR0tlAABj1X5u2nQ717.jpg)
浪潮信息"源2.0"大模型YuanChat支持英特爾最新商用AI PC
![<b class='flag-5'>浪潮信息</b>"源2.0"大模型YuanChat支持<b class='flag-5'>英特爾</b>最新商用AI PC](https://file1.elecfans.com//web2/M00/C6/02/wKgZomYEMqWAGh5CAAGNLjfb0sc454.jpg)
浪潮信息與英特爾合作推出一種大模型效率工具“YuanChat”
![<b class='flag-5'>浪潮信息</b>與<b class='flag-5'>英特爾</b>合作推出一種大模型效率工具“YuanChat”](https://file1.elecfans.com/web2/M00/C6/D3/wKgaomYDs-iAXotIAAFZxWMgFo8771.jpg)
新升級 浪潮信息邊緣服務器支持英特爾第五代至強處理器
![新升級 <b class='flag-5'>浪潮信息</b>邊緣<b class='flag-5'>服務器</b>支持<b class='flag-5'>英特爾</b>第五代至強處理<b class='flag-5'>器</b>](https://file1.elecfans.com//web2/M00/C3/AC/wKgaomXnGlKAf8pTAACRxzQuUVY844.jpg)
評論