作者:周立旸,IBM 大中華區科技事業部存儲軟件產品總監
北京2024年2月1日/美通社/ -- 一年前,IBM 將 Red Hat 存儲產品的路線圖及團隊集成至 IBM存儲業務(IBM Storage)。在此期間,企業在擴展 AI 時正面臨前所未有的數據挑戰:在多個位置、以多種形式存儲的數據量飆升,但數據質量較差。為了幫助客戶解決這一問題,我們需要領先的解決方案對客戶的基礎架構進行現代化改造,以支持其數字化轉型。這主要涉及在本地和云環境中提供一致的應用和數據存儲。此外,還需要幫助客戶采用云原生架構,實現公有云在成本、速度和彈性等方面的優勢。作為業界領先的開源軟件定義存儲平臺,IBM Storage Ceph(前身為 Red Hat Ceph)正是實現這一目標所需的基石。
周立旸,IBM 大中華區科技事業部存儲軟件產品總監
在數據管理方面,軟件定義存儲 (SDS) 已成為一股變革力量。與傳統的傳統存儲陣列相比,它具有許多優勢,包括極高的靈活性與可擴展性,這非常適用于處理生成式 AI 等最新用例。借助 IBM Storage Ceph,用戶可從底層硬件中提取存儲資源,實現數據存儲的動態分配和高效利用。這種靈活性不僅可以簡化管理流程,還有助于提高敏捷性,適應不斷變化的業務需求,并將隨著新工作負載的增加而擴展計算和容量。這一自我修復和自我管理的平臺可在行業標準硬件上運行,并大規模地提供統一的文件存儲、塊存儲和對象存儲服務。[1]統一存儲可以幫助客戶將在獨立文件或塊存儲上運行的傳統應用,和包含單一設備對象存儲的通用平臺連接起來。
Ceph 針對大型單站點和多站點部署進行了優化,經過高效擴展可以支持數百 PB 級數據和數百億個對象,[2]這對于傳統工作負載和生成式 AI 工作負載至關重要。IBM Storage Ceph 可擴展、彈性且安全,支持更傳統的工作負載,例如 Red Hat OpenShift 或 RedHat OpenStack 上的 MySQL 和 MongoDB,是支持數據湖倉和AI/ML 開源框架的理想之選。這也是 IBMwatsonx.data包含 IBM Storage Ceph 768 TiB 裸容量授權的原因之一;前者是 IBM推出的開放、可治理、定制化的數據湖倉架構,并針對數據、分析和 AI 工作負載進行了優化。
計算密集型和數據密集型工作負載的理想底座
非結構化數據的爆炸式增長和生成式 AI 相互影響,也相輔相成。Gartner 在其《2023 年企業數據存儲的主要趨勢》報告中指出:"到 2028 年,大型企業的本地、邊緣和公有云上的非結構化數據將比 2023 年年中增加兩倍。"[3]非結構化數據(如文本、圖像和視頻)的激增為訓練生成式 AI 模型提供了廣泛而多樣的資源,而生成式 AI 可支持用戶從非結構化數據中提前寶貴的洞察。這種協同作用形成了一個反饋循環,生成式 AI 在大量非結構化數據的基礎上蓬勃發展,而 AI 持續生成的真實數據則進一步豐富和完善人們對非結構化數據集的理解,從而促進創新和進步。
根據上述報告[4],預計到 2028 年,將有 70% 的文件和對象數據部署在集成的非結構化數據存儲平臺上(高于 2023 年的 35%),組織需要能夠加速數據提取、數據清理和分類、元數據管理和擴充、云規模容量管理和部署(如軟件定義存儲)的存儲管理解決方案。IBM Storage Ceph 可實現無縫擴展,滿足不斷增長的數據需求;其自我管理功能確保系統適應不斷變化的條件,輕松實現數據完整性。
為了在整個組織中加速和擴展數據和 AI,并最終改善業務成果,企業必須有意識地采用混合云設計(hybrid cloud by design)。這包括通過云原生運營模式在本地使用存儲服務,以解決公有云上的部分企業級功能不可用、數據主權和成本等問題。IBM Storage Ceph 的"即插即用"架構簡化了與現有基礎架構的集成,包括各種平臺、云環境、虛擬管理程序、開源數據存儲庫(如 Apache Iceberg 或 Apache Parquet)以及完整解決方案(如 watsonx.ai、watsonx.data 等)。新節點或設備可以無縫添加到集群中,而不會出現中斷或服務停機。它為客戶提供來一種簡單高效的方式,來使用 watsonx.data 和其他新一代 AI 工作負載構建數據湖倉。
Snap Inc.相關負責人表示:"在 Snap,我們對數據存儲的需求越來越大,需要一個能夠快速擴展、滿足性能 KPI 且具有成本效益的平臺。IBM Storage Ceph 憑借其簡單可擴展的架構、易于管理的界面和經濟高效的軟件定義部署,成為我們的首選平臺。IBM Storage Ceph 還擁有 IBM 的世界級專長和支持,這也是我們決定將其引入關鍵業務的一個重要原因。"
利用NVMe over TCP 技術實現快速數據訪問
去年,IBM 對 Ceph 進行了幾項重要更新,包括最近的 IBM Storage Ceph 7.0。新一代Ceph 平臺為 NVMe/TCP 功能做好了準備。它保留了傳統 NVMe 的低延遲和高帶寬特性,可以在存儲設備、服務器和云平臺之間實現更快的數據傳輸,因此適用于需要超快速存儲訪問的應用,例如數據庫、分析和內容傳輸;并且兼容傳統的網絡技術投資,從而簡化了基礎架構。這些優勢將幫助客戶采用軟件定義的方法,在速度、敏捷性和經濟性方面享受云端體驗。
NVMe/TCP 可以幫助 Ceph 通過擴展架構彌補傳統塊存儲的不足。借助 NVMe/TCP,Ceph 將與 VMware 等平臺集成,幫助企業在自己的數據中心復制云架構,擺脫昂貴且固定的 SAN 網絡和單片存儲陣列。
Ceph 7.0 的其他新功能:
SEC 和 FINRA 合規認證的"寫一次讀多次"(WORM) 對象鎖定,確保對象存儲符合WORM 合規要求
為非原生Ceph 客戶端的 CephFS文件系統訪問提供NFS 支持
如需了解該功能的更多信息,請點擊此處訪問IBM Storage 社區
借助IBM Storage Ceph 實現云規模經濟
由于IBM Storage Ceph 將數據作為對象存儲在邏輯存儲池中,因此單個集群可以有多個存儲池,每個存儲池都將針對不同的性能或容量需求進行調整。這樣一來,客戶能夠更輕松快速地訪問各種經過分類的內容數據和上下文數據,存儲容量僅受組織基礎架構規模的限制;與傳統存儲陣列架構相比,IBM Storage Ceph可消除硬件限制,實現大規模成本降低。
加快價值實現的步伐
IBM Storage Ceph
IBM 更進一步簡化了 Ceph 部署。借助IBM Storage Ready Nodesfor Ceph,該平臺可部署為完整的軟硬件解決方案,提供多種容量配置,針對運行 IBM Storage Ceph 工作負載進行了優化。我們消除了配置中的不確定因素,使其更易于理解、配置和管理。
IBM Storage Ceph 的發展是 IBM 存儲的軟硬件產品通過擴展的容量與性能,加速價值實現、優化客戶成本的又一例證。
審核編輯 黃宇
-
IBM
+關注
關注
3文章
1813瀏覽量
75600 -
AI
+關注
關注
88文章
34733瀏覽量
276778
發布評論請先 登錄
華為發布AI數據湖解決方案加速行業智能化 AI時代數據覺醒

功率密度> 100W/in3,TI新款電源管理芯片賦能現代數據中心建設

IBM收購Hakkoda Inc.,擴展數據專業能力以推動客戶的AI轉型
IBM攜手英偉達AI數據平臺推動企業級AI創新
旋轉測徑儀的底座如何保證穩定性?
IBM Storage -?支持AI應用場景的數據存儲軟硬件解決方案

戴爾數據湖倉助力企業數字化轉型
IBM 發布光學技術關鍵突破,生成式AI迎來"光速時代"
虛擬化數據恢復—VMware ESX SERVER無法連接STORAGE的數據恢復案例
國產數據庫企業“人大金倉”更名為“電科金倉”

電科金倉:數智未來,國產數據庫大有可為

IaaS+on+DPU(IoD)+下一代高性能算力底座技術白皮書
基于DPU的Ceph存儲解決方案

評論