各種各樣的企業在加快AI和機器學習項目,但要真正發揮潛力,需要克服重大的技術障礙。雖然計算基礎架構常常是關注的重點,但存儲同樣重要。這三個主要的原因表明了為什么對象存儲(而不是文件存儲或塊存儲)特別適合AI和機器學習工作負載:
1. 可擴展性——有龐大且多樣的數據源可供學習時,AI和機器學習最有效。數據科學家利用這些豐富的數據來訓練領域模型。在“大數據的五個V”(容量、種類、速度、準確性和價值)中,前兩個(容量和種類)最重要。簡而言之,AI和機器學習依賴大量多樣化的數據(圖像、文本、結構化和半結構化數據),構建有用的模型、提供準確的結果并最終提供業務價值。
對象存儲是最具擴展性的存儲架構,特別適合支持AI和機器學習所需的大量數據。對象存儲旨在通過橫向擴展方法支持無限增長,使企業組織能夠通過隨時隨地添加節點來擴大部署范圍。由于對象存儲使用單個全局命名空間,也可以同時跨多個地方進行這種擴展。另一方面,文件和塊系統通常采用縱向擴展方法。這意味著這種平臺通過為單個節點添加更多計算資源實現縱向擴展,這種方法最終受到限制。它們無法通過部署額外節點來增加計算資源以高效地橫向擴展。
2. API——健壯靈活的數據API對于AI和機器學習很重要,如前所述,AI和機器學習使用多種類型的數據。存儲平臺需要支持API以容納各種數據。此外,AI和機器學習方面的創新日益在公共云上完成,但是仍有相當一部分的AI和機器學習在本地或私有云中進行,這取決于使用場合的具體情況(比如說,科學研究和醫療保健等領域的容量密集型工作負載往往最適合私有云)。這意味著企業需要在公共云和本地/私有云中都支持工作負載的存儲API。
文件和塊存儲平臺在它們支持的API方面受到限制,部分原因是它們是較舊的架構。相比之下,對象存儲使用云端更高級的API,這種API旨在以應用程序為中心,并支持比文件和塊存儲更廣泛的API,包括版本控制、生命周期管理、加密、對象鎖定和元數據。此外,支持AI和機器學習使用場景的新對象存儲API(比如支持流數據和海量數據集的查詢)也有可能。
由于對象存儲API圍繞Amazon S3實現了標準化,更容易整合本地和公共云中的軟件。企業可以輕松地將部署的AI和機器學習從本地/私有云環境擴展到公共云,或者將云原生的AI和機器學習工作負載遷移到本地環境,功能不會減損。這種雙模式方法使企業能夠以合作、可互換的方式利用本地/私有云和公共云上的資源。
由于S3 API已成為對象存儲事實上的標準,許多軟件工具和庫都可以充分利用該API。這允許共享代碼、軟件和工具,促進AI/機器學習社區更快速的開發。例子包括流行的機器學習平臺,比如擁有內置S3 API的TensorFlow和Apache Spark。
3.元數據——與API一樣,使用AI和機器學習的企業利用無限制、可自定義的元數據顯得至關重要。元數據就是關于數據的數據——從最基本的層面上講,某個數據何時在何地創建、創建者是誰。但是元數據可以描述更多信息:用戶可以創建任意的元數據標簽來描述他們需要的任何屬性。
數據科學家需要豐富的元數據來查找特定數據以構建和使用AI和機器學習模型。隨著更多信息添加到數據中,元數據注釋便于逐步積累知識。
文件和塊存儲僅支持有限的元數據,比如上述基本屬性。這在很大程度上歸結為可擴展性,因為文件和塊系統無力支持快速無縫的增長,如果存儲系統為依賴龐大數據集的AI和機器學習應用程序支持豐富的元數據,自然會出現這種情況。然而,對象存儲支持無限制的、完全可自定義的元數據,從而更容易找到用于AI和機器學習算法的數據,并從中獲得更準確的信息。
以一家醫院針對X射線圖像使用圖像識別應用程序為例:有了元數據,可以使用TensorFlow模型來分析添加到對象存儲系統的每個圖像,然后為每個圖像分配細化的元數據標簽(比如,傷病類型、基于骨骼大小或生長情況來判斷患者的年齡或性別)。然后可以針對該元數據訓練TensorFlow模型,并加以分析,對患者獲得新的寶貴信息(比如說,二三十歲的女性比五年前更容易患骨骼疾病)。
幾乎每家《財富》 500強公司都在大張旗鼓地搞AI和機器學習,可以想象這些技術在可預見的將來將是最重要的企業IT項目。然而,AI/機器學習項目要獲得回報,企業就要使用合適的存儲基礎架構。由于可擴展性、支持各種API(尤其是S3)和豐富的元數據,對象存儲可謂是AI和機器學習的最佳支柱。
-
存儲
+關注
關注
13文章
4359瀏覽量
86205
發布評論請先 登錄
相關推薦
對象存儲是什么結構類型?
HPC工作負載管理的關鍵要素
IBM Storage -?支持AI應用場景的數據存儲軟硬件解決方案
![IBM Storage -?支持<b class='flag-5'>AI</b>應用場景的數據<b class='flag-5'>存儲</b>軟硬件解決方案](https://file1.elecfans.com/web3/M00/04/42/wKgZPGdyPFKAcWI-AABzqFpBr2U600.png)
深度學習工作負載中GPU與LPU的主要差異
![深度<b class='flag-5'>學習</b><b class='flag-5'>工作</b><b class='flag-5'>負載</b>中GPU與LPU的主要差異](https://file1.elecfans.com/web3/M00/01/8B/wKgZPGdWXeGAM5JpAABgeEQ8gjc450.png)
關于對象存儲和云硬盤區別,你了解多少?
AI大模型與傳統機器學習的區別
使用帶有三個DC-DC模塊的UCC39002的48VIN、12VOUT負載共享系統
![使用帶有<b class='flag-5'>三個</b>DC-DC模塊的UCC39002的48VIN、12VOUT<b class='flag-5'>負載</b>共享系統](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
評論