經驗告訴我們,組織規模與技術采用之間存在關系:更大,資源更豐富的企業通常會首先采用新技術,而隨后是規模較小,資源受限的組織會緊隨其后(前提是,小型組織不在企業內部)。技術業務)。這種模式已經在多種技術中重復了好幾代。但是,一旦較小的組織掌握了一項技術,他們的創造力便會以前所未有的方式推動其發展。恰當的例子:個人計算機最初是在大型公司中部署的,主要用于文字處理和電子表格,但是在十年之內被用于創作音樂,控制建筑物,前端復雜的醫療設備以及成千上萬的其他應用程序。聯想
NetApp使用AI的漂亮描述作為數據管道。由于我們是合作伙伴,因此我將毫不客氣地竊取該描述。管道始于(1)在邊緣創建和攝取數據,然后(2)移至位于中心的數據清理和準備階段,在此階段將其匯總為(3)訓練階段,這是資源消耗最大的階段。過程。如果數據是石油,則將培訓視為通過煉油廠生產石油。最后,(4)部署和推理階段,其中訓練后的數據以推理模式發送回邊緣,并收集更多數據以重新開始引入流水線。
我們的解決方案專注于關鍵的第三階段培訓。它是一種參考架構(RA),它將配備了NVIDIA GPU的Lenovo ThinkSystem服務器和基于NetApp技術的Lenovo ThinkSystem存儲結合在一起。通過為客戶和合作伙伴提供“最佳配方”,聯想,NetApp和NVIDIA消除了配置和優化培訓平臺的猜測。它可以作為單個向上擴展實例,其中多個用戶使用共享存儲在單個節點上運行作業,也可以作為多節點向外擴展群集,其中在所有節點上依次執行作業,并且節點訪問共享存儲同時。這是一個關鍵的區別,因為大多數較小的組織都將從擴大規模開始,但最終可能會遷移到擴大規模的方法。
培訓,尤其是依賴于神經網絡進行培訓的深度學習,可能需要數百GB的存儲空間,最多需要PB的存儲空間。在清理和準備階段,數據被組裝成大的,預打包的文件,例如TFRecords(TensorFlow記錄),然后依次讀取它們。對于利用GPU的任何工作負載而言,至關重要的是使它們不斷地處理數據。這使得系統范圍內的吞吐量對于保持所有計算資源都至關重要。
責任編輯:lq
-
神經網絡
+關注
關注
42文章
4787瀏覽量
101383 -
AI
+關注
關注
87文章
32054瀏覽量
270957 -
深度學習
+關注
關注
73文章
5523瀏覽量
121727
發布評論請先 登錄
相關推薦
NetApp革新塊存儲,賦能現代工作負載

NetApp與Google Cloud深化合作,強化分布式云存儲
NetApp數據恢復—NetApp存儲WAFL文件系統下誤刪除的數據恢復案例
國內常見的石油管道外徑測量方法?
聲波定位技術在地下管道中如何應用
NetApp數據恢復—NetApp存儲誤刪除的數據恢復案例

消防管道壓力流量監控方案
管道風速傳感器的安裝在管道的前端還是后端
NetApp推出專為人工智能時代打造的統一數據存儲
NetApp數據恢復—WAFL文件系統下誤刪除數據的數據恢復案例
Netapp數據恢復—Netapp存儲中卷被誤刪除的數據恢復案例

NetApp數據恢復—NetApp存儲中的卷丟失的數據恢復案例

評論