NetApp使用AI的漂亮描述作為數據管道

經驗告訴我們，組織規模與技術采用之間存在關系：更大，資源更豐富的企業通常會首先采用新技術，而隨后是規模較小，資源受限的組織會緊隨其后（前提是，小型組織不在企業內部）。技術業務）。這種模式已經在多種技術中重復了好幾代。但是，一旦較小的組織掌握了一項技術，他們的創造力便會以前所未有的方式推動其發展。恰當的例子：個人計算機最初是在大型公司中部署的，主要用于文字處理和電子表格，但是在十年之內被用于創作音樂，控制建筑物，前端復雜的醫療設備以及成千上萬的其他應用程序。聯想

NetApp使用AI的漂亮描述作為數據管道。由于我們是合作伙伴，因此我將毫不客氣地竊取該描述。管道始于（1）在邊緣創建和攝取數據，然后（2）移至位于中心的數據清理和準備階段，在此階段將其匯總為（3）訓練階段，這是資源消耗最大的階段。過程。如果數據是石油，則將培訓視為通過煉油廠生產石油。最后，（4）部署和推理階段，其中訓練后的數據以推理模式發送回邊緣，并收集更多數據以重新開始引入流水線。

我們的解決方案專注于關鍵的第三階段培訓。它是一種參考架構（RA），它將配備了NVIDIA GPU的Lenovo ThinkSystem服務器和基于NetApp技術的Lenovo ThinkSystem存儲結合在一起。通過為客戶和合作伙伴提供“最佳配方”，聯想，NetApp和NVIDIA消除了配置和優化培訓平臺的猜測。它可以作為單個向上擴展實例，其中多個用戶使用共享存儲在單個節點上運行作業，也可以作為多節點向外擴展群集，其中在所有節點上依次執行作業，并且節點訪問共享存儲同時。這是一個關鍵的區別，因為大多數較小的組織都將從擴大規模開始，但最終可能會遷移到擴大規模的方法。

培訓，尤其是依賴于神經網絡進行培訓的深度學習，可能需要數百GB的存儲空間，最多需要PB的存儲空間。在清理和準備階段，數據被組裝成大的，預打包的文件，例如TFRecords（TensorFlow記錄），然后依次讀取它們。對于利用GPU的任何工作負載而言，至關重要的是使它們不斷地處理數據。這使得系統范圍內的吞吐量對于保持所有計算資源都至關重要。

責任編輯：lq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4813

瀏覽量
103419
AI

AI

+關注

關注
88

文章
34990

瀏覽量
278622
深度學習

深度學習

+關注

關注
73

文章
5560

瀏覽量
122745

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

NetApp使用AI的漂亮描述作為數據管道

評論