經驗告訴我們,組織規模與技術采用之間存在關系:更大,資源更豐富的企業通常會首先采用新技術,而隨后是規模較小,資源受限的組織會緊隨其后(前提是,小型組織不在企業內部)。技術業務)。這種模式已經在多種技術中重復了好幾代。但是,一旦較小的組織掌握了一項技術,他們的創造力便會以前所未有的方式推動其發展。恰當的例子:個人計算機最初是在大型公司中部署的,主要用于文字處理和電子表格,但是在十年之內被用于創作音樂,控制建筑物,前端復雜的醫療設備以及成千上萬的其他應用程序。聯想
NetApp使用AI的漂亮描述作為數據管道。由于我們是合作伙伴,因此我將毫不客氣地竊取該描述。管道始于(1)在邊緣創建和攝取數據,然后(2)移至位于中心的數據清理和準備階段,在此階段將其匯總為(3)訓練階段,這是資源消耗最大的階段。過程。如果數據是石油,則將培訓視為通過煉油廠生產石油。最后,(4)部署和推理階段,其中訓練后的數據以推理模式發送回邊緣,并收集更多數據以重新開始引入流水線。
我們的解決方案專注于關鍵的第三階段培訓。它是一種參考架構(RA),它將配備了NVIDIA GPU的Lenovo ThinkSystem服務器和基于NetApp技術的Lenovo ThinkSystem存儲結合在一起。通過為客戶和合作伙伴提供“最佳配方”,聯想,NetApp和NVIDIA消除了配置和優化培訓平臺的猜測。它可以作為單個向上擴展實例,其中多個用戶使用共享存儲在單個節點上運行作業,也可以作為多節點向外擴展群集,其中在所有節點上依次執行作業,并且節點訪問共享存儲同時。這是一個關鍵的區別,因為大多數較小的組織都將從擴大規模開始,但最終可能會遷移到擴大規模的方法。
培訓,尤其是依賴于神經網絡進行培訓的深度學習,可能需要數百GB的存儲空間,最多需要PB的存儲空間。在清理和準備階段,數據被組裝成大的,預打包的文件,例如TFRecords(TensorFlow記錄),然后依次讀取它們。對于利用GPU的任何工作負載而言,至關重要的是使它們不斷地處理數據。這使得系統范圍內的吞吐量對于保持所有計算資源都至關重要。
責任編輯:lq
-
神經網絡
+關注
關注
42文章
4813瀏覽量
103419 -
AI
+關注
關注
88文章
34990瀏覽量
278622 -
深度學習
+關注
關注
73文章
5560瀏覽量
122745
發布評論請先 登錄
最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)
海思SD3403邊緣計算AI數據訓練概述
NetApp與Google Cloud合作,簡化云端高性能工作負載的擴展
適用于數據中心和AI時代的800G網絡
NetApp革新塊存儲,賦能現代工作負載
AI賦能邊緣網關:開啟智能時代的新藍海

NetApp與Google Cloud深化合作,強化分布式云存儲
NetApp數據恢復—NetApp存儲WAFL文件系統下誤刪除的數據恢復案例
國內常見的石油管道外徑測量方法?
聲波定位技術在地下管道中如何應用
NetApp數據恢復—NetApp存儲誤刪除的數據恢復案例

評論