如何使用分布式存儲系統促進AI模型訓練

在處理小型數據集和簡單算法時，傳統的機器學習模型可以存儲在獨立機器或本地硬盤驅動器上。然而，隨著深度學習的發展，團隊在處理更大的數據集和更復雜的算法時越來越多地遇到存儲瓶頸。

這凸顯了分布式存儲在人工智能（AI）領域的重要性。JuiceFS 是一個開源、高性能的分布式文件系統，為這個問題提供了解決方案。

在本文中，我們將討論 AI 團隊面臨的挑戰，JuiceFS 如何加速模型訓練，以及加速模型訓練的常見策略。

AI 團隊經常遇到以下挑戰：

大型數據集：隨著數據和模型大小的增長，獨立存儲無法滿足應用程序需求。因此，分布式存儲解決方案成為解決這些問題的必要條件。

完整存檔歷史數據集：在某些情況下，每天都會生成大量新數據集，并且必須作為歷史數據存檔。這在自動駕駛領域尤其重要，因為道路測試車輛收集的數據（如雷達和攝像頭數據）是公司的寶貴資產。在這些情況下，獨立存儲被證明是不夠的，因此分布式存儲成為必要的考慮因素。

小文件和非結構化數據過多：傳統的分布式文件系統難以管理大量小文件，導致元數據存儲負擔沉重。這對于視覺模型尤其成問題。為了解決這個問題，我們需要一個針對存儲小文件進行優化的分布式存儲系統。這確保了高效的上層訓練任務和大量小文件的輕松管理。

用于培訓框架的 POSIX 接口：在模型開發的初始階段，算法科學家通常依靠本地資源進行研究和數據訪問。但是，當擴展到分布式存儲以滿足更大的訓練需求時，原始代碼通常需要最少的修改。因此，分布式存儲系統應支持 POSIX 接口，以最大程度地兼容在本地環境中開發的代碼。

共享公共數據集和數據隔離：在某些領域，例如計算機視覺，權威的公共數據集需要在公司內的不同團隊之間共享。為了促進團隊之間的數據共享，這些數據集通常集成并存儲在共享存儲解決方案中，以避免不必要的數據重復和冗余。

基于云的訓練中的數據 I/O 效率低：基于云的模型訓練通常使用對象存儲作為存儲-計算分離架構的基礎存儲。但是，對象存儲的讀寫性能不佳可能會導致訓練期間出現重大瓶頸。

JuiceFS 如何幫助提高模型訓練效率

什么是果汁FS？

JuiceFS 是一個開源、云原生的分布式文件系統，兼容 POSIX、HDFS 和 S3 API。JuiceFS 采用解耦架構，將元數據存儲在元數據引擎中，并將文件數據上傳到對象存儲，提供高性價比、高彈性的存儲解決方案。

JuiceFS 的用戶遍布 20 多個國家，包括人工智能、互聯網、汽車、電信、金融科技等行業的龍頭企業。

模型訓練場景中 JuiceFS 的架構。

JuiceFS 在模型訓練場景中的架構由三個組件組成：

元數據引擎：任何數據庫，如 Redis 或 MySQL，都可以用作元數據引擎。用戶可以根據自己的需求做出選擇。

對象存儲：您可以使用公有云或自托管提供的任何受支持的對象存儲服務。

果汁FS客戶端：要像訪問本地硬盤一樣訪問 JuiceFS 文件系統，用戶需要將其掛載在每個 GPU 和計算節點上。

底層存儲依賴于對象存儲中的原始數據，每個計算節點都有一些本地緩存，包括元數據和數據緩存。

JuiceFS 設計允許在每個計算節點上多級本地緩存：

第一級：基于內存的緩存

第二級：基于磁盤的緩存

對象存儲僅在緩存滲透時訪問。

對于獨立模型，在第一輪訓練中，訓練集或數據集通常不會命中緩存。但是，從第二輪開始，有了足夠的緩存資源，幾乎不需要訪問對象存儲。這可以加速數據 I/O。

JuiceFS 中的讀寫緩存流程

我們之前比較了使用或不使用緩存來訓練訪問對象存儲時的效率。結果表明，JuiceFS 的元數據緩存和數據緩存，與對象存儲相比，平均性能提升了 4 倍以上，性能提升了近 7 倍。

下圖顯示了在 JuiceFS 中讀寫緩存的過程：

JuiceFS 的讀寫緩存流程

對于上圖中的“塊緩存”，塊是 JuiceFS 中的一個邏輯概念。每個文件分為多個 64 MB 的塊，以提高大文件的讀取性能。這些信息緩存在 JuiceFS 進程的內存中，以加速元數據訪問效率。
JuiceFS 中的讀緩存流程：

1. 應用程序（可以是 AI 模型訓練應用程序，也可以是任何啟動讀取請求的應用程序）發送請求。

2. 請求進入左側的內核空間。內核檢查請求的數據在內核頁面緩存中是否可用。如果沒有，請求會回到用戶空間中的 JuiceFS 進程，該進程處理所有讀寫請求。

默認情況下，JuiceFS 在內存中維護一個讀取緩沖區。當請求無法從緩沖區檢索數據時，JuiceFS 會訪問塊緩存索引，這是一個基于本地磁盤的緩存目錄。JuiceFS 將文件劃分為 4 MB 塊進行存儲，因此緩存粒度也是 4 MB。

例如，當客戶端訪問文件的一部分時，它僅將與該部分數據對應的 4 MB 塊緩存到本地緩存目錄，而不是整個文件。這是 JuiceFS 與其他文件系統或緩存系統的顯著區別。

3. 塊緩存索引在本地緩存目錄中快速定位文件塊。如果找到文件塊，JuiceFS 會從本地磁盤讀取，進入內核空間，并將數據返回給 JuiceFS 進程，再將數據返回給應用。

4. 讀取本地磁盤數據后，也會緩存在內核頁面緩存中。這是因為如果不使用直接 I/O，Linux 系統會默認將數據存儲在內核頁面緩存中。內核頁面緩存可加快緩存訪問速度。如果第一個請求命中并返回數據，則請求不會通過用戶空間（FUSE）層中的文件系統進入用戶空間進程。如果沒有，JuiceFS 客戶端會通過緩存目錄來獲取這些數據。如果在本地找不到，則會將網絡請求發送到對象存儲，然后提取數據并將其返回到應用程序。

5. 當 JuiceFS 從對象存儲下載數據時，數據會異步寫入本地緩存目錄。這可確保下次訪問同一塊時，可以在本地緩存中命中該塊，而無需再次從對象存儲中檢索它。

與數據緩存不同，元數據緩存時間更短。為了確保強一致性，默認情況下不緩存 Open 操作。考慮到元數據流量較低，其對整體 I/O 性能的影響很小。但是，在小文件密集型場景中，元數據的開銷也占據了一定的比例。

為什么AI模型訓練太慢？

當你使用 JuiceFS 進行模型訓練時，性能是你應該考慮的關鍵因素，因為它直接影響訓練過程的速度。有幾個因素可能會影響 JuiceFS 的培訓效率：

元數據引擎

元數據引擎（如 Redis、TiKV 或 MySQL）的選擇會在處理小文件時顯著影響性能。一般來說，Redis 比其他數據庫快 3-5 倍。如果元數據請求速度較慢，請嘗試使用更快的數據庫作為元數據引擎。

對象存儲

對象存儲會影響數據存儲訪問的性能和吞吐量。公有云對象存儲服務提供穩定的性能。如果您使用自建對象存儲（例如 Ceph 或 MinIO），則可以優化組件以提高性能和吞吐量。

本地磁盤

緩存目錄存儲的位置對整體讀取性能有重大影響。在高緩存命中率的情況下，緩存磁盤的 I/O 效率會影響整體 I/O 效率。因此，您必須考慮存儲類型、存儲介質、磁盤容量和數據集大小等因素。

網絡帶寬

第一輪訓練后，如果數據集不足以在本地完全緩存，網絡帶寬或資源消耗會影響數據訪問效率。在云中，不同的機器型號具有不同的網卡帶寬。這也會影響數據訪問速度和效率。

內存大小

內存大小會影響內核頁緩存的大小。當有足夠的內存時，剩余的可用內存可以作為 JuiceFS 的數據緩存。這可以進一步加快數據訪問速度。

但是，當可用內存很少時，您需要通過本地磁盤獲取數據訪問權限。這會導致訪問開銷增加。此外，在內核模式和用戶模式之間切換會影響性能，例如系統調用的上下文切換開銷。

如何排查 JuiceFS 中的問題

JuiceFS 提供了許多工具來優化性能和診斷問題。

工具#1：命令juicefs profile

您可以運行該命令來分析訪問日志以進行性能優化。掛載每個文件系統后，都會生成訪問日志。但是，訪問日志不會實時保存，僅在查看時顯示。juicefs profile

與查看原始訪問日志相比，該命令聚合信息并執行滑動窗口數據統計信息，按響應時間從高到低對請求進行排序。這有助于您專注于響應時間較慢的請求，進一步分析請求與元數據引擎或對象存儲之間的關系。juicefs profile

工具#2：命令juicefs stats

該命令從宏觀角度收集監視數據并實時顯示。它監控當前掛載點的 CPU 使用率、內存使用率、內存中的緩沖區使用率、FUSE 讀/寫請求、元數據請求和對象存儲延遲。通過這些詳細的監控指標，可以輕松查看和分析模型訓練期間的潛在瓶頸或性能問題。juicefs stats

其他工具

JuiceFS 還提供了 CPU 和堆分析的性能分析工具：

CPU 分析工具分析了 JuiceFS 進程執行速度的瓶頸，適合熟悉源代碼的用戶。

堆分析工具會分析內存使用情況，尤其是在 JuiceFS 進程占用大量內存時。有必要使用堆分析工具來確定哪些函數或數據結構消耗了大量內存。

加速AI模型訓練的常用方法

元數據緩存優化

您可以通過兩種方式優化元數據緩存，如下所示。

調整內核元數據緩存的超時

參數、和對應于不同類型的元數據：--attr-cache--entry-cache--dir-entry-cache

attr表示文件屬性，例如大小、修改時間和訪問時間。

entry表示 Linux 中的文件和相關屬性。

dir-entry表示目錄及其包含的文件。

這些參數分別控制元數據緩存的超時。

為了保證數據的一致性，這些參數的默認超時值僅為1秒。在模型訓練場景中，不會修改原始數據。因此，可以將這些參數的超時時間延長到幾天甚至一周。請注意，元數據緩存無法主動失效，只能在超時期限到期后刷新。

優化 JuiceFS 客戶端的用戶級元數據緩存

打開文件時，元數據引擎通常會檢索最新的文件屬性以確保強一致性。但是，由于通常不會修改模型訓練數據，因此可以啟用該參數，并且可以設置超時以避免每次打開同一文件時重復訪問元數據引擎。

此外，該參數控制緩存文件的最大數量。默認值為 10，000，這意味著最近打開的 10，000 個文件的元數據最多將緩存在內存中。可以根據數據集中的文件數調整此值。

數據緩存優化

JuiceFS 數據緩存包括內核頁面緩存和本地數據緩存：

內核頁面緩存不能通過參數調整。因此，在計算節點上預留足夠的空閑內存，以便 JuiceFS 能夠充分利用它。如果計算節點上的資源緊張，JuiceFS 不會在內核中緩存數據。

本地數據緩存可由用戶控制，緩存參數可根據具體場景進行調整。

調整緩存大小，默認值為 100 GB，這足以滿足大多數方案的需求。但是，對于占用特別大的存儲空間的數據集，需要適當調整緩存大小。否則 100 GB 的緩存空間可能會很快被填滿，使得 JuiceFS 無法緩存更多數據。

另一個可以與之一起使用的參數是。它確定緩存磁盤上的可用空間量。默認值為 0.1，它允許將最多 90% 的磁盤空間用于緩存數據。

JuiceFS 也支持同時使用多個緩存盤。建議盡可能使用所有可用磁盤。數據將通過輪詢均勻分布到多個磁盤，實現負載均衡，最大化多個磁盤的存儲優勢。

緩存預熱

為了提高訓練效率，您可以使用緩存預熱來加速訓練任務。JuiceFS 支持在客戶端預熱元數據緩存和本地數據緩存。該命令會提前構建緩存，以便在訓練任務開始時緩存可用，從而提高效率。

增加緩沖區大小

緩沖區大小也會影響讀取性能。默認情況下，緩沖區大小為 300 MB。但在高通量訓練場景中，這可能還不夠。您可以根據訓練節點的內存資源調整緩沖區大小。

一般來說，緩沖區大小越大，讀取性能越好。但不要將值設置得太大，尤其是在最大內存有限的容器環境中。有必要根據實際工作負載設置緩沖區大小，并找到一個相對合理的值。可以使用本文前面介紹的命令實時監視緩沖區使用情況。

審核編輯：郭婷

閱讀全文

人工智能(229987) 人工智能(229987)
MySQL(25956) MySQL(25956)

分布式系統的優勢是什么？

當討論分布式系統時，我們面臨許多以下這些形容詞所描述的同類型： 分布式的、刪絡的、并行的、并發的和分散的。分布式處理是一個相對較新的領域，所以還沒有‘致的定義。與順序計算相比、并行的、并發的和分布式的計算包括多個PE問的集體協同動作。這些術語在范圍一卜相互覆蓋，有時也交換使用。　

2020-03-31 09:01:18

分布式系統的組合相位噪聲性能怎么評估？

在分布式系統中，共同噪聲源是相關的，而分布式噪聲源如果不相關，在RF信號組合時就會降低。對于系統中的大部分組件，這都可以非常直觀地加以評估。對于鎖相環，環路中的每個組件都有與之相關聯的噪聲傳遞函數

2019-08-02 08:35:04

分布式系統硬件資源池原理和接入實踐

把各個設備的硬件外設抽象為外設信息單元，外設信息在各個可信設備之間自動同步，如此，實現了外設信息的全局可見；結合分布式硬件虛擬化技術，實現任意設備之間的硬件外設能力跨設備調用；分布式硬件資源池作為系統

2023-12-06 10:02:45

分布式光纖測溫系統DTS

關于分布式光纖測溫系統的簡介說明

2018-10-18 14:01:57

分布式光纖測溫系統DTS-BLY-5S介紹

分布式光纖測溫系統DTS-BLY-5S

2021-01-06 07:45:31

分布式光纖測溫系統DTS-BLY-5S介紹

分布式光纖測溫系統DTS-BLY-5S系統的特點

2020-12-22 06:49:48

分布式入侵檢測系統的設計

分布式入侵檢測系統的設計入侵檢測是網絡安全的一個新方向，其重點是有效地提取特征數據并準確地分析出非正常網絡行為。該文在深入研究分析公共入侵檢測框架理論和現有入侵檢測系統實現策略的基礎上，提出一種

2009-03-10 09:55:26

分布式聲波傳感系統DAS

分布式聲波傳感系統DAS產品介紹1、分布式聲傳感（Distributed?Acoustic?Sensing,?DAS）技術：利用相干瑞利散射光的相位而非光強來探測音頻范圍內的聲音或振動等信號

2018-11-09 11:48:17

分布式聲波傳感系統DAS產品介紹

分布式聲波傳感系統DAS

2020-12-21 07:48:43

分布式操作系統的相關資料分享

文章目錄分布式操作系統嵌入式操作系統集群操作系統集群系統管理分布式操作系統在以往的計算機系統中，其處理和控制功能都高度集中在一臺主機上，所有的任務都由主機處理，這樣的系統稱為集中式處理系統。而大量

2021-12-22 07:23:59

分布式數據庫有什么優缺點？

分布式數據庫系統（DDBS）是數據庫技術和網絡技術兩者相互滲透和有機結合的結果。涉及數據庫基本理論和網絡通信理論。分布式數據庫由一組數據組成，這些數據在物理上分布在計算機網絡的不同節點上，邏輯上是屬于同一個系統。

2019-09-24 09:13:39

分布式文件系統和fastDFS

項目（1）（分布式文件系統、fastDFS，代碼實現fastDFS 文件上傳和下載）

2019-05-10 08:51:28

分布式電源分布式電源裝置是指什么？有何特點

分布式電源分布式電源裝置是指與環境兼容的獨立電源，功率為數千瓦與環境兼容。這些電源由電力部門、電力用戶或第3方所有，用以滿足電力系統和用戶特定的要求。例如，對偏遠地區的用戶或商業地區、居民地

2021-12-29 06:51:27

分布式電源的相關資料推薦

（1）含分布式電源的配電網日前兩階段優化調度模型，EI，如圖 1—3matlab源代碼，高水平文章，保證正確，可先發您文章看是否滿足您的要求在電力市場環境下，供電公司通過對接入配電網的分布式電源

2021-12-29 06:33:33

分布式能源系統當微型電網技術應用

分布式能源系統當微型電網技術應用、電網微型電網的分布式電源及接入模式在國際上由于電力市場的拓展,在受到了發電投資的回報周期較長和幾次國際上大面積的停電所影響,新增的電源當中分布式的發電設施,所占比例

2011-06-13 14:25:10

分布式軟件系統

分布式軟件系統分布式軟件系統(Distributed Software Systems)是支持分布式處理的軟件系統,是在由通信網絡互聯的多處理機體系結構上執行任務的系統。它包括分布式操作系統

2009-07-22 14:53:12

分布式控制系統

分布式控制系統分布式控制系統 (distributed control systems,簡稱DCS),又稱為分散控制系統,分散型控制系統,集散控制系統.行業內業稱4C技術既Control控制技術

2010-03-01 22:19:00

存儲系統的層次結構

的L1 Cache存儲管理段式存儲管理頁式存儲管理存儲系統的層次結構技術指標層次結構局部性原理主存儲器讀寫存儲器只讀存儲器存儲器地址譯碼主存空間分配高速緩沖存儲器工作原理地址映射替換算法寫入策略80486的L1 CachePentium的L1 Cache存儲管理段式存儲管理頁式存

2021-07-29 09:47:21

訓練好的ai模型導入cubemx不成功怎么解決？

訓練好的ai模型導入cubemx不成功咋辦，試了好幾個模型壓縮了也不行，ram占用過大，有無解決方案？

2023-08-04 09:16:28

HarmonyOS應用開發-分布式設計

設計理念HarmonyOS 是面向未來全場景智慧生活方式的分布式操作系統。對消費者而言，HarmonyOS 將生活場景中的各類終端進行能力整合，形成“One Super Device”，以實現

2020-09-22 17:11:07

HarmonyOS應用開發-分布式語音攝像頭體驗

一、組件說明使用HarmonyOS分布式文件系統和AI語音識別功能開發了一個分布式語音攝像頭。使用此相機應用程序，同一分布式網絡下的不同設備可以實時看到主設備拍攝的照片。這有效解決了對方拍照時需要

2022-08-24 15:06:51

OpenHarmony3.1分布式技術資料合集

如下：common：存放公共資源media：存放圖片model：存放數據模型類KvStoreModel.ts：分布式數據存儲類RemoteDeviceModel.ts：遠程設備類pages：存放頁面

2022-04-11 11:50:05

RTX在分布式實時仿真系統中的應用是什么？

基于反射內存實時局域網的特點是什么？基于反射內存卡實時局域網的實現機制RTX在分布式實時仿真系統中的應用

2021-05-19 06:46:01

TSP分布式控制有什么優勢？

TSP分布式控制有什么優勢？TSP分布式控制提高了測試速度并且降低了測試成本。

2021-05-12 06:19:56

labview分布式壓力測量

基于labview的分布式壓力采集系統，用于假肢接受腔內部接觸面的壓力測量，選擇哪種壓力傳感器和采集卡比較合適，求推薦。

2015-05-19 14:31:25

【學習打卡】OpenHarmony的分布式數據管理介紹

分布式數據管理，英文縮寫是DDM，是對一個系統中創建和收集的數據的提取、存儲、組織和維護的過程進行的有效控制和管理。有效的數據管理對于運行應用程序，以及提供分析信息來幫助整個系統進行規劃和決策，從而

2022-07-15 15:49:32

關于分布式系統的全面介紹

操作系統-----分布式系統概述

2019-07-25 06:59:49

各種分布式電源的電氣特性

PS：滲透率的概念：從字面上理解，“滲透”就是由分布式電源發出的功率進入（滲入）到配電系統，所謂的“率”就是由分布式電源發出的電和整個系統所消耗的電（或者說總發電量）的一個比值。各種分布式電源的電氣

2021-07-12 07:54:19

基于ZigBee的分布式電子警察系統該如何去設計？

一種基于ZigBee和ModBus的分布式電子警察系統設計

2021-05-31 06:24:15

如何使用Jmeter進行分布式測試；檢索日志？

使用 Jmeter 進行分布式測試；檢索日志

2023-05-10 13:00:46

如何利用FPGA設計無線分布式采集系統？

的選擇無線分布式采集來進行。現有的無線分布式采集系統中，往往使用單片機、DSP等作為系統的主控控制單元。但是由于其自身工作特點，往往對于精確的定時控制以及并行處理能力上比FPGA弱。

2019-10-14 07:10:38

如何去設計分布式車身控制系統？

分布式車身控制系統的結構是怎樣構成的？分布式車身控制系統有哪些功能？

2021-05-13 07:03:30

如何去設計一種分布式數據采集與控制系統？

如何去設計一種分布式數據采集與控制系統？

2021-05-28 07:18:31

如何對分布式天線系統(DAS)進行優化？

什么是分布式天線系統？如何對分布式天線系統(DAS)進行優化？

2021-05-24 06:03:56

如何設計分布式干擾系統？

什么是分布式干擾系統？分布式干擾系統是一種綜合化、一體化、小型化、網絡化和智能化系統，是將眾多體積小，重量輕，廉價的小功率偵察干擾機裝置在易于投放的小型平臺上，撒布在接近***擾目標空域地，通過指令

2019-08-08 06:57:44

如何高效完成HarmonyOS分布式應用測試？

作者：liuxun，HarmonyOS測試架構師HarmonyOS是新一代的智能終端操作系統，給開發者提供了設備發現、設備連接、跨設備調用等豐富的分布式API。隨著越來越多的開發者投入到

2021-12-13 18:07:58

常見的分布式供電技術有哪些？

　　分布式供電技術是指將發電設備建設在用戶或供電系統端，將發電與負荷直接相連，通過局部供電的方式滿足用戶的電力需求。其主要特點是將傳統的集中式供電方式改為分散式供電方式，不僅既有大型電站向小型分布式

2023-04-10 16:28:30

開放分布式追蹤（OpenTracing）入門與 Jaeger 實現

您享受 Jaeger 在分布式追蹤領域給您帶來便捷的同時無需過多關注后端存儲系統的問題。Jaeger UI 部分僅提供查詢、展示 trace 的功能，對分析問題、排查問題支持不足。使用 Jaeger

2018-03-07 16:27:35

怎么實現分布式測試系統的一種網絡通信設計

怎么實現分布式測試系統的一種網絡通信設計？

2021-05-08 09:48:22

怎樣去設計一種小容量分布式光伏電站信息采集系統

小容量分布式光伏電站信息采集系統是由哪些部分組成的？怎樣去設計一種小容量分布式光伏電站信息采集系統？

2021-10-22 06:22:39

我國分布式光伏發電發展現狀

。　　我國光伏產業嚴重依賴國外市場的風險在歐美“雙反”時暴露無遺。為挽救我國光伏產業，國家今年連續出臺政策支持分布式光伏發電發展。為了響應國家政策，國家電網公司發布分布式光伏發電相關管理辦法，為促進

2014-04-22 14:38:48

淺談分布式緩存技術

存儲成本分布式緩存應用場景1，用于緩存網頁的內容片段，包括HTML，CSS和圖像等，主要用于社交網站;2，緩存系統作為ORM框架的二級緩存提供外部服務，減輕了數據庫的負載壓力，加快了應用訪問;3.緩存

2018-11-16 15:45:55

萌新求助，求一個分布式光伏發電監測系統解決方案

萌新求助，求一個分布式光伏發電監測系統解決方案

2021-10-22 07:59:10

請問怎么設計一種分布式無線測控系統？

怎么設計一種分布式無線測控系統？無線測控網絡系統具有哪些優點及應用？

2021-04-13 06:29:32

請問怎樣去設計一種車門分布式控制系統？

一種介紹基于CAN/LIN總線的車門分布式控制系統設計

2021-05-14 06:44:29

分布式光纖測溫系統（DTS）

產品概述： 分布式光纖測溫系統（DTS）是杭州淞柏科技有限公司（http

2021-11-25 15:49:18

分布式測控系統框架模型研究

本文提出了一種組建分布式測控系統的方法。描述了分布式測控系統基于網絡、物理層節點和功能節點的三層結構模型。這種模型是建立在面向對象的軟件方法上的。該模型有著良

2009-06-09 09:18:05

一種分布式視頻系統中多級存儲模型研究

本文提出的分布式視頻系統中一種多級存儲模型，它將計算機系統中的緩存概念應用于網絡信息服務系統中。中央檔案服務器(AS)作為一種后備視頻庫的方式存在，它的優點是存儲

2009-07-30 10:16:38

#硬聲創作季 13-JAVAEE實戰項目課程—Ceph介紹-分布式存儲系統對比與Ceph整體

JAVA存儲系統編程語言分布式存儲分布式存儲系統

Mr_haohao發布于 2022-09-05 07:50:51

分布式存儲架構：第一節什么是分布式存儲??#云計算培訓?#大數據?#分布式存儲?#硬聲創作季

云計算分布式存儲分布式存儲系統

學習硬聲知識發布于 2022-10-21 14:28:10

分布式存儲架構：第二節分布式存儲優勢??#云計算?#大數據??#分布式存儲?#硬聲創作季

云計算分布式存儲分布式存儲系統

學習硬聲知識發布于 2022-10-21 14:28:31

分布式存儲架構：第三節分布式文件模型?#分布式架構??#分布式存儲系統?#分布式系統?#硬聲創作季

云計算存儲系統分布式系統分布式存儲分布式存儲系統

學習硬聲知識發布于 2022-10-21 14:28:49

分布式存儲架構：第四節分布式數據分片?#云計算?#大數據??#分布式存儲#硬聲創作季

云計算分布式存儲分布式存儲系統

學習硬聲知識發布于 2022-10-21 14:29:06

分布式存儲架構：第六節分布式CAP原則?#云計算??#分布式存儲??#cap?#硬聲創作季

云計算分布式存儲分布式存儲系統

學習硬聲知識發布于 2022-10-21 14:29:39

分布式存儲架構：第七節分布式數據壓縮算法?#云計算?#分布式存儲?#壓縮算法?#硬聲創作季

云計算壓縮分布式存儲分布式存儲系統

學習硬聲知識發布于 2022-10-21 14:29:56

分布式存儲架構：第八節分布式數據即刻修復?#分布式存儲?#數據修復?#大數據?#硬聲創作季

云計算修復分布式存儲分布式存儲系統

學習硬聲知識發布于 2022-10-21 14:30:38

分布式存儲架構：第九節分布式數據存儲方式?#大數據?#分布式存儲?#分布式?#硬聲創作季

云計算數據存儲分布式存儲數據存儲技術數據存儲器分布式存儲系統數據存儲方式

學習硬聲知識發布于 2022-10-21 14:31:06

分布式存儲架構：第十一節 Ceph 功能優勢??#分布式存儲?#大數據?#ceph分布式存儲?#硬聲創作季

云計算分布式存儲分布式存儲系統

學習硬聲知識發布于 2022-10-21 14:31:58

分布式存儲架構：第十一節 Ceph 功能優勢??#分布式存儲?#大數據?#ceph分布式存儲?#硬聲創作季

云計算分布式存儲分布式存儲系統

學習硬聲知識發布于 2022-10-21 14:32:27

分布式存儲架構：第十二節 Ceph 應用場景??#分布式存儲?#大數據?#ceph分布式存儲?#硬聲創作季

云計算分布式存儲分布式存儲系統

學習硬聲知識發布于 2022-10-21 14:57:46

分布式存儲架構：第十三節 Ceph 分布式存儲架構?#分布式存儲?#大數據?#ceph分布式存#硬聲創作季

云計算分布式存儲分布式存儲系統

學習硬聲知識發布于 2022-10-21 14:58:13

GL Studio的分布式虛擬訓練系統關鍵技術

為在GL Studio中實現分布式虛擬儀表的遠程交互，對該虛擬訓練系統的關鍵技術進行研究。在分析分布式虛擬訓練系統運行環境和操作流程的基礎上，給出系統的總體設計框架；設計出基

2011-03-22 00:04:16

[2.2.1]--初步認識大數據對分布式存儲系統的需求

分布式大數據

jf_75936199發布于 2023-03-06 23:38:58

[2.7.1]--分布式存儲系統舉例（主講人：姚文輝）

分布式大數據

jf_75936199發布于 2023-03-06 23:42:25

存儲分布式系統中如何從CAP轉到PACELC

CAP理論是當前分布式存儲系統設計的理論指導，而PACELC理論是CAP理論的擴展，分布式存儲系統設計的理論依據是時候從CAP理論擴展為PACELC理論。

2018-06-10 01:45:00

2575

基于單機存儲系統故障恢復

本文中介紹的故障恢復主要是只單機存儲系統中的故障恢復，就是只有一臺電腦，與之相對的是分布式存儲系統，暫且不談。

2018-06-10 01:41:00

777

集群環境下分布式索引的實現

針對分布式存儲系統上使用非主鍵訪問數據帶來的性能問題，探討在分布式存儲系統上實現索引的相關關鍵技術。在充分分析分布式存儲特征的基礎上，提出了分布式索引設計和實現的關鍵點，并結合分布式存儲系統的特點

2017-12-25 10:01:56

一種面向高性能計算的分布式對象存儲系統

在高性能計算領域，隨著計算規模的不斷擴大，其配套存儲系統規模也在快速擴展，同時支撐的應用也從傳統的科學計算擴展到數據分析等領域，給目前高性能計算機上普遍使用的以分布式文件系統為核心的集中共享文件系統

2018-01-29 16:08:42

分布式存儲運維系統構架簡析

分布式存儲系統是為了解決單機存儲所存在的容量、性能等瓶頸，以及可用性、擴展性等方面的問題，通過把數據分散存儲在多臺存儲設備上，為大規模的存儲應用提供大容量、高性能、高可用、擴展性好的存儲服務。這一

2018-06-01 10:32:00

2549

廣域網環境下的分布式存儲系統原型的介紹

本文提出一種在廣域網環境下的采用冗余數據刪除技術的分布式存儲系統原型——AegeanStore。在AegeanStore中采用客戶端相關的冗余數據刪除技術。該技術通過客戶端和服務器端的合作，不僅

2018-11-01 09:33:00

2630

探討AI在存儲中的應用和對存儲系統的改進

說一說AI技術在存儲中的應用，和對存儲系統帶來的創新性改進。

2018-10-24 15:41:58

4084

分布式存儲的優點

本視頻主要詳細介紹了分布式存儲的優點，分別是高性能、支持分級存儲、多副本的一致性、容災與備份、彈性擴展、存儲系統標準化。

2019-01-04 15:53:56

12283

關于騰訊的開源分布式存儲系統DCache

騰訊最近開源了一個分布式 NoSQL 存儲系統 DCache，它的典型應用場景就在分布式緩存。根據官方介紹，DCache 基于 TARS 微服務治理方案，它支持 k-v、k-k-row、list、set 與 zset 多種數據結構，數據基于內存存儲，同時支持后接 DB 實現數據持久化。

2019-08-01 10:42:44

1881

元核云最新發布自主可控分布式存儲產品

YC-SCDS（元核云自主可控分布式存儲系統）采用業內領先的分布式架構，基于指令集自主可控的申威1621處理器硬件平臺，支持中標麒麟、深度、神威睿思等多款國產Linux操作系統。

2019-08-23 11:02:14

857

關于分布式存儲系統糾刪碼技術的分享

隨著計算機技術和存儲技術的發展，數據正以爆炸式的速度增長，海量數據對存儲系統提出了巨大的挑戰。為了保障存儲系統的CAP，Consistency（一致性）、 Availability（可用性

2020-07-11 11:29:24

3233

盤點分布式存儲系統的主流框架

整個大數據處理的體系，按我的理解可以分為兩個部分，一個是分布式存儲系統、另一個是分布式計算框架。分布式存儲系統主流是HadoopDFS，其他還有Ceph和Swift。分布式計算框架主流是MapReduce，Storm和Spark。

2020-08-06 09:07:08

2402

分布式文件存儲系統GFS的基礎知識

GFS是google的分布式文件存儲系統，是專為存儲海量搜索數據而設計的，2003年提出，是閉源的分布式文件系統。

2020-08-25 17:49:07

5282

常見的分布式存儲系統有哪些類型

分布式存儲系統是大數據技術學習過程中會經常接觸到的一個工具，而今天我們就一起來了解一下，常見的一些分布式存儲系統都有哪些類型。

2020-11-09 10:41:01

27499

分布式存儲常見的架構有哪些

分布式存儲系統，是將數據分散存儲在多臺獨立的設備上。傳統的網絡存儲系統采用集中的存儲服務器存放所有數據，存儲服務器成為系統性能的瓶頸，也是可靠性和安全性的焦點，不能滿足大規模存儲應用的需要。

2020-11-16 14:55:06

8199

中科曙光基于區塊鏈存儲應用的智能高效的專屬存儲系統—區塊鏈存儲系統ChainStor

近日，中科曙光在北京發布了基于區塊鏈存儲應用打造的一款智能高效的專屬存儲系統——區塊鏈存儲系統ChainStor。ChainStor沿用了曙光多年技術積累的分布式存儲架構，底層核心是基于裸設備的數據

2020-12-31 11:36:00

13314

分布式存儲的特性/類型/需要解決的問題

互聯網的發展催生了云計算和大數據的發展，云計算和大數據的本質都是構建低成本，高性能高可用的分布式存儲系統，本文簡單介紹分布式存儲的一些基礎知識。

2021-01-14 10:09:14

3712

分布式存儲系統聯合解決方案的優勢是什么

日前，飛騰攜手芯盛智能推出分布式存儲系統聯合解決方案，該方案由飛騰FT-2000+/64處理器提供核心算力支撐，能夠應用于云計算、大數據等需要海量存儲的業務環境，為信息產業和新基建積極賦能。擴展

2021-01-22 13:46:33

1678

一種可行的分布式存儲系統安全構造方法

針對當前分布式存儲系統中漏洞后門威脅導致的數據安全問題，通過引入網絡空間擬態防御理論及其相關安全機制，從結構角度出發增強系統的安全防護能力。對分布式存儲系統面臨的主要威脅和攻擊途徑進行分析，定位

2021-04-02 11:01:07

Ceph分布式存儲系統性能優化研究綜述

Ceph是一個統一的分布式存儲系統，可同時提供塊、文件和對象3種接口的存儲服務。與傳統的分布式存儲系統不同，它采用了無中心節點的元數據管理方式，因此具有良妤的擴展性和線性增長的性能。經過十余年的發展

2021-04-13 13:58:29

分布式存儲系統與糾刪碼技術背景

01 分布式存儲系統與糾刪碼技術背景 分布式存儲是當代大數據的基本存在形式，在工業界和學術界已經得到深入研究和高度重視，為了解決大規模存儲帶來的磁盤故障，跨節點直接復制數據包存儲是最簡單的解決方案

2021-06-01 11:31:18

2275

Google Brain和DeepMind聯手發布可以分布式訓練模型的框架

【導讀】AI模型進入大數據時代，單機早已不能滿足訓練模型的要求，最近Google Brain和DeepMind聯手發布了一個可以分布式訓練模型的框架Launchpad，堪稱AI界的MapReduce

2021-06-26 15:42:42

1974

探究超大Transformer語言模型的分布式訓練框架

。優化的分布式集群架構：NVIDIA DGX SuperPOD 有了高效的分布式訓練框架，自然也需要優化的分布式訓練集群。 NVIDIA DGX SuperPOD 便是 NVIDIA 推出的一個

2021-10-20 09:25:43

2078

為什么需要分布式存儲？

華為OceanStor Pacific系列存儲是一款可大規模橫向擴展的智能分布式存儲產品，是既具備云基礎架構的彈性按需服務能力、又滿足企業級關鍵業務和新興業務需求的全自研存儲系統。

2022-07-23 10:25:22

1577

一個去中心化的分布式存儲系統Ceph概述

Ceph 是一個去中心化的分布式存儲系統，提供較好的性能、可靠性和可擴展性。

2022-09-02 10:11:23

1493

分布式存儲的分類和典型應用場景

分布式對象存儲：指各存儲節點由標識符、數據和元數據的對象數據構成。其中標識符在該存儲系統中唯一，用于區分不同存儲區域；元數據將提取數據特征，便于快速檢索。

2023-06-12 14:38:13

2598

分布式存儲的7個特征

什么是分布式存儲呢？如果一個存儲系統，不管是對象、塊、文件、kv、log、olap、oltp，只要對所管理的數據做了Partitioning&Replication，不管姿勢對不對，其實

2023-07-18 14:17:26

568

基于PyTorch的模型并行分布式訓練Megatron解析

NVIDIA Megatron 是一個基于 PyTorch 的分布式訓練框架，用來訓練超大Transformer語言模型，其通過綜合應用了數據并行，Tensor并行和Pipeline并行來復現 GPT3，值得我們深入分析其背后機理。

2023-10-23 11:01:33

826

曙光存儲推出ParaStor分布式全閃存儲

曙光存儲推出ParaStor分布式全閃存儲，攜業內首創技術XDS，以訓練加速、穩定性強、性價比高的獨特價值，全維度涵蓋網絡、計算和平臺，為千行百業的AI大模型開發者提供存儲解決方案。

2024-03-01 11:30:19

138

大數據時代的存儲革命：理解分布式存儲系統

數據管理的效率極低。因此，分布式存儲系統應運而生。 分布式存儲就是將數據存儲在眾多的服務器或網絡節點上，而不是集中在單個位置。這種方式的好處包括：方便擴容、數據冗余備份提高容錯性、避免單點故障影響整個系統。而分布式計算則是將一個大任

2024-03-07 15:40:21

111

已全部加載完成

搜索歷史

如何使用分布式存儲系統促進AI模型訓練

評論