在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息發(fā)布為大模型專門優(yōu)化的分布式全閃存儲AS13000G7-N系列

浪潮存儲 ? 來源:浪潮存儲 ? 2024-05-08 09:38 ? 次閱讀

近日,浪潮信息發(fā)布為大模型專門優(yōu)化的分布式全閃存儲AS13000G7-N系列。該系列依托浪潮信息自研分布式文件系統(tǒng),搭載新一代數(shù)據(jù)加速引擎DataTurbo,通過盤控協(xié)同、GPU直訪存儲、全局一致性緩存等技術(shù)為AI大模型數(shù)據(jù)歸集、訓(xùn)練、數(shù)據(jù)歸檔與管理等階段提供強大存儲支撐能力,助力用戶加速大模型系統(tǒng)的創(chuàng)新及應(yīng)用落地。

化解大模型時代的存儲挑戰(zhàn)

構(gòu)建堅實的數(shù)據(jù)存儲底座

大模型已經(jīng)成為驅(qū)動數(shù)字經(jīng)濟深度創(chuàng)新、引領(lǐng)企業(yè)業(yè)務(wù)變革、加速形成新質(zhì)生產(chǎn)力的重要動能,隨著大模型參數(shù)量和數(shù)據(jù)量的極速膨脹,多源異構(gòu)數(shù)據(jù)的傳、用、管、存,正在成為制約生成式AI落地的瓶頸之一,用戶亟需構(gòu)建更加高效的存儲底座。在數(shù)據(jù)準備階段,在規(guī)模大、來源廣泛、格式多樣的原始數(shù)據(jù)中,篩選和清洗出利用于訓(xùn)練的高質(zhì)量數(shù)據(jù)常會耗費大量時間;在模型訓(xùn)練階段,海量小文件數(shù)據(jù)加載、Checkpoint數(shù)據(jù)調(diào)用對IO處理效率提出嚴苛要求;模型訓(xùn)練之后,多個數(shù)據(jù)資源池無法互通、海量冷數(shù)據(jù)歸檔帶來較高的數(shù)據(jù)管理復(fù)雜度。

作為率先在業(yè)界提出分布式融合存儲的廠商,浪潮信息聚焦行業(yè)客戶的大模型落地需求與核心痛點,基于NVMe SSD研發(fā)出高效適配和優(yōu)化的分布式全閃存儲AS13000G7-N系列。硬件方面,AS13000G7-N是一款2U24盤位的全閃存儲機型,搭載英特爾至強第四、第五代可擴展處理器,支持400 Gb 網(wǎng)卡,同時每盤位可配置15.36TB 大容量NVMe SSD。軟件方面,通過集群控制服務(wù)將N個節(jié)點聯(lián)成一套具有高擴展性的文件系統(tǒng);通過分布式元數(shù)據(jù)服務(wù)提升海量小文件讀寫性能;通過數(shù)控分離架構(gòu),實現(xiàn)東西向網(wǎng)絡(luò)優(yōu)化,降低IO訪問時延,提升單節(jié)點帶寬。在軟硬件協(xié)同創(chuàng)新下,AS13000G7-N充分滿足大模型應(yīng)用在存儲性能和存儲容量方面的嚴苛需求。

1a34deda-0c6e-11ef-a297-92fbcf53809c.jpg

具體來說,在數(shù)據(jù)準備階段,通過多協(xié)議融合互通技術(shù),面對多份、多種協(xié)議的數(shù)據(jù),存儲底層僅保留一份數(shù)據(jù),實現(xiàn)數(shù)據(jù)共享免搬遷;在模型訓(xùn)練階段,通過大小IO智能識別和緩存預(yù)讀技術(shù)快速保存和恢復(fù)checkpoint(檢查點)文件,實現(xiàn)TB級訓(xùn)練數(shù)據(jù)Checkpoint讀取耗時從10分鐘縮短至10秒內(nèi),大幅提升訓(xùn)練過程中數(shù)據(jù)加載速度;RDMA/RoCE網(wǎng)絡(luò)連接技術(shù)和數(shù)控分離架構(gòu)的設(shè)計,實現(xiàn)東西向數(shù)據(jù)免轉(zhuǎn)發(fā),極限發(fā)揮大模型訓(xùn)練中硬件網(wǎng)絡(luò)帶寬性能;基于盤控協(xié)同架構(gòu),網(wǎng)絡(luò)數(shù)據(jù)直通NVMe SSD,進一步提升單盤帶寬;在數(shù)據(jù)歸檔與管理階段,AS13000G7-N提供了多元異構(gòu)存儲的統(tǒng)一納管能力,保障數(shù)據(jù)資產(chǎn)高效存儲與管理,大幅提升存儲資源的利用率且最大化數(shù)據(jù)基礎(chǔ)設(shè)施投資回報比。

DataTurbo數(shù)據(jù)加速引擎

全力保障大模型高效訓(xùn)練

在大模型的數(shù)據(jù)應(yīng)用全流程中,要想使訓(xùn)練效率達到極致,減少不必要的資源浪費,訓(xùn)練階段的數(shù)據(jù)讀寫性能成為重中之重。而想要提升算力利用率、降低模型訓(xùn)練成本,必須要在數(shù)據(jù)存儲性能上進行創(chuàng)新。

AS13000G7-N系列具備強大的端到端性能優(yōu)化能力,這也是模型訓(xùn)練階段最為核心的考量因素。浪潮信息基于計算和存儲協(xié)同的理念,依托自研分布式文件系統(tǒng)構(gòu)建了新一代數(shù)據(jù)加速引擎DataTurbo,在緩存優(yōu)化、空間均衡、縮短GPU與存儲讀取路徑等方面進行了全面升級。”

■ 智能緩存優(yōu)化,保障大模型訓(xùn)練速度與質(zhì)量

AS13000G7-N能夠通過對大小IO的智能識別,進行分類治理,小文件采取聚合的操作,大文件采取切片的操作,所有數(shù)據(jù)以大小均衡的模式保存到全局緩存中,實現(xiàn)小文件性能提升5倍,大文件性能提升10倍。在模型訓(xùn)練中斷后,從Checkpoint恢復(fù)數(shù)據(jù)過程中,AS13000G7-N通過緩存預(yù)讀技術(shù),提前識別數(shù)據(jù)的冷熱程度,加速了重復(fù)樣本數(shù)據(jù)的讀取,訓(xùn)練加載速度提升10倍。無論是讀操作還是寫操作,AS13000G7-N采取了字節(jié)級(Byte)分布式鎖機制,粒度是主流并行文件系統(tǒng)鎖機制粒度的幾十分之一,確保多個節(jié)點訪問共享資源時能夠安全、有序地進行操作,從而保持訓(xùn)練數(shù)據(jù)的強一致性和訓(xùn)練質(zhì)量。

■ 智能空間均衡,高水位下性能無衰減

AS13000G7-N搭載了浪潮信息自主研發(fā)的分布式并行客戶端技術(shù),相比通用私有客戶端,卸載了獨立的元數(shù)據(jù),實現(xiàn)了元數(shù)據(jù)和數(shù)據(jù)節(jié)點的高效統(tǒng)一部署,有效提升存儲的并發(fā)能力,充分利用訓(xùn)練節(jié)點網(wǎng)卡的帶寬,讓GPU算力得到完全釋放。同時在存儲端,相較于業(yè)界主流的文件系統(tǒng)需要在磁盤之上構(gòu)筑一層文件協(xié)議,AS13000G7-N能夠直接對裸盤的空間進行均衡排布,并在管理層面設(shè)計了智能空間預(yù)分技術(shù),能夠結(jié)合用戶前端算力節(jié)點數(shù)量、訓(xùn)練模型的數(shù)量,對存儲空間分配進一步進行智能策略預(yù)埋。這套組合拳能夠使AS13000G7-N在空間利用率達到95%高水位時,依然可以平穩(wěn)輸出強大的性能。在模型訓(xùn)練的空間損耗上,AS13000G7-N相較傳統(tǒng)方案,將損耗率降低了85%左右,充分保護了客戶在大模型存儲上的投資。

■ GPU直通存儲,服務(wù)萬億參數(shù)大模型

當大模型參數(shù)在百億級別,GPU對存儲資源的調(diào)用效率往往差別不大。但隨著大模型從單模態(tài)走向多模態(tài),數(shù)據(jù)量指數(shù)型增長,訓(xùn)練效率隨之要求更高。從數(shù)據(jù)層面來看,AS13000G7-N具備和GPU直通的能力,數(shù)據(jù)流不經(jīng)過客戶端緩存,直接到達存儲底層文件系統(tǒng),縮短GPU與存儲的讀取路徑,這項技術(shù)能夠使存儲讀寫帶寬翻倍,大模型訓(xùn)練加載時間縮短50%。隨著萬卡萬億參數(shù)模型時代的到來,GPU直通存儲高效提升數(shù)據(jù)讀寫訪問的能力將是大模型訓(xùn)練的標配。

通過上述技術(shù)創(chuàng)新,分布式全閃存儲AS13000G7-N憑借領(lǐng)先的性能和管理優(yōu)勢,能夠幫助用戶加速大模型的數(shù)據(jù)歸集、提升模型訓(xùn)練效率、簡化海量異構(gòu)數(shù)據(jù)的管理,從而推動業(yè)務(wù)智能化變革。浪潮信息將借助AS13000G7-N等存儲產(chǎn)品,與合作伙伴加快在場景化方案定制、市場拓展等方面的創(chuàng)新,助力用戶構(gòu)筑人工智能時代最佳數(shù)據(jù)存儲底座。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19407

    瀏覽量

    231185
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4774

    瀏覽量

    129353
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    21

    文章

    2887

    瀏覽量

    117857
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2545

    瀏覽量

    3166

原文標題:為大模型專門優(yōu)化!浪潮信息發(fā)布分布式全閃存儲AS13000G7-N系列

文章出處:【微信號:inspurstorage,微信公眾號:浪潮存儲】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    浪潮信息AS13000G7榮獲MLPerf? AI存儲基準測試五項性能全球第一

    北京2024年9月27日?/美通社/ -- 9月25日,MLCommons協(xié)會發(fā)布最新MLPerf? Storage v1.0 AI存儲基準測試成績。浪潮信息分布式
    的頭像 發(fā)表于 09-28 16:46 ?253次閱讀
    <b class='flag-5'>浪潮信息</b>AS<b class='flag-5'>13000G7</b>榮獲MLPerf? AI<b class='flag-5'>存儲</b>基準測試五項性能全球第一

    浪潮信息推出AIGC存儲解決方案

    隆重推出了基于其新一代分布式存儲平臺AS13000G7的AIGC存儲解決方案,這一創(chuàng)新成果無疑為當前大模型應(yīng)用面臨的
    的頭像 發(fā)表于 07-03 11:16 ?800次閱讀

    浪潮信息推出基于新一代分布式存儲平臺AS13000G7的AIGC存儲解決方案

    、新一代分布式存儲AS13000G7自身產(chǎn)品優(yōu)勢,新方案從容應(yīng)對大模型應(yīng)用對存儲性能、容量以及數(shù)據(jù)管理等方面的苛刻要求。同時,
    的頭像 發(fā)表于 07-01 19:00 ?1519次閱讀
    <b class='flag-5'>浪潮信息</b>推出基于新一代<b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>平臺AS<b class='flag-5'>13000G7</b>的AIGC<b class='flag-5'>存儲</b>解決方案

    浪潮信息分布式存儲AS13000完成英特爾至強6能效核處理器適配

    近日,浪潮信息分布式存儲AS13000完成英特爾至強6能效核處理器適配,實現(xiàn)每瓦性能提升2.3倍,以更高的效率、更優(yōu)的成本滿足海量多態(tài)數(shù)據(jù)的存儲
    的頭像 發(fā)表于 06-19 10:05 ?938次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>AS<b class='flag-5'>13000</b>完成英特爾至強6能效核處理器適配

    CCF-TCIST走進浪潮信息 共話AI時代存儲創(chuàng)新

    CCF信息存儲技術(shù)專委會走進浪潮信息 共話大模型時代的存儲創(chuàng)新之道 北京2024年6月7日?/美
    的頭像 發(fā)表于 06-07 14:27 ?314次閱讀
    CCF-TCIST走進<b class='flag-5'>浪潮信息</b> 共話AI時代<b class='flag-5'>存儲</b>創(chuàng)新

    浪潮信息重磅發(fā)布“源2.0-M32”開源大模型

    浪潮信息近日發(fā)布了一款全新的開源大模型——“源2.0-M32”。這款大模型在“源2.0”系列模型
    的頭像 發(fā)表于 06-05 14:50 ?840次閱讀

    浪潮信息發(fā)布源2.0-M32開源大模型,模算效率大幅提升

    5月28日,浪潮信息發(fā)布“源2.0-M32”開源大模型。“源2.0-M32”在基于”源2.0”系列模型已有工作基礎(chǔ)上,創(chuàng)新性地提出和采用了
    的頭像 發(fā)表于 05-29 09:34 ?495次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b>源2.0-M32開源大<b class='flag-5'>模型</b>,模算效率大幅提升

    浪潮信息發(fā)布“源2.0-M32”開源大模型

    浪潮信息近日推出了革命性的“源2.0-M32”開源大模型。該模型在源2.0系列基礎(chǔ)上,引入了“基于注意力機制的門控網(wǎng)絡(luò)”技術(shù),構(gòu)建了一個包含32個專家的混合專家
    的頭像 發(fā)表于 05-29 09:08 ?722次閱讀

    浪潮信息發(fā)布AS13000G7-N系列分布式閃存儲

    浪潮信息近日推出了專為大型AI模型優(yōu)化AS13000G7-N系列分布式
    的頭像 發(fā)表于 05-14 10:03 ?622次閱讀

    模型專門優(yōu)化 浪潮信息發(fā)布分布式閃存儲AS13000G7-N系列

    北京2024年5月10日?/美通社/ -- 近日,浪潮信息發(fā)布模型專門優(yōu)化
    的頭像 發(fā)表于 05-10 16:37 ?485次閱讀
    <b class='flag-5'>為</b>大<b class='flag-5'>模型</b><b class='flag-5'>專門</b><b class='flag-5'>優(yōu)化</b> <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b><b class='flag-5'>分布式</b><b class='flag-5'>全</b><b class='flag-5'>閃存儲</b><b class='flag-5'>AS13000G7-N</b><b class='flag-5'>系列</b>

    一圖讀懂浪潮信息新一代分布式閃存儲AS13000G7-N系列

    一圖讀懂浪潮信息新一代分布式閃存儲AS13000G7-N系列
    的頭像 發(fā)表于 05-08 09:35 ?1350次閱讀
    一圖讀懂<b class='flag-5'>浪潮信息</b>新一代<b class='flag-5'>分布式</b><b class='flag-5'>全</b><b class='flag-5'>閃存儲</b><b class='flag-5'>AS13000G7-N</b><b class='flag-5'>系列</b>

    浪潮信息發(fā)布企業(yè)大模型開發(fā)平臺“元腦企智”EPAI

    4月17日,在2024浪潮信息生態(tài)伙伴大會(IPF2024)上,浪潮信息重磅發(fā)布企業(yè)大模型開發(fā)平臺“元腦企智”EPAI(Enterprise Platform of AI),
    的頭像 發(fā)表于 04-18 10:12 ?432次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b>企業(yè)大<b class='flag-5'>模型</b>開發(fā)平臺“元腦企智”EPAI

    浪潮信息推出全球首個單存儲即可支持16節(jié)點的SAP HANA集群方案

    近日,浪潮信息成功實現(xiàn)并推出全球首個單存儲即可支持16節(jié)點的SAP HANA集群方案,閃存儲HF5000系列作為該方案的數(shù)據(jù)
    的頭像 發(fā)表于 04-01 10:03 ?489次閱讀

    浪潮信息與英特爾合作推出一種大模型效率工具“YuanChat”

    3月26日,浪潮信息與英特爾正式宣布,浪潮信息“源2.0系列基礎(chǔ)大模型”已和最新的英特爾? 酷睿? Ultra處理器平臺完成適配,本地推理速度提升100%。
    的頭像 發(fā)表于 03-27 13:50 ?698次閱讀
    <b class='flag-5'>浪潮信息</b>與英特爾合作推出一種大<b class='flag-5'>模型</b>效率工具“YuanChat”

    曙光存儲推出ParaStor分布式閃存儲

    曙光存儲推出ParaStor分布式閃存儲,攜業(yè)內(nèi)首創(chuàng)技術(shù)XDS,以訓(xùn)練加速、穩(wěn)定性強、性價比高的獨特價值,維度涵蓋網(wǎng)絡(luò)、計算和平臺,
    發(fā)表于 03-01 11:30 ?658次閱讀
    主站蜘蛛池模板: 色婷婷亚洲精品综合影院 | 成年美女 | 免费国产成高清人在线视频 | 一区二区三区四区视频 | 色多多在线看 | 国产在线色视频 | 在线播放黄色网址 | 亚洲色图综合在线 | 操日韩美女 | 男男h啪肉np文总受 男男h全肉耽污 | 黄色三级在线观看 | 看毛片网站 | 国产精品午夜在线观看 | 免费又黄又硬又大爽日本 | 欧美特黄三级在线观看 | 男女交性永久免费视频播放 | 久操色| 久久久久国产精品免费看 | 精品乩伦视频 | 一级一级女人18毛片 | 国产伦子一区二区三区 | 欧美一区二区三区大片 | 日本黄色a级| 天天躁夜夜躁狠狠躁躁88 | 色视频免费观看高清完整 | 天天操操| 五月天婷婷在线免费观看 | 午夜片网站 | 国产在线成人一区二区 | 青青热久免费精品视频在线观看 | 中文字幕在线观看一区二区三区 | 国产性做久久久久久 | 欧美高清一区 | 国产午夜精品久久理论片小说 | 日本成人黄色网址 | 诱人的老师bd高清日本在线观看 | 四虎国产永久在线精品免费观看 | 一级特黄aaa大片 | 丁香花在线视频 | 欧美性喷潮 | 久久99精品一级毛片 |