在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

鄭緯民院士:內存型長記憶存儲以存換算是AI推理新趨勢

要長高 ? 2024-11-01 16:03 ? 次閱讀

在10月29日由中國電子工業標準化技術協會舉辦的數據存儲專業委員會(簡稱“數據存儲專委會”)成立大會上,匯聚了產業界代表、專委會成員及多位院士專家,共逾百人,共同探討了數據存儲產業的發展,并見證了數據存儲專業委員會的正式成立。會上,中國工程院院士、數據存儲專委會名譽會長鄭緯民發表了題為“AI存儲:人工智能大模型的基石”的主旨演講。

鄭緯民院士指出,人工智能進入大模型時代展現出兩大特征:一是基礎大模型邁入多模態時代,實現了從單一文本到圖片、視頻等多模態信息的綜合應用;二是大模型已在金融、醫療、智能制造等多個領域得到實際應用。

針對大模型的四個關鍵環節,鄭緯民院士詳細闡述了存儲在大模型訓練和推理應用中所面臨的挑戰及相關技術:

首先,數據獲取階段,大模型訓練需要海量的原始數據,這些數據需被存儲設備妥善保存。隨著大模型從單模態向多模態發展,產生了數以百億計的小文件,這對文件系統的目錄擴展性、讀寫速度以及存儲的低延遲和高可擴展性提出了更高要求。

其次,數據預處理階段,由于原始數據質量參差不齊,存在大量重復和低質量數據,因此需要進行預處理以提升數據質量。以ChatGPT4級別的大模型為例,其訓練過程可能需要1萬塊A100顯卡耗時11個月,其中數據預處理可能占據一半以上的時間,這與數據存儲的性能密切相關。

再次,模型訓練階段,大規模訓練系統(如10萬塊顯卡組成的系統)的可靠性難以保證,頻繁出現故障,導致集群可用度低下。為了快速恢復訓練,需要依賴高性能的存儲系統來快速讀取CheckPoint數據。華為與清華大學MADSys實驗室聯合開發的高性能AI存儲系統在此方面表現出色,曾在國際權威機構MLPerf Storage基準評測中獲得第一名,性能密度是第二名的兩倍。

最后,模型推理階段,這是與AI應用最直接相關的環節。更高效的人工智能需要處理更多數據、使用更大模型以及更長的上下文窗口,但這同時也帶來了極重的推理負載。模型參數以及推理過程中產生的KV-Cache需要巨大的存儲空間。為此,國內優秀的大模型應用Kimi與清華大學MADSys實驗室共同推出了Mooncake分離式推理架構,通過保存共享的KV-Cache,采用以存換算的策略大幅提升系統吞吐。

鄭緯民院士強調,模型推理過程是一個復雜的存儲系統工程,關鍵在于存儲容量大、傳輸速度快以及性價比高。清華大學MADSys實驗室聯合華為數據存儲、9#AISoft、阿里云、面壁、趨境等公司共同開發的高性能內存型長記憶存儲系統即將開源發布,該系統能夠實現大范圍全局共享與持久化KV-Cache,以存換算,共同構建大模型時代下的高性能內存型長記憶存儲系統生態。

最后,鄭緯民院士總結指出,AI存儲是人工智能大模型的基石,貫穿于大模型生命周期的每一個環節。通過以存強算、以存換算,先進的AI存儲能夠提升訓練集群的可用度,降低推理成本,提升用戶體驗。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 存儲
    +關注

    關注

    13

    文章

    4478

    瀏覽量

    86960
  • AI
    AI
    +關注

    關注

    87

    文章

    33711

    瀏覽量

    274451
  • 人工智能
    +關注

    關注

    1804

    文章

    48509

    瀏覽量

    245307
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    AI推理存儲,看好SRAM?

    看到了其前景并提前布局。AI推理也使得存儲HBM不再是唯一熱門,更多存儲芯片與AI推理芯片結合,
    的頭像 發表于 03-03 08:51 ?1438次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>的<b class='flag-5'>存儲</b>,看好SRAM?

    【「零基礎開發AI Agent」閱讀體驗】+ 入門篇學習

    ,展現出高度的個性化 7.AI Agent具備4大能力:規劃、記憶、使用工具、行動 8.短期記憶主要用于處理當前任務與上下文;長期記憶主要用于存儲
    發表于 05-02 09:26

    華為加速AI時代數據存儲產業發展

    近日,在華為中國合作伙伴大會2025上,華為數據存儲產品線總裁周躍峰發表“共筑數智解決方案,共享數據存儲產業大發展”主題演講,深入探討如何加速AI行業化落地,并分享AI時代數據
    的頭像 發表于 04-01 15:35 ?211次閱讀

    曙光存儲全新升級AI存儲方案

    近日,曙光存儲全新升級AI存儲方案,秉持“AI加速”理念,面向AI訓練、AI
    的頭像 發表于 03-31 11:27 ?334次閱讀

    力接棒算力,慧榮科技主控技術突破AI存儲極限

    電子發燒友網報道(文/黃山明)在AI的高速增長下,尤其是以DeepSeek為代表的AI大模型推動存儲需求激增,算力增長倒逼力升級。而存儲
    的頭像 發表于 03-19 01:29 ?1485次閱讀
    <b class='flag-5'>存</b>力接棒算力,慧榮科技<b class='flag-5'>以</b>主控技術突破<b class='flag-5'>AI</b><b class='flag-5'>存儲</b>極限

    曙光存儲先進力引領存儲產業發展

    這些觀點折射出存儲技術對國家培育新質生產力的核心價值。作為國產存儲的實力代表,曙光存儲始終堅持自研,先進力引領
    的頭像 發表于 03-17 09:24 ?415次閱讀

    使用OpenVINO?進行推理時的內存泄漏怎么解決?

    使用 OpenVINO? 進行推理時,內存會隨著時間的推移而增加,并導致程序崩潰。
    發表于 03-06 08:29

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業節省了數百萬美元。
    的頭像 發表于 02-08 09:59 ?555次閱讀
    使用NVIDIA<b class='flag-5'>推理</b>平臺提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能

    華為發布數據通信未來技術趨勢報告

    近日,CCF中國網絡大會(CCF ChinaNet 2024)期間,由中國計算機學會主辦的“算網融合·數智賦能·發展新質生產力”主題論壇成功舉辦。論壇邀請了鄔江興、吳建平、、張宏科多位
    的頭像 發表于 11-18 11:28 ?829次閱讀

    AMD助力HyperAccel開發全新AI推理服務器

    HyperAccel 是一家成立于 2023 年 1 月的韓國初創企業,致力于開發 AI 推理專用半導體器件和硬件,最大限度提升推理工作負載的存儲
    的頭像 發表于 09-18 09:37 ?688次閱讀
    AMD助力HyperAccel開發全新<b class='flag-5'>AI</b><b class='flag-5'>推理</b>服務器

    智馭未來,AI拼才會贏—弘孟董事寄語工業富聯,拼搏共贏新篇章

    奧運會馬上就要開始,Fii工業富聯發布《弘孟董事致工業富聯全體同仁的一封信》,在全球AI競賽浪潮中,AI已經成為公司未來發展的核心驅動力,如何讓
    的頭像 發表于 07-14 08:33 ?744次閱讀
    智馭未來,<b class='flag-5'>AI</b>拼才會贏—<b class='flag-5'>鄭</b>弘孟董事<b class='flag-5'>長</b>寄語工業富聯,拼搏共贏新篇章

    第十三期CCF秀湖會議:共話未來數據中心的存儲平臺技術挑戰與探索

    、清華大學教授,華中科技大學金海教授,清華大學舒繼武教授,浪潮存儲產品線總經理李輝等20余位專家出席會議。秀湖會議AC主席、CCF副理事
    的頭像 發表于 06-04 16:33 ?509次閱讀
    第十三期CCF秀湖會議:共話未來數據中心的<b class='flag-5'>存儲</b>平臺技術挑戰與探索

    英特爾助力京東云用CPU加速AI推理,大模型構建數智化供應鏈

    英特爾助力京東云用CPU加速AI推理,大模型構建數智化供應鏈
    的頭像 發表于 05-27 11:50 ?740次閱讀
    英特爾助力京東云用CPU加速<b class='flag-5'>AI</b><b class='flag-5'>推理</b>,<b class='flag-5'>以</b>大模型構建數智化供應鏈

    科技助力AI應用落地:WTMDK2101-ZT1評估板實地評測與性能揭秘

    計算: 近計算:在近計算中,計算單元與高速存儲單元(如高速緩存)緊密集成。這意味著處理器和高速存儲單元之間的距離很近,可以快速訪問數據并進行計算,減少了數據從
    發表于 05-16 16:38

    內計算WTM2101編譯工具鏈 資料

    內計算是突破物理極限的下一代算力技術- AIGC等人工智能新興產業的快速發展離不開算力,算力的基礎是人工智能芯片。 當前CPU/GPU在執行計算密集任務時需要將海量參數(ωij)從內存
    發表于 05-16 16:33
    主站蜘蛛池模板: 高清视频一区 | 狠狠色噜噜狠狠狠97影音先锋 | 黄色的视频网站 | 一级网站片| 午夜在线播放视频在线观看视频 | 国产高清在线观看 | 久久艹影院| 六月激情婷婷 | 88影视在线观看污污 | 国产小视频网站 | 日本女人啪啪 | 一级片在线免费播放 | 天天干天天日天天射天天操毛片 | 青青草国产三级精品三级 | 国产午夜视频在线观看 | 欧美黄又粗暴一进一出抽搐 | 国产高清在线看 | 亚洲欧美色中文字幕 | www一片黄| xx毛片 | 特级淫片aaaaa片毛片 | 久久精品视频免费观看 | 国产一级特黄老妇女大片免费 | 日韩亚色 | 美女视频黄a视频免费全过程 | 亚州人成网在线播放 | 丁香伊人五月综合激激激 | 国产99在线 | 韩国三级视频网站 | 曰本三级香港三级人妇99视频 | 97伊人网| 成年片色大黄全免费网址 | 国产精品综合色区在线观看 | 日韩一级一片 | 夜天干天干啦天干天天爽 | 国产一区二区在线观看免费 | 久久美女视频 | 在线免费色视频 | 天天躁夜夜躁狠狠躁2018a | 2021国内精品久久久久影院 | 韩国成人毛片aaa黄 韩国床戏合集三小时hd中字 |