在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI時代的存儲墻,哪種存算方案才能打破?

E4Life ? 來源:電子發燒友網 ? 作者:周凱揚 ? 2024-04-21 01:36 ? 次閱讀
電子發燒友網報道(文/周凱揚)回顧計算行業幾十年的歷史,芯片算力提升在幾年前,還在遵循摩爾定律。可隨著如今摩爾定律顯著放緩,算力發展已經陷入瓶頸。而且禍不單行,陷入同樣困境的還有存儲。從新標準推進的角度來看,存儲市場依然在朝著更高性能的方向發展。但以這些通用標準推出的產品,終究還是會被用到馮諾依曼架構的計算體系中去。或許單個產品的性能有所增加,可面對AI計算的海量數據,這點提升還是有些不夠看。

以LLM這個熱門AI應用而言,其數據量已經在以2年750倍的速度爆發式增長,相較之下硬件算力正在以2年3倍的速度增長。但與存儲不同,硬件算力是可以靠堆規模來實現持續提升的,可存儲帶寬和互聯帶寬卻沒法擁有同樣的拓展性,只有存儲容量能夠勉強跟上。所以市場上多數都在追求某種形式的存算一體方案,但實現的形式和技術路線不盡相同。

近存方案,更大的SRAM和HBM

對于我們說的存儲墻而言,其實在SRAM上并不那么明顯,這種最接近處理單元的存儲,常被用作高速緩存,不僅讀寫速度極快,能效比更是遠超DRAM。但SRAM相對其他存儲而言,存儲密度最低,成本卻不低。所以盡管現如今雖然更大的SRAM設計越來越普遍,但容量離DRAM還差得很遠。

但這并不代表這樣的設計沒有人嘗試,對于愿意花大成本的廠商而言,還是很高效的一條技術路線。以特斯拉為例,其Tesla Dojo超算系統的自研芯片D1就采用了超大SRAM的技術路線。Dojo在其網格設計中采用了超快且平均分布的SRAM。
D1芯片 / 特斯拉

單個D1核心擁有1.25MB的SRAM,加載速度達到400GB/s,存儲速度達到270GB/s。單個D1芯片的SRAM緩存達到440MB。簡單來說,Dojo可以用遠超L2緩存級別的SRAM容量,實現L1緩存級別的帶寬和延遲。

當然了,這樣的設計注定代表了投入大量的成本。在特斯拉2023財年Q4的財報會議上,馬斯克強調他們做了英偉達和Dojo的兩手準備。Dojo作為長遠計劃,因為最終的回報可能會值回現在的投入,但他也強調這確實不是什么高收益的項目。

所以對于已有的計算架構來說,走近存路線,提高DRAM的性能是最為適合的,比如HBM。HBM作為主流的近存高帶寬方案,已經被廣泛應用在新一代的AI芯片、GPU上。以HBM3e為例,1.2TB/s的超大帶寬足以滿足現如今絕大多數AI芯片的數據傳輸。未來的HBM4更是承諾1.5TB/s到2TB/s的帶寬,

HBM的方案象征了目前DRAM堆疊的集大成技術,但目前還是存在不少問題,比如更高的成本以及對產能的要求。在現如今的AI需求驅動下,新發布的芯片很難再采用HBM設計的同時,保證大批量量產,無論是HBM產能還是CoWoS產能都處于滿載的階段,而且與制造廠商強綁定。可恰恰存儲帶寬決定了AI應用的速度,所以在HBM方案量產困難成本高昂的前提下,即便是英特爾AMD這樣的廠商也經不起這樣揮霍,不少其他廠商更是選擇了看下存內計算。

存內計算與處理,需要解決算力與存儲雙瓶頸

為了解決AI計算中數據存取的效率問題,把數據處理和篩選的工作放在存儲端,就能極大地降低數據移動的能耗。以三星PIM技術為例,其將關鍵的算法內核放在內存中的PCU模塊中執行,相比已有的HBM方案,PIM-HBM可以將能耗降低70%以上。而且不僅是HBM,PIM也可以集成到LPDDR、GDDR等存儲方案中。

不過存內處理的方案只解決了功耗和效率的問題,并沒有對計算性能和存儲性能帶來任何大幅提升。至于將主要計算工作交給存內的計算單元,就是存內計算的目標了,比如不少廠商嘗試的模擬存內計算(AIMC)。但這類方案實現大規模并行化運算的同時,還是需要昂貴的數模轉換器,以及逃不開的錯誤檢測。至于數字存內計算方案,一定程度上規避了模擬存內計算的缺陷,但還是犧牲了一些面積效率。對于一些大模型AI應用而言,單芯片的存儲容量擴展性堪憂。

所以數模混合成了新的研究方向,比如中科院微電子研究所就在今年的ISSCC大會上發表了數模混合存算一體芯片的論文,其采用模擬方案來進行陣列內位乘法計算,利用數字方案來進行陣列外多位移位累加計算,從而達到整體的高能量效率和面積效率,INT8精度下的計算峰值能效可達111.17TFLOPS/W.
speedAI240 / Untether AI

除此之外,還有存間計算的廠商,將計算單元放在不同的SRAM之間。以存間計算初創公司Untether AI為例,他們以打造存內推理加速器AI為主,通過將計算單元放在兩個存儲單元之間,其IC可以提供更高能效比的推理性能。比如他們在打造的第二代IC,speedAI240,集成了1400個定制RISC-V核心,可以提供至高2PetaFlops的推理性能,能耗比最高可達30 TFLOPS/W。

除了各種存算一體架構的算力瓶頸外,存儲本身也需要做出突破。以三星的PIM為例,其雖然在DRAM上引入了PIM計算單元,但并未對DRAM本身的帶寬的性能帶來提升,這就造成了在存算一體的架構中,依然存在計算單元與存儲器性能不平衡的問題,各種其他類型的存儲器,包括MRAM、PCM、RRAM,除了量產問題外,寫入速度和功耗的問題也還未實現突破。

西安紫光國芯為此提出了一種3D異質集成DRAM架構,邏輯晶圓通過3D混合鍵合工藝堆疊至SeDRAM晶圓上,進一步提升了訪存帶寬,降低了單位比特能耗,還能實現超大容量。從去年紫光國芯在VLSI 2023發布的論文來看,其SeDRAM已經發展至新一代多層陣列架構。結合低溫混合鍵合技術和mini-TSV堆疊技術,可以實現135Gbps/Gbit的帶寬和0.66pJ/bit的能效。

寫在最后

其實無論是哪一種突破存儲墻瓶頸的方式,最終都很難逃脫復雜工藝帶來的挑戰。行業遲遲不愿普及相關的存算技術,還是在制造工藝上沒有達到適合普及的標準,無論是良率、成本還是所需的設計、制造流水線變化。已經占據主導地位的計算芯片廠商,也不會選擇非得和存儲綁在一條船上,但行業必然會朝這個方向發展。

此外,不少存內計算的堆疊方案中,還沒有選擇將主計算資源的CPU或GPU與存儲垂直堆疊,而是把部分計算負載交給與存儲結合的計算單元。這樣一來既提高了AI計算的效率,又不會因為結構變化而出現不兼容的情況。從行業發展的角度來看,近存計算和存內處理最有可能先普及開來。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 存儲
    +關注

    關注

    13

    文章

    4359

    瀏覽量

    86211
  • sram
    +關注

    關注

    6

    文章

    769

    瀏覽量

    114916
  • AI
    AI
    +關注

    關注

    87

    文章

    31711

    瀏覽量

    270507
  • HBM
    HBM
    +關注

    關注

    0

    文章

    387

    瀏覽量

    14849
  • 存算一體
    +關注

    關注

    0

    文章

    104

    瀏覽量

    4357
  • 存內計算
    +關注

    關注

    0

    文章

    30

    瀏覽量

    1407
收藏 人收藏

    評論

    相關推薦

    AI驅動新型存儲器技術,國內新興存儲企業進階

    生成式AI對于力、運力和力的需求與日俱增,如何打破存儲”成為
    發表于 10-16 08:10 ?1099次閱讀
    <b class='flag-5'>AI</b>驅動新型<b class='flag-5'>存儲</b>器技術,國內新興<b class='flag-5'>存儲</b>企業進階

    大模型遭遇,探索超級應用的發展路徑

    最近,開源中國 OSCHINA、Gitee 與 Gitee AI? 全文如下: 大模型撞上 “”,超級應用的探尋之路 文 / 傅聰 近日,大模型教父 Sam Altman 在 Reddit 上
    的頭像 發表于 02-10 17:24 ?66次閱讀
    大模型遭遇<b class='flag-5'>算</b>力<b class='flag-5'>墻</b>,探索超級應用的發展路徑

    開源芯片系列講座第24期:基于SRAM的高效計算架構

    先進的計算架構技術,以克服傳統馮諾依曼架構中計算單元與存儲單元分離導致的“內存”問題。基于SRAM的一體技術在智能計算中具有高能效、高密度等優勢,近年來在A
    的頭像 發表于 11-27 01:05 ?347次閱讀
    開源芯片系列講座第24期:基于SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b>的高效計算架構

    科技啟動首屆內計算創新大賽

    內計算作為一項打破“內存”“功耗”的顛覆性技術,消除了的界限,相比CPU或GPU能夠
    的頭像 發表于 11-21 10:44 ?319次閱讀

    科技榮獲2024中國AI力層創新企業

    中國科技產業智庫「甲子光年」主辦、中關村東升科學城協辦的「AI創生時代2024甲子引力X科技產業新風向」大會在北京正式舉行。作為壓軸,「甲子光年」重磅發布了【星辰100】2024創新企業榜。知
    的頭像 發表于 11-06 15:30 ?558次閱讀

    一體架構創新助力國產大AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計算(HPC)應用論壇》上,億鑄科技高級副總裁徐芳發表了題為《一體架構創新助力國產大AI
    的頭像 發表于 10-23 14:48 ?431次閱讀

    力與力并重:數據時代的雙刃劍

    在2024年的今天,人工智能(AI)技術已經全面滲透至我們生活的方方面面,從醫療診斷到智能交通,從金融分析到智能家居,AI正以前所未有的速度重塑我們的世界。這一變革背后,力和力成為
    的頭像 發表于 10-08 16:00 ?931次閱讀

    大模型時代力需求

    現在AI已進入大模型時代,各企業都爭相部署大模型,但如何保證大模型的力,以及相關的穩定性和性能,是一個極為重要的問題,帶著這個極為重要的問題,我需要在此書中找到答案。
    發表于 08-20 09:04

    后摩智能推出邊端大模型AI芯片M30,展現出一體架構優勢

    了基于M30芯片的智模組(SoM)和力謀??AI加速卡。 ? 后摩智能一體架構芯片產品 ? 后摩智能是一家專注于
    的頭像 發表于 07-03 00:58 ?4403次閱讀

    2024多樣性力產業峰會:江波龍解碼AI存儲方案的未來之路

    6月18日,多樣性力產業峰會2024在北京圓滿舉行,江波龍企業級存儲事業部市場總監曹潯峰受邀出席本次峰會并發表了《大模型時代AI存儲
    的頭像 發表于 06-21 08:20 ?632次閱讀
    2024多樣性<b class='flag-5'>算</b>力產業峰會:江波龍解碼<b class='flag-5'>AI</b><b class='flag-5'>存儲</b><b class='flag-5'>方案</b>的未來之路

    科技助力AI應用落地:WTMDK2101-ZT1評估板實地評測與性能揭秘

    一體領域的研發領導者 一體技術作為解決馮諾依曼架構下存儲問題的重要方案,吸引了國內外眾多企業的研發投入,其中知
    發表于 05-16 16:38

    內計算WTM2101編譯工具鏈 資料

    出來再進行計算,讀取時間與參數規模成正比,計算芯片的功耗和性能受限,GPU力利用率甚至不到8%。 內計算芯片實現了存儲單元與計算單元的物理融合,沒有獨立的計算單元,直接通過在存儲
    發表于 05-16 16:33

    一圖看懂星河AI數據中心網絡,全面釋放AI時代

    華為中國合作伙伴大會 | 一圖看懂星河AI數據中心網絡,以網強,全面釋放AI時代
    的頭像 發表于 03-22 10:28 ?846次閱讀
    一圖看懂星河<b class='flag-5'>AI</b>數據中心網絡,全面釋放<b class='flag-5'>AI</b><b class='flag-5'>時代</b><b class='flag-5'>算</b>力

    AI時代強則強

    ,以強訓,以強安
    的頭像 發表于 03-22 09:17 ?2253次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>時代</b>,<b class='flag-5'>存</b>強則強

    時代, 如何打破內存

    設計的不斷革新,進入了大時代。 目前,主流AI芯片的架構仍然沿用了傳統的馮·諾依曼模型,這一設計將計算單元與數據存儲分離。在這種架構下,處理器需要從內存中讀取數據,執行計算任務,然
    的頭像 發表于 03-06 19:51 ?358次閱讀
    大<b class='flag-5'>算</b>力<b class='flag-5'>時代</b>, 如何<b class='flag-5'>打破</b>內存<b class='flag-5'>墻</b>
    主站蜘蛛池模板: 天天色天天操天天射 | 欧美一级免费在线观看 | 亚洲 欧美 丝袜 制服 在线 | 又污又黄的网站 | 国产理论最新国产精品视频 | 一级毛片a | 成人欧美一区二区三区 | 手机在线观看一级午夜片 | 性欧美大战久久久久久久 | 免费播放黄色 | 一级a级国产不卡毛片 | 狠狠色噜噜狠狠狠97影音先锋 | 国产精品理论 | 激情久久婷婷 | 老汉影视永久免费视频 | 日本三级香港三级人妇网站 | 免费边摸边吃奶边叫床视频gif | 一级伦奸视频 | 2019天天操| 色天使网| 天天搞天天干 | 天天干天天操天天 | 欧美一级特黄乱妇高清视频 | 龙口护士门91午夜国产在线 | 国产盗摄女厕美女嘘嘘 | 嘿嘿嘿视频在线观看 | 57pao成人永久免费视频 | 人人干人人澡 | 国产高清在线视频 | 免费看h视频 | 国产一级做a爰片久久毛片 国产一级做a爰片久久毛片男 | 成人在线一区二区 | 视频在线观看免费网站 | 朋友夫妇和交换性bd高清 | 午夜高清| 99热网址 | 国产成人精品怡红院 | aaa一级 | 色妞综合| 日韩亚洲欧美日本精品va | 在线视频精品免费 |