在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

這個計算世界的一個關鍵的未來要素是移動數據

M8kW_icbank ? 來源:半導體行業觀察 ? 2019-12-10 14:20 ? 次閱讀

關于這個計算世界的一個關鍵的未來要素是移動數據。移動數據需要功率,以至于從內存中調用數據要比實際對其進行“計算”消耗更多的功率。這就是我們有緩存的原因,但即使有緩存,也需要對CPU進行廣泛的管理。對于簡單的操作,如位轉移或和操作,目標是將計算能力轉移到主DRAM本身,這樣它就不必來回穿梭。今年在Hot Chips, UPMEM是第一批展示新技術的公司之一。

對于任何已經完成任何形式的通用計算的人來說,通過算法推送一堆輸入來獲得結果,對于編寫代碼的人來說,通常有兩個高級的心理階段需要克服:首先是讓它工作,其次是優化它。算法需要產生正確的結果,越快越好 - 慢速正確的結果通常是無用的,而快速的錯誤的結果也是無用的。如果能夠以更低的功率完成,那么也會減少開銷。

In-Memory Processing或“Processing In-Memory”背后的想法是,當內存仍在DRAM中時,應該完成一些簡單的整數或浮點運算 - 無需將其推送到CPU操作,然后將其發回。如果數據可以保留在那里并進行更新,則可以節省時間和功耗,而不會影響結果。或者,如果結果被發送回主存儲器并且最終的XOR應用于存儲器中的數據,則可以減少CPU上的計算。這可以釋放主CPU核心來執行其他與計算相關的事情,或者如果它是一個限制因素,則會減少有效內存帶寬。

UPMEM所做的是在DRAM工藝節點上開發內置于DRAM芯片本身的數據處理單元(DPU)。每個DPU可以訪問64 MB的DRAM,并且相當于該內存的1 GB / s帶寬。DPU構建在一個干凈的32位ISA上,具有大量優化功能,例如0循環條件jmps,組合SHIFT + X指令(如SHIFT + ADD或SHIFT + SUB),基本邏輯指令,SHIFT和rotate指令。編程模型使得基于c語言的庫能夠處理所有常見問題,UPMEM預計大多數應用程序需要幾百行代碼,少數人組成的團隊只需2-4周就可以更新軟件。

UPMEM所報的大數字包括更好的TCO、更好的ROI,以及潛在的100億美元目標市場。我們會在適當的時候討論這些。

(我個人更喜歡PIM-DIMM這個名字)

UPMEM提出的是一種類似于DDR4 RDIMM的標準產品,每個64MB的內存都可以訪問它的一個DPU。DPU內置于DRAM本身,使用內存制造節點。例如,UPMEM正在宣傳它正在制作一個4 Gb DDR4-2400芯片,用于嵌入8個DPU 512 MB的模塊, DPU以500 MHz運行。UPMEM計劃將這4個Gb芯片中的16個放入單個DDR4 RDIMM模塊中,提供8 GB模塊,內置128個DPU。

目標是最終生產128 GB模塊,總共2048個DPU。在DPU與其64 MB內存之間的有效1 GB / s帶寬下,這意味著DPU與內存之間的有效帶寬為2 TB / s。由于DPU的工作方式,這是必需的,這將在下面解釋。 處理器和技術已獲得專利,但UPMEM表示,他們正在與內存供應商合作開發20nm級工藝。添加DPU內核可以增加非常小的裸片面積,并且可以在2-3個金屬層內啟用,因為邏輯的密度小于前沿邏輯實現的密度。與領先的CPU實現相比,我們的想法是實現10倍的總能效和可擴展性。

目前,UPMEM為客戶提供軟件模擬和硬件FPGA驗證模擬器 - 實際上,感興趣的各方可以在AWS f1.16x大型實例上模擬UPMEM平臺。實際的PIM-DRAM模塊樣品將在第三季度向高端客戶發貨,隨著更多公司對此感興趣并加入,我們計劃在明年繼續推廣。UPMEM引用性能示例表示,他們已經看到基因組模式匹配的速度提高了22x-25x,數據庫索引搜索的吞吐量提高了18倍,延遲為原來的1/100,索引搜索應用程序的TCO提高了14倍。

在成本方面,UPMEM沒有說明計劃以多少價格出售其技術,但與其他解決方案相比,UPMEM有望成為一個邊際成本。在一次演示中,該公司表示,他們的解決方案可以用一個400美元的增強內存解決方案替代一個潛在的40000美元的服務器,并指出使用PIM在軟件許可、數據中心空間和功耗/效率方面產生了連鎖反應。

UPMEM提供了一些關于電力消耗的數據。在這張幻燈片中,該公司比較了兩臺服務器,一臺帶有pimm - dram,另一臺沒有。在這種情況下,“DRAM到處理器的64位操作數”召回需要在常規服務器上運行3000個pJ,將數據從DRAM中取出,并傳遞到緩存中,而在PIM-DRAM上,只需將數據移動到DPU上,同樣的操作只需要150個pJ的能量。DPU上的操作本身實際上需要2倍的功率(20 pJ與10 pJ相比),但是總的功率效率增益是170 pJ vs 3010 pJ,或者略低于20x。

這張幻燈片指出的一件可能令人困惑的事情是服務器的功耗——常規服務器列出的功耗只有300W,但是PIM解決方案的功耗高達700W。這是因為在UPMEM的解決方案下,每個DRAM模塊的功耗將會增加。

UPMEM提出的第一個產品模塊是前面提到的8 GB DDR4-2400模塊,其中128個DPU各自覆蓋64 MB內存并以500 MHz運行。對于單個4 Gb裸片(其中16個在8 GB模塊中,18個用于RDIMM ECC),我們仍然處于1 cm2的常規裸片尺寸,但每個芯片所需的功率約為1.2瓦。

如果我們研究所有16/18芯片,我們可以看到每個8GB的模塊將是19.2-21.6瓦。對于DRAM來說,這是一個很大的功耗,而且實際上超過了DDR4插槽的額定范圍。從這個角度來看,Intel的512GB Optane模塊有一個18w的運行模式,服務器可以冷卻到18w,但是也可以低到12w。UPMEM并沒有說明它是否能夠通過降低DPU頻率來降低每個模塊的功率。

UPMEM的目標是用PIM-DRAM模塊替換服務器中的DRAM模塊。該公司表示,DDR4接口并不適合這類事情,但他們已經解決了這個問題。在一份簡報中,該公司指出,目前至少需要為一個操作系統安裝非PIM-DRAM。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • DRAM
    +關注

    關注

    40

    文章

    2334

    瀏覽量

    184064
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10929

    瀏覽量

    213466
  • 內存
    +關注

    關注

    8

    文章

    3074

    瀏覽量

    74463

原文標題:關于內存內計算,這家公司有新想法

文章出處:【微信號:icbank,微信公眾號:icbank】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    HPC工作負載管理的關鍵要素

    HPC工作負載管理是復雜而精細的過程,涉及資源分配、作業調度、性能監控與優化以及故障處理與恢復等多個關鍵要素。下面,AI部落小編帶您了解HPC工作負載管理的
    的頭像 發表于 02-08 09:53 ?82次閱讀

    解析AMR設計關鍵要素:照明方案、通信方案

    自主移動機器人設計涉及各種重要器件,例如電機控制、傳感器、電源、照明和通信器件等。在之前的兩篇文章AMR電機控制方案超強整理,解析AMR設計關鍵要素:傳感器、可見光通信驅動器、電源方案等,我們介紹了電機控制方案、傳感器方案、可見
    的頭像 發表于 01-14 11:10 ?559次閱讀

    PCB的五基本要素

    網絡。同時PCB板還具有絕緣,隔熱,防潮等功能。 3、PCB的五基本要素用 01 要素:載板 PCB的載板又稱為基
    的頭像 發表于 01-07 09:30 ?371次閱讀

    中科創達旗下暢行智駕亮相2024世界計算大會

    日前,以“智算萬物 湘約未來—算出新質生產力”為主題的2024世界計算大會在湖南長沙盛大開幕。全球頂尖的計算產業專家、學者、企業家等匯聚星城,圍繞人工智能賦能新型工業化、算力創新應用、
    的頭像 發表于 11-15 10:54 ?554次閱讀

    四維圖新入選2024北京“數據要素×”典型案例

    近日,2024全球數字經濟大會在北京舉行。在大會期間舉辦的“數智驅動創新×流通鏈接未來數據要素高層論壇上,北京市政數局發布了《2024北京“數據
    的頭像 發表于 09-04 17:16 ?903次閱讀

    工業設備數據管理的關鍵要素

    這個信息爆炸的時代,設備數據管理已成為企業運營的核心環節之。它不僅是信息技術的基石,更是企業發展的重要保障。設備數據管理是指通過系列技
    的頭像 發表于 07-15 15:41 ?338次閱讀
    工業設備<b class='flag-5'>數據</b>管理的<b class='flag-5'>關鍵</b><b class='flag-5'>要素</b>

    工業邊緣計算網關的技術特性和關鍵功能

    在工業4.0的浪潮中,工業邊緣計算網關正成為連接物理世界與數字世界的橋梁,它在智能制造中的應用日益凸顯。本文將剖析工業邊緣計算網關的技術特性、關鍵
    的頭像 發表于 05-29 14:35 ?548次閱讀

    座座數據之城,點亮數字中國的未來

    數據要素,成為城市的未來之鑰
    的頭像 發表于 05-28 18:19 ?793次閱讀
    用<b class='flag-5'>一</b>座座<b class='flag-5'>數據</b>之城,點亮數字中國的<b class='flag-5'>未來</b>

    “大模型”釋放數據要素價值,軟通動力喚醒企業沉睡的積累

    釋放數據要素價值的路徑不止有條。有條路相對較短,但多數企業學不來;另條路正在修,未來可期;
    的頭像 發表于 05-22 11:36 ?591次閱讀

    微軟攜手OpenAI打造超級計算數據中心 預計耗資超過1150億美元

    在OpenAI內部,這個超級計算機項目被賦予了充滿想象力的名字——“Stargate”,寓意著它將開啟扇通往
    的頭像 發表于 04-01 15:22 ?636次閱讀

    【量子計算機重構未來 | 閱讀體驗】 跟我起漫步量子計算

    首先感謝發燒友提供的試讀機會。 略讀周,感觸頗深。首先量子計算機作為種前沿技術,正逐步展現出其巨大的潛力,預示著未來社會和技術領域的深刻變革。下面,我將從幾個方面探討量子
    發表于 03-13 19:28

    【量子計算機重構未來 | 閱讀體驗】+ 了解量子疊加原理

    機如何生產制造。。。。。。 近來通過閱讀《量子計算機—重構未來書,結合網絡資料,了解了點點量子疊加知識,分享給大家。 先提下電子
    發表于 03-13 17:19

    【量子計算機重構未來 | 閱讀體驗】第二章關鍵知識點

    ,Snor算法和Grover算法。Snor算法典型的應用場景為超大數的質因數分解,普通計算機需要通過一個一個的枚舉才能解析出來,但量子計算機可以同時對多個候選結果進行“研究分析”,并巧妙地進行篩選,從而減少
    發表于 03-06 23:17

    【量子計算機重構未來 | 閱讀體驗】+ 初識量子計算

    欣喜收到《量子計算機——重構未來書,感謝電子發燒友論壇提供了讓我了解量子計算機的機會!
    發表于 03-05 17:37

    【量子計算機重構未來 | 閱讀體驗】初探

    ,自己專門去查閱了網上的資料,發現量子計算能用量子比特表示以前需要多個門電路組合才能表示的數據。也就意味著,以前需要復雜門電路實現的邏輯運算,在量子比特上可能僅僅需要
    發表于 03-04 23:09
    主站蜘蛛池模板: 特色一级黄色片 | 91aaa免费观看在线观看资源 | 国产情侣露脸 | 男人日女人免费视频 | 最新版天堂中文在线官网 | 国产精品久久久久久久牛牛 | h在线网站 | 欧美午夜寂寞影院安卓列表 | 亚洲五月综合网色九月色 | 黑人边吃奶边扎下面激情视频 | 四虎最新影院 | 天天射天天干天天插 | 男人资源站 | 天天操天天搞 | 天天射天天怕 | 国产亚洲高清在线精品不卡 | 成人夜色视频网站在线观看 | 99免费观看视频 | 国产精品毛片在线大全 | 丁香花在线电影小说观看 | 又黑又长黑人欧美三级 | 1024你懂的国产欧美日韩在 | 伊人色婷婷综在合线亚洲 | 性日韩| 俺来也久久 | 在线播放交视频 | 国产综合在线播放 | 四虎影库网址 | 性xxxxbbbb在线 | 精品免费久久久久久成人影院 | 萌白酱一线天粉嫩喷水在线观看 | semimi亚洲综合在线观看 | 在线观看视频你懂的 | 欧美在线资源 | 毛片网站免费 | 福利社看片 | 在线观看永久免费 | 欧美有码视频 | 18年大片免费在线观看 | 久久九九色| 国产美女视频黄a视频全免费网站 |