在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何處理CPU亂序調度中的內存數據依賴

數字芯片實驗室 ? 來源:數字芯片實驗室 ? 2024-08-06 11:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

要處理CPU亂序調度中的內存數據依賴,通常涉及兩個步驟:

1.計算內存訪問的有效地址

2.檢查所有未處理完的load/store的地址,并確保沖突的load/store不能亂序執行

A Load / Store Processing Model

load/store處理模型,如下圖所示。

a459f9f4-4019-11ef-b8af-92fbcf53809c.jpg

load和store指令首先發給reservation station ,然后發送到load單元或store 單元。

在store單元中,store 指令首先經過有效的地址計算和地址轉換,然后駐留在“Finished ”store 緩沖區中。 “completed ”store 緩沖區中的store 指令最終會提交到內存中。

同樣,load指令首先通過地址生成和翻譯,并最終讀取數據cache 以從內存中獲取數據。

我們可以做出的一個假設是,store 指令需要按程序順序完成,因此WAW數據依賴性是默認強制執行的。從本質上講,處理數據依賴項可以簡化為處理load/store 依賴項(RAW和WAR)。

Handling Data Dependencies with In-order Load / Store Dispatch

最直接的解決方案是按程序順序向公共reservation station 發出load/store 指令,并從reservation station 按FIFO順序發送。只有當store 緩沖區為空時,才能發送load。然而,load指令的延遲很長,不可預測。盡早執行load至關重要。

改進的方案是支持不同地址的load bypass ,如果store 緩沖區中有地址匹配,則stall load指令。因此,不同地址的load可以繼續進行。

a4732afa-4019-11ef-b8af-92fbcf53809c.jpg

為了進一步加快load。如果存在地址匹配,但store buffer數據不可用,則load stall;如果存在地址匹配和store 數據可用,則將數據直接forward 到load。由于load直接從store buffer接收數據,因此可以盡早執行load指令,并避免數據cache 訪問。

a4872be0-4019-11ef-b8af-92fbcf53809c.jpg

Handling Data Dependencies with Out-of-order Load / Store Dispatch

如果我們亂序調度load/store,可以在store之前發放load。由于無法檢查地址匹配,因此存在潛在的RAW依賴關系。

a4b2721e-4019-11ef-b8af-92fbcf53809c.jpg

與store指令類似,如果從reservation station 發送的store在“finished ”load buffer中發現匹配的load,則應刷新所有指令。

這種放松也引入了可能的WAR數據依賴性。load地址可能與后續store的地址匹配,因此會觸發不正確的數據forward 。一個簡單的解決方案是stall 匹配地址的“finished ” store的load,僅具有匹配地址的“completed ”store上數據forward 給load。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11063

    瀏覽量

    216480
  • 內存
    +關注

    關注

    8

    文章

    3117

    瀏覽量

    75121
  • 數據依賴
    +關注

    關注

    0

    文章

    2

    瀏覽量

    5722

原文標題:CPU面試題Q7:如何處理內存中的數據依賴?

文章出處:【微信號:數字芯片實驗室,微信公眾號:數字芯片實驗室】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Cjson協議申請不到內存何處理

    最近用原子哥的ucosII例程做個東西,使用到Cjson協議,其中使用到了申請內存內存回收的問題,用的是原子哥的內存管理函數,前幾次還可以,通信幾次就申請不到內存了,感覺好像是
    發表于 04-26 21:22

    何處理好FPGA設計跨時鐘域間的數據

    跨時鐘域處理是FPGA設計中經常遇到的問題,而如何處理好跨時鐘域間的數據,可以說是每個FPGA初學者的必修課。如果是還是在校的學生,跨時鐘域處理也是面試中經常常被問到的一個問題。在本篇
    發表于 07-29 06:19

    labview寫入access數據亂序問題

    用database insert 插入數據,移位寄存器當作順序編號,發現不管循環框頻率設多少,到編號713這里必定會跳到737,然后中間這段會在1035后出現,其他地方也有類似的亂序,多次寫入亂序
    發表于 08-09 10:23

    何處理存儲在非易失性設備內存數據集損壞

    保護您的嵌入式軟件免受內存損壞本文的目的是提供一種軟件方法,解釋如何處理存儲在非易失性設備(如小型 EEPROM 或閃存)內存數據集損壞
    發表于 12-24 07:27

    何處理才能使CPU的效率更高呢?

    ,大家都知道,當按鍵按下之后需要抖動處理,一般會延時20MS再判斷按鍵是否有效,如果這20MS內處在原地踏步的等待狀態,那么效率會非常低。如何處理才能使CPU的效率更高呢?采用時間片輪轉算法可以解決這個
    發表于 01-27 07:28

    stm32如何處理數組數據

    更新一下博客,最近有一些朋友問我如何處理數組數據,順便發一下教程,代碼如下if(UartHandle->Instance == USART3)//stm32的串口
    發表于 02-21 07:09

    編譯器優化的靜態調度介紹

      指令調度簡介  指令調度是指對程序塊或過程的操作進行排序以有效利用處理器資源的任務。指令調度的目的就是通過重排指令,提高指令級并行性,
    發表于 03-17 17:07

    什么是CPU分枝/亂序執行?

    什么是分枝/亂序執行?   分枝(branch)是指程序運行時需要改變的節點。分枝有無條件分枝和有條件分枝,其中無條件分枝只
    發表于 02-04 10:49 ?960次閱讀

    何處理cpu風扇轉速過快

    何處理cpu風扇轉速過快 問:我前天在電腦城組裝了一臺電腦,機器運轉還算好,可是CPU風扇聲音很大。CPU溫度在39℃~40℃的時候,
    發表于 02-25 10:23 ?1w次閱讀

    小型Hadoop集群的數據分層調度處理算法分析

    調度處理的要求也在逐漸提高,僅依靠CPU主頻的提升并不能快速的處理數據帶來的壓力,快速有效的算法成為目前
    發表于 11-03 15:02 ?1次下載
    小型Hadoop集群的<b class='flag-5'>數據</b>分層<b class='flag-5'>調度</b><b class='flag-5'>處理</b>算法分析

    基于GPU/CPU的流程序多粒度劃分與調度

    并實現了面向GPU/CPU混合架構的數據流程序任務劃分方法和多粒度調度策略,包括任務的分類處理、GPU端任務的水平分裂和CPU端離散任務的均
    發表于 11-23 14:29 ?0次下載

    互聯車輛如何處理數據:3個常見問題

    互聯車輛如何處理數據:3個常見問題
    發表于 10-31 08:23 ?0次下載
    互聯車輛如<b class='flag-5'>何處理</b><b class='flag-5'>數據</b>:3個常見問題

    Redis服務器的內存耗盡后,Redis會如何處理呢?

    作為一臺服務器來說,內存并不是無限的,所以總會存在內存耗盡的情況,那么當 Redis 服務器的內存耗盡后,如果繼續執行請求命令,Redis 會如何處理呢?
    的頭像 發表于 03-08 09:26 ?742次閱讀

    證明CPU指令是亂序執行的

    雙擊QQ.exe從磁盤加載到內存里面,內存里面就會有了一個進程,進程產生的時候會產生一個主線程,就是main方法所在的線程,cpu會找到main開始的地方,把它的指令讀取過來放到程序計數器,把
    的頭像 發表于 03-15 09:13 ?1165次閱讀

    當我們在談論cpu指令亂序的時候,究竟在談論什么?

    知道指令的亂序策略很重要,原因是這樣我們就能夠通過barrier(內存屏障)等指令,在正確的位置告訴cpu或者是編譯器,這里我可以接受亂序,那里我不能接受
    的頭像 發表于 05-19 14:42 ?1742次閱讀
    當我們在談論<b class='flag-5'>cpu</b>指令<b class='flag-5'>亂序</b>的時候,究竟在談論什么?
    主站蜘蛛池模板: 男人的天堂免费网站 | 热99久久| 美女免费黄 | 人人操天天射 | 又粗又长又色又爽视频 | 美女又爽又黄视频 | 视频一区亚洲 | 国产nv精品你懂得 | 久久久久国产精品四虎 | 宅男在线看片 | 真实女人寂寞偷人视频 | free性欧美高清另类 | 婷婷丁香色综合狠狠色 | 久久综合99 | 成 人网站免费 | 亚洲女同一区二区 | 天天涩综合 | 欧美一区二区三区视频在线观看 | 视频色版 | 国产在线观看午夜不卡 | 91男人 | 婷婷色综合网 | 激情六月天婷婷 | 香港三澳门三日本三级 | 27pao强力打造高清免费高 | 亚洲一区二区三区首页 | 色爱区综合激月婷婷激情五月 | 天天做天天爰夜夜爽 | 99国产精品久久久久久久成人热 | 狠狠色网 | 天天爱天天做天天干 | 国产三级在线观看播放 | 成人的天堂视频一区二区三区 | 亚洲 午夜在线一区 | 老色批软件| 天堂在线最新版资源www | 藏经阁在线观看 | 色综合天天综合网亚洲影院 | 色婷婷影院在线视频免费播放 | 久久精品综合视频 | 欧美色婷婷天堂网站 |