在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何處理CPU亂序調度中的內存數據依賴

數字芯片實驗室 ? 來源:數字芯片實驗室 ? 2024-08-06 11:49 ? 次閱讀

要處理CPU亂序調度中的內存數據依賴,通常涉及兩個步驟:

1.計算內存訪問的有效地址

2.檢查所有未處理完的load/store的地址,并確保沖突的load/store不能亂序執行

A Load / Store Processing Model

load/store處理模型,如下圖所示。

a459f9f4-4019-11ef-b8af-92fbcf53809c.jpg

load和store指令首先發給reservation station ,然后發送到load單元或store 單元。

在store單元中,store 指令首先經過有效的地址計算和地址轉換,然后駐留在“Finished ”store 緩沖區中。 “completed ”store 緩沖區中的store 指令最終會提交到內存中。

同樣,load指令首先通過地址生成和翻譯,并最終讀取數據cache 以從內存中獲取數據。

我們可以做出的一個假設是,store 指令需要按程序順序完成,因此WAW數據依賴性是默認強制執行的。從本質上講,處理數據依賴項可以簡化為處理load/store 依賴項(RAW和WAR)。

Handling Data Dependencies with In-order Load / Store Dispatch

最直接的解決方案是按程序順序向公共reservation station 發出load/store 指令,并從reservation station 按FIFO順序發送。只有當store 緩沖區為空時,才能發送load。然而,load指令的延遲很長,不可預測。盡早執行load至關重要。

改進的方案是支持不同地址的load bypass ,如果store 緩沖區中有地址匹配,則stall load指令。因此,不同地址的load可以繼續進行。

a4732afa-4019-11ef-b8af-92fbcf53809c.jpg

為了進一步加快load。如果存在地址匹配,但store buffer數據不可用,則load stall;如果存在地址匹配和store 數據可用,則將數據直接forward 到load。由于load直接從store buffer接收數據,因此可以盡早執行load指令,并避免數據cache 訪問。

a4872be0-4019-11ef-b8af-92fbcf53809c.jpg

Handling Data Dependencies with Out-of-order Load / Store Dispatch

如果我們亂序調度load/store,可以在store之前發放load。由于無法檢查地址匹配,因此存在潛在的RAW依賴關系。

a4b2721e-4019-11ef-b8af-92fbcf53809c.jpg

與store指令類似,如果從reservation station 發送的store在“finished ”load buffer中發現匹配的load,則應刷新所有指令。

這種放松也引入了可能的WAR數據依賴性。load地址可能與后續store的地址匹配,因此會觸發不正確的數據forward 。一個簡單的解決方案是stall 匹配地址的“finished ” store的load,僅具有匹配地址的“completed ”store上數據forward 給load。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11017

    瀏覽量

    215456
  • 內存
    +關注

    關注

    8

    文章

    3103

    瀏覽量

    74919
  • 數據依賴
    +關注

    關注

    0

    文章

    2

    瀏覽量

    5719

原文標題:CPU面試題Q7:如何處理內存中的數據依賴?

文章出處:【微信號:數字芯片實驗室,微信公眾號:數字芯片實驗室】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    Cjson協議申請不到內存何處理

    最近用原子哥的ucosII例程做個東西,使用到Cjson協議,其中使用到了申請內存內存回收的問題,用的是原子哥的內存管理函數,前幾次還可以,通信幾次就申請不到內存了,感覺好像是
    發表于 04-26 21:22

    何處理好FPGA設計跨時鐘域間的數據

    跨時鐘域處理是FPGA設計中經常遇到的問題,而如何處理好跨時鐘域間的數據,可以說是每個FPGA初學者的必修課。如果是還是在校的學生,跨時鐘域處理也是面試中經常常被問到的一個問題。在本篇
    發表于 07-29 06:19

    labview寫入access數據亂序問題

    用database insert 插入數據,移位寄存器當作順序編號,發現不管循環框頻率設多少,到編號713這里必定會跳到737,然后中間這段會在1035后出現,其他地方也有類似的亂序,多次寫入亂序
    發表于 08-09 10:23

    何處理存儲在非易失性設備內存數據集損壞

    保護您的嵌入式軟件免受內存損壞本文的目的是提供一種軟件方法,解釋如何處理存儲在非易失性設備(如小型 EEPROM 或閃存)內存數據集損壞
    發表于 12-24 07:27

    何處理才能使CPU的效率更高呢?

    ,大家都知道,當按鍵按下之后需要抖動處理,一般會延時20MS再判斷按鍵是否有效,如果這20MS內處在原地踏步的等待狀態,那么效率會非常低。如何處理才能使CPU的效率更高呢?采用時間片輪轉算法可以解決這個
    發表于 01-27 07:28

    stm32如何處理數組數據

    更新一下博客,最近有一些朋友問我如何處理數組數據,順便發一下教程,代碼如下if(UartHandle->Instance == USART3)//stm32的串口
    發表于 02-21 07:09

    編譯器優化的靜態調度介紹

      指令調度簡介  指令調度是指對程序塊或過程的操作進行排序以有效利用處理器資源的任務。指令調度的目的就是通過重排指令,提高指令級并行性,
    發表于 03-17 17:07

    什么是CPU分枝/亂序執行?

    什么是分枝/亂序執行?   分枝(branch)是指程序運行時需要改變的節點。分枝有無條件分枝和有條件分枝,其中無條件分枝只
    發表于 02-04 10:49 ?946次閱讀

    何處理cpu風扇轉速過快

    何處理cpu風扇轉速過快 問:我前天在電腦城組裝了一臺電腦,機器運轉還算好,可是CPU風扇聲音很大。CPU溫度在39℃~40℃的時候,
    發表于 02-25 10:23 ?1w次閱讀

    小型Hadoop集群的數據分層調度處理算法分析

    調度處理的要求也在逐漸提高,僅依靠CPU主頻的提升并不能快速的處理數據帶來的壓力,快速有效的算法成為目前
    發表于 11-03 15:02 ?1次下載
    小型Hadoop集群的<b class='flag-5'>數據</b>分層<b class='flag-5'>調度</b><b class='flag-5'>處理</b>算法分析

    基于GPU/CPU的流程序多粒度劃分與調度

    并實現了面向GPU/CPU混合架構的數據流程序任務劃分方法和多粒度調度策略,包括任務的分類處理、GPU端任務的水平分裂和CPU端離散任務的均
    發表于 11-23 14:29 ?0次下載

    互聯車輛如何處理數據:3個常見問題

    互聯車輛如何處理數據:3個常見問題
    發表于 10-31 08:23 ?0次下載
    互聯車輛如<b class='flag-5'>何處理</b><b class='flag-5'>數據</b>:3個常見問題

    Redis服務器的內存耗盡后,Redis會如何處理呢?

    作為一臺服務器來說,內存并不是無限的,所以總會存在內存耗盡的情況,那么當 Redis 服務器的內存耗盡后,如果繼續執行請求命令,Redis 會如何處理呢?
    的頭像 發表于 03-08 09:26 ?702次閱讀

    證明CPU指令是亂序執行的

    雙擊QQ.exe從磁盤加載到內存里面,內存里面就會有了一個進程,進程產生的時候會產生一個主線程,就是main方法所在的線程,cpu會找到main開始的地方,把它的指令讀取過來放到程序計數器,把
    的頭像 發表于 03-15 09:13 ?1112次閱讀

    當我們在談論cpu指令亂序的時候,究竟在談論什么?

    知道指令的亂序策略很重要,原因是這樣我們就能夠通過barrier(內存屏障)等指令,在正確的位置告訴cpu或者是編譯器,這里我可以接受亂序,那里我不能接受
    的頭像 發表于 05-19 14:42 ?1620次閱讀
    當我們在談論<b class='flag-5'>cpu</b>指令<b class='flag-5'>亂序</b>的時候,究竟在談論什么?
    主站蜘蛛池模板: 国产在线视频不卡 | 都市激情亚洲 | 免费在线观看一区二区 | 高清国产亚洲va精品 | 特黄特黄aaaa级毛片免费看 | 丁香月婷婷| 丁香婷婷综合五月六月 | 天天综合色一区二区三区 | 影音先锋色偷偷米奇四色 | 天天色天天搞 | 四虎www成人影院观看 | 免费播放欧美毛片欧美aaaaa | 最新中文字幕在线资源 | 国产午夜一区二区在线观看 | 不卡的毛片 | 色成年激情久久综合 | 午夜亚洲精品 | 久久国产精品亚洲综合 | 黄色在线播放网站 | 酒色激情网 | 欧美zooz人禽交免费观看 | 国语自产拍在线观看7m | 免费观看欧美成人1314色 | 国产精品情人露脸在线观看 | xxxx日本xx| 人人干人人爱 | 手机看片国产免费现在观看 | 日本写真高清视频免费网站网 | 亚洲成a人片在线观看www | 免费看大黄 | 永久免费人成网ww555kkk手机 | 午夜精品区| 美女扒开尿口给男人桶视频免费 | 国产午夜精品久久久久 | 特级淫片aaaa毛片aa视频 | 天天操天天玩 | 神马午夜在线观看 | 天天鲁天天爽精品视频 | 爱夜夜性夜夜夜夜夜夜爽 | 成人免费看黄网站无遮挡 | 日本在线视 |