在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

從三個方面闡述Cache

Linux閱碼場 ? 來源:Linux閱碼場 ? 作者:甄建勇 ? 2021-11-21 11:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

關于cache,大概可以從三個方面進行闡述:內存到cache的映射方式,cache的寫策略,cache的替換策略。

映射方式

內存到cache的映射方式,大致可以分為三種,分別是:直接映射(directmapped),全相連(fullyassociative),組相連(setassociative)。

為了便于理解,現在假設一個例子,比如咱們的內存只有16bytes,而cache只有4bytes(cacheline是1byte),那么對于分別采用三種不同的映射方式,會是什么情況呢?如下圖所示:

(direct mapped:直接映射 ; fully associative:全相連 ;set associative:組相連)

(1)directmapped

對于directmapped(直接映射),為了便于數據查找,一般規定內存數據只能置于緩存的特定區域。對于直接匹配緩存,每一個內存塊地址都可通過模運算對應到一個唯一緩存塊上。注意這是一個多對一匹配:多個內存塊地址須共享一個緩存區域。

對于咱們這個例子來說,內存的0地址只能映射到cache的第0個(0%4=0)cacheline,內存的1地址只能映射到cache的第1個(1%4=1)cacheline,內存的2地址只能映射到cache的第2個(2%4=2)cacheline,內存的3地址只能映射到cache的第3個(3%4=3)cacheline,內存的4地址只能映射到cache的第0個(4%4=0)cacheline,。。。。。。如此循環下去。

所以如果采用directmapped的話,core在訪問cache時,根據TLB處理之后的物理地址,進行取模(%)運算,就可以直接確定其cache的位置,由于一個cacheline可能對應不同的內存地址(具有相同模運算結果的內存),然后將物理地址的tag部分與cache的tag部分進行一次比較,就可以確定是cache hit,還是cachemiss。

directmapped的特點是,邏輯簡單,延遲短(只進行一次比較),但命中率低。

(2)fullyassociative

對于fullyassociative(全相連),這種方式,內存中的數據塊可以被放置到cache的任意區域。這種相聯完全免去了索引的使用,而直接通過在整個緩存空間上匹配標簽進行查找。

對于咱們的這個例子來說,內存的某個地址,可以映射到cache的任意個cacheline。內存的0地址能映射到cache的第0個cacheline,也可以映射到第1個cacheline,也可以映射到第2個cache line,也可以映射到第3個cacheline。

所以如果采用fullyassociative的話,core在訪問cache時,根據TLB處理之后的物理地址,要依次和所有的cacheline的tag進行比較。

fullyassociative的特點是:控制復雜,查找造成的電路延遲最長,因此僅在特殊場合,如緩存極小時,才會使用,命中率較高。

(3)setassociative

set associative(組相連)是directmapped 和fully associative兩種方式的一個折中。

對于咱們這個例子來說,我們將4個cacheline分成了兩組,內存的0地址只能映射到cache的第0個組(0%2=0),但是在組內是任意的,既可以映射到組內的第0個cacheline,也可以映射到第1個cacheline。內存的1地址只能映射到cache的第1個組(1%2=1),但是在組內也是任意的,既可以映射到組內的第0個cacheline,也可以映射到第1個cacheline。內存的2地址只能映射到cache的第0個組(2%2=0),但是在組內也是任意的,既可以映射到組內的第0個cacheline,也可以映射到第1個cacheline,。。。。。。。依次類推。

所以,如果采用setassociative的話,core在訪問cache時,根據TLB處理之后的物理地址,先將物理地址取模,得到其可能的cache的組,然后再依次與組內的所有cacheline的tag進行比較,確定是cache hit還是cachemiss。

setassociative是折中方案,所以其特點就是集directmapped 和fully associative之所長。是一個平衡方案。

咱們這個例子是2 way setassociative,即兩路組相連,所謂的兩路,是指每個cache組內的cacheline的數目,不是分組的數目。比如是4路組相連,指的是每個cache組內有4個cacheline。

對于直接映射,由于緩存字節數和緩存塊數均為2的冪,上述運算可以由硬件通過移位極快地完成。直接匹配緩存盡管在電路邏輯上十分簡單,但是存在顯著的沖突問題。由于多個不同的內存塊僅共享一個緩存塊,一旦發生緩存失效就必須將緩存塊的當前內容清除出去。這種做法不但因為頻繁的更換緩存內容造成了大量延遲,而且未能有效利用程序運行期所具有的時間局部性。

組相聯(SetAssociativity)是解決這一問題的主要辦法。使用組相聯的緩存把存儲空間組織成多個組,每個組有若干數據塊。通過建立內存數據和組索引的對應關系,一個內存塊可以被載入到對應組內的任一數據塊上。

直接映射可以認為是單路組相聯。經驗規則表明,在緩存小于128KB時,欲達到相同失效率,一個雙路組相聯緩存僅需相當于直接匹配緩存一半的存儲空間。

為了和下級存儲(如內存)保持數據一致性,就必須把數據更新適時傳播下去。這種傳播通過回寫來完成。

寫策略

一般有兩種回寫策略:寫回(Writeback)和寫通(Writethrough)。

寫回是指,僅當一個緩存塊需要被替換回內存時,才將其內容寫入內存。如果緩存命中,則總是不用更新內存。為了減少內存寫操作,緩存塊通常還設有一個臟位(dirtybit),用以標識該塊在被載入之后是否發生過更新。如果一個緩存塊在被置換回內存之前從未被寫入過,則可以免去回寫操作。

寫回的優點是節省了大量的寫操作。這主要是因為,對一個數據塊內不同單元的更新僅需一次寫操作即可完成。這種內存帶寬上的節省進一步降低了能耗,因此頗適用于嵌入式系統

寫通是指,每當緩存接收到寫數據指令,都直接將數據寫回到內存。如果此數據地址也在緩存中,則必須同時更新緩存。由于這種設計會引發造成大量寫內存操作,有必要設置一個緩沖來減少硬件沖突。這個緩沖稱作寫緩沖器(Writebuffer),通常不超過4個緩存塊大小。不過,出于同樣的目的,寫緩沖器也可以用于寫回型緩存。

寫通較寫回易于實現,并且能更簡單地維持數據一致性。

當發生寫失效時,緩存可有兩種處理策略,分別稱為分配寫(Writeallocate)和非分配寫(No-writeallocate)。

分配寫是指,先如處理讀失效一樣,將所需數據讀入緩存,然后再將數據寫到被讀入的單元。非分配寫則總是直接將數據寫回內存。

設計緩存時可以使用回寫策略和分配策略的任意組合。對于不同組合,發生數據寫操作時的行為也有所不同。

對于組相聯緩存,當一個組的全部緩存塊都被占滿后,如果再次發生緩存失效,就必須選擇一個緩存塊來替換掉。存在多種策略決定哪個塊被替換。

替換策略

顯然,最理想的替換塊應當是距下一次被訪問最晚的那個。這種理想策略無法真正實現,但它為設計其他策略提供了方向。

先進先出算法(FIFO)替換掉進入組內時間最長的緩存塊。最久未使用算法(LRU)則跟蹤各個緩存塊的使用狀況,并根據統計比較出哪個塊已經最長時間未被訪問。對于2路以上相聯,這個算法的時間代價會非常高。

對最久未使用算法的一個近似是非最近使用(NMRU)。這個算法僅記錄哪一個緩存塊是最近被使用的。在替換時,會隨機替換掉任何一個其他的塊。故稱非最近使用。相比于LRU,這種算法僅需硬件為每一個緩存塊增加一個使用位(usebit)即可。

此外,也可使用純粹的隨機替換法。測試表明完全隨機替換的性能近似于LRU。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 內存
    +關注

    關注

    8

    文章

    3115

    瀏覽量

    75109
  • Cache
    +關注

    關注

    0

    文章

    129

    瀏覽量

    28985

原文標題:甄建勇:五分鐘搞定Cache(上)

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何檢測極管的三個

    可以用萬用表來初步確定極管的好壞及類型 (NPN 型還是 PNP 型 ),并辨別出e(發射極)、b(基極)、c(集電極)三個電極。
    發表于 03-08 16:40

    如何區分場效應管mos管三個引腳

    場效應管mos管三個引腳怎么區分
    發表于 03-07 09:20 ?0次下載

    Linux系統中最重要的三個命令

    Linux劍客是Linux系統中最重要的三個命令,它們以其強大的功能和廣泛的應用場景而聞名。這三個工具的組合使用幾乎可以完美應對Shell中的數據分析場景,因此被統稱為Linux
    的頭像 發表于 03-03 10:37 ?393次閱讀

    ADS828的GND引腳有三個,這三個引腳的接地是哪個接數字地,哪個接模擬地?

    在貴公司的這款AD轉換芯片ADS828的GND引腳有三個(1、16、26)想咨詢一下這三個引腳的接地是哪個接數字地,哪個接模擬地,還是不用考慮這方面;還有就是在輸出偏置電壓的時候,在為2.5V的時候,是用CM輸出端好,還是用R
    發表于 02-14 08:27

    直線電機主要應用在哪三個方面

    直線電機是一種將電能直接轉換為直線運動機械能的裝置,它具有結構簡單、響應速度快、精度高、維護方便等優點。在現代工業和科技領域,直線電機的應用非常廣泛,主要可以歸納為以下三個方面: 1. 工業自動化
    的頭像 發表于 10-24 10:06 ?1762次閱讀

    簡述光刻工藝的三個主要步驟

    “ 光刻作為半導體中的關鍵工藝,其中包括3大步驟的工藝:涂膠、曝光、顯影。三個步驟有一異常,整個光刻工藝都需要返工處理,因此現場異常的處理顯得尤為關鍵”
    的頭像 發表于 10-22 13:52 ?1971次閱讀

    自動發電控制系統具有三個基本功能

    自動發電控制系統(AGC)具有三個基本功能,這些功能在電力系統的運行和調度中發揮著重要作用。以下是這三個基本功能的詳細解析:
    的頭像 發表于 10-03 15:05 ?1534次閱讀

    三個電流怎么判斷NPN還是PNP

    在判斷晶體管是NPN型還是PNP型時,主要依據是其內部半導體材料的排列方式以及電流在晶體管中的流動方向。闡述如何根據三個電流(通常指的是發射極電流IE、基極電流IB和集電極電流IC)來判斷NPN和PNP晶體管。
    的頭像 發表于 09-14 15:44 ?3947次閱讀

    基本理想電路元件的三個特征是什么

    基本理想電路元件是構成電路的基本單元,它們具有三個基本特征:電壓-電流關系、能量轉換和電路參數。以下是對這三個特征的分析: 電壓-電流關系 理想電路元件的電壓-電流關系是其最基本的特征之一。這種關系
    的頭像 發表于 08-25 09:38 ?2303次閱讀

    對稱相電壓的特點是哪三個方面

    對稱相電壓是電力系統中常見的一種電壓形式,它具有三個相位,每個相位之間的相位差為120度。對稱相電壓在工業生產和日常生活中有著廣泛的應用,如電動機、變壓器、發電機等。本文將從三個
    的頭像 發表于 08-12 18:18 ?2985次閱讀

    簡述極管的三個工作區域

    極管的三個區域,通常指的是其在不同工作條件下的狀態區域,即截止區、放大區和飽和區。這三個區域定義了極管在不同電壓和電流條件下的行為特性,對于理解和設計電子電路至關重要。
    的頭像 發表于 07-29 10:50 ?6267次閱讀

    可調變阻器三個引腳怎么區分

    可調變阻器,也稱為電位器或可變電阻器,是一種可以調節電阻值的電子元件。它廣泛應用于各種電子設備中,如音頻設備、電源管理、電機控制等。可調變阻器有三個引腳,分別是固定端、滑動端和可調端。這三個引腳
    的頭像 發表于 07-24 11:12 ?2479次閱讀

    可調電阻三個腳各是什么

    可調電阻器,也稱為電位器或可變電阻器,是一種可調節電阻值的電子元件。它通常由三個腳(引腳)組成,分別是固定腳、滑動腳和可調腳。以下是對這三個腳的介紹: 固定腳(Fixed Terminal): 固定
    的頭像 發表于 07-24 11:06 ?3935次閱讀

    如何分別場效應管的三個

    場效應管(Field-Effect Transistor,簡稱FET)是一種半導體器件,廣泛應用于電子電路中。它具有三個主要的引腳:源極(Source)、漏極(Drain)和柵極(Gate)。正確
    的頭像 發表于 07-14 09:14 ?4001次閱讀

    簡述使用波特五力模型的三個步驟

    企業了解行業的競爭環境,從而制定相應的競爭策略。以下是使用波特五力模型的三個步驟。 第一步:識別行業 在使用波特五力模型之前,首先需要明確分析的行業范圍。行業的定義可以根據產品、服務、市場、地理區域等因素來確定。這一步的目的是確保分析的焦點集中,避免將不同行業的競爭力量混
    的頭像 發表于 07-05 14:34 ?1895次閱讀
    主站蜘蛛池模板: 国产精品臀控福利在线观看 | 日韩成人毛片高清视频免费看 | 日日操夜夜操天天操 | 日韩免费视频一区 | 亚洲精品资源在线 | 国产黄色在线看 | 91久久澡人人爽人人添 | 福利毛片 | 大又大粗又爽又黄少妇毛片 | 高清一级做a爱视频免费 | 天天鲁天天爽精品视频 | 成zzzwww日本免费 | 一个综合色 | 日本又粗又长一进一出抽搐 | 亚洲bbbbbxxxxx精品三十七 | 1024手机看片国产旧版你懂的 | 高清影院在线欧美人色 | 国产999星空传媒在线观看 | 天天操伊人 | 亚洲欧美在线一区二区 | 天天摸天天做 | 亚洲五月激情综合图片区 | 91av视频 | 日本欧美强乱视频在线 | 天天夜夜狠狠一区二区三区 | 亚洲电影在线看 | 特级一级毛片视频免费观看 | 艹久久 | 国产免费一区二区三区 | 国产精品视频网站你懂得 | 免费观看视频高清www | 草草影院ccyy国产日本欧美 | 性做久久久久久免费观看 | 在线毛片免费 | 午夜免费福利片观看 | 99久久国产免费 - 99久久国产免费 | 日日噜夜夜噜 | 国产高清视频免费最新在线 | 国产免费好大好硬视频 | 成人在线91 | 亚洲一区欧美日韩 |