在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

淺析從同步到RCU的引入

Linux閱碼場 ? 來源:內核工匠 ? 2023-03-23 17:13 ? 次閱讀

一、從同步開始

1.1 同步的產生

在閱讀或者編寫內核代碼的時候,總是需要帶著一個默認的前提條件:任意的一條執行流,都可能在任意一條指令之后被中斷執行,然后在并不確定的時間后再次回來執行。

因此,常常需要考慮一個問題:指令在被中斷到回到斷點繼續執行的這個過程中,原本所依賴的執行環境是不是會發生變化,對應的問題是,指令執行所依賴的環境是獨享的還是共享的。如果它的獨享的,那就是安全的,而如果是共享的,那就可能存在被意外修改的問題,由此引發一些同步問題。處理同步問題,通常是通過原子變量、加鎖這些同步機制來解決。

而大部分工程師對于是否使用同步機制的判斷基于一個樸素的觀念:全局變量的操作需要加鎖,而局部變量并不需要。

在絕大多數的情況下,這句話是適用的。之所以我將全局和局部替換為共享與獨享,是因為在特定情況下,局部變量并不等于獨享資源,而全局變量也同樣如此,是否要引入同步機制這個問題也并不是一成不變的,比如下面的幾種情況:

(1) 需要注意的一個問題是,我們通常毫不思索地把返回指向棧上資源的指針這種行為視為絕對的 bug,但是卻忽略了這個 bug 產生的原因:函數返回之后棧上的數據會被覆蓋。但是如果函數沒有返回呢?內核中能看到這樣的代碼:在棧上初始化一些資源,然后將其鏈接到全局鏈表上,隨后陷入睡眠,棧上數據的生命周期也就保持到了被喚醒之后。既然棧上的數據可以導出到其它地方,自然也就由獨享變成了共享,也就需要考慮同步問題。

(2) 當我們把視線全部聚焦在數據上時,或者像第一點提到的理所當然地認為棧就應該是獨占的時候,其實我們忽略了它們本身存在的形式:不論是指令、亦或者是數據,棧區也好,堆區也罷,它們都是存在于內存當中,而內存本身的硬件屬性是可讀可寫的。而諸如代碼段只讀,棧獨立于每個進程只是操作系統賦予它們的屬性,如果我們只是操作系統的使用者,自然可以默認這些規律,但是如果我們是開發者,是不是存在修改代碼段或者其它非數據部分的需求?而這些修改又會不會存在同步問題呢?所以有時候同步問題并不僅僅局限于數據。

(3) 有些全局變量的定義可能僅僅是為了擴大訪問范圍,或者雖然它是共享資源,但是在特定場景下并沒有并發產生,(比如 per-task 的變量,percpu 變量)。因此,對于產生同步問題來說,共享只是其中一個必要條件,它還有另一個必要條件:同時操作。也就是多條執行流同時訪問同一個共享資源。

同時操作中的同時如何理解?時間刻度下的同一時刻?如果是這樣判定,那從來就不存在真正意義上的同時,我們所定義的同時是在 A 還沒完成某項工作的情況下,B 也參與進來,這種情況就視為 A 與 B 同時做這項工作。

比如,在單核環境下并不存在代碼執行的同時,所有代碼都是串行執行的,但是依舊會產生同步問題,比如 i++。這是因為,C 語言的最小粒度并非指令執行的最小粒度,一個 i++ 操作實際上由 load/modified/store 指令組成,如果在執行 load 指令完成之后被打斷,在其它執行流再操作 i,從 C 語言的執行角度來說,i++ 是沒有被執行完的,由此而帶來的一種”同時”。而這樣的概念同樣可以引申到復合結構。

(4)多個執行流對共享的數據進行同時操作,當這個場景出現時,許多工程師會毫不猶豫地增加同步機制來避免出現問題。不知道各位盆友有沒有想過,如果不加鎖,是不是一定會造成程序上的 bug?要弄清楚這個問題,我們需要知道 CPU 在執行時的一些行為。

首先就是要區分讀和寫,通常我們所說的問題其實就是執行讀操作時讀取到不符合預料之中的值,隨后的邏輯判斷或者隨后的寫操作就會出現邏輯問題,而這種問題就是同時寫共享資源帶來的。

另一方面,程序在執行時如果不做同步,會遇到幾種亂序:

編譯器會對程序執行優化操作,編譯器會假定所編譯的程序都是在單執行流環境下運行的,在此基礎上進行優化,比如將代碼亂序,將計算結果使用寄存器緩存而不寫回內存等等,自然地,如果你不希望編譯器這么做,就需要通過 volatile 來禁用激進的優化項,對于內核而言,通常是使用 WRITE_ONCE/READ_ONCE 接口,或者試用 barrie 屏障防止特定代碼段的亂序行為。

為了進一步提高并發性能,CPU 也會對代碼進行亂序排列,通常 CPU 只會保證有邏輯依賴的指令按照順序執行,比如一條指令依賴于上一條指令的執行結果,就會按照順序執行。而對于其它不存在邏輯依賴的指令,則不能保證順序,至于會怎么亂序,這個并不能做任何假設,而在多線程多核環境下,這種亂序會帶來問題,可以通過 CPU 的屏障來禁止這種行為。

現代 CPU 弱序的內存模型,這和處理器架構相關,在較弱的內存模型中,寫操作并不會按照執行順序提交到內存,一個 CPU 寫完之后,另一個 CPU 在下次訪問時并不一定能立刻訪問到新值,而且另一個 CPU 的看到寫的順序也是不一定的,只有通過數據屏障或者特定內存屏障來禁止這種行為。

因此,當我們了解了程序在不使用同步機制會帶來什么問題的情況下,就可以具體問題具體分析,即使是針對同一共享數據的同時操作,比如出現下面的情況,即使不加鎖也不會出現問題:

針對共享數據的只讀

即使存在同時讀寫,也不一定會產生 bug,最常見的例子是對 /proc/ 目錄下的某些節點進行設置操作,該設置對應一個全局變量,而內核代碼中只會讀取該變量,這種情況不加同步措施(或者只加編譯器屏障),通常也只會造成非常短的時間周期內讀者讀到舊值,通常不會產生邏輯問題。

而對于同時的寫,在特定應用場景下也可以不加鎖。參考下圖:

971266a8-c957-11ed-bfe3-dac502259ad0.png

A 線程和 B 線程同時操作變量 cnt,盡管 A 和 B 都執行了 cnt++ 操作,但是 B 的操作被覆蓋了,兩次 ++ 操作最終只有一次產生了效果,看起來這肯定是有問題的。但是在諸如網絡數據包統計的時候,這種情況發生的概率非常低,和所有路徑加鎖帶來巨大的性能損失相比,統計值稍微有一點點誤差也不是不能接受,這種情況下我們可以只加一個 WRITE_ONCE 來限制編譯器優化。因此,當我們了解了不同的同步措施所帶來的性能損失以及它實際能解決什么問題的時候,更多的是做性能與準確性(也可以是吞吐量、功耗之類的指標)之間的權衡,而并不是不由分說地加鎖。

1.2 同步機制

聊到同步問題,那自然就離不開它的解決方案:同步機制,當然,我們討論最多的同步機制就是鎖。既然同步問題產生的必要條件是 "共享" 和 "同時",那只需要破壞其中的某一個條件,就可以解決同步問題。

最簡單也是最經典的方案就是 spinlock 和 mutex,只要接觸過 linux,對這兩者基本上就不會陌生,這兩者所實現的邏輯就是建立一個臨界區來保護某一個共享資源的操作,一次只允許一個訪問者進入,等該訪問者退出的時候,下一個再進來,破壞了 "同時" 這個條件,也就能解決同步問題。

spinlock 在無法獲取鎖的時候會選擇自旋等待,而 mutex 無法獲取鎖的時候會選擇睡眠,它們應用在不同的場景,對于一個操作系統而言,這兩者是必要的。但是很多朋友在看待它們之間的差異的時候,往往只注意到嘗試持鎖但失敗這個場景下的不同,而忽略了持鎖之后的差異:

(1) spinlock 持鎖是關搶占的,但是并不一定關中斷,也就是說在 spinlock 臨界區中,不會出現調度,但是可能出現進程環境的切換,比如中斷、軟中斷,這在某些場景下是需要考慮的。

(2) 而 mutex 是不能應用在中斷環境下的,所以可以不用考慮進程運行環境的切換,但是 mutex 并不關搶占,所以 mutex 也會帶來嵌套持鎖的復雜問題。

如果要深入研究代碼實現甚至對它們進行優化,這兩個問題是無法回避的。而如果只是使用 spinlock、mutex 作為同步措施保護特定全局數據,這兩個問題并不需要過多考慮,而且如果沒有其它方面諸如性能的需求,你只需要知道 mutex 和 spinlock 這兩個簡單的接口就能應付工作。

當然,如果你是一個對事物本源有好奇心的朋友,可以再深入思考 spinlock(mutex) 的實現原理,就會發現一個矛盾點:spinlock 的作用是對全局數據的同時操作做互斥保護,讓一個訪問者進入而其它訪問者等待,而讓一個訪問者進入而其它訪問者等待,做這件事本身就需要線程之間的通信。

換句話說,在 spinlock 的實現中,等待線程要知道鎖已經被占用,而占用者在嘗試持鎖之初要知道自己已經占用鎖,它們也必須通過訪問某個全局的資源才能獲得這個信息,這是不是又產生了對某一個共享資源的同時訪問?那誰又來保護 spinlock 本身的實現呢?

軟件無法解決,那就需要借助硬件來實現,因此每個不同的硬件架構都至少需要實現對單字長變量的原子操作指令,比如 64 位平臺下,硬件必須支持一類或一組指令,該指令保證對一個 long 型變量執行諸如 ++ 操作時,保證它的原子性。

借助于這個原子性的硬件操作,spinlock 就可以這樣實現:先請求鎖的,就可以通過原子操作獲取到某個全局變量的所有權,而后請求鎖的,必須等待之前的 owner 釋放其所有權,也就是 unlock,而上面說到的某個全局變量,就是鎖變量。

因此可以看到,對共享的全局數據的操作,變成了對鎖的競爭,而對鎖的競爭實際上就是對鎖變量的競爭,本質上就是將復合數據的保護收斂成單字長變量的保護,然后使用硬件的原子指令來解決這個問題。

舉個例子,多個執行流對某個 struct foo 結構實例有讀寫操作,為了防止同步問題,這些執行流從競爭 struct foo 變成競爭 foo->spinlock,而 spinlock 是基于鎖變量lock->val實現的,所以,實際上所有執行流競爭的是鎖變量?;诖?,不難發現,鎖的實現并非消除了競爭,它只是將競爭縮小到單變量的范圍。

而在隨后的發展中,因為需要平衡延遲、吞吐量、功耗等因素,漸漸地對鎖又加入了更多的邏輯,比如 mutex 最開始實現了排隊機制,后續為了減少上下文切換引入樂觀自旋,又為了解決樂觀自旋帶來的公平性問題引入 handoff 機制。而它的表兄弟 rwsem 在 mutex 的基礎上進一步區分讀寫,實現則更加復雜。

俗話說,是藥三分毒,鎖是解決同步問題的一劑猛藥,但是它帶來的問題也不容小覷:

死鎖、餓死這些常見且直接導致系統死機。

鎖只是緩解競爭,而不是根治,所以競爭依舊存在,在激烈條件下開銷依舊不小。

鎖實現越來越趨于復雜,也會消耗指令周期和 cache 空間,而且這種復雜度讓量化分析變得越來越難。

具體的鎖有具體的問題,比如spinlock 機制會帶來 cpu 的空轉,在某些競爭激烈的場景下,8 個 cpu 同時競爭同一個 spinlock 鎖,因為關搶占的原因,這 8 個 CPU 上除了處理中斷,再也做不了任何事,只是空轉浪費 CPU 資源。而 mutex 所帶來的無效喚醒以及本身的進程切換也是有不小的開銷,比如 mutex 的環境下,當多個 cpu 在競爭同一把鎖時,不良的鎖使用或者不合時宜的設計會導致很多的無效喚醒,也就是很多進程被喚醒之后卻無法獲取鎖,只能再次睡下,而這些開銷都是一種資源的浪費,在重載環境下這種浪費程度是非常大的.

這些都是鎖本身的實現問題,來自于性能、公平性、吞吐量之間不可調和的矛盾,而鎖競爭所花費的時間完全是產生不了任何效益的。

當解決方案本身成為最大的問題,當屠龍的少年即將成為新的惡龍,我們不得不轉而去尋找更合適的同步方案。

1.3 其它同步解決方案

當通用的鎖方案無法更進一步時,另一個方向是拆分使用場景,尋找特定場景下的針對性解決方案。

一種想法是繼續沿用鎖的形式,但是區分讀寫,因為讀寫的性質是完全不一樣的。

在上面的描述中,對共享資源進行操作的角色我們統稱為訪問者,但是從實際的硬件角度出發,發現讀和寫對于共享數據的操作有根本性的不同,而寫操作通常才是帶來同步問題的罪魁禍首,針對多讀少寫的場景,在 spinlock、mutex 的基礎上衍生出了 rwlock、rwsem(rwsem 其實并沒有信號量的語義,它更像是睡眠版的 rwlock)。

另一種是無鎖設計,無鎖設計也分成很多種類型,第一種是干脆不使用同步機制,或者最小化使用同步機制,因為某些場景下,全局數據的不同步是可以接受的。這一點在上面已經論證過了。

另外的較常見的無鎖方案,通過結合應用場景采用更細化的設計,只使用硬件提供的原子操作,而不引入諸如 spinlock 這一類復雜的鎖邏輯,從而避免在鎖上消耗太多 CPU 資源。

除此之外,一種二次確認的機制也比較常用,因為某些共享數據的操作可能會帶來同步問題,如果產生并發條件的概率足夠低,直接采用鎖有時候并沒有必要,我們大可以直接使用無鎖下的操作,然后對操作結果進行檢查,如果結果不符合我們的預期,那就重新執行一遍操作,以保證數據被正常更新。

還有很多的無鎖方案都是針對”共享”的條件來做的,比如使用額外的內存來避免競爭的產生,其中使用最多的就是內核中的 percpu 機制,盡管大多數工程師通常并不會將它看成是一種同步的解決方案,但是它卻實際上地解決了同步問題產生的"共享"這個條件,也就是將原本 cpu 之間共享的全局數據分散到每個 cpu 一份,這樣雖然依舊存在進程環境與中斷環境的同步問題,但是卻極大地降低了多 cpu 之間的同步問題,從多核收斂到單核的環境。

同時,針對一些特定的場景還涌現出一些無鎖方案,最常見的是在特定場景下存在冷熱路徑,通過增大冷路徑下的開銷這種設計來實現熱路徑下的無鎖方案,而冷熱路徑的定義完全是取決于應用場景的,因此這些優化都不能作為通用方案,因為它們的實現是一些特殊情況下的權衡。

而我們今天要聊到的,RCU,也正是在特定場景下的一種無鎖方案。

二、RCU 是什么?

2.1 RCU 的基本概念

RCU,read-copy-update,也就是讀-拷貝-更新,其基本思想在于,當我們需要對一個共享數據進行操作的時候,我們可以先復制一份原有的數據 B,將需要更新的部分在 B 上實現,然后再使用 B 替換掉 A,這也是 RCU 最典型的使用場景。

很顯然,這種無鎖方案所針對的是 "共享" 這個特性,畢竟并不直接對目標數據進行操作。

從這個理念出發,其實我們可以非常直觀地感受到 RCU 的第一個特點:RCU 是針對多讀少寫的使用場景的,畢竟這種形式的實現明顯加大了寫端的開銷。

RCU 的設計理念簡單到任何人在第一次聽到時就能夠理解它,但是當我們嘗試像 spinlock 那樣通過它的 lock/unlock 接口來閱讀它的代碼實現時,居然驚奇地發現它的 lock/unlock 實現僅僅只是開關一下搶占,在多次確認內核配置沒有問題之后,發現事實確實是如此,從而產生一種很荒謬的感覺:僅僅通過開關搶占是怎么實現讀-拷貝-更新的?

2.2 RCU 實現的核心問題是什么?

很多對 RCU 感興趣的朋友其實在網上也看過不少 RCU 相關的文章,知道了 RCU 的操作形式:讀-拷貝-更新,并自然而然地覺得這是個很好的想法,而且它好像確實不需要鎖來實現,因為更新操作和原本讀者讀到的是不同的數據,不滿足共享的條件,隨后再執行替換就好了。而且,這三個操作步驟完全就可以由使用者自己完成,實在是想不到有什么地方需要操作系統來插手的。

如果一個問題想不明白,那么我們就代入到真實的場景下來考慮這個問題:假設現在有 3 個讀者和 1 個更新者需要對共享數據進行訪問,讀者不間斷地對數據發起讀操作,而更新者需要更新時,拷貝出一份新的數據,操作完之后然后再替換舊的數據,這樣就完成了數據的更新,而讀者就可以讀到新的數據。

看起來非常合理,效率也很高,但是這里有一個最大的問題在于,我們默認了一個并不存在的前提條件:新數據的替換立馬就對所有的讀者生效,替換之后就可以立刻刪除舊數據,而讀者也可以立刻讀到新的數據。

972aa948-c957-11ed-bfe3-dac502259ad0.png

我們可以通過上圖來了解這個流程,其中存在三個讀者,讀者的兩個箭頭標定讀操作的開始點和結束點,中間的表示共享數據。

從圖中可以看到,writer 先是從 D1 copy 出一份 D2,接著對D2 執行修改,緊接著將 D2 更新為新的共享數據,這個過程就可以理解為一次 Read-Copy-Update 操作。

而在整個過程中,reader1 始終讀到 D1 數據,而reader3 始終讀到 D2 的新數據,但是 reader2 就比較麻煩了,它的讀操作跨越了 D1 到 D2 的更新過程,那么它讀到的是 D1 還是 D2,又或者說讀到一半 D1 的數據和另一半 D2 的數據?

按照傳統的同步鎖做法,這時候需要寫者等所有舊讀者退出,然后讀者等待寫者更新完,才繼續進讀臨界區,對應上圖就是 writer 必須等 reader2 先讀完再執行更新。你有沒有意識到,寫者等讀者退出,讀者再等寫者更新完,這個操作實際上就是 rwlock 的實現,難道 RCU 操作要基于 rwlock 來實現?那為什么我不直接使用 rwlock 呢?顯然讓替換立刻生效來實現 RCU 的方式,只能說你創造了一個新的同步機制,但它永遠也不會有人用。

那么為了能超過 rwlock 的性能,一方面不能做讀者與寫者之間的鎖同步,從而讓 RCU 能在特定場景下有性能優勢,另一方面,如果不做鎖同步,那就意味著讀者不知道寫者什么時候更新,寫者也不知道更新時是否存在讀者,唯一的方案是:即使 writer 在更新完之后,reader2 讀取的依舊是 D1 的舊數據(因為 reader2 不知道數據有更新),而更新完之后新來的讀者讀到的自然是新數據。

在這種情況下,也就意味著 RCU 不能像普通鎖一樣保護復合結構的實例,而只能是針對指向動態資源的數據指針,稍微深入地想一想,就能發現,如果D1 和 D2是同一個結構實例,D2 會覆蓋掉 D1 的數據,就會產生reader2 讀到一半D1,更新后讀到另一半D2的錯誤結果。而如果在更新完之后reader2依舊需要能夠讀取到 D1,那D1和D2必須是獨立的兩片內存。

之前的問題是如何處理跨越更新點的讀者,在確定這類讀者依舊讀取舊數據之后,現在剩下的問題變成了:判斷什么時候這些讀者讀完了舊數據,從而可以回收舊數據的資源?

這就是內核中 RCU 實現所需要解決的問題:如何低成本地實現等待依舊正在訪問舊數據的讀者退出?而讀-拷貝-更新操作,完全可以留給用戶自己做,所以,RCU 在內核中的實現實際上并不是 Read-Copy-Update 操作,而是實現一種等待讀者退出臨界區的機制。

同時,由于通常情況下,RCU 等待所有舊讀者退出之后,主要的操作就是釋放舊數據,所以它的實現也很像一種垃圾回收機制。

結合上面的兩點問題,也就引出 RCU 的另外幾個特點:

即使是在寫者更新完之后,依舊允許讀者讀到舊數據。而內核的 RCU 實現需要保證所有能讀到舊數據的 RCU 退出,才刪除舊數據。

RCU 同步機制所保護的對象不能直接是復合結構,只能保護動態分配數據對應的指針

追求讀端的極限性能,這是 RCU 在內核中的立足之本。

2.3 RCU 的實現討論

如果我上一小節已經將 RCU 在內核中實現的邏輯表達清楚,且你也已經看明白,那下一步需要討論的就是:如何低成本地實現等待舊的讀者退出臨界區。也就是從現在開始,我們才真正進入到 RCU 的實現中。

等待一件事情結束,最常用的也是容易想到的解決方案就是在開始的時候做一個標記,憑票入場,出場退票,這樣只需要通過判斷出入的記錄是否成對就能判斷是否還存在沒有退出者,當然,這個想法在上面已經被證實效率過低,記錄讀端的起始意味著需要執行全局的寫操作,而讀端臨界區一旦需要執行全局的寫操作,在多核上并發時就會產生同步問題,這并不好解決,而且開銷并不小,當然這個全局寫操作可以換成 percpu 類型的,從而減少一些性能的損失,不過這種方式總歸是治標不治本,而我們的理想狀態是讀端沒有同步開銷,也就是不記錄讀臨界區的進入。

另一個思路是,我們是否可以借用其它的事件來完成這個等待操作?也就是說是否能通過一些既有事件來判斷我們需要等待的條件已經滿足,而不需要進行針對該事件直接的記錄行為。

在內核中,RCU 的實現就使用了一種非常巧妙的方式:簡單地通過關-開搶占來實現一個讀臨界區,讀者進入臨界區將會關搶占,而退出臨界區時再將搶占打開,而進程的調度只會在搶占開的時候發生,因此,寫者等待之前所有的讀者退出,只需要等待所有 cpu 上都執行完一次調度就行了。

這里有必要進一步解釋一下,上一段文字中非常重要的幾個字是:之前所有的讀者。

973967bc-c957-11ed-bfe3-dac502259ad0.png

參考上圖,在writer更新之前,reader1 和 reader2 依舊引用的是 D1 數據,而 reader3 已經讀取到新的數據了,所以只需要等待 reader1 和 reader2 完成讀操作,就可以釋放 D1 了。

而在 reader1 整個讀的過程中,是處于關搶占的狀態,如果 reader1 運行在 cpu0 上,那 writer 更新完之后,只需要判斷 cpu0 上一旦發生了調度,就能判斷 reader1 已經退出臨界區,畢竟發生調度的前提是 cpu0 上開了搶占,也就意味著 reader1 已經讀完了。

而更新者更新完數據之后,等待所有讀者退出臨界區這個過程,被命名為寬限期(grance period),也就是寬限期一過,也就意味著數據的更新以及所有讀者退出這個過程已經完成,這時候就可以釋放舊數據了,如果是單純的 add 操作,那自然就不需要刪除舊數據,只需要確認更新已經完成就好。

當然,等待所有之前的讀者退出臨界區這個過程可能會比較長,甚至到幾十毫秒。因此,在決定是否使用 RCU 作為同步之前需要考慮到這一點。

這也就引出 RCU 的另外兩個特點:

Linux 實現下的RCU 讀端臨界區就是通過關-開搶占來實現的,性能以及多核擴展性非常好,但是很明顯讀端臨界區不支持搶占和睡眠。

寫端具有一定的延遲。讀端在一定的時間周期內會獲取到新或者舊數據。

9747c1ea-c957-11ed-bfe3-dac502259ad0.png

上圖是一個簡單的示例,更新端在 CPU1 上對 gptr 執行了置 NULL 操作,然后調用 synchronize_rcu 阻塞等待所有之前的讀者退出臨界區,synchronize_rcu 會立刻觸發一次調度,接著 CPU2 上在執行完淺藍長條對應的讀端臨界區之后,執行了一次調度,同時也意味著 CPU2 已經渡過了臨界區,而在 CPU3 上,實際上經歷了三次進入-退出讀臨界區的階段,但是因為沒有觸發進程切換,RCU core 是無法判斷 CPU3 渡過了臨界區的,直到最后 CPU3 執行了一次調度,整個系統也就渡過了一個完整的寬限期,CPU1 上阻塞的 task 得以繼續運行,free 對應的內存。

同時,再整體總結一下 RCU 的特點:

RCU 是針對多讀少寫的使用場景

寫端具有一定的延遲。讀端在一定的時間周期內會獲取到新或者舊數據

即使是在寫者更新完之后,依舊允許讀者讀到舊數據。而內核的 RCU 實現需要保證所有能讀到舊數據的讀者退出,才刪除舊數據

RCU 同步機制所保護的對象不能直接是復合結構,只能是指針

RCU 追求讀端的極限性能,這是 RCU 在內核中的立足之本

Linux 實現下的經典RCU 讀端臨界區就是通過關-開搶占來實現的,性能以及多核擴展性非常好,但是很明顯讀端臨界區不支持搶占和睡眠

三、結語

其實對于 RCU ,還有很多東西要講,包括RCU的使用、實現、RCU的變種、RCU的發展以及源代碼分析之類的,整個 RCU 是一個非常龐大的體系。

按照我以往的經驗,這種大段的文字且沒有什么趣味性的東西,篇幅還是不宜過長,如果各位對 RCU 真的感興趣,下次咱們再一起走進 RCU 的使用和實現。






審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19829

    瀏覽量

    233868
  • 寄存器
    +關注

    關注

    31

    文章

    5425

    瀏覽量

    123648
  • C語言
    +關注

    關注

    180

    文章

    7630

    瀏覽量

    140682
  • rcu
    rcu
    +關注

    關注

    0

    文章

    21

    瀏覽量

    5588

原文標題:RCU前傳:從同步到RCU的引入

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    謝寶友教你學Linux:深入理解Linux RCU硬件說起

    RCU是Linux內核中很難的一部分,本系列文章一點一滴地來把RCU說清楚。第一次連載,是描述硬件。
    的頭像 發表于 09-04 10:29 ?6213次閱讀
    謝寶友教你學Linux:深入理解Linux <b class='flag-5'>RCU</b>之<b class='flag-5'>從</b>硬件說起

    硬件引申出內存屏障,帶你深入了解Linux內核RCU

    本文硬件的角度引申出內存屏障,這不是內存屏障的詳盡手冊,但是相關知識對于理解RCU有所幫助。
    的頭像 發表于 09-19 11:39 ?6316次閱讀
    <b class='flag-5'>從</b>硬件引申出內存屏障,帶你深入了解Linux內核<b class='flag-5'>RCU</b>

    深入理解Linux RCU:經典RCU實現概要

    減少鎖競爭的一個有效方法是創建一個分級結構,如上圖所示。在此,四個rcu_node 結構中的每一個都有各自的鎖,這樣只有 CPU 0 和 1 會獲取最左邊的 rcu_node的鎖, CPU 2 和 3 會獲取中間的rcu_nod
    的頭像 發表于 05-10 09:08 ?1.5w次閱讀
    深入理解Linux <b class='flag-5'>RCU</b>:經典<b class='flag-5'>RCU</b>實現概要

    基于Linux內核源碼的RCU實現方案

    RCU(Read-Copy Update)是數據同步的一種方式,在當前的Linux內核中發揮著重要的作用。RCU主要針對的數據對象是鏈表,目的是提高遍歷讀取數據的效率,為了達到目的使用RCU
    的頭像 發表于 09-25 15:10 ?2773次閱讀

    Linux內核RCU鎖的原理與使用

    好久沒有更文,上次更文時西安天氣還很熱,現在“寒氣”它還真來了。在前一階段經歷了一些公司的面試,經常會問到RCU鎖的原理,其實在跟對方口述表達時才真正能體現出來自己到底懂不懂,關于RCU鎖的原理與使用,我打算分若干個次文章整理出來,本次就先從一個大概的原理上進行講解。
    發表于 10-13 16:17 ?4879次閱讀
    Linux內核<b class='flag-5'>RCU</b>鎖的原理與使用

    深入理解RCU:玩具式實現

    也許最簡單的RCU實現就是用鎖了,如下圖所示。在該實現中,rcu_read_lock()獲取一把全局自旋鎖,rcu_read_unlock()釋放鎖,而synchronize_rcu(
    的頭像 發表于 12-27 09:06 ?992次閱讀

    分級RCU的基礎知識

    雖然Linux更早版本中的經典RCU,其讀端原語擁有出色的性能和擴展性,但是寫端原語則需要判斷預先存在的讀端臨界區在什么時候完成,它僅僅被設計用于數十個CPU的系統。經典RCU的實現,要求在每個優雅
    的頭像 發表于 12-27 09:54 ?1339次閱讀
    分級<b class='flag-5'>RCU</b>的基礎知識

    Linux內核中RCU的用法

    在Linux內核中,RCU最常見的用途是替換讀寫鎖。在20世紀90年代初期,Paul在實現通用RCU之前,實現了一種輕量級的讀寫鎖。后來,為這個輕量級讀寫鎖原型所設想的每個用途,最終都使用RCU來實現了。
    的頭像 發表于 12-27 09:56 ?2470次閱讀
    Linux內核中<b class='flag-5'>RCU</b>的用法

    分級RCU基礎知識

    謝寶友:深入理解RCU之六:分級RCU基礎
    發表于 05-25 06:18

    linux經典的rcu如何實現?

    RCU主要用于對性能要求苛刻的并行實時計算。例如:天氣預報、模擬核爆炸計算、內核同步等等。
    的頭像 發表于 11-07 11:09 ?3973次閱讀
    linux經典的<b class='flag-5'>rcu</b>如何實現?

    linux內核rcu機制詳解

    Linux內核源碼當中,關于RCU的文檔比較齊全,你可以在 /Documentation/RCU/ 目錄下找到這些文件。Paul E. McKenney 是內核中RCU源碼的主要實現者,他也寫了很多
    發表于 11-13 16:47 ?8963次閱讀
    linux內核<b class='flag-5'>rcu</b>機制詳解

    深入理解Linux RCU:RCU是讀寫鎖的替代者

    請注意,在單個CPU上讀寫鎖比RCU慢一個數量級,在16個CPU上讀寫鎖比RCU幾乎要慢兩個數量級。隨著CPU數量的增加,RCU的擴展性優勢越來越突出??梢赃@么說,RCU幾乎就是水平擴
    的頭像 發表于 05-10 09:13 ?1.2w次閱讀
    深入理解Linux <b class='flag-5'>RCU</b>:<b class='flag-5'>RCU</b>是讀寫鎖的替代者

    并行程序設計中最重要的鎖-RCU

    hi,大家好,今天給大家分享并行程序設計中最重要的鎖-RCU鎖,RCU鎖本質是用空間換時間,是對讀寫鎖的一種優化加強,但不僅僅是這樣簡單,RCU體現出來的垃圾回收思想,也是值得我們學習和借鑒
    的頭像 發表于 08-27 14:25 ?3449次閱讀

    DA14585 Voice RCU 快速入門指南

    DA14585 Voice RCU 快速入門指南
    發表于 03-15 20:31 ?2次下載
    DA14585 Voice <b class='flag-5'>RCU</b> 快速入門指南

    RK3588 原理圖遷移同步 PCB 的關鍵操作及技巧

    RK3588 原理圖遷移同步 PCB 的關鍵操作及技巧
    的頭像 發表于 08-14 10:00 ?1393次閱讀
    RK3588 <b class='flag-5'>從</b>原理圖遷移<b class='flag-5'>同步</b><b class='flag-5'>到</b> PCB 的關鍵操作及技巧
    主站蜘蛛池模板: 亚洲四虎 | 性欧美大战久久久久久久久 | 午夜在线观看视频在线播放版 | 午夜高清免费观看视频 | 国产一级做a爰片久久毛片 国产一级做a爰片久久毛片男 | 亚洲福利一区二区 | 免费观看做网站爱 | 一级一级一片免费高清 | 日日摸人人看97人人澡 | 久久精品影院永久网址 | 久久国产精品亚洲综合 | 手机看片1024精品日韩 | 99久久免费精品国产免费高清 | 免费大片黄在线观看日本 | 成人在线网站 | 色老成人精品视频在线观看 | 好大好硬好深好爽的视频 | 夜夜夜爽| 免费看黄的视频网站 | 激情网址在线观看 | 精品国产三级a∨在线 | 狠狠色噜噜狠狠狠狠97影音先锋 | www在线观看 | 欧美无遮挡一区二区三区 | 国产午夜小视频 | 狠狠色噜噜狠狠狠狠98 | 看全色黄大色大片免费久久怂 | 欧美高清一区二区 | 毛片大全免费 | 日韩亚洲人成在线综合 | 亚洲欧洲色天使日韩精品 | 一级a爱片久久毛片 | 成人在色线视频在线观看免费大全 | 久热福利视频 | 日本一区二区三区视频在线观看 | 国产三级毛片视频 | 天天谢天天干 | 福利视频自拍 | 女人午夜啪啪性刺激免费看 | 欧美成人精品久久精品 | 国产一级特黄aa大片免费 |