好看的言情小说,完结小说排行榜,已完结小说排行榜

本文對(duì)多線程服務(wù)器的常用編程模型進(jìn)行了一個(gè)詳細(xì)的解讀，本文中的多線程服務(wù)器是運(yùn)行在 Linux 操作系統(tǒng)上網(wǎng)絡(luò)應(yīng)用程序。介紹了典型的單線程服務(wù)器編程模型和典型的多線程服務(wù)器的線程模型以及進(jìn)程間通信與線程間通信等相關(guān)內(nèi)容。

總結(jié)了一兩種常用的線程模型，歸納了進(jìn)程間通訊與線程同步的最佳實(shí)踐，以期用簡單規(guī)范的方式開發(fā)多線程程序。

文中的“多線程服務(wù)器”是指運(yùn)行在 Linux 操作系統(tǒng)上的獨(dú)占式網(wǎng)絡(luò)應(yīng)用程序。硬件平臺(tái)為 Intel x64 系列的多核 CPU，單路或雙路 SMP 服務(wù)器（每臺(tái)機(jī)器一共擁有四個(gè)核或八個(gè)核，十幾 GB 內(nèi)存），機(jī)器之間用百兆或千兆以太網(wǎng)連接。這大概是目前民用 PC 服務(wù)器的主流配置。

本文不涉及 Windows 系統(tǒng)，不涉及人機(jī)交互界面（無論命令行或圖形）；不考慮文件讀寫（往磁盤寫 log 除外），不考慮數(shù)據(jù)庫操作，不考慮 Web 應(yīng)用；不考慮低端的單核主機(jī)或嵌入式系統(tǒng)，不考慮手持式設(shè)備，不考慮專門的網(wǎng)絡(luò)設(shè)備，不考慮高端的》=32 核 Unix 主機(jī)；只考慮 TCP，不考慮 UDP，也不考慮除了局域網(wǎng)絡(luò)之外的其他數(shù)據(jù)收發(fā)方式（例如串并口、USB口、數(shù)據(jù)采集板卡、實(shí)時(shí)控制等）。

有了以上這么多限制，那么我將要談的“網(wǎng)絡(luò)應(yīng)用程序”的基本功能可以歸納為“收到數(shù)據(jù)，算一算，再發(fā)出去”。在這個(gè)簡化了的模型里，似乎看不出用多線程的必要，單線程應(yīng)該也能做得很好。“為什么需要寫多線程程序”這個(gè)問題容易引發(fā)口水戰(zhàn)，我放到另一篇博客里討論。請(qǐng)?jiān)试S我先假定“多線程編程”這一背景。

“服務(wù)器”這個(gè)詞有時(shí)指程序，有時(shí)指進(jìn)程，有時(shí)指硬件（無論虛擬的或真實(shí)的），請(qǐng)注意按上下文區(qū)分。另外，本文不考慮虛擬化的場(chǎng)景，當(dāng)我說“兩個(gè)進(jìn)程不在同一臺(tái)機(jī)器上”，指的是邏輯上不在同一個(gè)操作系統(tǒng)里運(yùn)行，雖然物理上可能位于同一機(jī)器虛擬出來的兩臺(tái)“虛擬機(jī)”上。

本文假定讀者已經(jīng)有多線程編程的知識(shí)與經(jīng)驗(yàn)，這不是一篇入門教程。

1 進(jìn)程與線程

“進(jìn)程/process”是操作里最重要的兩個(gè)概念之一（另一個(gè)是文件），粗略地講，一個(gè)進(jìn)程是“內(nèi)存中正在運(yùn)行的程序”。本文的進(jìn)程指的是 Linux 操作系統(tǒng)通過 fork（）系統(tǒng)調(diào)用產(chǎn)生的那個(gè)東西，或者 Windows 下 CreateProcess（）的產(chǎn)物，不是 Erlang 里的那種輕量級(jí)進(jìn)程。

每個(gè)進(jìn)程有自己獨(dú)立的地址空間（address space），“在同一個(gè)進(jìn)程”還是“不在同一個(gè)進(jìn)程”是系統(tǒng)功能劃分的重要決策點(diǎn)。Erlang 書把“進(jìn)程”比喻為“人”，我覺得十分精當(dāng)，為我們提供了一個(gè)思考的框架。

每個(gè)人有自己的記憶（memory），人與人通過談話（消息傳遞）來交流，談話既可以是面談（同一臺(tái)服務(wù)器），也可以在電話里談（不同的服務(wù)器，有網(wǎng)絡(luò)通信）。面談和電話談的區(qū)別在于，面談可以立即知道對(duì)方死否死了（crash， SIGCHLD），而電話談只能通過周期性的心跳來判斷對(duì)方是否還活著。

有了這些比喻，設(shè)計(jì)分布式系統(tǒng)時(shí)可以采取“角色扮演”，團(tuán)隊(duì)里的幾個(gè)人各自扮演一個(gè)進(jìn)程，人的角色由進(jìn)程的代碼決定（管登陸的、管消息分發(fā)的、管買賣的等等）。每個(gè)人有自己的記憶，但不知道別人的記憶，要想知道別人的看法，只能通過交談。（暫不考慮共享內(nèi)存這種 IPC。）然后就可以思考容錯(cuò)（萬一有人突然死了）、擴(kuò)容（新人中途加進(jìn)來）、負(fù)載均衡（把 a 的活兒挪給 b 做）、退休（a 要修復(fù) bug，先別給他派新活兒，等他做完手上的事情就把他重啟）等等各種場(chǎng)景，十分便利。

“線程”這個(gè)概念大概是在 1993 年以后才慢慢流行起來的，距今不過十余年，比不得有 40 年光輝歷史的 Unix 操作系統(tǒng)。線程的出現(xiàn)給 Unix 添了不少亂，很多 C 庫函數(shù)（strtok（）， ctime（））不是線程安全的，需要重新定義；signal 的語意也大為復(fù)雜化。據(jù)我所知，最早支持多線程編程的（民用）操作系統(tǒng)是 Solaris 2.2 和 Windows NT 3.1，它們均發(fā)布于 1993 年。隨后在 1995 年，POSIX threads 標(biāo)準(zhǔn)確立。

線程的特點(diǎn)是共享地址空間，從而可以高效地共享數(shù)據(jù)。一臺(tái)機(jī)器上的多個(gè)進(jìn)程能高效地共享代碼段（操作系統(tǒng)可以映射為同樣的物理內(nèi)存），但不能共享數(shù)據(jù)。如果多個(gè)進(jìn)程大量共享內(nèi)存，等于是把多進(jìn)程程序當(dāng)成多線程來寫，掩耳盜鈴。

“多線程”的價(jià)值，我認(rèn)為是為了更好地發(fā)揮對(duì)稱多路處理（SMP）的效能。在 SMP 之前，多線程沒有多大價(jià)值。Alan Cox 說過 A computer is a state machine. Threads are for people who can‘t program state machines. （計(jì)算機(jī)是一臺(tái)狀態(tài)機(jī)。線程是給那些不能編寫狀態(tài)機(jī)程序的人準(zhǔn)備的。）如果只有一個(gè)執(zhí)行單元，一個(gè) CPU，那么確實(shí)如 Alan Cox 所說，按狀態(tài)機(jī)的思路去寫程序是最高效的，這正好也是下一節(jié)展示的編程模型。

2 典型的單線程服務(wù)器編程模型

UNP3e 對(duì)此有很好的總結(jié)（第 6 章：IO 模型，第 30 章：客戶端/服務(wù)器設(shè)計(jì)范式），這里不再贅述。據(jù)我了解，在高性能的網(wǎng)絡(luò)程序中，使用得最為廣泛的恐怕要數(shù)“non-blocking IO + IO multiplexing”這種模型，即 Reactor 模式，我知道的有：

l lighttpd，單線程服務(wù)器。（nginx 估計(jì)與之類似，待查）

l libevent/libev

l ACE，Poco C++ libraries（QT 待查）

l Java NIO （Selector/SelectableChannel）， Apache Mina， Netty （Java）

l POE （Perl）

l Twisted （Python）

相反，boost：：asio 和 Windows I/O Completion Ports 實(shí)現(xiàn)了 Proactor 模式，應(yīng)用面似乎要窄一些。當(dāng)然，ACE 也實(shí)現(xiàn)了 Proactor 模式，不表。

在“non-blocking IO + IO multiplexing”這種模型下，程序的基本結(jié)構(gòu)是一個(gè)事件循環(huán) （event loop）：（代碼僅為示意，沒有完整考慮各種情況）

while （！done）

{

int timeout_ms = max（1000， getNextTimedCallback（））;

int retval = ：：poll（fds， nfds， timeout_ms）;

if （retval 《 0） {

處理錯(cuò)誤

} else {

處理到期的 timers

if （retval 》 0） {

處理 IO 事件

}

當(dāng)然，select（2）/poll（2）有很多不足，Linux 下可替換為 epoll，其他操作系統(tǒng)也有對(duì)應(yīng)的高性能替代品（搜 c10k problem）。

Reactor 模型的優(yōu)點(diǎn)很明顯，編程簡單，效率也不錯(cuò)。不僅網(wǎng)絡(luò)讀寫可以用，連接的建立（connect/accept）甚至 DNS 解析都可以用非阻塞方式進(jìn)行，以提高并發(fā)度和吞吐量（throughput）。對(duì)于 IO 密集的應(yīng)用是個(gè)不錯(cuò)的選擇，Lighttpd 即是這樣，它內(nèi)部的 fdevent 結(jié)構(gòu)十分精妙，值得學(xué)習(xí)。（這里且不考慮用阻塞 IO 這種次優(yōu)的方案。）

當(dāng)然，實(shí)現(xiàn)一個(gè)優(yōu)質(zhì)的 Reactor 不是那么容易，我也沒有用過坊間開源的庫，這里就不推薦了。

3 典型的多線程服務(wù)器的線程模型

這方面我能找到的文獻(xiàn)不多，大概有這么幾種：

1. 每個(gè)請(qǐng)求創(chuàng)建一個(gè)線程，使用阻塞式 IO 操作。在 Java 1.4 引入 NIO 之前，這是 Java 網(wǎng)絡(luò)編程的推薦做法。可惜伸縮性不佳。

2. 使用線程池，同樣使用阻塞式 IO 操作。與 1 相比，這是提高性能的措施。

3. 使用 non-blocking IO + IO multiplexing。即 Java NIO 的方式。

4. Leader/Follower 等高級(jí)模式

在默認(rèn)情況下，我會(huì)使用第 3 種，即 non-blocking IO + one loop per thread 模式。

http://pod.tst.eu/http://cvs.schmorp.de/libev/ev.pod#THREADS_AND_COROUTINES

One loop per thread

此種模型下，程序里的每個(gè) IO 線程有一個(gè) event loop （或者叫 Reactor），用于處理讀寫和定時(shí)事件（無論周期性的還是單次的），代碼框架跟第 2 節(jié)一樣。

這種方式的好處是：

l 線程數(shù)目基本固定，可以在程序啟動(dòng)的時(shí)候設(shè)置，不會(huì)頻繁創(chuàng)建與銷毀。

l 可以很方便地在線程間調(diào)配負(fù)載。

event loop 代表了線程的主循環(huán)，需要讓哪個(gè)線程干活，就把 timer 或 IO channel （TCP connection）注冊(cè)到那個(gè)線程的 loop 里即可。對(duì)實(shí)時(shí)性有要求的 connection 可以單獨(dú)用一個(gè)線程；數(shù)據(jù)量大的 connection 可以獨(dú)占一個(gè)線程，并把數(shù)據(jù)處理任務(wù)分?jǐn)偟搅韼讉€(gè)線程中；其他次要的輔助性 connections 可以共享一個(gè)線程。

對(duì)于 non-trivial 的服務(wù)端程序，一般會(huì)采用 non-blocking IO + IO multiplexing，每個(gè) connection/acceptor 都會(huì)注冊(cè)到某個(gè) Reactor 上，程序里有多個(gè) Reactor，每個(gè)線程至多有一個(gè) Reactor。

多線程程序?qū)?Reactor 提出了更高的要求，那就是“線程安全”。要允許一個(gè)線程往別的線程的 loop 里塞東西，這個(gè) loop 必須得是線程安全的。

線程池

不過，對(duì)于沒有 IO 光有計(jì)算任務(wù)的線程，使用 event loop 有點(diǎn)浪費(fèi)，我會(huì)用有一種補(bǔ)充方案，即用 blocking queue 實(shí)現(xiàn)的任務(wù)隊(duì)列（TaskQueue）：
多線程服務(wù)器編程模型：如何正確使用mutex 和condition variable

上面十幾行代碼就實(shí)現(xiàn)了一個(gè)簡單的固定數(shù)目的線程池，功能大概相當(dāng)于 Java 5 的 ThreadPoolExecutor 的某種“配置”。當(dāng)然，在真實(shí)的項(xiàng)目中，這些代碼都應(yīng)該封裝到一個(gè) class 中，而不是使用全局對(duì)象。另外需要注意一點(diǎn)：Foo 對(duì)象的生命期。

除了任務(wù)隊(duì)列，還可以用 blocking_queue《T》實(shí)現(xiàn)數(shù)據(jù)的消費(fèi)者-生產(chǎn)者隊(duì)列，即 T 的是數(shù)據(jù)類型而非函數(shù)對(duì)象，queue 的消費(fèi)者（s）從中拿到數(shù)據(jù)進(jìn)行處理。這樣做比 task queue 更加 specific 一些。

blocking_queue《T》是多線程編程的利器，它的實(shí)現(xiàn)可參照 Java 5 util.concurrent 里的（Array|Linked）BlockingQueue，通常 C++ 可以用 deque 來做底層的容器。Java 5 里的代碼可讀性很高，代碼的基本結(jié)構(gòu)和教科書一致（1 個(gè) mutex，2 個(gè) condition variables），健壯性要高得多。如果不想自己實(shí)現(xiàn)，用現(xiàn)成的庫更好。（我沒有用過免費(fèi)的庫，這里就不亂推薦了，有興趣的同學(xué)可以試試 Intel Threading Building Blocks 里的 concurrent_queue《T》。）

歸納

總結(jié)起來，我推薦的多線程服務(wù)端編程模式為：event loop per thread + thread pool。

l event loop 用作 non-blocking IO 和定時(shí)器。

l thread pool 用來做計(jì)算，具體可以是任務(wù)隊(duì)列或消費(fèi)者-生產(chǎn)者隊(duì)列。

以這種方式寫服務(wù)器程序，需要一個(gè)優(yōu)質(zhì)的基于 Reactor 模式的網(wǎng)絡(luò)庫來支撐，我只用過 in-house 的產(chǎn)品，無從比較并推薦市面上常見的 C++ 網(wǎng)絡(luò)庫，抱歉。

程序里具體用幾個(gè) loop、線程池的大小等參數(shù)需要根據(jù)應(yīng)用來設(shè)定，基本的原則是“阻抗匹配”，使得 CPU 和 IO 都能高效地運(yùn)作，具體的考慮點(diǎn)容我以后再談。

這里沒有談線程的退出，留待下一篇 blog“多線程編程反模式”探討。

此外，程序里或許還有個(gè)別執(zhí)行特殊任務(wù)的線程，比如 logging，這對(duì)應(yīng)用程序來說基本是不可見的，但是在分配資源（CPU 和 IO）的時(shí)候要算進(jìn)去，以免高估了系統(tǒng)的容量。

4 進(jìn)程間通信與線程間通信

Linux 下進(jìn)程間通信（IPC）的方式數(shù)不勝數(shù)，光 UNPv2 列出的就有：pipe、FIFO、POSIX 消息隊(duì)列、共享內(nèi)存、信號(hào) （signals）等等，更不必說 Sockets 了。同步原語（synchronization primitives）也很多，互斥器（mutex）、條件變量（condition variable）、讀寫鎖（reader-writer lock）、文件鎖（Record locking）、信號(hào)量（Semaphore）等等。

如何選擇呢？根據(jù)我的個(gè)人經(jīng)驗(yàn)，貴精不貴多，認(rèn)真挑選三四樣?xùn)|西就能完全滿足我的工作需要，而且每樣我都能用得很熟，，不容易犯錯(cuò)。

5 進(jìn)程間通信

進(jìn)程間通信我首選 Sockets（主要指 TCP，我沒有用過 UDP，也不考慮 Unix domain 協(xié)議），其最大的好處在于：可以跨主機(jī)，具有伸縮性。反正都是多進(jìn)程了，如果一臺(tái)機(jī)器處理能力不夠，很自然地就能用多臺(tái)機(jī)器來處理。把進(jìn)程分散到同一局域網(wǎng)的多臺(tái)機(jī)器上，程序改改 host:port 配置就能繼續(xù)用。相反，前面列出的其他 IPC 都不能跨機(jī)器（比如共享內(nèi)存效率最高，但再怎么著也不能高效地共享兩臺(tái)機(jī)器的內(nèi)存），限制了 scalability。

在編程上，TCP sockets 和 pipe 都是一個(gè)文件描述符，用來收發(fā)字節(jié)流，都可以 read/write/fcntl/select/poll 等。不同的是，TCP 是雙向的，pipe 是單向的（Linux），進(jìn)程間雙向通訊還得開兩個(gè)文件描述符，不方便；而且進(jìn)程要有父子關(guān)系才能用 pipe，這些都限制了 pipe 的使用。在收發(fā)字節(jié)流這一通訊模型下，沒有比 sockets/TCP 更自然的 IPC 了。當(dāng)然，pipe 也有一個(gè)經(jīng)典應(yīng)用場(chǎng)景，那就是寫 Reactor/Selector 時(shí)用來異步喚醒 select （或等價(jià)的 poll/epoll）調(diào)用（Sun JVM 在 Linux 就是這么做的）。

TCP port 是由一個(gè)進(jìn)程獨(dú)占，且操作系統(tǒng)會(huì)自動(dòng)回收（listening port 和已建立連接的 TCP socket 都是文件描述符，在進(jìn)程結(jié)束時(shí)操作系統(tǒng)會(huì)關(guān)閉所有文件描述符）。這說明，即使程序意外退出，也不會(huì)給系統(tǒng)留下垃圾，程序重啟之后能比較容易地恢復(fù)，而不需要重啟操作系統(tǒng)（用跨進(jìn)程的 mutex 就有這個(gè)風(fēng)險(xiǎn)）。還有一個(gè)好處，既然 port 是獨(dú)占的，那么可以防止程序重復(fù)啟動(dòng)（后面那個(gè)進(jìn)程搶不到 port，自然就沒法工作了），造成意料之外的結(jié)果。

兩個(gè)進(jìn)程通過 TCP 通信，如果一個(gè)崩潰了，操作系統(tǒng)會(huì)關(guān)閉連接，這樣另一個(gè)進(jìn)程幾乎立刻就能感知，可以快速 failover。當(dāng)然，應(yīng)用層的心跳也是必不可少的，我以后在講服務(wù)端的日期與時(shí)間處理的時(shí)候還會(huì)談到心跳協(xié)議的設(shè)計(jì)。

與其他 IPC 相比，TCP 協(xié)議的一個(gè)自然好處是“可記錄可重現(xiàn)”，tcpdump/Wireshark 是解決兩個(gè)進(jìn)程間協(xié)議/狀態(tài)爭端的好幫手。

另外，如果網(wǎng)絡(luò)庫帶“連接重試”功能的話，我們可以不要求系統(tǒng)里的進(jìn)程以特定的順序啟動(dòng)，任何一個(gè)進(jìn)程都能單獨(dú)重啟，這對(duì)開發(fā)牢靠的分布式系統(tǒng)意義重大。

使用 TCP 這種字節(jié)流（byte stream）方式通信，會(huì)有 marshal/unmarshal 的開銷，這要求我們選用合適的消息格式，準(zhǔn)確地說是 wire format。這將是我下一篇 blog 的主題，目前我推薦 Google Protocol Buffers。

有人或許會(huì)說，具體問題具體分析，如果兩個(gè)進(jìn)程在同一臺(tái)機(jī)器，就用共享內(nèi)存，否則就用 TCP，比如 MS SQL Server 就同時(shí)支持這兩種通信方式。我問，是否值得為那么一點(diǎn)性能提升而讓代碼的復(fù)雜度大大增加呢？TCP 是字節(jié)流協(xié)議，只能順序讀取，有寫緩沖；共享內(nèi)存是消息協(xié)議，a 進(jìn)程填好一塊內(nèi)存讓 b 進(jìn)程來讀，基本是“停等”方式。要把這兩種方式揉到一個(gè)程序里，需要建一個(gè)抽象層，封裝兩種 IPC。這會(huì)帶來不透明性，并且增加測(cè)試的復(fù)雜度，而且萬一通信的某一方崩潰，狀態(tài) reconcile 也會(huì)比 sockets 麻煩。為我所不取。再說了，你舍得讓幾萬塊買來的 SQL Server 和你的程序分享機(jī)器資源嗎？產(chǎn)品里的數(shù)據(jù)庫服務(wù)器往往是獨(dú)立的高配置服務(wù)器，一般不會(huì)同時(shí)運(yùn)行其他占資源的程序。

TCP 本身是個(gè)數(shù)據(jù)流協(xié)議，除了直接使用它來通信，還可以在此之上構(gòu)建 RPC/REST/SOAP 之類的上層通信協(xié)議，這超過了本文的范圍。另外，除了點(diǎn)對(duì)點(diǎn)的通信之外，應(yīng)用級(jí)的廣播協(xié)議也是非常有用的，可以方便地構(gòu)建可觀可控的分布式系統(tǒng)。

本文不具體講 Reactor 方式下的網(wǎng)絡(luò)編程，其實(shí)這里邊有很多值得注意的地方，比如帶 back off 的 retry connecting，用優(yōu)先隊(duì)列來組織 timer 等等，留作以后分析吧。

6 線程間同步

線程同步的四項(xiàng)原則，按重要性排列：

1. 首要原則是盡量最低限度地共享對(duì)象，減少需要同步的場(chǎng)合。一個(gè)對(duì)象能不暴露給別的線程就不要暴露；如果要暴露，優(yōu)先考慮 immutable 對(duì)象；實(shí)在不行才暴露可修改的對(duì)象，并用同步措施來充分保護(hù)它。

2. 其次是使用高級(jí)的并發(fā)編程構(gòu)件，如 TaskQueue、Producer-Consumer Queue、CountDownLatch 等等；

3. 最后不得已必須使用底層同步原語（primitives）時(shí)，只用非遞歸的互斥器和條件變量，偶爾用一用讀寫鎖；

4. 不自己編寫 lock-free 代碼，不去憑空猜測(cè)“哪種做法性能會(huì)更好”，比如 spin lock vs. mutex。

前面兩條很容易理解，這里著重講一下第 3 條：底層同步原語的使用。

互斥器（mutex）

互斥器（mutex）恐怕是使用得最多的同步原語，粗略地說，它保護(hù)了臨界區(qū)，一個(gè)時(shí)刻最多只能有一個(gè)線程在臨界區(qū)內(nèi)活動(dòng)。（請(qǐng)注意，我談的是 pthreads 里的 mutex，不是 Windows 里的重量級(jí)跨進(jìn)程 Mutex。）單獨(dú)使用 mutex 時(shí)，我們主要為了保護(hù)共享數(shù)據(jù)。我個(gè)人的原則是：

l 用 RAII 手法封裝 mutex 的創(chuàng)建、銷毀、加鎖、解鎖這四個(gè)操作。

l 只用非遞歸的 mutex（即不可重入的 mutex）。

l 不手工調(diào)用 lock（）和 unlock（）函數(shù)，一切交給棧上的 Guard 對(duì)象的構(gòu)造和析構(gòu)函數(shù)負(fù)責(zé)，Guard 對(duì)象的生命期正好等于臨界區(qū)（分析對(duì)象在什么時(shí)候析構(gòu)是 C++ 程序員的基本功）。這樣我們保證在同一個(gè)函數(shù)里加鎖和解鎖，避免在 foo（）里加鎖，然后跑到 bar（）里解鎖。

l 在每次構(gòu)造 Guard 對(duì)象的時(shí)候，思考一路上（調(diào)用棧上）已經(jīng)持有的鎖，防止因加鎖順序不同而導(dǎo)致死鎖（deadlock）。由于 Guard 對(duì)象是棧上對(duì)象，看函數(shù)調(diào)用棧就能分析用鎖的情況，非常便利。

次要原則有：

l 不使用跨進(jìn)程的 mutex，進(jìn)程間通信只用 TCP sockets。

l 加鎖解鎖在同一個(gè)線程，線程 a 不能去 unlock 線程 b 已經(jīng)鎖住的 mutex。（RAII 自動(dòng)保證）

l 別忘了解鎖。（RAII 自動(dòng)保證）

l 不重復(fù)解鎖。（RAII 自動(dòng)保證）

l 必要的時(shí)候可以考慮用 PTHREAD_MUTEX_ERRORCHECK 來排錯(cuò)

用 RAII 封裝這幾個(gè)操作是通行的做法，這幾乎是 C++ 的標(biāo)準(zhǔn)實(shí)踐，后面我會(huì)給出具體的代碼示例，相信大家都已經(jīng)寫過或用過類似的代碼了。Java 里的 synchronized 語句和 C# 的 using 語句也有類似的效果，即保證鎖的生效期間等于一個(gè)作用域，不會(huì)因異常而忘記解鎖。

Mutex 恐怕是最簡單的同步原語，安照上面的幾條原則，幾乎不可能用錯(cuò)。我自己從來沒有違背過這些原則，編碼時(shí)出現(xiàn)問題都很快能招到并修復(fù)。

跑題：非遞歸的 mutex

談?wù)勎覉?jiān)持使用非遞歸的互斥器的個(gè)人想法。

Mutex 分為遞歸（recursive）和非遞歸（non-recursive）兩種，這是 POSIX 的叫法，另外的名字是可重入（Reentrant）與非可重入。這兩種 mutex 作為線程間（inter-thread）的同步工具時(shí)沒有區(qū)別，它們的惟一區(qū)別在于：同一個(gè)線程可以重復(fù)對(duì) recursive mutex 加鎖，但是不能重復(fù)對(duì) non-recursive mutex 加鎖。

首選非遞歸 mutex，絕對(duì)不是為了性能，而是為了體現(xiàn)設(shè)計(jì)意圖。non-recursive 和 recursive 的性能差別其實(shí)不大，因?yàn)樯儆靡粋€(gè)計(jì)數(shù)器，前者略快一點(diǎn)點(diǎn)而已。在同一個(gè)線程里多次對(duì) non-recursive mutex 加鎖會(huì)立刻導(dǎo)致死鎖，我認(rèn)為這是它的優(yōu)點(diǎn)，能幫助我們思考代碼對(duì)鎖的期求，并且及早（在編碼階段）發(fā)現(xiàn)問題。

毫無疑問 recursive mutex 使用起來要方便一些，因?yàn)椴挥每紤]一個(gè)線程會(huì)自己把自己給鎖死了，我猜這也是 Java 和 Windows 默認(rèn)提供 recursive mutex 的原因。（Java 語言自帶的 intrinsic lock 是可重入的，它的 concurrent 庫里提供 ReentrantLock，Windows 的 CRITICAL_SECTION 也是可重入的。似乎它們都不提供輕量級(jí)的 non-recursive mutex。）

正因?yàn)樗奖悖瑀ecursive mutex 可能會(huì)隱藏代碼里的一些問題。典型情況是你以為拿到一個(gè)鎖就能修改對(duì)象了，沒想到外層代碼已經(jīng)拿到了鎖，正在修改（或讀取）同一個(gè)對(duì)象呢。具體的例子：

std：：vector《Foo》 foos;

MutexLock mutex;

void post（const Foo& f）

{

MutexLockGuard lock（mutex）;

foos.push_back（f）;

}

void traverse（）

{

MutexLockGuard lock（mutex）;

for （auto it = foos.begin（）; it ！= foos.end（）; ++it） { // 用了 0x 新寫法

it-》doit（）;

}

post（）加鎖，然后修改 foos 對(duì)象； traverse（）加鎖，然后遍歷 foos 數(shù)組。將來有一天，F(xiàn)oo：：doit（）間接調(diào)用了 post（）（這在邏輯上是錯(cuò)誤的），那么會(huì)很有戲劇性的：

1. Mutex 是非遞歸的，于是死鎖了。

2. Mutex 是遞歸的，由于 push_back 可能（但不總是）導(dǎo)致 vector 迭代器失效，程序偶爾會(huì) crash。

這時(shí)候就能體現(xiàn) non-recursive 的優(yōu)越性：把程序的邏輯錯(cuò)誤暴露出來。死鎖比較容易 debug，把各個(gè)線程的調(diào)用棧打出來（（gdb） thread apply all bt），只要每個(gè)函數(shù)不是特別長，很容易看出來是怎么死的。（另一方面支持了函數(shù)不要寫過長。）或者可以用 PTHREAD_MUTEX_ERRORCHECK 一下子就能找到錯(cuò)誤（前提是 MutexLock 帶 debug 選項(xiàng)。）

程序反正要死，不如死得有意義一點(diǎn)，讓驗(yàn)尸官的日子好過些。

如果一個(gè)函數(shù)既可能在已加鎖的情況下調(diào)用，又可能在未加鎖的情況下調(diào)用，那么就拆成兩個(gè)函數(shù)：

1. 跟原來的函數(shù)同名，函數(shù)加鎖，轉(zhuǎn)而調(diào)用第 2 個(gè)函數(shù)。

2. 給函數(shù)名加上后綴 WithLockHold，不加鎖，把原來的函數(shù)體搬過來。

就像這樣：

void post（const Foo& f）

{

MutexLockGuard lock（mutex）;

postWithLockHold（f）; // 不用擔(dān)心開銷，編譯器會(huì)自動(dòng)內(nèi)聯(lián)的

}

// 引入這個(gè)函數(shù)是為了體現(xiàn)代碼作者的意圖，盡管 push_back 通常可以手動(dòng)內(nèi)聯(lián)

void postWithLockHold（const Foo& f）

{

foos.push_back（f）;

}

這有可能出現(xiàn)兩個(gè)問題（感謝水木網(wǎng)友 ilovecpp 提出）：a）誤用了加鎖版本，死鎖了。b）誤用了不加鎖版本，數(shù)據(jù)損壞了。

對(duì)于 a），仿造前面的辦法能比較容易地排錯(cuò)。對(duì)于 b），如果 pthreads 提供 isLocked（）就好辦，可以寫成：

void postWithLockHold（const Foo& f）

{

assert（mutex.isLocked（））; // 目前只是一個(gè)愿望

// 。。.

}

另外，WithLockHold 這個(gè)顯眼的后綴也讓程序中的誤用容易暴露出來。

C++ 沒有 annotation，不能像 Java 那樣給 method 或 field 標(biāo)上 @GuardedBy 注解，需要程序員自己小心在意。雖然這里的辦法不能一勞永逸地解決全部多線程錯(cuò)誤，但能幫上一點(diǎn)是一點(diǎn)了。

我還沒有遇到過需要使用 recursive mutex 的情況，我想將來遇到了都可以借助 wrapper 改用 non-recursive mutex，代碼只會(huì)更清晰。

本文這里只談了 mutex 本身的正確使用，在 C++ 里多線程編程還會(huì)遇到其他很多 race condition，請(qǐng)參考拙作《當(dāng)析構(gòu)函數(shù)遇到多線程——C++ 中線程安全的對(duì)象回調(diào)》

http://blog.csdn.net/Solstice/archive/2010/01/22/5238671.aspx 。請(qǐng)注意這里的 class 命名與那篇文章有所不同。我現(xiàn)在認(rèn)為 MutexLock 和 MutexLockGuard 是更好的名稱。

性能注腳：Linux 的 pthreads mutex 采用 futex 實(shí)現(xiàn)，不必每次加鎖解鎖都陷入系統(tǒng)調(diào)用，效率不錯(cuò)。Windows 的 CRITICAL_SECTION 也是類似。

條件變量

條件變量（condition variable）顧名思義是一個(gè)或多個(gè)線程等待某個(gè)布爾表達(dá)式為真，即等待別的線程“喚醒”它。條件變量的學(xué)名叫管程（monitor）。Java Object 內(nèi)置的 wait（）， notify（）， notifyAll（）即是條件變量（它們以容易用錯(cuò)著稱）。條件變量只有一種正確使用的方式，對(duì)于 wait（）端：

1. 必須與 mutex 一起使用，該布爾表達(dá)式的讀寫需受此 mutex 保護(hù)

2. 在 mutex 已上鎖的時(shí)候才能調(diào)用 wait（）

3. 把判斷布爾條件和 wait（）放到 while 循環(huán)中

寫成代碼是：

MutexLock mutex;

Condition cond（mutex）;

std：：deque《int》 queue;

int dequeue（）

{

MutexLockGuard lock（mutex）;

while （queue.empty（）） { // 必須用循環(huán)；必須在判斷之后再 wait（）

cond.wait（）; // 這一步會(huì)原子地 unlock mutex 并進(jìn)入 blocking，不會(huì)與 enqueue 死鎖

}

assert（！queue.empty（））;

int top = queue.front（）;

queue.pop_front（）;

return top;

}

對(duì)于 signal/broadcast 端：

1. 不一定要在 mutex 已上鎖的情況下調(diào)用 signal （理論上）

2. 在 signal 之前一般要修改布爾表達(dá)式

3. 修改布爾表達(dá)式通常要用 mutex 保護(hù)（至少用作 full memory barrier）

寫成代碼是：

void enqueue（int x）

{

MutexLockGuard lock（mutex）;

queue.push_back（x）;

cond.notify（）;

}

上面的 dequeue/enqueue 實(shí)際上實(shí)現(xiàn)了一個(gè)簡單的 unbounded BlockingQueue。

條件變量是非常底層的同步原語，很少直接使用，一般都是用它來實(shí)現(xiàn)高層的同步措施，如 BlockingQueue 或 CountDownLatch。

讀寫鎖與其他

讀寫鎖（Reader-Writer lock），讀寫鎖是個(gè)優(yōu)秀的抽象，它明確區(qū)分了 read 和 write 兩種行為。需要注意的是，reader lock 是可重入的，writer lock 是不可重入（包括不可提升 reader lock）的。這正是我說它“優(yōu)秀”的主要原因。

遇到并發(fā)讀寫，如果條件合適，我會(huì)用《借 shared_ptr 實(shí)現(xiàn)線程安全的 copy-on-write》http://blog.csdn.net/Solstice/archive/2008/11/22/3351751.aspx 介紹的辦法，而不用讀寫鎖。當(dāng)然這不是絕對(duì)的。

信號(hào)量（Semaphore），我沒有遇到過需要使用信號(hào)量的情況，無從談及個(gè)人經(jīng)驗(yàn)。

說一句大逆不道的話，如果程序里需要解決如“哲學(xué)家就餐”之類的復(fù)雜 IPC 問題，我認(rèn)為應(yīng)該首先考察幾個(gè)設(shè)計(jì)，為什么線程之間會(huì)有如此復(fù)雜的資源爭搶（一個(gè)線程要同時(shí)搶到兩個(gè)資源，一個(gè)資源可以被兩個(gè)線程爭奪）？能不能把“想吃飯”這個(gè)事情專門交給一個(gè)為各位哲學(xué)家分派餐具的線程來做，然后每個(gè)哲學(xué)家等在一個(gè)簡單的 condition variable 上，到時(shí)間了有人通知他去吃飯？從哲學(xué)上說，教科書上的解決方案是平權(quán)，每個(gè)哲學(xué)家有自己的線程，自己去拿筷子；我寧愿用集權(quán)的方式，用一個(gè)線程專門管餐具的分配，讓其他哲學(xué)家線程拿個(gè)號(hào)等在食堂門口好了。這樣不損失多少效率，卻讓程序簡單很多。雖然 Windows 的 WaitForMultipleObjects 讓這個(gè)問題 trivial 化，在 Linux 下正確模擬 WaitForMultipleObjects 不是普通程序員該干的。

封裝 MutexLock、MutexLockGuard 和 Condition

本節(jié)把前面用到的 MutexLock、MutexLockGuard、Condition classes 的代碼列出來，前面兩個(gè) classes 沒多大難度，后面那個(gè)有點(diǎn)意思。

MutexLock 封裝臨界區(qū)（Critical secion），這是一個(gè)簡單的資源類，用 RAII 手法［CCS:13］封裝互斥器的創(chuàng)建與銷毀。臨界區(qū)在 Windows 上是 CRITICAL_SECTION，是可重入的；在 Linux 下是 pthread_mutex_t，默認(rèn)是不可重入的。MutexLock 一般是別的 class 的數(shù)據(jù)成員。

MutexLockGuard 封裝臨界區(qū)的進(jìn)入和退出，即加鎖和解鎖。MutexLockGuard 一般是個(gè)棧上對(duì)象，它的作用域剛好等于臨界區(qū)域。

這兩個(gè) classes 應(yīng)該能在紙上默寫出來，沒有太多需要解釋的：

#include 《pthread.h》

#include 《boost/noncopyable.hpp》

class MutexLock ： boost：：noncopyable

{

public：

MutexLock（） // 為了節(jié)省版面，單行函數(shù)都沒有正確縮進(jìn)

{ pthread_mutex_init（&mutex_， NULL）; }

~MutexLock（）

{ pthread_mutex_destroy（&mutex_）; }

void lock（） // 程序一般不主動(dòng)調(diào)用

{ pthread_mutex_lock（&mutex_）; }

void unlock（） // 程序一般不主動(dòng)調(diào)用

{ pthread_mutex_unlock（&mutex_）; }

pthread_mutex_t* getPthreadMutex（） // 僅供 Condition 調(diào)用，嚴(yán)禁自己調(diào)用

{ return &mutex_; }

private：

pthread_mutex_t mutex_;

};

class MutexLockGuard ： boost：：noncopyable

{

public：

explicit MutexLockGuard（MutexLock& mutex）： mutex_（mutex）

{ mutex_.lock（）; }

~MutexLockGuard（）

{ mutex_.unlock（）; }

private：

MutexLock& mutex_;

};

#define MutexLockGuard（x） static_assert（false， “missing mutex guard var name”）

注意代碼的最后一行定義了一個(gè)宏，這個(gè)宏的作用是防止程序里出現(xiàn)如下錯(cuò)誤：

void doit（）

{

MutexLockGuard（mutex）; // 沒有變量名，產(chǎn)生一個(gè)臨時(shí)對(duì)象又馬上銷毀了，沒有鎖住臨界區(qū)

// 正確寫法是 MutexLockGuard lock（mutex）;

// 臨界區(qū)

}

這里 MutexLock 沒有提供 trylock（）函數(shù)，因?yàn)槲覜]有用過它，我想不出什么時(shí)候程序需要“試著去鎖一鎖”，或許我寫過的代碼太簡單了。

我見過有人把 MutexLockGuard 寫成 template，我沒有這么做是因?yàn)樗哪０孱愋蛥?shù)只有 MutexLock 一種可能，沒有必要隨意增加靈活性，于是我人肉把模板具現(xiàn)化（instantiate）了。此外一種更激進(jìn)的寫法是，把 lock/unlock 放到 private 區(qū)，然后把 Guard 設(shè)為 MutexLock 的 friend，我認(rèn)為在注釋里告知程序員即可，另外 check-in 之前的 code review 也很容易發(fā)現(xiàn)誤用的情況（grep getPthreadMutex）。

這段代碼沒有達(dá)到工業(yè)強(qiáng)度：a） Mutex 創(chuàng)建為 PTHREAD_MUTEX_DEFAULT 類型，而不是我們預(yù)想的 PTHREAD_MUTEX_NORMAL 類型（實(shí)際上這二者很可能是等同的），嚴(yán)格的做法是用 mutexattr 來顯示指定 mutex 的類型。b）沒有檢查返回值。這里不能用 assert 檢查返回值，因?yàn)?assert 在 release build 里是空語句。我們檢查返回值的意義在于防止 ENOMEM 之類的資源不足情況，這一般只可能在負(fù)載很重的產(chǎn)品程序中出現(xiàn)。一旦出現(xiàn)這種錯(cuò)誤，程序必須立刻清理現(xiàn)場(chǎng)并主動(dòng)退出，否則會(huì)莫名其妙地崩潰，給事后調(diào)查造成困難。這里我們需要 non-debug 的 assert，或許 google-glog 的 CHECK（）是個(gè)不錯(cuò)的思路。

以上兩點(diǎn)改進(jìn)留作練習(xí)。

Condition class 的實(shí)現(xiàn)有點(diǎn)意思。

Pthreads condition variable 允許在 wait（）的時(shí)候指定 mutex，但是我想不出什么理由一個(gè) condition variable 會(huì)和不同的 mutex 配合使用。Java 的 intrinsic condition 和 Conditon class 都不支持這么做，因此我覺得可以放棄這一靈活性，老老實(shí)實(shí)一對(duì)一好了。相反 boost：：thread 的 condition_varianle 是在 wait 的時(shí)候指定 mutex，請(qǐng)參觀其同步原語的龐雜設(shè)計(jì)：

l Concept 有四種 Lockable， TimedLockable， SharedLockable， UpgradeLockable.

l Lock 有五六種： lock_guard， unique_lock， shared_lock， upgrade_lock， upgrade_to_unique_lock， scoped_try_lock.

l Mutex 有七種：mutex， try_mutex， timed_mutex， recursive_mutex， recursive_try_mutex， recursive_timed_mutex， shared_mutex.

恕我愚鈍，見到 boost：：thread 這樣如 Rube Goldberg Machine 一樣“靈活”的庫我只得三揖繞道而行。這些 class 名字也很無厘頭，為什么不老老實(shí)實(shí)用 reader_writer_lock 這樣的通俗名字呢？非得增加精神負(fù)擔(dān)，自己發(fā)明新名字。我不愿為這樣的靈活性付出代價(jià)，寧愿自己做幾個(gè)簡簡單單的一看就明白的 classes 來用，這種簡單的幾行代碼的輪子造造也無妨。提供靈活性固然是本事，然而在不需要靈活性的地方把代碼寫死，更需要大智慧。

下面這個(gè) Condition 簡單地封裝了 pthread cond var，用起來也容易，見本節(jié)前面的例子。這里我用 notify/notifyAll 作為函數(shù)名，因?yàn)?signal 有別的含義，C++ 里的 signal/slot，C 里的 signal handler 等等。就別 overload 這個(gè)術(shù)語了。

class Condition ： boost：：noncopyable

{

public：

Condition（MutexLock& mutex）： mutex_（mutex）

{ pthread_cond_init（&pcond_， NULL）; }

~Condition（）

{ pthread_cond_destroy（&pcond_）; }

void wait（）

{ pthread_cond_wait（&pcond_， mutex_.getPthreadMutex（））; }

void notify（）

{ pthread_cond_signal（&pcond_）; }

void notifyAll（）

{ pthread_cond_broadcast（&pcond_）; }

private：

MutexLock& mutex_;

pthread_cond_t pcond_;

};

如果一個(gè) class 要包含 MutexLock 和 Condition，請(qǐng)注意它們的聲明順序和初始化順序，mutex_ 應(yīng)先于 condition_ 構(gòu)造，并作為后者的構(gòu)造參數(shù)：

class CountDownLatch

{

public：

CountDownLatch（int count）

： count_（count），

mutex_（），

condition_（mutex_）

{ }

private：

int count_;

MutexLock mutex_; // 順序很重要

Condition condition_;

};

請(qǐng)?jiān)试S我再次強(qiáng)調(diào)，雖然本節(jié)花了大量篇幅介紹如何正確使用 mutex 和 condition variable，但并不代表我鼓勵(lì)到處使用它們。這兩者都是非常底層的同步原語，主要用來實(shí)現(xiàn)更高級(jí)的并發(fā)編程工具，一個(gè)多線程程序里如果大量使用 mutex 和 condition variable 來同步，基本跟用鉛筆刀鋸大樹（孟巖語）沒啥區(qū)別。

線程安全的 Singleton 實(shí)現(xiàn)

研究 Signleton 的線程安全實(shí)現(xiàn)的歷史你會(huì)發(fā)現(xiàn)很多有意思的事情，一度人們認(rèn)為 Double checked locking 是王道，兼顧了效率與正確性。后來有神牛指出由于亂序執(zhí)行的影響，DCL 是靠不住的。（這個(gè)又讓我想起了 SQL 注入，十年前用字符串拼接出 SQL 語句是 Web 開發(fā)的通行做法，直到有一天有人利用這個(gè)漏洞越權(quán)獲得并修改網(wǎng)站數(shù)據(jù)，人們才幡然醒悟，趕緊修補(bǔ)。）Java 開發(fā)者還算幸運(yùn)，可以借助內(nèi)部靜態(tài)類的裝載來實(shí)現(xiàn)。C++ 就比較慘，要么次次鎖，要么 eager initialize、或者動(dòng)用 memory barrier 這樣的大殺器（ http://www.aristeia.com/Papers/DDJ_Jul_Aug_2004_revised.pdf ）。接下來 Java 5 修訂了內(nèi)存模型，并增強(qiáng)了 volatile 的語義，這下 DCL （with volatile）又是安全的了。然而 C++ 的內(nèi)存模型還在修訂中，C++ 的 volatile 目前還不能（將來也難說）保證 DCL 的正確性（只在 VS2005+ 上有效）。

其實(shí)沒那么麻煩，在實(shí)踐中用 pthread once 就行：

#include 《pthread.h》

template《typename T》

class Singleton ： boost：：noncopyable

{

public：

static T& instance（）

{

pthread_once（&ponce_， &Singleton：：init）;

return *value_;

}

static void init（）

{

value_ = new T（）;

}

private：

static pthread_once_t ponce_;

static T* value_;

};

template《typename T》

pthread_once_t Singleton《T》：：ponce_ = PTHREAD_ONCE_INIT;

template《typename T》

T* Singleton《T》：：value_ = NULL;

上面這個(gè) Singleton 沒有任何花哨的技巧，用 pthread_once_t 來保證 lazy-initialization 的線程安全。使用方法也很簡單：

Foo& foo = Singleton《Foo》：：instance（）;

當(dāng)然，這個(gè) Singleton 沒有考慮對(duì)象的銷毀，在服務(wù)器程序里，這不是一個(gè)問題，因?yàn)楫?dāng)程序退出的時(shí)候自然就釋放所有資源了（前提是程序里不使用不能由操作系統(tǒng)自動(dòng)關(guān)閉的資源，比如跨進(jìn)程的 Mutex）。另外，這個(gè) Singleton 只能調(diào)用默認(rèn)構(gòu)造函數(shù)，如果用戶想要指定 T 的構(gòu)造方式，我們可以用模板特化（template specialization）技術(shù)來提供一個(gè)定制點(diǎn)，這需要引入另一層間接。

歸納

l 進(jìn)程間通信首選 TCP sockets

l 線程同步的四項(xiàng)原則

l 使用互斥器的條件變量的慣用手法（idiom），關(guān)鍵是 RAII

用好這幾樣?xùn)|西，基本上能應(yīng)付多線程服務(wù)端開發(fā)的各種場(chǎng)合，只是或許有人會(huì)覺得性能沒有發(fā)揮到極致。我認(rèn)為，先把程序?qū)懻_了，再考慮性能優(yōu)化，這在多線程下任然成立。讓一個(gè)正確的程序變快，遠(yuǎn)比“讓一個(gè)快的程序變正確”容易得多。

7 總結(jié)

在現(xiàn)代的多核計(jì)算背景下，線程是不可避免的。多線程編程是一項(xiàng)重要的個(gè)人技能，不能因?yàn)樗y就本能地排斥，現(xiàn)在的軟件開發(fā)比起 10 年 20 年前已經(jīng)難了不知道多少倍。掌握多線程編程，才能更理智地選擇用還是不用多線程，因?yàn)槟隳茴A(yù)估多線程實(shí)現(xiàn)的難度與收益，在一開始做出正確的選擇。要知道把一個(gè)單線程程序改成多線程的，往往比重頭實(shí)現(xiàn)一個(gè)多線程的程序更難。

掌握同步原語和它們的適用場(chǎng)合時(shí)多線程編程的基本功。以我的經(jīng)驗(yàn)，熟練使用文中提到的同步原語，就能比較容易地編寫線程安全的程序。本文沒有考慮 signal 對(duì)多線程編程的影響，Unix 的 signal 在多線程下的行為比較復(fù)雜，一般要靠底層的網(wǎng)絡(luò)庫（如 Reactor）加以屏蔽，避免干擾上層應(yīng)用程序的開發(fā)。

通篇來看，“效率”并不是我的主要考慮點(diǎn)，a） TCP 不是效率最高的 IPC，b）我提倡正確加鎖而不是自己編寫 lock-free 算法（使用原子操作除外）。在程序的復(fù)雜度和性能之前取得平衡，并經(jīng)考慮未來兩三年擴(kuò)容的可能（無論是 CPU 變快、核數(shù)變多，還是機(jī)器數(shù)量增加，網(wǎng)絡(luò)升級(jí)）。下一篇“多線程編程的反模式”會(huì)考察伸縮性方面的常見錯(cuò)誤，我認(rèn)為在分布式系統(tǒng)中，伸縮性（scalability）比單機(jī)的性能優(yōu)化更值得投入精力。

這篇文章記錄了我目前對(duì)多線程編程的理解，用文中介紹的手法，我能解決自己面臨的全部多線程編程任務(wù)。如果文章的觀點(diǎn)與您不合，比如您使用了我沒有推薦使用的技術(shù)或手法（共享內(nèi)存、信號(hào)量等等），只要您理由充分，但行無妨。

這篇文章本來還有兩節(jié)“多線程編程的反模式”與“多線程的應(yīng)用場(chǎng)景”，考慮到字?jǐn)?shù)已經(jīng)超過一萬了，且聽下回分解吧：-）

后文預(yù)覽：Sleep 反模式

我認(rèn)為 sleep 只能出現(xiàn)在測(cè)試代碼中，比如寫單元測(cè)試的時(shí)候。（涉及時(shí)間的單元測(cè)試不那么好寫，短的如一兩秒鐘可以用 sleep，長的如一小時(shí)一天得想其他辦法，比如把算法提出來并把時(shí)間注入進(jìn)去。）產(chǎn)品代碼中線程的等待可分為兩種：一種是無所事事的時(shí)候（要么等在 select/poll/epoll 上。要么等在 condition variable 上，等待 BlockingQueue /CountDownLatch 亦可歸入此類），一種是等著進(jìn)入臨界區(qū)（等在 mutex 上）以便繼續(xù)處理。在程序的正常執(zhí)行中，如果需要等待一段時(shí)間，應(yīng)該往 event loop 里注冊(cè)一個(gè) timer，然后在 timer 的回調(diào)函數(shù)里接著干活，因?yàn)榫€程是個(gè)珍貴的共享資源，不能輕易浪費(fèi)。如果多線程的安全性和效率要靠代碼主動(dòng)調(diào)用 sleep 來保證，這是設(shè)計(jì)出了問題。等待一個(gè)事件發(fā)生，正確的做法是用 select 或 condition variable 或（更理想地）高層同步工具。當(dāng)然，在 GUI 編程中會(huì)有主動(dòng)讓出 CPU 的做法，比如調(diào)用 sleep（0）來實(shí)現(xiàn) yield。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴