每個進程各自有不同的用戶地址空間,任何一個進程的全局變數在另一個進程中都看不到,所以進程之間要交換數據必須通過內核,在內核中開闢一塊緩衝區,進程1把數據從用戶空間拷到內核緩衝區,進程2再從內核緩衝區把數據讀走,內核提供的這種機制稱為進程間通信(IPC,InterProcess Communication)。如下圖所示。
管道是一種最基本的IPC機制,由pipe
函數創建:
#include <unistd.h> int pipe(int filedes[2]);
調用pipe
函數時在內核中開闢一塊緩衝區(稱為管道)用於通信,它有一個讀端一個寫端,然後通過filedes
參數傳出給用戶程序兩個檔案描述符,filedes[0]
指向管道的讀端,filedes[1]
指向管道的寫端(很好記,就像0是標準輸入1是標準輸出一樣)。所以管道在用戶程序看起來就像一個打開的檔案,通過read(filedes[0]);
或者write(filedes[1]);
向這個檔案讀寫數據其實是在讀寫內核緩衝區。pipe
函數調用成功返回0,調用失敗返回-1。
開闢了管道之後如何實現兩個進程間的通信呢?比如可以按下面的步驟通信。
父進程調用pipe
開闢管道,得到兩個檔案描述符指向管道的兩端。
父進程調用fork
創建子進程,那麼子進程也有兩個檔案描述符指向同一管道。
父進程關閉管道讀端,子進程關閉管道寫端。父進程可以往管道里寫,子進程可以從管道里讀,管道是用環形隊列實現的,數據從寫端流入從讀端流出,這樣就實現了進程間通信。
例 30.7. 管道
#include <stdlib.h> #include <unistd.h> #define MAXLINE 80 int main(void) { int n; int fd[2]; pid_t pid; char line[MAXLINE]; if (pipe(fd) < 0) { perror("pipe"); exit(1); } if ((pid = fork()) < 0) { perror("fork"); exit(1); } if (pid > 0) { /* parent */ close(fd[0]); write(fd[1], "hello world\n", 12); wait(NULL); } else { /* child */ close(fd[1]); n = read(fd[0], line, MAXLINE); write(STDOUT_FILENO, line, n); } return 0; }
使用管道有一些限制:
兩個進程通過一個管道只能實現單向通信,比如上面的例子,父進程寫子進程讀,如果有時候也需要子進程寫父進程讀,就必須另開一個管道。請讀者思考,如果只開一個管道,但是父進程不關閉讀端,子進程也不關閉寫端,雙方都有讀端和寫端,為什麼不能實現雙向通信?
管道的讀寫端通過打開的檔案描述符來傳遞,因此要通信的兩個進程必須從它們的公共祖先那裡繼承管道檔案描述符。上面的例子是父進程把檔案描述符傳給子進程之後父子進程之間通信,也可以父進程fork
兩次,把檔案描述符傳給兩個子進程,然後兩個子進程之間通信,總之需要通過fork
傳遞檔案描述符使兩個進程都能訪問同一管道,它們才能通信。
使用管道需要注意以下4種特殊情況(假設都是阻塞I/O操作,沒有設置O_NONBLOCK
標誌):
如果所有指向管道寫端的檔案描述符都關閉了(管道寫端的引用計數等於0),而仍然有進程從管道的讀端讀數據,那麼管道中剩餘的數據都被讀取後,再次read
會返回0,就像讀到檔案末尾一樣。
如果有指向管道寫端的檔案描述符沒關閉(管道寫端的引用計數大於0),而持有管道寫端的進程也沒有向管道中寫數據,這時有進程從管道讀端讀數據,那麼管道中剩餘的數據都被讀取後,再次read
會阻塞,直到管道中有數據可讀了才讀取數據並返回。
如果所有指向管道讀端的檔案描述符都關閉了(管道讀端的引用計數等於0),這時有進程向管道的寫端write
,那麼該進程會收到信號SIGPIPE
,通常會導致進程異常終止。在第 33 章 信號會講到怎樣使SIGPIPE
信號不終止進程。
如果有指向管道讀端的檔案描述符沒關閉(管道讀端的引用計數大於0),而持有管道讀端的進程也沒有從管道中讀數據,這時有進程向管道寫端寫數據,那麼在管道被寫滿時再次write
會阻塞,直到管道中有空位置了才寫入數據並返回。
管道的這四種特殊情況具有普遍意義。在第 37 章 socket編程要講的TCP socket也具有管道的這些特性。
1、在例 30.7 “管道”中,父進程只用到寫端,因而把讀端關閉,子進程只用到讀端,因而把寫端關閉,然後互相通信,不使用的讀端或寫端必須關閉,請讀者想一想如果不關閉會有什麼問題。
2、請讀者修改例 30.7 “管道”的代碼和實驗條件,驗證我上面所說的四種特殊情況。
進程間通信必須通過內核提供的通道,而且必須有一種辦法在進程中標識內核提供的某個通道,上一節講的管道是用打開的檔案描述符來標識的。如果要互相通信的幾個進程沒有從公共祖先那裡繼承檔案描述符,它們怎麼通信呢?內核提供一條通道不成問題,問題是如何標識這條通道才能使各進程都可以訪問它?檔案系統中的路徑名是全局的,各進程都可以訪問,因此可以用檔案系統中的路徑名來標識一個IPC通道。
FIFO和UNIX Domain Socket這兩種IPC機制都是利用檔案系統中的特殊檔案來標識的。可以用mkfifo
命令創建一個FIFO檔案:
$ mkfifo hello $ ls -l hello prw-r--r-- 1 akaedu akaedu 0 2008-10-30 10:44 hello
FIFO檔案在磁碟上沒有數據塊,僅用來標識內核中的一條通道,各進程可以打開這個檔案進行read
/write
,實際上是在讀寫內核通道(根本原因在於這個file
結構體所指向的read
、write
函數和常規檔案不一樣),這樣就實現了進程間通信。UNIX Domain Socket和FIFO的原理類似,也需要一個特殊的socket檔案來標識內核中的通道,例如/var/run
目錄下有很多系統服務的socket檔案:
$ ls -l /var/run/ total 52 srw-rw-rw- 1 root root 0 2008-10-30 00:24 acpid.socket ... srw-rw-rw- 1 root root 0 2008-10-30 00:25 gdm_socket ... srw-rw-rw- 1 root root 0 2008-10-30 00:24 sdp ... srwxr-xr-x 1 root root 0 2008-10-30 00:42 synaptic.socket
檔案類型s表示socket,這些檔案在磁碟上也沒有數據塊。UNIX Domain Socket是目前最廣泛使用的IPC機制,到後面講socket編程時再詳細介紹。
現在把進程之間傳遞信息的各種途徑(包括各種IPC機制)總結如下:
父進程通過fork
可以將打開檔案的描述符傳遞給子進程
子進程結束時,父進程調用wait
可以得到子進程的終止信息
幾個進程可以在檔案系統中讀寫某個共享檔案,也可以通過給檔案加鎖來實現進程間同步
進程之間互發信號,一般使用SIGUSR1
和SIGUSR2
實現用戶自定義功能
管道
FIFO
mmap函數,幾個進程可以映射同一內存區
SYS V IPC,以前的SYS V UNIX系統實現的IPC機制,包括消息隊列、信號量和共享內存,現在已經基本廢棄
UNIX Domain Socket,目前最廣泛使用的IPC機制