TL;DR
PHP實(shí)現(xiàn)守護(hù)進(jìn)程可以通過 pcntl 與 posix 擴(kuò)展實(shí)現(xiàn)。
編程中需要注意的地方有:
- 通過二次 pcntl_fork() 以及 posix_setsid 讓主進(jìn)程脫離終端
- 通過 pcntl_signal() 忽略或者處理 SIGHUP 信號
- 多進(jìn)程程序需要通過二次 pcntl_fork() 或者 pcntl_signal() 忽略 SIGCHLD 信號防止子進(jìn)程變成 Zombie 進(jìn)程
- 通過 umask() 設(shè)定文件權(quán)限掩碼,防止繼承文件權(quán)限而來的權(quán)限影響功能
- 將運(yùn)行進(jìn)程的 STDIN/STDOUT/STDERR 重定向到 /dev/null 或者其他流上
如果要做的更好,還需要注意:
- 如果通過 root 啟動(dòng),運(yùn)行時(shí)更換到低權(quán)限用戶身份
- 及時(shí) chdir() 防止操作錯(cuò)誤路徑
- 多進(jìn)程程序考慮定時(shí)重啟,防止內(nèi)存泄露
什么是daemon
在一個(gè)多任務(wù)的電腦操作系統(tǒng)中,守護(hù)進(jìn)程(英語:daemon,/?di?m?n/或/?de?m?n/)是一種在后臺執(zhí)行的電腦程序。此類程序會(huì)被以進(jìn)程的形式初始化。守護(hù)進(jìn)程程序的名稱通常以字母“d”結(jié)尾:例如,syslogd就是指管理系統(tǒng)日志的守護(hù)進(jìn)程。
通常,守護(hù)進(jìn)程沒有任何存在的父進(jìn)程(即PPID=1),且在UNIX系統(tǒng)進(jìn)程層級中直接位于init之下。守護(hù)進(jìn)程程序通常通過如下方法使自己成為守護(hù)進(jìn)程:對一個(gè)子進(jìn)程運(yùn)行fork,然后使其父進(jìn)程立即終止,使得這個(gè)子進(jìn)程能在init下運(yùn)行。這種方法通常被稱為“脫殼”。
守護(hù)進(jìn)程也成精靈進(jìn)程( daemon )是生存周期較長的一種進(jìn)程。它們常常在系統(tǒng)自舉時(shí)啟動(dòng),僅在系統(tǒng)關(guān)閉時(shí)才終止。因?yàn)樗麄儧]有控制終端,所以說他們是在后臺運(yùn)行的。
這里注意到,daemon有如下特征:
- 沒有終端
- 后臺運(yùn)行
- 父進(jìn)程 pid 為1
想要查看運(yùn)行中的守護(hù)進(jìn)程可以通過 ps -ax 或者 ps -ef 查看,其中 -x 表示會(huì)列出沒有控制終端的進(jìn)程。
實(shí)現(xiàn)關(guān)注點(diǎn)二次 fork 與 setsidfork 系統(tǒng)調(diào)用
fork 系統(tǒng)調(diào)用用于復(fù)制一個(gè)與父進(jìn)程幾乎完全相同的進(jìn)程,新生成的子進(jìn)程不同的地方在于與父進(jìn)程有著不同的 pid 以及有不同的內(nèi)存空間,根據(jù)代碼邏輯實(shí)現(xiàn),父子進(jìn)程可以完成一樣的工作,也可以不同。子進(jìn)程會(huì)從父進(jìn)程中繼承比如文件描述符一類的資源。
PHP 中的 pcntl 擴(kuò)展中實(shí)現(xiàn)了 pcntl_fork() 函數(shù),用于在 PHP 中 fork 新的進(jìn)程。
setsid 系統(tǒng)調(diào)用
setsid 系統(tǒng)調(diào)用則用于創(chuàng)建一個(gè)新的會(huì)話并設(shè)定進(jìn)程組 id。
這里有幾個(gè)概念:會(huì)話,進(jìn)程組。
在 Linux 中,用戶登錄產(chǎn)生一個(gè)會(huì)話(Session),一個(gè)會(huì)話中包含一個(gè)或者多個(gè)進(jìn)程組,一個(gè)進(jìn)程組又包含多個(gè)進(jìn)程。每個(gè)進(jìn)程組有一個(gè)組長(Session Leader),它的 pid 就是進(jìn)程組的組 id。進(jìn)程組長一旦打開一個(gè)終端,這一個(gè)終端就被稱為控制終端。一旦控制終端發(fā)生異常(斷開、硬件錯(cuò)誤等),會(huì)發(fā)出信號到進(jìn)程組組長。
后臺運(yùn)行程序(如 shell 中以&結(jié)尾執(zhí)行指令)在終端關(guān)閉之后也會(huì)被殺死,就是沒有處理好控制終端斷開時(shí)發(fā)出的SIGHUP信號,而SIGHUP信號對于進(jìn)程的默認(rèn)行為則是退出進(jìn)程。
調(diào)用 setsid 系統(tǒng)調(diào)用之后,會(huì)讓當(dāng)前的進(jìn)程新建一個(gè)進(jìn)程組,如果在當(dāng)前進(jìn)程中不打開終端的話,那么這一個(gè)進(jìn)程組就不會(huì)存在控制終端,也就不會(huì)出現(xiàn)因?yàn)殛P(guān)閉終端而殺死進(jìn)程的問題。
PHP 中的 posix 擴(kuò)展中實(shí)現(xiàn)了 posix_setsid() 函數(shù),用于在 PHP 中設(shè)定新的進(jìn)程組。
孤兒進(jìn)程
父進(jìn)程比子進(jìn)程先退出,子進(jìn)程就會(huì)變成孤兒進(jìn)程。
init 進(jìn)程會(huì)收養(yǎng)孤兒進(jìn)程,即孤兒進(jìn)程的 ppid 變?yōu)?1。
二次 fork 的作用
首先,setsid 系統(tǒng)調(diào)用不能由進(jìn)程組組長調(diào)用,會(huì)返回-1。
二次 fork 操作的樣例代碼如下:
$pid1 = pcntl_fork();if ($pid1 > 0) { exit(0);} else if ($pid1 < 0) { exit("Failed to fork 1\n");}if (-1 == posix_setsid()) { exit("Failed to setsid\n");}$pid2 = pcntl_fork();if ($pid2 > 0) { exit(0);} else if ($pid2 < 0) { exit("Failed to fork 2\n");}
假定我們在終端中執(zhí)行應(yīng)用程序,進(jìn)程為 a,第一次 fork 會(huì)生成子進(jìn)程 b,如果 fork 成功,父進(jìn)程 a 退出。b 作為孤兒進(jìn)程,被 init 進(jìn)程托管。
此時(shí),進(jìn)程 b 處于進(jìn)程組 a 中,進(jìn)程 b 調(diào)用 posix_setsid 要求生成新的進(jìn)程組,調(diào)用成功后當(dāng)前進(jìn)程組變?yōu)?b。
此時(shí)進(jìn)程 b 事實(shí)上已經(jīng)脫離任何的控制終端,例程:
<?phpcli_set_process_title('process_a');$pidA = pcntl_fork();if ($pidA > 0) { exit(0);} else if ($pidA < 0) { exit(1);}cli_set_process_title('process_b');if (-1 === posix_setsid()) { exit(2);}while(true) { sleep(1);}
執(zhí)行程序之后:
? ~ php56 2fork1.php? ~ ps ax | grep -v grep | grep -E 'process_|PID' PID TTY STAT TIME COMMAND28203 ? Ss 0:00 process_b
從 ps 的結(jié)果來看,process_b 的 TTY 已經(jīng)變成了 ?,即沒有對應(yīng)的控制終端。
代碼走到這里,似乎已經(jīng)完成了功能,關(guān)閉終端之后 process_b 也沒有被殺死,但是為什么還要進(jìn)行第二次 fork 操作呢?
StackOverflow 上的一個(gè)回答寫的很好:
The second fork(2) is there to ensure that the new process is not a session leader, so it won’t be able to (accidentally) allocate a controlling terminal, since daemons are not supposed to ever have a controlling terminal.
這是為了防止實(shí)際的工作的進(jìn)程主動(dòng)關(guān)聯(lián)或者意外關(guān)聯(lián)控制終端,再次 fork 之后生成的新進(jìn)程由于不是進(jìn)程組組長,是不能申請關(guān)聯(lián)控制終端的。
綜上,二次 fork 與 setsid 的作用是生成新的進(jìn)程組,防止工作進(jìn)程關(guān)聯(lián)控制終端。
SIGHUP 信號處理
一個(gè)進(jìn)程收到 SIGHUP 信號的默認(rèn)動(dòng)作是結(jié)束進(jìn)程。
而 SIGHUP 會(huì)在如下情況下發(fā)出:
- 控制終端斷開,SIGHUP 發(fā)送到進(jìn)程組組長
- 進(jìn)程組組長退出,SIGHUP 會(huì)發(fā)送到進(jìn)程組中的前臺進(jìn)程
- SIGHUP 常被用于通知進(jìn)程重載配置文件(APUE 中提及,daemon 由于沒有控制終端,被認(rèn)為不可能會(huì)收到這一個(gè)信號,所以選擇復(fù)用)
由于實(shí)際的工作進(jìn)程不在前臺進(jìn)程組中,而且進(jìn)程組的組長已經(jīng)退出并且沒有控制終端,不處理正常情況下當(dāng)然也沒有問題,然而為了防止偶然的收到 SIGHUP 導(dǎo)致進(jìn)程退出,也為了遵循守護(hù)進(jìn)程程序設(shè)計(jì)的慣例,還是應(yīng)當(dāng)處理這一信號。
Zombie 進(jìn)程處理何為 Zombie 進(jìn)程
簡單來說,子進(jìn)程先于父進(jìn)程退出,父進(jìn)程沒有調(diào)用 wait 系統(tǒng)調(diào)用處理,進(jìn)程變?yōu)?Zombie 進(jìn)程。
子進(jìn)程先于父進(jìn)程退出時(shí),會(huì)向父進(jìn)程發(fā)送 SIGCHLD 信號,如果父進(jìn)程沒有處理,子進(jìn)程也會(huì)變?yōu)?Zombie 進(jìn)程。
Zombie 進(jìn)程會(huì)占用可 fork 的進(jìn)程數(shù),Zombie 進(jìn)程過多會(huì)導(dǎo)致無法 fork 新的進(jìn)程。
此外,Linux 系統(tǒng)中 ppid 為 init 進(jìn)程的進(jìn)程,變?yōu)?Zombie 后會(huì)由 init 進(jìn)程回收管理。
Zombie 進(jìn)程的處理
從 Zombie 進(jìn)程的特點(diǎn),對于多進(jìn)程的daemon,可以通過兩個(gè)途徑解決這一問題:
- 父進(jìn)程處理 SIGCHLD 信號
- 讓子進(jìn)程被 init 接管
父進(jìn)程處理信號無需多說,注冊信號處理回調(diào)函數(shù),調(diào)用回收方法即可。
對于讓子進(jìn)程被 init 接管,則可以通過2次 fork 的方法,讓第一次 fork 出的子進(jìn)程 a 再 fork 出實(shí)際的工作進(jìn)程 b,讓 a 先行退出,使得 b 成為孤兒進(jìn)程,這樣就能被 init 進(jìn)程托管了。
umask
umask 會(huì)從父進(jìn)程中繼承,影響創(chuàng)建文件的權(quán)限。
umask() 將 PHP 的 umask 設(shè)定為 mask & 0777 并返回原來的 umask。當(dāng) PHP 被作為服務(wù)器模塊使用時(shí),在每個(gè)請求結(jié)束后 umask 會(huì)被恢復(fù)。
如果父進(jìn)程的 umask 沒有設(shè)定好,那么在執(zhí)行一些文件操作時(shí),會(huì)出現(xiàn)意想不到的效果:
? ~ cat test_umask.php<?php chdir('/tmp'); umask(0066); mkdir('test_umask', 0777);? ~ php test_umask.php? ~ ll /tmp | grep umaskdrwx--x--x 2 root root 4.0K 8月 22 17:35 test_umask
所以,為了保證每一次都能按照預(yù)期的權(quán)限操作文件,需要置0 umask 值。
重定向0/1/2
這里的0/1/2分別指的是 STDIN/STDOUT/STDERR,即標(biāo)準(zhǔn)輸入/輸出/錯(cuò)誤三個(gè)流。
樣例
首先來看一個(gè)樣例:
<?php// not_redirect_std_stream_daemon.php$pid1 = pcntl_fork();if ($pid1 > 0) { exit(0);} else if ($pid1 < 0) { exit("Failed to fork 1\n");}if (-1 == posix_setsid()) { exit("Failed to setsid\n");}$pid2 = pcntl_fork();if ($pid2 > 0) { exit(0);} else if ($pid2 < 0) { exit("Failed to fork 2\n");}umask(0);declare(ticks = 1);pcntl_signal(SIGHUP, SIG_IGN);echo getmypid() . "\n";while(true) { echo time() . "\n"; sleep(10);}
上述代碼幾乎完成了文章最開始部分提及的各個(gè)方面,唯一不同的是沒有對標(biāo)準(zhǔn)流做處理。通過php not_redirect_std_stream_daemon.php 指令也能讓程序在后臺進(jìn)行。
在 sleep 的間隙,關(guān)閉終端,會(huì)發(fā)現(xiàn)進(jìn)程退出。
通過 strace 觀察系統(tǒng)調(diào)用的情況:
? ~ strace -p 6723Process 6723 attached - interrupt to quitrestart_syscall(<... resuming interrupted call ...>) = 0write(1, "1503417004\n", 11) = 11rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0rt_sigaction(SIGCHLD, NULL, {SIG_DFL, [], 0}, 8) = 0rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0nanosleep({10, 0}, 0x7fff71a30ec0) = 0write(1, "1503417014\n", 11) = -1 EIO (Input/output error)close(2) = 0close(1) = 0munmap(0x7f35abf59000, 4096) = 0close(0) = 0
發(fā)現(xiàn)發(fā)生了 EIO 錯(cuò)誤,導(dǎo)致進(jìn)程退出。
原因很簡單,即我們編寫的 daemon 程序使用了當(dāng)時(shí)啟動(dòng)時(shí)終端提供的標(biāo)準(zhǔn)流,當(dāng)終端關(guān)閉時(shí),標(biāo)準(zhǔn)流變得不可讀不可寫,一旦嘗試讀寫,會(huì)導(dǎo)致進(jìn)程退出。
解決方案APUE 樣例
APUE 13.3中提到過一條編程規(guī)則(第6條):
某些守護(hù)進(jìn)程打開 /dev/null 時(shí)期具有文件描述符0、1和2,這樣,任何一個(gè)視圖讀標(biāo)準(zhǔn)輸入、寫標(biāo)準(zhǔn)輸出或者標(biāo)準(zhǔn)錯(cuò)誤的庫例程都不會(huì)產(chǎn)生任何效果。因?yàn)槭刈o(hù)進(jìn)程并不與終端設(shè)備相關(guān)聯(lián),所以不能在終端設(shè)備上顯示器輸出,也無從從交互式用戶那里接受輸入。及時(shí)守護(hù)進(jìn)程是從交互式會(huì)話啟動(dòng)的,但因?yàn)槭刈o(hù)進(jìn)程是在后臺運(yùn)行的,所以登錄會(huì)話的終止并不影響守護(hù)進(jìn)程。如果其他用戶在同一終端設(shè)備上登錄,我們也不會(huì)在該終端上見到守護(hù)進(jìn)程的輸出,用戶也不可期望他們在終端上的輸入會(huì)由守護(hù)進(jìn)程讀取。
簡單來說:
- daemon 不應(yīng)使用標(biāo)準(zhǔn)流
- 0/1/2 要設(shè)定成 /dev/null
例程中使用:
for (i = 0; i < rl.rlim_max; i++) close(i);fd0 = open("/dev/null", O_RDWR);fd1 = dup(0);fd2 = dup(0);
實(shí)現(xiàn)了這一個(gè)功能。dup() (參考手冊)系統(tǒng)調(diào)用會(huì)復(fù)制輸入?yún)?shù)中的文件描述符,并復(fù)制到最小的未分配文件描述符上。所以上述例程可以理解為:
關(guān)閉所有可以打開的文件描述符,包括標(biāo)準(zhǔn)輸入輸出錯(cuò)誤;打開/dev/null并賦值給變量fd0,因?yàn)闃?biāo)準(zhǔn)輸入已經(jīng)關(guān)閉了,所以/dev/null會(huì)綁定到0,即標(biāo)準(zhǔn)輸入;因?yàn)樽钚∥捶峙湮募枋龇麨?,復(fù)制文件描述符0到文件描述符1,即標(biāo)準(zhǔn)輸出也綁定到/dev/null;因?yàn)樽钚∥捶峙湮募枋龇麨?,復(fù)制文件描述符0到文件描述符2,即標(biāo)準(zhǔn)錯(cuò)誤也綁定到/dev/null;開源項(xiàng)目實(shí)現(xiàn):Workerman
/*** Redirect standard input and output.** @throws Exception*/public static function resetStd(){ if (!self::$daemonize) { return; } global $STDOUT, $STDERR; $handle = fopen(self::$stdoutFile, "a"); if ($handle) { unset($handle); @fclose(STDOUT); @fclose(STDERR); $STDOUT = fopen(self::$stdoutFile, "a"); $STDERR = fopen(self::$stdoutFile, "a"); } else { throw new Exception('can not open stdoutFile ' . self::$stdoutFile); }}
Workerman 中如此實(shí)現(xiàn),結(jié)合博文,可能與 PHP 的 GC 機(jī)制有關(guān),對于 fd 0 1 2來說,PHP 會(huì)維持對這三個(gè)資源的引用計(jì)數(shù),在直接 fclose 之后,會(huì)使得這幾個(gè) fd 對應(yīng)的資源類型的變量引用計(jì)數(shù)為0,導(dǎo)致觸發(fā)回收。所需要做的就是將這些變量變?yōu)槿肿兞浚WC引用的存在。
作者:傳智播客PHP培訓(xùn)學(xué)院
首發(fā):http://php.ithcast.com/
|