linux僵尸進(jìn)程是一個(gè)早已死亡的進(jìn)程,但是在進(jìn)程表中仍占了一個(gè)位置;如果子進(jìn)程死亡時(shí)父進(jìn)程沒(méi)有wait(),通常用ps可以看到它被顯示為“”,這樣就產(chǎn)生了僵尸進(jìn)程;如果大量產(chǎn)生僵尸進(jìn)程,那么將因?yàn)闆](méi)有可用的進(jìn)程號(hào)而導(dǎo)致系統(tǒng)不能產(chǎn)生新的進(jìn)程,所以要避免有僵尸進(jìn)程。
本教程操作環(huán)境:linux5.9.8系統(tǒng)、Dell G3電腦。
linux下僵尸進(jìn)程(Defunct進(jìn)程)的產(chǎn)生與避免
一、什么是僵尸進(jìn)程
在unix 系統(tǒng)中,一個(gè)進(jìn)程結(jié)束了,但是他的父進(jìn)程沒(méi)有等待(調(diào)用wait / waitpid)他,那么他將變成一個(gè)僵尸進(jìn)程。當(dāng)用ps命令觀察進(jìn)程的執(zhí)行狀態(tài)時(shí),看到這些進(jìn)程的狀態(tài)欄為defunct。僵尸進(jìn)程是一個(gè)早已死亡的進(jìn)程,但在進(jìn)程表(processs table)中仍占了一個(gè)位置(slot)。
但是如果該進(jìn)程的父進(jìn)程已經(jīng)先結(jié)束了,那么該進(jìn)程就不會(huì)變成僵尸進(jìn)程。因?yàn)槊總€(gè)進(jìn)程結(jié)束的時(shí)候,系統(tǒng)都會(huì)掃描當(dāng)前系統(tǒng)中所運(yùn)行的所有進(jìn)程,看看有沒(méi)有哪個(gè)進(jìn)程是剛剛結(jié)束的這個(gè)進(jìn)程的子進(jìn)程,如果是的話,就由Init進(jìn)程來(lái)接管他,成為他的父進(jìn)程,從而保證每個(gè)進(jìn)程都會(huì)有一個(gè)父進(jìn)程。而Init進(jìn)程會(huì)自動(dòng)wait其子進(jìn)程,因此被Init接管的所有進(jìn)程都不會(huì)變成僵尸進(jìn)程。
二、UNIX下進(jìn)程的運(yùn)作方式
每個(gè)Unix進(jìn)程在進(jìn)程表里都有一個(gè)進(jìn)入點(diǎn)(entry),核心進(jìn)程執(zhí)行該進(jìn)程時(shí)使用到的一切信息都存儲(chǔ)在進(jìn)入點(diǎn)。當(dāng)用 ps 命令察看系統(tǒng)中的進(jìn)程信息時(shí),看到的就是進(jìn)程表中的相關(guān)數(shù)據(jù)。當(dāng)以fork()系統(tǒng)調(diào)用建立一個(gè)新的進(jìn)程后,核心進(jìn)程就會(huì)在進(jìn)程表中給這個(gè)新進(jìn)程分配一個(gè)進(jìn)入點(diǎn),然后將相關(guān)信息存儲(chǔ)在該進(jìn)入點(diǎn)所對(duì)應(yīng)的進(jìn)程表內(nèi)。這些信息中有一項(xiàng)是其父進(jìn)程的識(shí)別碼。
子進(jìn)程的結(jié)束和父進(jìn)程的運(yùn)行是一個(gè)異步過(guò)程,即父進(jìn)程永遠(yuǎn)無(wú)法預(yù)測(cè)子進(jìn)程到底什么時(shí)候結(jié)束。那么會(huì)不會(huì)因?yàn)楦高M(jìn)程太忙來(lái)不及 wait 子進(jìn)程,或者說(shuō)不知道子進(jìn)程什么時(shí)候結(jié)束,而丟失子進(jìn)程結(jié)束時(shí)的狀態(tài)信息呢?
不會(huì)。因?yàn)閁NIX提供了一種機(jī)制可以保證,只要父進(jìn)程想知道子進(jìn)程結(jié)束時(shí)的狀態(tài)信息,就可以得到。這種機(jī)制就是:當(dāng)子進(jìn)程走完了自己的生命周期后,它會(huì)執(zhí)行exit()系統(tǒng)調(diào)用,內(nèi)核釋放該進(jìn)程所有的資源,包括打開(kāi)的文件,占用的內(nèi)存等。但是仍然為其保留一定的信息(包括進(jìn)程號(hào)the process ID,退出碼exit code,退出狀態(tài)the terminationstatus of the process,運(yùn)行時(shí)間the amount of CPU time taken by the process等),這些數(shù)據(jù)會(huì)一直保留到系統(tǒng)將它傳遞給它的父進(jìn)程為止,直到父進(jìn)程通過(guò)wait / waitpid來(lái)取時(shí)才釋放。
也就是說(shuō),當(dāng)一個(gè)進(jìn)程死亡時(shí),它并不是完全的消失了。進(jìn)程終止,它不再運(yùn)行,但是還有一些殘留的數(shù)據(jù)等待父進(jìn)程收回。當(dāng)父進(jìn)程 fork() 一個(gè)子進(jìn)程后,它必須用 wait() (或者 waitpid())等待子進(jìn)程退出。正是這個(gè) wait() 動(dòng)作來(lái)讓子進(jìn)程的殘留數(shù)據(jù)消失。
三、僵尸進(jìn)程的危害
如果父進(jìn)程不調(diào)用wait / waitpid的話,那么保留的那段信息就不會(huì)釋放,其進(jìn)程號(hào)就會(huì)一直被占用,但是系統(tǒng)的進(jìn)程表容量是有限的,所能使用的進(jìn)程號(hào)也是有限的,如果大量的產(chǎn)生僵尸進(jìn)程,將因?yàn)闆](méi)有可用的進(jìn)程號(hào)而導(dǎo)致系統(tǒng)不能產(chǎn)生新的進(jìn)程。
所以,defunct進(jìn)程不僅占用系統(tǒng)的內(nèi)存資源,影響系統(tǒng)的性能,而且如果其數(shù)目太多,還會(huì)導(dǎo)致系統(tǒng)癱瘓。而且,由于調(diào)度程序無(wú)法選中Defunct 進(jìn)程,所以不能用kill命令刪除Defunct 進(jìn)程,惟一的方法只有重啟系統(tǒng)。
四、僵尸進(jìn)程的產(chǎn)生
如果子進(jìn)程死亡時(shí)父進(jìn)程沒(méi)有 wait(),通常用 ps 可以看到它被顯示為“
由此可見(jiàn),defunct進(jìn)程的出現(xiàn)時(shí)間是在子進(jìn)程終止后,但是父進(jìn)程尚未讀取這些數(shù)據(jù)之前。利用這一點(diǎn)我們可以用下面的程序建立一個(gè)defunct 進(jìn)程:
#include <stdio.h> #include<sys/types.h> main() { if(!fork()) { printf(“child pid=%dn”, getpid()); exit(0); } sleep(20); printf(“parent pid=%d n”, getpid()); exit(0); }
當(dāng)上述程序以后臺(tái)的方式執(zhí)行時(shí),第17行強(qiáng)迫程序睡眠20秒,讓用戶有時(shí)間輸入ps -e指令,觀察進(jìn)程的狀態(tài),我們看到進(jìn)程表中出現(xiàn)了defunct進(jìn)程。當(dāng)父進(jìn)程執(zhí)行終止后,再用ps -e命令觀察時(shí),我們會(huì)發(fā)現(xiàn)defunct進(jìn)程也隨之消失。這是因?yàn)楦高M(jìn)程終止后,init 進(jìn)程會(huì)接管父進(jìn)程留下的這些“孤兒進(jìn)程”(orphan process),而這些“孤兒進(jìn)程”執(zhí)行完后,它在進(jìn)程表中的進(jìn)入點(diǎn)將被刪除。如果一個(gè)程序設(shè)計(jì)上有缺陷,就可能導(dǎo)致某個(gè)進(jìn)程的父進(jìn)程一直處于睡眠狀態(tài)或是陷入死循環(huán),父進(jìn)程沒(méi)有wait子進(jìn)程,也沒(méi)有終止以使Init接管,該子進(jìn)程執(zhí)行結(jié)束后就變成了defunct進(jìn)程,這個(gè)defunct 進(jìn)程可能會(huì)一直留在系統(tǒng)中直到系統(tǒng)重新啟動(dòng)。
在看一個(gè)產(chǎn)生僵尸進(jìn)程的例子。
子進(jìn)程要執(zhí)行的程序test_prog
//test.c #include <stdio.h> int main() { int i = 0; for (i = 0 ; i < 10; i++) { printf ("child time %dn", i+1); sleep (1); } return 0; }
父進(jìn)程father的代碼father.c
#include?<stdio.h>? #include?<unistd.h>? #include?<sys>? #include?<sys>? int?main()?? {?? ?int?pid?=?fork?();?? ?if?(pid?==?0)?? ????????{?? ????????????????system?("./test_prog");?? ????????????????_exit?(0);?? ????????}else? ????????{?? ?int?i?=?0;?? ?/*? ????????????????????????????????int?status?=?0;? ????????????????while?(!waitpid(pid,?&status,?WNOHANG))? ????????????????{? ????????????????????????printf?("father?waiting%dn",?++i);? ????????????????????????sleep?(1);? ????????????????}*/? ?while?(1)?? ????????????????{?? ????????????????????????printf?("father?waiting?over%dn",?++i);?? ????????????????????????sleep?(1);?? ????????????????}?? ?return?0;?? ????????}?? ? }</sys></sys></unistd.h></stdio.h>
執(zhí)行./father,當(dāng)子進(jìn)程退出后,由于父進(jìn)程沒(méi)有對(duì)它的退出進(jìn)行關(guān)注,會(huì)出現(xiàn)僵尸進(jìn)程
20786 pts/0 00:00:00 father 20787 pts/0 00:00:00 father <defunct>
總結(jié):子進(jìn)程成為 defunct 直到父進(jìn)程 wait(),除非父進(jìn)程忽略了 SIGCLD 。更進(jìn)一步,父進(jìn)程沒(méi)有 wait() 就消亡(仍假設(shè)父進(jìn)程沒(méi)有忽略 SIGCLD )的子進(jìn)程(活動(dòng)的或者 defunct)成為 init 的子進(jìn)程,init 著手處理它們。
五、如何避免僵尸進(jìn)程
1、父進(jìn)程通過(guò)wait和waitpid等函數(shù)等待子進(jìn)程結(jié)束,這會(huì)導(dǎo)致父進(jìn)程掛起。
在上個(gè)例子中,如果我們略作修改,在第8行sleep()系統(tǒng)調(diào)用前執(zhí)行wait()或waitpid()系統(tǒng)調(diào)用,則子進(jìn)程在終止后會(huì)立即把它在進(jìn)程表中的數(shù)據(jù)返回給父進(jìn)程,此時(shí)系統(tǒng)會(huì)立即刪除該進(jìn)入點(diǎn)。在這種情形下就不會(huì)產(chǎn)生defunct進(jìn)程。
2. 如果父進(jìn)程很忙,那么可以用signal函數(shù)為SIGCHLD安裝handler。在子進(jìn)程結(jié)束后,父進(jìn)程會(huì)收到該信號(hào),可以在handler中調(diào)用wait回收。
3. 如果父進(jìn)程不關(guān)心子進(jìn)程什么時(shí)候結(jié)束,那么可以用signal(SIGCLD, SIG_IGN)或signal(SIGCHLD, SIG_IGN)通知內(nèi)核,自己對(duì)子進(jìn)程的結(jié)束不感興趣,那么子進(jìn)程結(jié)束后,內(nèi)核會(huì)回收,并不再給父進(jìn)程發(fā)送信號(hào)
4. fork兩次,父進(jìn)程fork一個(gè)子進(jìn)程,然后繼續(xù)工作,子進(jìn)程fork一個(gè)孫進(jìn)程后退出,那么孫進(jìn)程被init接管,孫進(jìn)程結(jié)束后,init會(huì)回收。不過(guò)子進(jìn)程的回收還要自己做。 下面就是Stevens給的采用兩次folk避免僵尸進(jìn)程的示例:
#include "apue.h" #include <sys/wait.h> int main(void) ...{ pid_t pid; if ((pid = fork()) < 0) ...{ err_sys("fork error"); } else if (pid == 0) ...{ /**//* first child */ if ((pid = fork()) < 0) err_sys("fork error"); else if (pid > 0) exit(0); /**//* parent from second fork == first child */ /**//* * We're the second child; our parent becomes init as soon * as our real parent calls exit() in the statement above. * Here's where we'd continue executing, knowing that when * we're done, init will reap our status. */ sleep(2); printf("second child, parent pid = %d ", getppid()); exit(0); } if (waitpid(pid, NULL, 0) != pid) /**//* wait for first child */ err_sys("waitpid error"); /**//* * We're the parent (the original process); we continue executing, * knowing that we're not the parent of the second child. */ exit(0); }
相關(guān)推薦:《Linux視頻教程》