Pārlūkot izejas kodu

:sparkles: 不可中断状态与僵尸进程

nick 6 gadi atpakaļ
vecāks
revīzija
ab8361a155
2 mainītis faili ar 65 papildinājumiem un 0 dzēšanām
  1. 1 0
      SUMMARY.md
  2. 64 0
      zombie-process.md

+ 1 - 0
SUMMARY.md

@@ -70,6 +70,7 @@
 * [平均负载](stress-sysstat-mpstat-pidstat-watch-uptime.md)
 * [CPU 上下文切换](cpu-context.md)
 * [CPU 使用率过高](cpu-used.md)
+* [不可中断进程和僵尸进程](zombie-process.md)
 
 ## 参考资料
 * [书籍](http://billie66.github.io/TLCL/book/)	

+ 64 - 0
zombie-process.md

@@ -0,0 +1,64 @@
+## 什么是不可中断状态
+
+当 iowait 升高时,进程很可能因为得不到硬件的响应,而长时间处于不可中断状态。从 ps 或者 top 命令的输出中,可以发现它们都处于 D 状态,也就是不可中断状态 (Uninterruptible Sleep)。
+
+不可中断状态,表示进程正在跟硬件交互,为了保护进程数据和硬件的一致性,系统不 允许其他进程或中断打断这个进程。进程长时间处于不可中断状态,通常表示系统有 I/O 性能问题。
+
+## 什么是僵死(僵尸)进程
+
+僵死(僵尸)进程进程:一个进程使用 fork 创建子进程,如果子进程退出,而父进程并没有调用 wait() 或 waitpid() 获取子进程的状态信息,那么子进程的进程描述符仍然保存在系统中。这种进程称之为僵死(僵尸)。
+
+通常,僵尸进程持续的时间都比较短,在父进程回收它的资源后就会消亡;或者在父进程退出后,由 init 进程回收后也会消亡。
+
+短暂的僵尸状态我们通常不必理会,但进程长时间处于僵尸状态,就应该注意了,可能有应用程序没有正常处理子进程的退出。
+
+#### top 命令查看进程状态
+
+top 和 ps 是最常用的查看进程状态的工具,我们就从 top 的输出开始。下面是一个 top 命令输出的示例,S 列(也就是 Status 列)表示进程的状态。
+
+```
+top - 21:43:31 up 28 days, 23:44,  2 users,  load average: 0.02, 0.02, 0.00
+Tasks: 139 total,   1 running, 138 sleeping,   0 stopped,   0 zombie
+%Cpu(s):  3.2 us,  1.2 sy,  0.0 ni, 95.7 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
+KiB Mem :  4042140 total,  1234472 free,   525152 used,  2282516 buff/cache
+KiB Swap:        0 total,        0 free,        0 used.  3169024 avail Mem
+
+  PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
+ 4606 rabbitmq  20   0 2169848  69784   6516 S   0.3  1.7 115:20.52 beam.smp
+ 4921 rabbitmq  20   0    7716     88      0 S   0.3  0.0   0:05.35 inet_gethost
+11943 ubuntu    20   0   40504   3764   3184 R   0.3  0.1   0:00.01 top
+    1 root      20   0  119960   6116   4020 S   0.0  0.2   3:18.65 systemd
+    2 root      20   0       0      0      0 S   0.0  0.0   0:00.00 kthreadd
+    3 root      20   0       0      0      0 S   0.0  0.0   0:33.16 ksoftirqd/0
+```
+
+- __R__ 是 Running 或 Runnable 的缩写,表示进程在 CPU 的就绪队列中,正在运行或者正 在等待运行。
+
+- __D__ 是 Disk Sleep 的缩写,也就是不可中断状态睡眠(Uninterruptible Sleep),一般 表示进程正在跟硬件交互,并且交互过程不允许被其他进程或中断打断。
+
+- __Z__ 是 Zombie 的缩写,如果你玩过“植物大战僵尸”这款游戏,应该知道它的意思。它 表示僵尸进程,也就是进程实际上已经结束了,但是父进程还没有回收它的资源(比如进程的描述符、PID 等)。
+
+- __S__ 是 Interruptible Sleep 的缩写,也就是可中断状态睡眠,表示进程因为等待某个事件 而被系统挂起。当进程等待的事件发生时,它会被唤醒并进入 R 状态。
+
+- __I__ 是 Idle 的缩写,也就是空闲状态,用在不可中断睡眠的内核线程上。前面说了,硬件 交互导致的不可中断进程用 D 表示,但对某些内核线程来说,它们有可能实际上并没有任何负载,用 Idle 正是为了区分这种情况。要注意,D 状态的进程会导致平均负载升 高, I 状态的进程却不会。
+
+- __T__ 或者 t,也就是 Stopped 或 Traced 的缩写,表示进程处于暂停或者跟踪状态。向一个进程发送 SIGSTOP 信号,它就会因响应这个信号变成暂停状态(Stopped);再向它发送 SIGCONT 信号,进程又会恢复运行(如果进程是终端里直接启动的,则需要你 用 fg 命令,恢复到前台运行)。而当你用调试器(如 gdb)调试一个进程时,在使用断点中断进程后,进程就会变成跟踪 状态,这其实也是一种特殊的暂停状态,只不过你可以用调试器来跟踪并按需要控制进程的运行。
+
+- __X__ 是 Dead 的缩写,表示进程已经消亡,所以你不会在 top 或者 ps 命令 中看到它。
+
+#### ps 命令查看进程状态
+
+```
+root      6525  0.0  0.1  65512  6088 ?        Ss   Jun12  12:22 /usr/sbin/sshd -D
+root     10376  0.0  0.1  99272  6944 ?        Ss   21:25   0:00 sshd: ubuntu [priv]
+ubuntu   10453  0.0  0.0  99272  3384 ?        S    21:25   0:00 sshd: ubuntu@pts/0
+root     11893  0.0  0.1  99272  6920 ?        Ss   21:43   0:00 sshd: ubuntu [priv]
+ubuntu   11928  0.0  0.0  99272  3348 ?        S    21:43   0:00 sshd: ubuntu@pts/1
+root     12913  0.0  0.0  12944   928 pts/1    S+   21:55   0:00 grep --color=auto sshd
+```
+
+ 状态为 Ss+ 和 D+ ,其中 S 表示可中断睡眠状态,D 表示不可中断睡眠状态。s 表示 这个进程是一个会话的领导进程,而 + 表示前台进程组。
+
+进程组和会话。它们用来管理一组相互关联的进程,进程组表示一组相互关联的进程,比如每个子进程都是父进程所在组的成员;而会话是指共享同一个控制终端的一个或多个进程组。
+
+比如,我们通过 SSH 登录服务器,就会打开一个控制终端(TTY),这个控制终端就对应 一个会话。而我们在终端中运行的命令以及它们的子进程,就构成了一个个的进程组,其 中,在后台运行的命令,构成后台进程组;在前台运行的命令,构成前台进程组。