Skip to content

Commit

Permalink
✨ 不可中断状态与僵尸进程
Browse files Browse the repository at this point in the history
  • Loading branch information
Nick233333 committed Jul 10, 2019
1 parent dddb7e2 commit ab8361a
Show file tree
Hide file tree
Showing 2 changed files with 65 additions and 0 deletions.
1 change: 1 addition & 0 deletions SUMMARY.md
Expand Up @@ -70,6 +70,7 @@
* [平均负载](stress-sysstat-mpstat-pidstat-watch-uptime.md)
* [CPU 上下文切换](cpu-context.md)
* [CPU 使用率过高](cpu-used.md)
* [不可中断进程和僵尸进程](zombie-process.md)

## 参考资料
* [书籍](http://billie66.github.io/TLCL/book/)
Expand Down
64 changes: 64 additions & 0 deletions zombie-process.md
@@ -0,0 +1,64 @@
## 什么是不可中断状态

当 iowait 升高时,进程很可能因为得不到硬件的响应,而长时间处于不可中断状态。从 ps 或者 top 命令的输出中,可以发现它们都处于 D 状态,也就是不可中断状态 (Uninterruptible Sleep)。

不可中断状态,表示进程正在跟硬件交互,为了保护进程数据和硬件的一致性,系统不 允许其他进程或中断打断这个进程。进程长时间处于不可中断状态,通常表示系统有 I/O 性能问题。

## 什么是僵死(僵尸)进程

僵死(僵尸)进程进程:一个进程使用 fork 创建子进程,如果子进程退出,而父进程并没有调用 wait() 或 waitpid() 获取子进程的状态信息,那么子进程的进程描述符仍然保存在系统中。这种进程称之为僵死(僵尸)。

通常,僵尸进程持续的时间都比较短,在父进程回收它的资源后就会消亡;或者在父进程退出后,由 init 进程回收后也会消亡。

短暂的僵尸状态我们通常不必理会,但进程长时间处于僵尸状态,就应该注意了,可能有应用程序没有正常处理子进程的退出。

#### top 命令查看进程状态

top 和 ps 是最常用的查看进程状态的工具,我们就从 top 的输出开始。下面是一个 top 命令输出的示例,S 列(也就是 Status 列)表示进程的状态。

```
top - 21:43:31 up 28 days, 23:44, 2 users, load average: 0.02, 0.02, 0.00
Tasks: 139 total, 1 running, 138 sleeping, 0 stopped, 0 zombie
%Cpu(s): 3.2 us, 1.2 sy, 0.0 ni, 95.7 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 4042140 total, 1234472 free, 525152 used, 2282516 buff/cache
KiB Swap: 0 total, 0 free, 0 used. 3169024 avail Mem
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
4606 rabbitmq 20 0 2169848 69784 6516 S 0.3 1.7 115:20.52 beam.smp
4921 rabbitmq 20 0 7716 88 0 S 0.3 0.0 0:05.35 inet_gethost
11943 ubuntu 20 0 40504 3764 3184 R 0.3 0.1 0:00.01 top
1 root 20 0 119960 6116 4020 S 0.0 0.2 3:18.65 systemd
2 root 20 0 0 0 0 S 0.0 0.0 0:00.00 kthreadd
3 root 20 0 0 0 0 S 0.0 0.0 0:33.16 ksoftirqd/0
```

- __R__ 是 Running 或 Runnable 的缩写,表示进程在 CPU 的就绪队列中,正在运行或者正 在等待运行。

- __D__ 是 Disk Sleep 的缩写,也就是不可中断状态睡眠(Uninterruptible Sleep),一般 表示进程正在跟硬件交互,并且交互过程不允许被其他进程或中断打断。

- __Z__ 是 Zombie 的缩写,如果你玩过“植物大战僵尸”这款游戏,应该知道它的意思。它 表示僵尸进程,也就是进程实际上已经结束了,但是父进程还没有回收它的资源(比如进程的描述符、PID 等)。

- __S__ 是 Interruptible Sleep 的缩写,也就是可中断状态睡眠,表示进程因为等待某个事件 而被系统挂起。当进程等待的事件发生时,它会被唤醒并进入 R 状态。

- __I__ 是 Idle 的缩写,也就是空闲状态,用在不可中断睡眠的内核线程上。前面说了,硬件 交互导致的不可中断进程用 D 表示,但对某些内核线程来说,它们有可能实际上并没有任何负载,用 Idle 正是为了区分这种情况。要注意,D 状态的进程会导致平均负载升 高, I 状态的进程却不会。

- __T__ 或者 t,也就是 Stopped 或 Traced 的缩写,表示进程处于暂停或者跟踪状态。向一个进程发送 SIGSTOP 信号,它就会因响应这个信号变成暂停状态(Stopped);再向它发送 SIGCONT 信号,进程又会恢复运行(如果进程是终端里直接启动的,则需要你 用 fg 命令,恢复到前台运行)。而当你用调试器(如 gdb)调试一个进程时,在使用断点中断进程后,进程就会变成跟踪 状态,这其实也是一种特殊的暂停状态,只不过你可以用调试器来跟踪并按需要控制进程的运行。

- __X__ 是 Dead 的缩写,表示进程已经消亡,所以你不会在 top 或者 ps 命令 中看到它。

#### ps 命令查看进程状态

```
root 6525 0.0 0.1 65512 6088 ? Ss Jun12 12:22 /usr/sbin/sshd -D
root 10376 0.0 0.1 99272 6944 ? Ss 21:25 0:00 sshd: ubuntu [priv]
ubuntu 10453 0.0 0.0 99272 3384 ? S 21:25 0:00 sshd: ubuntu@pts/0
root 11893 0.0 0.1 99272 6920 ? Ss 21:43 0:00 sshd: ubuntu [priv]
ubuntu 11928 0.0 0.0 99272 3348 ? S 21:43 0:00 sshd: ubuntu@pts/1
root 12913 0.0 0.0 12944 928 pts/1 S+ 21:55 0:00 grep --color=auto sshd
```

状态为 Ss+ 和 D+ ,其中 S 表示可中断睡眠状态,D 表示不可中断睡眠状态。s 表示 这个进程是一个会话的领导进程,而 + 表示前台进程组。

进程组和会话。它们用来管理一组相互关联的进程,进程组表示一组相互关联的进程,比如每个子进程都是父进程所在组的成员;而会话是指共享同一个控制终端的一个或多个进程组。

比如,我们通过 SSH 登录服务器,就会打开一个控制终端(TTY),这个控制终端就对应 一个会话。而我们在终端中运行的命令以及它们的子进程,就构成了一个个的进程组,其 中,在后台运行的命令,构成后台进程组;在前台运行的命令,构成前台进程组。

0 comments on commit ab8361a

Please sign in to comment.