
#  オペレーティングシステム 演習 02
#  プロセス


名前と学生証番号を書け. Enter your name and student ID.

 * 名前 Name: Hartanto Kwee Jeffrey
 * 学生証番号 Student ID: 7V239416


# 1. プロセス関連コマンド

## 1-1. ps auxww
* ps は現存するプロセスを表示するコマンド
* 話せば長い(詳細はmanページを参照)が, auxwwですべてのプロセスがコマンドラインとともに表示される

* 以下によりシステムのすべてのプロセスが表示される
* 出力が一杯になりすぎたらなにも出力しないコマンドに書き換えて実行しなおせば良い
* 例えば
```
ps auxww > /dev/null
```

In [1]:
ps auxww > /dev/null


# 2. fork
* forkはUnixでプロセスを生成する手段
* プロセスを生成 = (例えば実行するファイルを指定して)プログラムを起動するということかと思いきやそうではなく, forkは何の引数もとらず, 呼び出したプロセスのコピーを作るというもの
* 以下は全く役に立たないが, ともかくforkが何をするシステムコールかを教えてくれるプログラム

In [2]:
%%writefile fork.c
#include <stdio.h>
#include <unistd.h>

int main() {
  printf("%d : before fork\n", getpid());
  fflush(stdout);
  fork();           /* 現プロセスをコピー */
  printf("%d : after fork\n", getpid());
  return 0;
}

Overwriting fork.c


In [3]:
gcc -Wall fork.c -o fork

In [4]:
./fork

4138645 : before fork
4138645 : after fork
4138646 : after fork


* forkを使うもう少し完結した例
* 親と子で違う動作をする

In [5]:
%%writefile fork_pc.c
#include <err.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

int main() {
  pid_t pid = fork();           /* 現プロセスをコピー */
  if (pid == -1) {
    err(1, "fork");
  } else if (pid == 0) {        /* 新しいプロセス(子プロセス) */
    for (int i = 0; i < 5; i++) {
      printf("child  %d: %d\n", getpid(), i);
      fflush(stdout);
      usleep(100 * 1000);
    }
  } else {                      /* 元いたプロセス(親プロセス)
                                   forkの返り値は子プロセスのプロセスID */
    for (int i = 0; i < 5; i++) {
      printf("parent %d: %d\n", getpid(), i);
      fflush(stdout);
      usleep(100 * 1000);
    }
  }
  return 0;
}

Writing fork_pc.c


In [6]:
gcc -Wall fork_pc.c -o fork_pc

In [7]:
./fork_pc

parent 4138665: 0
child  4138666: 0
parent 4138665: 1
child  4138666: 1
parent 4138665: 2
child  4138666: 2
parent 4138665: 3
child  4138666: 3
parent 4138665: 4
child  4138666: 4


* forkを使うさらにまともな例
* 親が子のwait処理をする

In [8]:
%%writefile fork_wait.c
#include <err.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>

int main() {
  pid_t pid = fork();
  if (pid == -1) {
    err(1, "fork");
  } else if (pid == 0) {          /* child */
    for (int i = 0; i < 5; i++) {
      printf("%d: %d\n", getpid(), i);
      fflush(stdout);
      usleep(100 * 1000);
    }
    return 123;
  } else {
    int ws;
    printf("parent: wait for child (pid = %d) to finish\n", pid);
    fflush(stdout);
    pid_t cid = waitpid(pid, &ws, 0);
    if (cid == -1) err(1, "waitpid");
    if (WIFEXITED(ws)) {
      printf("exited, status=%d\n", WEXITSTATUS(ws));
      fflush(stdout);
    } else if (WIFSIGNALED(ws)) {
      printf("killed by signal %d\n", WTERMSIG(ws));
      fflush(stdout);
    }
  }
  return 0;
}

Writing fork_wait.c


In [9]:
gcc -Wall fork_wait.c -o fork_wait

In [10]:
./fork_wait

parent: wait for child (pid = 4138702) to finish
4138702: 0
4138702: 1
4138702: 2
4138702: 3
4138702: 4
exited, status=123



# 3. exec

* execは指定したプログラムを実行するシステムコール
* 呼び出したプロセスをそのまま, 指定したプログラムを先頭から実行するものに「変える」というイメージ
* execがプロセスを生成するのではないので注意
* execはあくまで呼び出したプロセスを, これまでのことをすべて忘れて所定のことをするプロセスに「変身させる」
* なお, execという名のシステムコールが実在するのではなく, execv, execveなど色々な変種の総称
* 以下は ls -l を実行するプロセスを作るプログラム

In [11]:
%%writefile fork_exec.c
#include <err.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>

extern char ** environ;

int main() {
  pid_t pid = fork();           /* 現プロセスをコピー */
  if (pid == -1) {
    err(1, "fork");
  } else if (pid == 0) {        /* 新しいプロセス(子プロセス) */
    char * const argv[] = { "/bin/ls", "-l", 0 };
    execv(argv[0], argv);
    /* 成功すればexecveはリターンしない.
       i.e., リターンしたらエラー */
    err(1, "execve");
  } else {
    int ws;
    pid_t cid = waitpid(pid, &ws, 0);
    if (cid == -1) err(1, "waitpid");
    if (WIFEXITED(ws)) {
      printf("exited, status=%d\n", WEXITSTATUS(ws));
      fflush(stdout);
    } else if (WIFSIGNALED(ws)) {
      printf("killed by signal %d\n", WTERMSIG(ws));
      fflush(stdout);
    }
  }
  return 0;
}

Writing fork_exec.c


In [12]:
gcc -Wall fork_exec.c -o fork_exec

In [13]:
./fork_exec

total 116
-rwxr-xr-x 1 u23391 u23391 16128 Oct 14 17:32 fork
-rw-r--r-- 1 u23391 u23391   222 Oct 14 17:32 fork.c
-rwxr-xr-x 1 u23391 u23391 16272 Oct 14 17:34 fork_exec
-rw-r--r-- 1 u23391 u23391   874 Oct 14 17:34 fork_exec.c
-rwxr-xr-x 1 u23391 u23391 16216 Oct 14 17:32 fork_pc
-rw-r--r-- 1 u23391 u23391   722 Oct 14 17:32 fork_pc.c
-rwxr-xr-x 1 u23391 u23391 16312 Oct 14 17:33 fork_wait
-rw-r--r-- 1 u23391 u23391   804 Oct 14 17:33 fork_wait.c
-rw-r--r-- 1 u23391 u23391 33709 Oct 14 17:34 os02_process.sos.ipynb
exited, status=0


* execv関数では実行したいコマンド(ls)のファイル名(/bin/ls)を指定しなくてはならない
* 普段シェルでコマンドを実行する際は ls と打つだけで実行できているのは, シェルがPATHという環境変数を見てコマンドを探してくれているから
* 以下でPATHという環境変数の中身が表示できる

In [14]:
echo $PATH

/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/snap/bin


* シェルは, PATHに指定されているディレクトリを順に見ていって, lsという名前のファイルが見つかったらそれを実行する
* 同じことはexecの変種 execvp という関数を呼べばやってくれる

In [15]:
%%writefile fork_execvp.c
#include <err.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>

extern char ** environ;

int main() {
  pid_t pid = fork();           /* 現プロセスをコピー */
  if (pid == -1) {
    err(1, "fork");
  } else if (pid == 0) {        /* 新しいプロセス(子プロセス) */
    char * const argv[] = { "ls", "-l", 0 };
    execvp(argv[0], argv);
    /* 成功すればexecveはリターンしない.
       i.e., リターンしたらエラー */
    err(1, "execve");
  } else {
    int ws;
    pid_t cid = waitpid(pid, &ws, 0);
    if (cid == -1) err(1, "waitpid");
    if (WIFEXITED(ws)) {
      printf("exited, status=%d\n", WEXITSTATUS(ws));
      fflush(stdout);
    } else if (WIFSIGNALED(ws)) {
      printf("killed by signal %d\n", WTERMSIG(ws));
      fflush(stdout);
    }
  }
  return 0;
}

Writing fork_execvp.c


In [16]:
gcc -Wall fork_execvp.c -o fork_execvp

In [17]:
./fork_execvp

total 136
-rwxr-xr-x 1 u23391 u23391 16128 Oct 14 17:32 fork
-rw-r--r-- 1 u23391 u23391   222 Oct 14 17:32 fork.c
-rwxr-xr-x 1 u23391 u23391 16272 Oct 14 17:34 fork_exec
-rw-r--r-- 1 u23391 u23391   874 Oct 14 17:34 fork_exec.c
-rwxr-xr-x 1 u23391 u23391 16272 Oct 14 17:38 fork_execvp
-rw-r--r-- 1 u23391 u23391   870 Oct 14 17:38 fork_execvp.c
-rwxr-xr-x 1 u23391 u23391 16216 Oct 14 17:32 fork_pc
-rw-r--r-- 1 u23391 u23391   722 Oct 14 17:32 fork_pc.c
-rwxr-xr-x 1 u23391 u23391 16312 Oct 14 17:33 fork_wait
-rw-r--r-- 1 u23391 u23391   804 Oct 14 17:33 fork_wait.c
-rw-r--r-- 1 u23391 u23391 34743 Oct 14 17:36 os02_process.sos.ipynb
exited, status=0


* なお, PATHの中身を見て, コマンド名に対応するファイル名を表示してくれるのが which というコマンド
* コマンドを打ち込んで実行されているファイルがどこにあるのかを知りたいときに使う
* Linux, Macを使っている人は普段使っているプログラム, firefox, zoomなどがどこにあるのかを探ってみよ

In [19]:
which firefox
which zoom

: 1

# 4. forkにまつわる悲劇
* 以下のようなプログラムを書いたらプロセスはいくつ生成されるのだろう?
* そして以下を実行するとどんな表示が出てくるか?
* 頭で予想してから実行してみよ
* n=100としたら何が起こるか(<- 決してやってはいけない)?

In [20]:
%%writefile fork_n.c
#include <stdio.h>
#include <unistd.h>

int main() {
  int n = 5;
  for (int i = 0; i < n; i++) {
    pid_t cid = fork();
    printf("%d -> %d\n", getpid(), cid);
    fflush(stdout);
  }
  return 0;
}

Writing fork_n.c


In [21]:
gcc -Wall fork_n.c -o fork_n

* 以下を実行して (左側のファイル一覧から) out.txt を開いて見てみよ

In [22]:
./fork_n > out.txt

* 注: > out.txt なしで直接表示することもできるが, 結果をすべて出力てくれないことがしばしばある. これは多分, Jupyterのbashカーネルのバグ
* 多分以下のように, このセルの終了まで間を作ると全部出力してくれる(Jupyterのバグを回避しているだけで全く本質的なことではない. 端末で実行すればこんなことをする必要はない)

In [23]:
./fork_n
sleep 1 

4138935 -> 4138936
4138935 -> 4138937
4138936 -> 0
4138937 -> 0
4138935 -> 4138938
4138938 -> 0
4138936 -> 4138939
4138938 -> 4138941
4138937 -> 4138940
4138940 -> 0
4138938 -> 4138943
4138935 -> 4138942
4138940 -> 4138945
4138936 -> 4138944
4138939 -> 0
4138943 -> 0
4138937 -> 4138946
4138940 -> 4138948
4138935 -> 4138947
4138947 -> 0
4138941 -> 0
4138942 -> 0
4138945 -> 0
4138936 -> 4138949
4138937 -> 4138950
4138939 -> 4138951
4138946 -> 0
4138944 -> 0
4138936 -> 4138952
4138941 -> 4138953
4138948 -> 0
4138945 -> 4138955
4138942 -> 4138954
4138939 -> 4138956
4138956 -> 0
4138953 -> 0
4138946 -> 4138957
4138954 -> 0
4138956 -> 4138959
4138950 -> 0
4138951 -> 0
4138949 -> 0
4138939 -> 4138960
4138944 -> 4138958
4138952 -> 0
4138955 -> 0
4138957 -> 0
4138960 -> 0
4138958 -> 0
4138951 -> 4138961
4138959 -> 0
4138949 -> 4138962
4138944 -> 4138963
4138961 -> 0
4138962 -> 0
4138958 -> 4138964
4138951 -> 4138965
4138963 -> 0
4138964 -> 0
4138961 -> 4138966
4138965 -> 0
4138966 -> 0


# <font color="green"> Problem 1 :  fork, exec, waitの練習</font>
以下を行うプログラムを書け

1. 時刻をナノ秒単位で取得($t_0$とする)
2. 以下を多数回($n$回)繰り返す
 * 子プロセスをforkする
  * 子プロセスはただちに ./do_nothing という, 何もしないプログラムをexecする
  * 親プロセスはただちに子プロセスの終了をwaitする
3. 時刻をナノ秒単位で取得($t_1$とする)
4. 1回あたりの時間($(t_1 - t_0)/n$) をナノ秒単位で出力

* do_nothingは以下のような, 何もしないプログラム

In [24]:
%%writefile do_nothing.c
int main() {
  return 0;
}

Writing do_nothing.c


In [25]:
gcc -Wall do_nothing.c -o do_nothing

* $n$はコマンドラインから取得できるようにする
* 以下のコードを修正して上記を達成せよ

In [64]:

%%writefile time_fork_exec_wait.c
#include <err.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <time.h>
#include <sys/types.h>
#include <sys/wait.h>

long cur_time() {
  struct timespec ts[1];
  clock_gettime(CLOCK_REALTIME, ts);
  return ts->tv_sec * 1000000000L + ts->tv_nsec;
}

int main(int argc, char ** argv) {
  int n = (argc > 1 ? atoi(argv[1]) : 5);
  long t0 = cur_time();

  
  /* ここにプログラムを書く */
    for (int i = 0; i < n; i++) {
        pid_t pid = fork();
        if (pid == -1) {
            err(1, "fork");
        } else if (pid == 0) {
            char * const argv[] = { "/home/u23391/notebooks/os02_process/do_nothing", "-l", 0 };
            execv(argv[0], argv);
            err(1, "execv");
        } else {
            // waitpid(pid, NULL, 0);
            wait(NULL);
        }
    }

  
  long t1 = cur_time();
  long dt = t1 - t0;
  printf("%ld nsec to fork-exec-wait %d processes (%ld nsec/proc)\n",
         dt, n, dt / n);
  return 0;
}

Overwriting time_fork_exec_wait.c


In [65]:

gcc -Wall time_fork_exec_wait.c -o time_fork_exec_wait

* 以下のコマンドラインを色々変更して, 1回あたりの時間を計測せよ
* これは概ね, fork + exec + exit + wait の時間 (プログラムを起動して終了するまでにかかる最小の時間)を計測していることに相当する
* 正しく動いているかを確認するために, do_nothingで何かをprintするとか, time_fork_exec_wait中でwaitpidの結果を表示するようにせよ
* 時間を計測するときはそれらの表示を消すこと(消さないと, 測っているのは出力時間が大半を占めることになる)

In [66]:

./time_fork_exec_wait 10

11206483 nsec to fork-exec-wait 10 processes (1120648 nsec/proc)


* 子プロセスが do_nothing を exec する代わりに, 直ちにexit した場合の時間(fork + wait の時間)も計測せよ

In [67]:

%%writefile time_fork_exit_wait.c
#include <err.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <time.h>
#include <sys/types.h>
#include <sys/wait.h>

long cur_time() {
  struct timespec ts[1];
  clock_gettime(CLOCK_REALTIME, ts);
  return ts->tv_sec * 1000000000L + ts->tv_nsec;
}

int main(int argc, char ** argv) {
  int n = (argc > 1 ? atoi(argv[1]) : 5);
  long t0 = cur_time();

  
  /* ここにプログラムを書く */
    for (int i = 0; i < n; i++) {
        pid_t pid = fork();
        if (pid == -1) {
            err(1, "fork");
        } else if (pid == 0) {
            exit(0);
        } else {
            // waitpid(pid, NULL, 0);
            wait(NULL);
        }
    }
  
  long t1 = cur_time();
  long dt = t1 - t0;
  printf("%ld nsec to fork-wait %d processes (%ld nsec/proc)\n",
         dt, n, dt / n);
  return 0;
}

Writing time_fork_exit_wait.c


In [68]:

gcc -Wall time_fork_exit_wait.c -o time_fork_exit_wait

In [69]:

./time_fork_exit_wait 10

5754781 nsec to fork-wait 10 processes (575478 nsec/proc)
