#### 2018年度 計算機システム(演習) 第5回 2019.01.08

遠藤 敏夫(学術国際情報センター/数理・計算科学系 教授) 野村 哲弘(学術国際情報センター/数理・計算科学系 助教)

# 本日の内容 (Outline)

- ▶ MIPSシミュレータの概要
- ▶ ALUの作成
  - ▶ Iビット加算器の作成
    - ▶ Signal, Pathを作成
    - ▶ Iビット論理演算ユニットの作成
      - □ AND, OR, NOTゲート etc ...
  - > 32ビット加算器の作成
  - ▶ IビットALU
  - ▶ 32ビットALU

# MIPSシミュレータの作成

### MIPSシミュレータ 完成図



▶ 4 詳細は、講義資料やパターソン&ヘネシー「コンピュータの構成と設計 第5版」の第4章を参考にしてください

### MIPSシミュレータ構築の流れ

- I. ALUの作成
- 2. レジスタファイル
- 3. メモリ領域
  - ▶ 命令用メモリ
  - データ用メモリ
- 4. PCの作成
- 5. メインコントロールユニット
- 6. ALUコントロールユニット
- 7. 機能拡張 (演習範囲外)
  - メモリアクセス命令
  - > 分岐命令

### MIPSシミュレータ 概略図



### 動作の流れ(一部)



### 動作の流れ(一部)



### MIPSシミュレータ 概略図



# 本日の内容 (Outline)

- ▶ MIPSシミュレータの概要
- ▶ ALUの作成
  - ▶ Iビット加算器の作成
    - ▶ Signal, Pathを作成
    - ▶ Iビット論理演算ユニットの作成
      - □ AND, OR, NOTゲート etc ...
  - > 32ビット加算器の作成
  - ▶ IビットALU
  - ▶ 32ビットALU

# 第1目標:ALU( )の作成

- ALU: Arithmetic Logic Unit
  - 演算論理装置
- ▶ 組み合わせ回路
  - AND, OR, NOT ゲートを使っ て作成
- ト 作成の順番
  - I. Iビット加算器 〈 ̄ 本日の内容
  - 2. 32ビット加算器
  - 3. IビットALU
  - 4. 32ビットALU



### Signal

#### mips.h

- 回路内の信号を表現
  - ▶ 信号は 0, I の値を持つ
    - ▶ 0は false で表現
    - ▶ I は true で表現
- enumを用いて表現
  - C言語の機能の一つ
  - 定数のリストを定義
    - ▶ リストの頭のものから順番に整数0, I, 2, …と定義される
    - 自分で定義することも可能 |

```
typedef enum {
    false, //false = 0
    true //true = 1
} Signal;
```

```
Signal s0 = true, s1 = false;
printf("s0 = %d\forall n", s0); // 1
printf("s1 = %d\forall n", s1); // 0
```

### ゲート

- 基本論理演算を実装した電子素子
- ▶ 3種類
  - AND, OR, NOT
- 入力から出力が決まる
  - ▶ 出力する信号を論理演算で決定する
  - 出力配線に新しい信号を設定する
- ▶ 関数にてゲートの機能を実現
  - 引数に入力信号 (signal) と出力信号のポインタ (signal \*)

#### AND Gate

- ▶ AND ゲートを表現
  - ▶ 論理積:A•B
    - ト 論理積は && 演算子で実現
  - ▶ 引数は入出力配線
  - 入力信号から出力信号を決定



| 入力1 | 入力2 | 出力1 |
|-----|-----|-----|
| 0   | 0   | 0   |
| 0   | 1   | 0   |
| 1   | 0   | 0   |
| 1   | 1   | 1   |

### AND Gate のコード例

```
Signal (in1) ANDGate Signal (out1)
```

```
void and_gate(Signal in1, Signal in2, Signal *out1)
{
   *out1 = in1 && in2; // 論理積
}
```

```
// テスト例
Signal a = true, b = false, out;
and_gate(a, b, &out);
printf("AND(%d, %d) => %d\forall n", a, b, out); //AND(1, 0) => 0
```

gate.c

### OR Gate, NOT Gate

論理和 (||)

| 入力1 | 入力2 | 出力1 |  |
|-----|-----|-----|--|
| 0   | 0   | 0   |  |
| 0   | 1   | 1   |  |
| 1   | 0   | 1   |  |
| 1   | 1   | 1   |  |



否定 (!)

| 入力1 | 出力1 |  |
|-----|-----|--|
| 0   | 1   |  |
| 1   | 0   |  |

#### NAND Circuit

- ▶ 組み合わせ回路
  - ▶ AND Gate と NOT Gate の組み合わせ
    - ▶ 内部状態を持たない
    - ▶ 出力は入力のみに依存
  - ▶ 回路を構成
    - ▶ 内部配線でゲート同士を接続

| 入力1 | 入力2 | 出力1 |  |
|-----|-----|-----|--|
| 0   | 0   | 1   |  |
| 0   | 1   | 1   |  |
| 1   | 0   | 1   |  |
| 1   | 1   | 0   |  |



#### NAND Circuit のコード例

```
void nand_circuit (Signal in1, Signal in2, Signal *out1) {
    Signal inner; //内部配線
    // 内部配線をつかってAND Gateの出力とNOT Gateの入力を接続
    and_gate(in1, in2, &inner);
    not_gate(inner, out1);
}
```

#### **XOR Circuit**

#### XOR

- ▶ 排他的論理和: exclusive or
- Not Equal
  - ▶ 2つの入力値が異なる場合に真
- → A•B + A•B と等価

| 入力1 | 入力2 | 出力1 |
|-----|-----|-----|
| 0   | 0   | 0   |
| 0   | 1   | 1   |
| 1   | 0   | 1   |
| 1   | 1   | 0   |



# 1ビット全加算器 (FA) (1/2)

- ▶ 全加算器(Full Adder)
  - ▶ 桁上がり(Carry In)を入力に受け付ける
    - ▶ c.f) 半加算器(Half Adder): 桁上がりを入力に取らない
- ▶ 講義スライドの論理式
  - $\rightarrow$  sum = A xor B xor  $C_{in}$
  - $C_{out} = A \cdot B + A \cdot C_{in} + B \cdot C_{in}$
- 実装に使用する論理式
  - $\rightarrow$  sum = A xor B xor C<sub>in</sub>
  - $C_{out} = A \cdot B + (A \times B) \cdot C_{in}$



# 1ビット全加算器 (FA) (2/2)



| 入力<br>1 | 入力<br>2 | Carry<br>In | 出力<br>1 | Carry<br>Out |
|---------|---------|-------------|---------|--------------|
| 0       | 0       | 0           | 0       | 0            |
| 0       | 1       | 0           | 1       | 0            |
| 1       | 0       | 0           | 1       | 0            |
| 1       | 1       | 0           | 0       | 1            |

| 入力<br>1 | 入力<br>2 | Carry<br>In | 出力<br>1 | Carry<br>Out |
|---------|---------|-------------|---------|--------------|
| 0       | 0       | 1           | 1       | 0            |
| 0       | 1       | 1           | 0       | 1            |
| 1       | 0       | 1           | 0       | 1            |
| 1       | 1       | 1           | 1       | 1            |

#### AND-N Gate, OR-N Gate

- ▶ n 入力の AND GateとOR Gate
  - ▶ 回路ではなくfor文で処理
- ▶ (ORN Gateは省略)

```
void andn_gate(Signal *in1, int n, Signal *out1) {
   int i;
   Signal s = true;
   for (i = 0; i < n; ++i) {
      if (in1[i] == false) {
        s = false;
        break;
      }
   }
   *out1 = s;
}</pre>
```

### 2進数(復習)

- ▶ 2進数を10進数に変換するには?
- ▶ 10進数を2進数に変換するには?
- ▶ 2進数の符号を逆転するには?(2の補数)
- ▶ (2007年院試問題より)
  - 」 整数の20と-20のビット表現はそれぞれ00010100と L1101100となる. -40 のビット表現を答えよ.
  - 2) 整数を表現するのに,最上位ビットで符号を表し,その他のビットで数の絶対値を表す方法も考えられる.たとえば,この方法で-20 を表すと 10010100 と なる.この方法と前述の 28 を法とした方法を比較し,28 を法とした方法が優れている点を論じよ.

#### 2進数と16進数

▶ I0進数よりも、I6進数の方が2進数と相性が良い

#### ▶ 問:

- F<sub>(16)</sub> は、2進数でどう表現されるか?10進数では?
- 2) II<sub>(16)</sub>は、32ビット2の補数ではどう表現されるか?
- 3) 1000....0000 (32ビット2の補数表現)は、どのような数か? 16進数で書くと?

### 32ビット加算器

- 入力配線
  - ▶ 32本 2組
- ▶出力配線
  - ▶ 32本
- Signalが多すぎて取り扱いにくい
  - ▶ 信号を1つ1つ設定するのは大変



### Word 構造体

- ▶ 信号 (Signal) の集合をバスとして表現
  - ▶ Signal の配列を持つ
- Word構造体と関数
  - void word\_set\_value(Word \*w, int val)
    - 指定された数値を二進数で表すように各 SIgnalを設定
    - ▶ 例) val=5 => 00...00101
  - int \_word\_get\_value(Word w)
    - ▶ 各配線の信号が表す二進数の数値を返す
    - ▶ 例) 00...00101 => 5



```
typedef struct {
   Signal bit[32]
} Word;
```

# Word 構造体のコード (1/2)

```
// valの値を表すように配線に信号を設定
void word set value(Word *w, int val)
  int i:
  for (i = 0; i < 32; ++i) {
    if ((val & 0x1) != 0) { // ビットが立っていたら
     w->bit[i] = true;
    else {
     w->bit[i] = false:
   val >>= 1; //1ビット右シフト
```

Ox: 16進数 L: long型

#### 4bitでのsetValue(3)



# Word 構造体のコード (2/2)

```
// 配線の信号によって表される整数値を返す
int word get value(Word w)
 int i, val = 0;
 for(i = 31; i >= 0; --i) {
   val <<= 1; // 1ビット左シフト
   if (w.bit[i]) {
     val++; // 信号が1ならビットを立てる
 return val;
```

0x: 16進数 L: long型

#### 4bitでのsetValue(3)



# 32ビット Ripple Carry Adder

- ▶ Iビット全加算器(FA)を32 個つなげた加算器
  - ▶ FA₀を実行
  - ▶ キャリーC<sub>I</sub>をFA<sub>I</sub>に伝播
  - ▶ FA<sub>I</sub>を実行

  - キャリーC31をFA31に伝播
  - ▶ FA<sub>31</sub>を実行



### RCAのコード

```
void rca(Word in1, Word in2, Signal carry_in,
Word *out1, Signal *carry_out) {
    // FAをつなげる (for文を使ってよい)
}
```

### Carry Lookahead Adder (1/2)

- ▶ Ripple Carry Adder の問題
  - キャリーの伝播のために FA を一つずつしか実行できないため、遅い
- 同時により多くのビットを計算できないか?
  - あらかじめキャリーが計算できればよい
  - トキャリーは c<sub>i+1</sub> = g<sub>i</sub> + p<sub>i</sub> c<sub>i</sub> の関係を満たす
    - $\triangleright$   $g_i = a_i \cdot b_i : Generator$
    - $p_i = a_i + b_i$ : Propagator
  - 前回はc<sub>i+1</sub> = a<sub>i</sub> b<sub>i</sub> + (a<sub>i</sub> xor b<sub>i</sub>) c<sub>i</sub> とした



### Carry Lookahead Adder (2/2)

#### ▶ この式を展開していくと

```
ト c_1 = g_0 + p_0 c_0

ト c_2 = g_1 + g_0 p_1 + p_0 p_1 c_0

ト c_3 = g_2 + g_1 p_2 + g_0 p_1 p_2 + p_0 p_1 p_2 c_0

ト c_4 = g_3 + g_2 p_3 + g_1 p_2 p_3 + g_0 p_1 p_2
```

- この計算を行うPFA (Partial FA) と CLA (Carry Lookahead Unit) 導入
  - PFA
    - ▶ 入力: Bus a, b, Path carry
    - ▶ 出力: g, p, s
  - ▶ CLA
    - ▶ 入力: g<sub>0</sub>~g<sub>3</sub>, p<sub>0</sub>~p<sub>3</sub>, c<sub>0</sub>
    - ▶ 出力: c<sub>1</sub>~c<sub>4</sub>

# 4ビット Carry Lookahead Adder

- ▶ PFA (Partial FA)
  - ▶ g<sub>i</sub>, p<sub>i</sub>を計算
  - ▶ s<sub>i</sub> (sum)を計算
    - $\rightarrow$   $a_i$  xor  $b_i$  xor  $c_i$
- Carry Lookahead Unit (CLU)
  - ▶ c<sub>1</sub>~c<sub>3,</sub> carry out を計算
- ▶動作
  - I. PFA: g<sub>i</sub>, p<sub>i</sub> を計算
    - ここで出力されるs<sub>i</sub>は c<sub>i</sub> =0の場合
  - 2. CLU: c<sub>1</sub>~c<sub>3.</sub> carry out を計算
  - 3. PFA: s<sub>i</sub> を計算
    - ここで正しいsiが出力



#### PFA

#### ▶ 以下のようにPFAを実装



※PFA0用のcarry in.



# 16ビット Carry Lookahead Adder

#### ▶ 4bit CLAのCarry-inの計算

- Cはどのように記述されるか?
  - ► C<sub>1</sub> = "4bit CLA0のcarry-out"
    - $C_1 = g_3 + g_2 p_3 + g_1 p_2 p_3 + g_0 p_1 p_2 p_3 + p_0 p_1 p_2 p_3 + p_0 p_1 p_2 p_3$
  - $Arr C_2$  = "4bit CLAI  $\Omega$  carry-out"
  - $C_3 = \text{``4bit CLA2} \sim \text{''}, C_4 = \text{``4bit CLA3} \sim \text{''}$
- 以下のように一般化すると
  - $G_{i} = g_{3+4xi} + p_{3+4xi} g_{2+4xi} + p_{3+4xi} p_{2+4xi}$   $g_{1+4xi} + p_{3+4xi} p_{2+4xi} p_{1+4xi} g_{0+4xi}$
  - $P_{i} = P_{0+4xi} P_{1+4xi} P_{2+4xi} P_{3+4xi}$
- Cは以下のように記述できる
  - $C_1 = G_0 + P_0 C_0$
  - $C_2 = G_1 + P_1 C_1$ =  $G_1 + G_0 P_1 + P_0 P_1 C_0$
  - $C_3 = ..., C_4 = ...$
- ▶ 16bit CLAにおけるCLU
  - ▶ 4ビットの場合と全く同じ回路
  - 备 4ビット CLA の carry in を計算



# 32ビット Carry Lookahead Adder

▶ 16ビット Carry Lookahead Adder を2つつなげる



# 注意: Carry Lookahead Adder の性能

- ▶ ハードウェアで作った場合に速くなる回路
  - C<sub>1</sub> ~ C<sub>4</sub> が並列に(同時に)計算できるため
    - C<sub>i</sub> から C<sub>i+1</sub> を逐次計算するより速い
- ▶ シミュレータとして作った場合にはむしろ遅くなる
  - ▶ プログラムを並列化していない
  - ▶ 回路がより複雑になるため
    - ▶ 計算量が増える



# Ripple Carry Adder と Carry Lookahead Adderの速度の違い

- Carryが最下位(0)ビットから最上位(31)ビットまで伝播 されるときに通過するゲート数を数える
  - ▶ ANDGateとORGateのおよその通過数を数える
    - ▶ 2つのゲートの実行時間は同じ
    - ▶ 並列に計算できる計算も考慮

▶ 加算器では、このCarryの伝播がクリティカルパスになる

# Ripple Carry Adder の場合

- ▶ Iビット全加算器のCour計算
  - $C_{out} = A \cdot B + A \cdot C_{in} + B \cdot C_{in}$ 
    - ► ANDGate 並列3個 →I回
    - ▶ ORGate 逐次2個 →2回
  - ▶ 計:3ゲート



▶ 32ビット伝搬ゲート数

▶ およそ32x3=96ゲート



# Carry Lookahead Adderの場合:1

#### I. PFAでgi, piを計算

- ▶ gi = ai•bi, pi = ai+bi (並列)
- ▶ 32ビットで並列計算
- ▶ 計:\_ゲート
- 2. 4ビットCLA内のCLUでGi,Pi を計算
  - $G_{i} = g_{3} + p_{3} g_{2} + p_{3} p_{2}g_{1} + p_{3} p_{3}g_{2} + p_{3} p_{2}g_{1} +$
  - $P_i = P_0 P_1 P_2 P_3$



# Carry Lookahead Adderの場合: 2

#### 2. (つづき)

- ▶ 図のように回路を構成すれば、 最長パスはGi計算のゲート
- 全8個の4ビットCLAで並列計 算可能

#### 3. 下位16ビットCLAで CarryOutを計算

- C<sub>out</sub> = G3 + G2 P3 + G1 P2 P3 + G0 P1 P2 P3 + P0 P1 P2 P3 c0
- パスは\_ゲート

#### Gi 計算回路



#### Pi 計算回路



# Carry Lookahead Adderの場合:3

- 4. 上位16ビットCLAで各4ビットCLAへのCarryInを計算
  - ▶ 最長パスは3と同じ \_ ゲート
  - ただし最上位4ビットCLAへのCarryIn計算には \_ゲート
    - 合計の方には下の方を用いる
- 5. 4ビットCLAで各桁へのCarryInを計算
  - ▶ 最長パスは最上位ビットの\_ゲート
- ▶ 以上で、32ビット各桁へCarryがいきわたる
  - 合計: およそ\_ゲート

# MIPSシミュレータの プログラムについて

#### MIPSシミュレータプログラム

- ▶ こちらから雛形を提供します
  - ▶ (本日の資料としてOCW-iに掲載)
  - mips\_simulator
    - src
      - □ プログラムのソースファイルを置くフォルダ
    - ▶ bin
      - □ バイナリファイル(実行ファイル)が生成されるフォルダ
    - obj
      - 各ソースファイルがコンパイルされた状態のもの が保管されているフォルダ
    - ▶ mips.h
      - □ ヘッダファイル
    - Makefile
      - □ コンパイルを簡単にするためのもの
  - ディレクトリ構造は変更しないことを推奨

```
mips_student
    Makefile
    bin
    mips.h
    obj
    src
        adder.c
        alu.c
        control_unit.c
        gate.c
        memory.c
        mips.c
        reg_file.c
        test.c
        word.c
```

#### ヘッダファイル

- 規模が大きい場合、もしくは管理を行いやすくするため に一つのプログラムを複数のファイルに分ける
  - ▶ 通常、別の.cファイルで定義された変数や関数を使うことはで きない
- 複数のファイル内で共有されるべき定数や変数、関数を 定義する
  - 対応するcファイルではヘッダファイルをincludeする

```
#include "inc.h"
int inc(int a) {
    return a + 1;
         inc.c
```

```
int inc(int a);
     inc.h
```

```
#include <stdio.h>
#include "inc.h"
int main() {
    int a, b;
    a = 2;
    b = inc(a);
    printf("%d\forall n", b);
    return 0;
```

# ヘッダファイル (続き)

- ▶ includeする時の記述方法について
  - #include <stdio.h>
    - ▶ C言語の標準ライブラリや "-I(ディレクトリ名)"で指定した場所にある ヘッダファイル
  - #include "inc.h"
    - コンパイル時のディレクトリにあるヘッダファイル

#### オブジェクトファイル

- ▶ ソースファイルをバイナリ(0,1の列)にしたもの
  - ▶ 各ファイルごとにオブジェクトファイルを生成し、結合することで実行ファイルが生成される
  - ▶ オブジェクトファイル単体では実行できず、他の必要なライブラリ等と結合する必要がある
  - ▶ コンパイル時に-cオプションをつけることで生成される

```
gcc -c inc.c //オブジェクトファイルinc.oを生成
gcc -c main.c //オブジェクトファイルmain.oを生成
gcc -o inc inc.o main.o //実行ファイルincを生成
./inc //実行ファイルincを実行
```

#### Makefile

#### コンパイル作業の自動化

- ▶ 大規模なプログラムの実装において、一部のプログラムを変 更しただけなのにすべてのプログラムをコンパイルし直すの は無駄
- コンパイルのたびに長いコマンドを書くのは面倒



# Makefileの例 (MIPSシミュレータ)

```
CC = gcc # \frac{1}{2} \frac
CFLAGS = -Wall -O3 -g #コンパイルオプション
INCLUDE = -I. #ヘッダファイルがあるディレクトリを指定
BIN = ./bin
                                                                                                                                                           変数の官言と代入が可能
SRC = ./src
                                                                                                                                                           変数を参照するときには変数名の頭に$をつける
OBJ = ./obj
                                                                                                                                                           #でコメントが書ける
OBJ TEST = $(OBJ)/test.o
OBJS = $(OBJ)/word.o $(OBJ)/gate.o $(OBJ TEST)
all: # make もしくは make all と書いた時に実行される
                                     make test
test: $(OBJS)
                                      $(CC) $(CFLAGS) $(INCLUDE) -0 $(BIN)/$@
$(OBJS)$(OBJ)/%.o : $(SRC)/%.c
                                      mkdir -p $(dir $@)
                                      $(CC) -c $(CFLAGS) $(INCLUDE) -o $@ $<
clean : # 生成されたものを削除
                                      rm -rf $(BIN)/*
                                      rm -rf $(OBJ)/*
```

# Makefileの使用例 (MIPSシミュレータ)

```
#Makefileのあるディレクトリに移動
#コンパイル
$ make test
#生成された実行ファイルtestを実行する
$ ./bin/test
#実行結果が表示される
#生成された実行ファイルやオブジェクトファイルを削除する
#こちらは必要に応じて実行する
$ make clean
```

# Makefileの編集 (MIPSシミュレータ)

▶ 新たに adder.c をコンパイルの対象として追加する

```
OBJ = ./obj
OBJ_TEST = $(OBJ)/test.o
OBJS = $(OBJ)/word.o $(OBJ)/gate.o $(OBJ)/adder.o $(OBJ_TEST)
// make testのところでは拡張子.oとしてファイルを見つけたい
// 拡張子を.oとして、$(OBJ_TEST)の前に追加
```

# 課題の解き方

- ▶ 各課題に対応するファイルを編集します
  - ▶ 第5回: gate.c, adder.c
  - ▶ 第6回: alu.c
  - ▶ 第7回: reg\_file.c, memory.c
  - ▶ 第8回: control\_unit.c
  - ▶ 必要に応じてMakefileも
- ▶ main関数はtest.cにあります
  - ▶ 各課題でテスト関数を作り、main()から呼び出す
    - ▶ 最初は呼び出し部分が殆どコメントアウトされているはず

# コンパイル・実行の方法

#### コンパイル

- ▶ 下記の通りコマンドを実行、Makefileに従って自動的にコンパイルされる
  - \$ make test
  - ▶ エラーがなければ最終的に /bin/test に出力される)

#### ▶ 実行

- 下記の通りコマンドを実行
  - \$ ./bin/test
  - コンパイルエラーを起こしていると、古いtestを実行することがあるので注意

#### 演習室以外での環境について

- ▶ MacやLinux系はコマンドでmakeが使えると思います
  - 入っていない場合は各自で調べてインストールしてください
- ▶Windowsの場合
  - ▶ cygwin: インストーラでmakeを追加
- ▶ どうしてもmakeが使えない場合
  - 逐一丁寧に全部書いてコンパイルしてください

gcc -Wall -03 -g -o bin/test -I. src/word.c src/gate.c src/test.c

- ▶ OR Gate, XOR Circuitの各関数を作成せよ
  - ▶ OR GateはAND Gateと同様にC言語の演算子を使ってよい
  - ▶ XOR Circitは、各種Gateを組み合わせて作ること
  - ▶ すべての入力についてそれぞれが正しい結果を返すことを確認すること
    - ▶ n入力の論理回路に対して、出力は 2<sup>n</sup> パターンある
    - ▶ gate.c の test\_gate に追記する
      - □ AND Gate等のものを参考に

- ▶ Iビット全加算器を作成せよ(FA)
  - ▶ テストケースを作成し、レポートにはその実行結果も含める
    - ▶ 8入力パターンすべて試すこと

- ▶ 32ビットの Ripple Carry Adder (RCA)を完成させよ
  - ▶ adder.cのtest\_rcaにてテストをすること

- ▶ 32ビットでのRCAとCLAを比較せよ
  - ▶ AND GateとOR Gateの数をもとにして、クリティカルパスを考え よ
    - ▶ 先のページの空白部分を適宜補完して、レポートにまとめる
  - ▶ RCAと比較しつつ、CLAの利点を述べよ

#### 課題提出

- ▶ 〆切: I/I8 (金) 23:59
- ▶ 提出物:以下のファイルをIつのファイルに圧縮したもの
  - ▶ プログラムソース (gate.c と adder.c)
    - シミュレータ全体ではなく、関係するコード(変更したファイル)のみ 提出すること
    - 作成したプログラムは今後も使用するため、十分にテストすること
  - トドキュメント
    - > 実行結果
    - ▶ 課題4について
    - ▶ 感想等
- ▶ 質問等があれば compsys 18@el.gsic.titech.ac.jp まで
  - 課題のレポートやコメントに書かれていると、返信が遅くなります

# 課題フィードバックについて

- ▶ I/8 I2:00までに提出された第I~4回課題は確認済み
  - ▶ 問題点がある方にはメールしていますので、現時点でメールが来ていない場合は合格点を取れています。
  - 期限後提出の方にも大きな問題点があれば連絡はする予定ですが、課題の確認の頻度は減りますので、忘れたころの連絡になるかもしれません
- ▶ 本日返信した課題フィードバックに対応する修正は、 I/II 13:20までの提出に限り、期限内の修正と扱います

# 課題フィードバックについて

#### ▶ 質問抜粋

- ▶ aレジスタってcaller/callee-save どっち?
  - ▶ caller-saveです 第4回資料p.28/29の誤りでした
  - 引数を入れるので、関数呼び出しにおいて必然的に壊されることに 注意
  - ▶ 関数から戻ってきたときにaレジスタの内容が保存されている保証はない

# 課題フィードバックについて

#### ▶ 質問抜粋

- どのレジスタを保存しなければいけないかが分からない
  - ▶ 呼び出し元・呼び出し先の中身がブラックボックスでも動くように
  - caller-save (t/v/a)

呼び出し元 (caller) 関数呼び出し後以降に 使うものは自分で退避

呼び出し先 (callee) どのt/vを壊すか不明

callee-save (s/ra)

呼び出し元 (caller) どのs/raを以後必要と しているか不明 呼び出し先 (callee) 関数内で壊したs/raは 自分で復元