# 機械学習関連知識

## 学習済の重み
入力データが出力にどれだけ影響を与えるかを示すパラメータ  
訓練の過程で更新され続ける値

In [None]:
# chkp_pathのパスを指定して、重みを読みこみそこから再開できる
chkp_path = None # 重みの初期値
continuation = False # 訓練を続きから再開する場合True

## 学習率
機械学習モデルの訓練中にパラメータ（重み）を更新する際、どの程度の幅で変化させるかを決める重要なハイパーパラメータ  


In [None]:
# 学習率
lr = 0.01

## 過学習
<img src='img/over_fitting.png'></img>  
引用元: [zeroone[G検定（AI・機械学習）用語集]](https://zero2one.jp/ai-word/overfitting-2/)
### 特徴
- モデルが訓練データの細かいノイズや例外にまで適応しすぎ、汎化性能（新しいデータに対する予測力）が低下すること
- 訓練データでの精度が非常に高い一方、テストデータでの精度が低くなること

### 防ぐ方法
- データを増やす
- 正則化 (Regularization)
- クロスバリデーション (Cross-Validation)
- モデルの単純化


## データ拡張 (Data Augmentation)
元の訓練データをさまざまな方法で変形・加工することで、データの量を人工的に増やし、モデルの汎化性能を向上させる手法

**画像の場合の手法**
- 回転: 画像を一定の角度で回転させる。
- 反転・フリップ: 左右や上下に画像を反転させる。
- ズーム: 拡大・縮小を行う。
- 平行移動: 画像を上下左右にずらす。
- 色調変化: 明るさやコントラスト、色相などを変える。

In [None]:
# data_augmentation = Trueにすることデータアーギュメント
data_augmentation = True

# dataset.py
# augment関数内でデータ拡張を行っている。今回は水平反転と回転。さらに追加してもOK
def augment(self, img, gt):
    # 同じシードでランダム変換を適用
    seed = torch.randint(0, 2**32, (1,)).item()
    
    # ランダム水平反転
    torch.manual_seed(seed)
    img = self.random_flip(img)
    torch.manual_seed(seed)
    gt = self.random_flip(gt)
    
    # ランダム回転
    torch.manual_seed(seed)
    img = self.random_rotation(img)
    torch.manual_seed(seed)
    gt = self.random_rotation(gt)
    
    return img, gt

## 正則化
機械学習モデルの複雑さを抑えるために、モデルのパラメータに制約を加え、過学習を防ぐ手法  
例）L1正則化（Lasso）、L2正則化（Ridge）

In [None]:
# weight_decayを入れることでL2正則化
torch.optim.Adam(model.parameters(), lr=0.001, weight_decay=1e-4)

## ドロップアウト（Dropout）
正則化手法の一つで、訓練中にランダムに一部のノード（ニューロン）を無効にして学習を行う方法 

In [None]:
# ドロップアウト
# pはドロップアウト率（0.2~0.5が一般的）
nn.Dropout(p=0.5)

# ヒント

## クロスエントロピー損失のクラスごとの重み（weight）
これを指定することで、各クラスごとの重みを指定することができる。  
最初の値から順番に'CLASSES'の値を示す。  
CLASSES = ['backgrounds','aeroplane','bicycle','bird','boat','bottle', 'bus','car' ,'cat','chair','cow', 'diningtable','dog','horse','motorbike','person', 'potted plant', 'sheep', 'sofa', 'train', 'monitor','unlabeld']

In [None]:
weight = torch.tensor([0.3, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 0.5])

## 損失関数の比率（dice_weight）

In [None]:
dice_weight = 0.5

# util.py
# class DiceCrossEntropyLoss
# 複合損失の計算
total_loss = (1 - self.dice_weight) * ce_loss + self.dice_weight * dice_loss