Google Colabを用いる際には，Driveをマウントする必要があります．

In [None]:
from google.colab import drive
drive.mount('/content/drive')

**環境構築**

リモートリポジトリからディレクトリをcloneします．あなたのgithubのidとpasswordを入力してください．

In [None]:
git_id = ''
git_password = ''
folder_name = 'SemanticSegmentation'

!git clone  https://$git_id:$git_password@github.com/RUTILEA/o-semantic-segmentation "drive/My Drive"/$folder_name

In [None]:
%cd drive/MyDrive/$folder_name/
!bash requirements/get_pretained_weights.sh
!bash requirements/get_sample_datasets.sh
!pip install -r requirements/mac_0828.txt
%cd ../../../

用いるディレクトリのパスを入力します．srcやdatasetのあるメインのディレクトリ名を指定します．
colabの場合はそのまま，jupyterの場合はコメントアウトを変更してください．

In [None]:
from pathlib import Path

data_path = Path(f"/content/drive/My Drive/{folder_name}")#colabの場合
# data_path = Path('./')#jupyterの場合

src以下のライブラリをインポートするための準備をします．

In [None]:
import sys
sys.path.append(str(data_path.joinpath('src')))

学習

In [None]:
import datetime
import collections
from utils import calc_weights_of_crossentropy, CallbackForSegmentation
import utils
import train
import numpy as np
import importlib
import train
importlib.reload(utils)
importlib.reload(train)
from tensorflow.keras.callbacks import ModelCheckpoint, EarlyStopping, TensorBoard, ReduceLROnPlateau, CSVLogger

用いるデータセット名を指定します．dataset内のディレクトリを指定します．データセットは指定された形である必要があります．

`dataset/`を作成し、その中に今回使うデータセットのディレクトリ（今回は`sample/`）を準備します。
その中に、以下の４つのディレクトリを作成し、それぞれ画像を格納します。
- `dataset/sample/train/image`: 訓練用画像
- `dataset/sample/train/label`: 訓練用ラベル
- `dataset/sample/test/image`: 評価用画像
- `dataset/sample/test/label`: 評価用ラベル

In [None]:
#　データセット名を指定
dataset = 'sample'

dataset_path = data_path.joinpath('dataset', dataset)
print(dataset_path)

assert dataset_path.is_dir()

ラベル情報，訓練画像のサイズ，学習の記録(これがcallbackのディレクトリ名になります)，学習時に推論するための画像データ，ラベルデータ名を定義します．

ラベル情報はOrderedDict型で定義します。キーはクラス名、値はそのクラスのラベル画像でのRGB値としてください。

- `img_shape`: 学習に使う画像の解像度を指定します。データセットの画像はこのサイズにランダムな位置でクロップされます。`(256, 256)`か`(512, 512)`を選択してください。これ以外のサイズにも変更可能ですが，設定の関係で4の倍数でのみ正常に作動します．

- `params`: Data Augmentation用のパラメータです．詳しくは[こちら](https://keras.io/ja/preprocessing/image/)を見てください．

- `description`: どういう設定で学習したらうまくいくのかを覚えておくのは難しいので、識別できるような内容をあらかじめここに書いておくのをお勧めします。形式は自由です。
デフォルトではデータセット名，使用モデル名，学習率の3つを記述しています．

- `test_img_name`: 学習時に推論するための画像のデータのファイル名

- `test_label_name`: 学習時に推論するためのラベルのデータのファイル名

- `model_name`:`UNet`あるいは`Deeplabv3`が利用できます。

In [None]:
# ラベル情報の定義(RGBの順)
label_info = collections.OrderedDict()
label_info["background"] = (0, 0, 0)
label_info["genmai"] = (0, 128, 0)
label_info["trash"] = (128, 0, 0)

# 訓練画像のshape (height, width, channel)
img_shape=(512, 512, 3)

# Data Augmentationのパラメータ
params = {
    'rotation_range': 20,
    'horizontal_flip': True,
    'vertical_flip': True,
    'random_crop': img_shape[:2],
    'fill_mode': 'reflect',
}

# 学習用のパラメータ
steps_per_epoch=80
epochs=300
validation_steps=8
batch_size=3
lr=1e-4  # Optimizerの学習率
model_name = "Deeplabv3" # choose model, 'Deeplabv3' or 'Unet'

# どういう設定で学習したのかを記録する用途（形式自由）
description=f"{dataset}_{model_name}_lr_{lr}"  

# 学習時に推論する設定
test_img_name='img_104.jpg'  # 画像データ
test_label_name='label_104.png'  # ラベルデータ

以下，callbackの設定をします．

`CallbackForSegmentation`は、以下の機能を提供します。

- 各エポックの学習が終わった後のモデルで推論をし、`weights/~~~/images/`以下に結果が保存されます。ファイル名には、今のエポック数・クラス名・IoUが含まれています。
- Ground Truthと比較してmIoUを算出します。
- この値は、Keras標準で付属している`CSVLogger`によって`weights/~~~/log.csv`に保存されます。`CSVLogger`は`CallbackForSegmentation`より後ろに配置する必要があります。

In [None]:
# 下準備
weight_id = f"{datetime.datetime.now().isoformat(timespec='seconds')}_{description}"
weight_path = data_path.joinpath("weights")
weight_path.mkdir(exist_ok=True)
weight_path = weight_path.joinpath(weight_id)
weight_path.mkdir(parents=True)
log_path = weight_path.joinpath("log")
log_path.mkdir()

# callbackの設定
ckpt = ModelCheckpoint(
        filepath=str(log_path / 'ep{epoch:03d}-loss{loss:.3f}-val_loss{val_loss:.3f}.h5'),
        monitor='val_loss',
        save_best_only=True,
        save_freq='epoch',
        save_weights_only=False
)

early_stop = EarlyStopping(
    monitor='val_mIoU',
    patience=15,
    restore_best_weights=True
)

cb_for_sg = CallbackForSegmentation(
    validation_img_path=dataset_path/"test/image/"/test_img_name,
    ground_truth_path=dataset_path/"test/label/"/test_label_name,
    label_info=label_info,
    model_path=weight_path,
    train_img_size=(img_shape[0], img_shape[1]),
    period=1
)

reduce_lr = ReduceLROnPlateau(min_lr=1e-6, patience=4, cooldown=2, monitor="val_mIoU")
t_board = TensorBoard(log_dir=str(weight_path / "board"))

csv = CSVLogger(filename=str(weight_path / "log.csv"))

callbacks = [cb_for_sg, ckpt, early_stop, reduce_lr, csv]

学習を行います．学習済みのモデルを読み込む場合には，最初のmodelと，train.run内のmodelのコメントアウトを戻してください．
学習率，バッチサイズ等，任意に変更することができます．

- `weights_of_crossentropy`: このライブラリでは普通の交差エントロピーではなく、重み付き交差エントロピーを用いています。
これにより、クラス間で出現頻度に大きな偏りがある場合でも効率よく学習を進められます。
`calc_weights_of_crossentropy`関数を用いることで、それぞれのクラスの出現数から自動的に適した重みを算出できます。`* np.array([1., 3., 1.])`のように、さらにそれに重み付けをすることができます。

In [None]:
# 学習済みモデルの読み込み
# model = load_model(filepath="", custom_objects={"weighted_cross_entropy": weighted_crossentropy_wrapper(base_weights_of_crossentropy), 'tf': tf})

base_weights_of_crossentropy = calc_weights_of_crossentropy(dataset_path=dataset_path, label_info=label_info)
print("base_weights_of_crossentropy:", base_weights_of_crossentropy)

print(f"##### START ######\n{weight_id}")
train.run(
        img_shape=img_shape,
        params=params,
        steps_per_epoch=steps_per_epoch,
        epochs=epochs,
        validation_steps=validation_steps,
        batch_size=batch_size,
        lr=lr,  # Optimizerの学習率
        weights_of_crossentropy=base_weights_of_crossentropy * np.array([1., 3., 1.,]),
        dataset_path=dataset_path,
        weight_path=weight_path,
        model_name=model_name,
        callbacks = callbacks,
        # model=model,
        label_info=label_info,
        description=description,
)

推論

In [None]:
from tensorflow.keras.models import load_model, Model
from utils import weighted_crossentropy_wrapper, get_paths_in_dir
import tensorflow as tf
import inference
importlib.reload(inference)

推論に使用するモデルのh5ファイルの絶対パスや，フォルダ名等を指定してください．

ModelCheckpointによって保存された`log/`内のweightも指定できます。

ラベル情報や`train_img_size`は，学習の時に用いたものと同じものを定義します。


In [None]:
# パス・名前の設定
weight_path = Path("")  # 使うモデルの設定
target_name = "genmai_masked"  # inference_targetの中のフォルダ名
result_name = "genmai_masked_01"  # inference_resultの作成するフォルダ名

label_info = collections.OrderedDict()
label_info["background"] = (0, 0, 0)  # RGB
label_info["genmai"] = (0, 128, 0)
label_info["trash"] = (128, 0, 0)


target_dir_path = data_path.joinpath("inference_target", target_name)
result_path = data_path.joinpath("inference_result", result_name)
result_path.mkdir(exist_ok=True)
assert weight_path.is_file() and target_dir_path.is_dir()
model: Model = load_model(str(weight_path), custom_objects={"weighted_cross_entropy": weighted_crossentropy_wrapper([1., 60., 60.]), 'tf': tf})
image_paths = get_paths_in_dir(target_dir_path)


for target_img_path in image_paths:
    print("processing...")
    inference.run_inference(target_img_path=target_img_path, label_info=label_info, model=model, train_img_size=(512, 512), result_path=result_path)
