# **肺野セグメンテーションをやってみよう**
画像処理における「セグメンテーション」とは，ある画像における関心領域を色塗りしたり，輪郭を特定したりする作業のことを言います． \
今回は，肺野セグメンテーションと称して，胸部X線単純写真から肺野を抽出する課題に挑戦してみましょう．\
\
データセットとしては，[日本放射線技術学会 画像部会 miniJSRT_database](http://imgcom.jsrt.or.jp/minijsrtdb/)が公開してくださっているSegmentation01を利用します(図１)．

<div style="text-align: center;">
<IMG SRC="https://drive.google.com/uc?id=1VhdvY9JA8hB9R2T55KCqec2Gi7H-CR0n" width="70%"> 
<br>
図1
</div>

## **深層学習によるセグメンテーション**
セグメンテーションの課題に対しては，「ピクセル毎の分類問題を解く」という問題設定で深層学習を適用することが一般的です．
最も簡単な例としては，正方形のパッチを切り取っては，中心のピクセルが関心領域であるかを分類することを，ピクセル数だけ繰り返す方法があります（図2）．

<div style="text-align: center;">
<IMG SRC="https://drive.google.com/uc?id=1TsLF3fkFbdpP5X9RfKHC1S5DFbI_MAXV" width="70%"> 
<br>
図2
</div>

これにより，実質的にはピクセルの数だけ画像がある問題としてみなすことができ，比較的少ない症例数でも所望の結果を出しやすくなります．\
しかし，この手法では，あまり広い範囲を考慮して分類することができない点や，ピクセルの数だけ行われる学習や推論を効率的に行うことが難しい点が課題になります．これらを解決するアイデアとして，Fully Convolutional Networks（FCN）[引用]という深層学習モデルが開発されました（図3）

<div style="text-align: center;">
<IMG SRC="https://drive.google.com/uc?id=1XUW-uNNhPtDHd26AEcm1LLXkS8hHZ56v" width="70%"> 
<br>
図3　Fully Convolutional Networks[引用]
</div>

そして，このFCNを改良し，現時点で医用画像セグメンテーションにおけるデファクトスタンダードとして利用されるようになったのがU−Netです【引用】（図4）．

<div style="text-align: center;">
<IMG SRC="https://drive.google.com/uc?id=1H-VmyDCTV1IU9-o8AihHsJ6wHCJWJjn-" width="70%"> 
<br>
図4　U-Net[引用]
</div>


今回取り組む肺野セグメンテーションでは，このU-Netを使っていきましょう！\
全体の流れを以下に示します．

## **プログラム全体の流れ**
- データローダの作成
- U-Netの定義
- 誤差関数の定義
- 学習ループの設計
- モデルの学習
- モデルの評価

### **データローダの作成**
深層学習を実践する上で最も重要かつ面倒なのは，画像等のデータを読み込む部分（データローダ）を作り込むことだと言っても過言ではありません．作り方の方針は色々考えられますが，ここではPytorchを使った実践でよく行われる方法を説明します．\
データローダの実装にあたり，まずはミニバッチ学習という概念を思い出しましょう（図5）．

<div style="text-align: center;">
<IMG SRC="https://drive.google.com/uc?id=1rWgWkMT0LLv17p21C2NQMjPh_bkJ_Fcu" width="70%"> 
<br>
図5　ミニバッチ学習のおさらい
</div>

深層学習では，手持ちのデータを1つずつ入力したり，すべてまとめて入力したりするのではなく，ミニバッチというグループ単位で入力し，パラメータの調整が行われることが一般的です．\
この処理を実現するためには，手持ちのデータをグループに分け，それらのグループを順番に取り出すような機能を持つデータローダを作る必要があります．なおかつ，データの読み込みが一巡したら全体をシャッフルし，改めてグループ分けを行う機能も必要です．さらには，データをニューラルネットワークにすぐに流し込めるように，予め最適な形に変換しておく機能も欲しいところです．\
要求がたくさんあって混乱してくるかもしれませんが，Pytorchでは，
- どのデータを使うか
- そのデータはいくつあるのか
- それぞれのデータはどのような形であってほしいのか

以上3つをきちんと記述すれば，上記の要求をすべて満たすことができてしまいます．

では実際にデータローダを設計していきましょう．


配布したデータのフォルダ構造は，以下のようになっています．\
data\
&emsp; \- train\
&emsp;&emsp;&emsp; \- label\
&emsp;&emsp;&emsp; \- org\
&emsp; \- val\
&emsp;&emsp;&emsp; \- label\
&emsp;&emsp;&emsp; \- org\
&emsp; \- test\
&emsp;&emsp;&emsp; \- label\
&emsp;&emsp;&emsp; \- org

データをtrain, validation, testに分ける意義については，【リンク】をご覧ください．\
画像部会が公開している形式では，trainとtestのみに分かれていますが，配布資料一式の中には，あらかじめtrainのうち10例をvalとして分け直したものが含まれています．

上記のフォルダ構造を念頭に置きながら，データローダを作ります．\
まずは必要なライブラリをインポートしましょう．

In [None]:
import numpy as np
import torch
from torch.utils.data import Dataset
from torch.utils.data import DataLoader
from PIL import Image
import glob

numpyは，ベクトルや行列の演算を行うためのライブラリです．使用頻度が高く，機能を呼び出す度にいちいちnumpyと書くのは面倒なので，プログラム上ではnpと略して使うことが一般的です（「as \~」 は 「\~と略して使いますよ」という宣言です）．\
\
torchは，言わずとしれた深層学習ライブラリ Pytorch です．\
from torch\~ は必ずしも必要はありませんが，Pytorch の機能に含まれているDatasetとDataLoaderを使う際に毎回 torch.utils.data.Dataset などと宣言する必要があり冗長となってしまいます．上記のように書くことで，torch.utils.data を省略して Dataset を使うことができます．\
\
PILは，Pillowと呼ばれる画像処理ライブラリです．そこに含まれる Image という機能のみをインポートします．これは画像の読み込みや保存などを行うために使用します．\
\
globは，フォルダの中に含まれるファイル名を取り出す際に用いるライブラリです．\
\
この後にも，必要に応じてPythonのライブラリをインポートすることがあります．

先述した3つの要素
- どのデータを使うか
- そのデータはいくつあるのか
- それぞれのデータはどのような形であってほしいのか


については，ChestDatasetという自作のクラスの中で定義していきます．これは，便利なデータローダを実現するための設計図のようなものだと理解しておきましょう．

In [None]:
class ChestDataset(Dataset):
    def __init__(self, TrainValTest="train"):
        super().__init__()
        """
        どのデータを使うのかを記述する部分
        """
        if TrainValTest == "train":
            self.img_path_list = sorted(glob.glob("/content/drive/MyDrive/segmentation/data/train/org/*"))
            self.label_path_list = sorted(glob.glob("/content/drive/MyDrive/segmentation/data/train/label/*"))
        elif TrainValTest == "val":
            self.img_path_list = sorted(glob.glob("/content/drive/MyDrive/segmentation/data/val/org/*"))
            self.label_path_list = sorted(glob.glob("/content/drive/MyDrive/segmentation/data/val/label/*"))
        elif TrainValTest == "test":
            self.img_path_list = sorted(glob.glob("/content/drive/MyDrive/segmentation/data/test/org/*"))
            self.label_path_list = sorted(glob.glob("/content/drive/MyDrive/segmentation/data/test/label/*"))    
    
    def __len__(self):
        """
        データがいくつあるのかを数える
        """
        return len(self.img_path_list)
    
    def __getitem__(self, index):
        """
        データをどのような形で取り出すのか記述する
        """
        image_path = self.img_path_list[index] # ファイル名
        label_path = self.label_path_list[index] # ファイル名
        
        img = Image.open(image_path) # ファイル名を与えて画像を取り出す
        img = np.array(img) # 画像をnumpy形式の行列へ変換
        img = np.expand_dims(img, 0) # 1チャンネルであることを明示する（256, 256）→ (1, 256, 256)
        img = torch.tensor(img) # 行列をpytorchで扱える形式（tensor型）に変換する
        img = img / 255 # 0~255までの値を0~1までの値に変換する
        
        label = Image.open(label_path) # ファイル名を与えてラベルを取り出す
        label = np.array(label) # ラベルをnumpy形式の行列へ変換
        label = np.expand_dims(label, 0)
        label = torch.tensor(label)
        label = label = label / 255 # 肺野領域は255，それ以外は0となっているので，255で割って0 or 1に変換する
        label = label.float() # 行列の値をfloat型に変換する（pytorchの都合）
        
        return img, label

「どのデータを使うか」については，\__init__()の部分に記述しています．glob関数を用いて，フォルダから画像ファイル名のリストを取得しています．\
ユーザーの指定に従って利用するデータを分けられるように，train,val,testで場合分けしてあります．

\__len__()の部分では，上で読み込まれた画像ファイルリストが何枚あるのかを確認するために，len()を用いてリストの長さを出力するようにしています．すなわち，「そのデータはいくつあるのか」を確かめる機能ができあがりました．

やや長くてめんどくさそうなのが__getitem__()の中身です．ここでは，ファイル名を用いた画像読み込みからスタートして，最後にreturnされるimg, labelが理想的な形になるようにデータの変換を行います．「それぞれのデータがどのような形になっていてほしいのか」を意識しながら変換を繰り返していきましょう．\
各行でどのような変換が行われているのかは，各行の#の後に付記してあります．

さて，ここまででChestDatasetという設計図が完成しましたが，実際にこれを使うには「実体化（プログラミングの専門用語ではインスタンス化と呼ばれます）」をする必要があります．\
実体化は次のように行います．

In [None]:
chest_train = ChestDataset(TrainValTest="train")
chest_val = ChestDataset(TrainValTest="val")
chest_test = ChestDataset(TrainValTest="test")

1行目では，ChestDatasetをchest_trainという名前で実体化しました．TrainValTest="train"という記述がありますが，これはChestDatasetの\__init__()でどのフォルダから画像ファイルパスを取り出すのかを指定しています．\
2~3行目でも，同様にchest_valとchest_testを実体化しています．

ここまでくれば，あとは簡単です．\
「実体化されたデータセットをDataLoaderで包み込む」という作業を行います．

In [None]:
train_loader = DataLoader(chest_train, batch_size=5, shuffle=True)
val_loader = DataLoader(chest_val, batch_size=5, shuffle=False)
test_loader = DataLoader(chest_test, batch_size=5, shuffle=False)

PytorchのDataLoaderには，あるデータセットに対して，グループ化を行って順番に取り出す機能や，中身をシャッフルする機能が備わっています．
ここでchest_trainなどを包み込む際にbatch_size=5, shuffle=Trueという記述があるのは，ミニバッチに含まれる要素数とシャッフル機能を使うかどうかを指定するためです．\
このように指定するだけで，train_loaderは，データを5つずつ順番に取り出し，なおかつ取り出しが一巡したらシャッフルする機能を持ったことになります．

train_loaderがきちんと画像を読み込めるか確認しましょう．\
ここで作成したデータローダは，for文のenumerateという機能を使って発動することができます．\
実際に，for文の中でiやdataをprintして遊んでみましょう．\
また，dataのshapeについても同様にprintしてみましょう．

In [None]:
for i, data in enumerate(train_loader):
    print(data[0].shape)

shapeをprintしたときに表示される[5, 1, 256, 256]は，それぞれ[バッチサイズ，チャンネル数，画像の幅，画像の高さ]を意味しています．\
Pytorchではこの形でデータをやりとりする必要があるので，そのために__getitem__()でいろいろな変換を施していました．

### **ネットワークの定義**
次に，深層学習のメイン要素である，ニューラルネットワークを構築していきましょう．\
先述したように，ここではセグメンテーションタスクでよく利用されるU-Net[引用]と呼ばれるネットワークを実装します．

In [None]:
import torch.nn as nn
import torch.nn.functional as F

class UNet(nn.Module):

    def __init__(self, n_class=2, input_channel=1, output_channel=1):
        super(UNet, self).__init__()
        self.n_class = n_class
        
        self.input_channel = input_channel
        self.output_channel = output_channel
        
        self.enco1_1 = nn.Conv2d(self.input_channel, 64, kernel_size=3, stride=1, padding=1)
        self.enco1_2 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1)
        
        self.enco2_1 = nn.Conv2d(64, 128, kernel_size=3, stride=1, padding=1)
        self.enco2_2 = nn.Conv2d(128, 128, kernel_size=3, stride=1, padding=1)

        self.enco3_1 = nn.Conv2d(128, 256, kernel_size=3, stride=1, padding=1)
        self.enco3_2 = nn.Conv2d(256, 256, kernel_size=3, stride=1, padding=1)

        self.enco4_1 = nn.Conv2d(256, 512, kernel_size=3, stride=1, padding=1)
        self.enco4_2 = nn.Conv2d(512, 512, kernel_size=3, stride=1, padding=1)

        self.enco5_1 = nn.Conv2d(512, 1024, kernel_size=3, stride=1, padding=1)
        self.enco5_2 = nn.Conv2d(1024, 512, kernel_size=3, stride=1, padding=1)

        self.deco6_1 = nn.Conv2d(1024, 512, kernel_size=3, stride=1, padding=1)
        self.deco6_2 = nn.Conv2d(512, 256, kernel_size=3, stride=1, padding=1)

        self.deco7_1 = nn.Conv2d(512, 256, kernel_size=3, stride=1, padding=1)
        self.deco7_2 = nn.Conv2d(256, 128, kernel_size=3, stride=1, padding=1)

        self.deco8_1 = nn.Conv2d(256, 128, kernel_size=3, stride=1, padding=1)
        self.deco8_2 = nn.Conv2d(128, 64, kernel_size=3, stride=1, padding=1)

        self.deco9_1 = nn.Conv2d(128, 64, kernel_size=3, stride=1, padding=1)
        self.deco9_2 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1)

        self.final_layer = nn.Conv2d(64, self.output_channel, kernel_size=1)

        self.bn1_1 = nn.BatchNorm2d(  64)
        self.bn1_2 = nn.BatchNorm2d(  64)

        self.bn2_1 = nn.BatchNorm2d(  128)
        self.bn2_2 = nn.BatchNorm2d(  128)

        self.bn3_1 = nn.BatchNorm2d(  256)
        self.bn3_2 = nn.BatchNorm2d(  256)

        self.bn4_1 = nn.BatchNorm2d(  512)
        self.bn4_2 = nn.BatchNorm2d(  512)

        self.bn5_1 = nn.BatchNorm2d(  1024)
        self.bn5_2 = nn.BatchNorm2d(  512)

        self.bn6_1 = nn.BatchNorm2d(  512)
        self.bn6_2 = nn.BatchNorm2d(  256)

        self.bn7_1 = nn.BatchNorm2d(  256)
        self.bn7_2 = nn.BatchNorm2d(  128)

        self.bn8_1 = nn.BatchNorm2d(  128)
        self.bn8_2 = nn.BatchNorm2d(  64)

        self.bn9_1 = nn.BatchNorm2d(  64)
        self.bn9_2 = nn.BatchNorm2d(  64)

    def forward(self, x): 
        
        h1_1 = F.relu(self.bn1_1(self.enco1_1(x)))
        h1_2 = F.relu(self.bn1_2(self.enco1_2(h1_1)))
        pool1, pool1_indice = F.max_pool2d(h1_2, 2, stride=2, return_indices=True) 

        h2_1 = F.relu(self.bn2_1(self.enco2_1(pool1)))
        h2_2 = F.relu(self.bn2_2(self.enco2_2(h2_1)))
        pool2, pool2_indice = F.max_pool2d(h2_2, 2, stride=2, return_indices=True)  

        h3_1 = F.relu(self.bn3_1(self.enco3_1(pool2)))
        h3_2 = F.relu(self.bn3_2(self.enco3_2(h3_1)))
        pool3, pool3_indice = F.max_pool2d(h3_2, 2, stride=2, return_indices=True)  

        h4_1 = F.relu(self.bn4_1(self.enco4_1(pool3)))
        h4_2 = F.relu(self.bn4_2(self.enco4_2(h4_1)))
        pool4, pool4_indice = F.max_pool2d(h4_2, 2, stride=2, return_indices=True) 

        h5_1 = F.relu(self.bn5_1(self.enco5_1(pool4)))
        h5_2 = F.relu(self.bn5_2(self.enco5_2(h5_1)))
        
        up5 = F.max_unpool2d(h5_2, pool4_indice, kernel_size=2, stride=2, output_size=(pool3.shape[2], pool3.shape[3]))
        h6_1 = F.relu(self.bn6_1(self.deco6_1(torch.cat((up5, h4_2), dim=1))))
        h6_2 = F.relu(self.bn6_2(self.deco6_2(h6_1)))

        up6 = F.max_unpool2d(h6_2, pool3_indice, kernel_size=2, stride=2, output_size=(pool2.shape[2], pool2.shape[3]))
        h7_1 = F.relu(self.bn7_1(self.deco7_1(torch.cat((up6, h3_2), dim=1))))
        h7_2 = F.relu(self.bn7_2(self.deco7_2(h7_1)))

        up7 = F.max_unpool2d(h7_2, pool2_indice, kernel_size=2, stride=2, output_size=(pool1.shape[2], pool1.shape[3]))
        h8_1 = F.relu(self.bn8_1(self.deco8_1(torch.cat((up7, h2_2), dim=1))))
        h8_2 = F.relu(self.bn8_2(self.deco8_2(h8_1)))

        up8 = F.max_unpool2d(h8_2, pool1_indice, kernel_size=2, stride=2, output_size=(x.shape[2], x.shape[3]))
        h9_1 = F.relu(self.bn9_1(self.deco9_1(torch.cat((up8, h1_2), dim=1))))
        h9_2 = F.relu(self.bn9_2(self.deco9_2(h9_1)))

        predict = self.final_layer(h9_2)
        
        return torch.sigmoid(predict)

改めてimportされているtorch.nnとtorch.functionalには，畳み込み層やプーリング層など，U-Netを構成する部品が含まれています．使用頻度が高いので，それぞれnn, Fと簡単に記述できるようにしてあります．
\__init__()では UNetを構成する部品を定義し，forward()ではそれらの部品同士がどのようにデータをバケツリレーしていくかを定義します．\
変数名を辿るだけでも図4のネットワークがだいたい再現できていることが分かると思いますので，興味のある人は照らし合わせてみてください．\
BatchNorm という，図に描かれていない部品があることに気がつく人もいるかもしれません．これは，理論編で説明した ドロップアウトと並んでよく知られている正則化手法の一つで，バッチ正則化と呼ばれるものです．\
このように，UNetは論文で提案されたものと全く同じものが使われることは稀で，様々な工夫が追加的に施されることが一般的です．\
その他，個々の部品についての詳しい説明はPytorchのドキュメントや他の書籍等（こちらがオススメ）にお任せします．

※UNetのようによく知られたネットワークは，世界中の誰かが既にpytorchで実装してくれているので，実際に上記のようなコードを自分で１から書かねばならないケースはほとんどありません．

### **誤差関数の定義**
「学習」とは，所望の出力が得られるようにモデルのパラメータを調整することでした．\
所望の出力が得られているかどうかを判断するために重要なのは，誤差関数です．\
今回取り組む問題はセグメンテーションですが，その本質はピクセルごとの分類問題ですので，誤差関数としては交差エントロピーを扱うことにします（図6）．

<div style="text-align: center;">
<IMG SRC="https://drive.google.com/uc?id=1HKd0gtYMLKld5t-yGj7W1K3cOC8qAvVP" width="70%"> 
<br>
図6　交差エントロピーの復習
</div>

数式はややこしいですが，pytorchで既に実装されているものを呼び出せばいいため，準備は下記の1行で完了します．

In [None]:
from torch.nn import BCELoss

図5で説明されている交差エントロピーの定義は，3クラス以上の分類問題で利用可能なものとなっていますが，今回は肺野領域であるか否かの2値分類を行うため，Binary Cross Entropy Loss，略してBCELossと呼ばれる関数をimportします．

### **学習ループの設計**
ここまでで，データローダ，U-Net，誤差関数の準備ができました．\
あとはこれらの部品を使って，学習ループを設計します．\
学習ループで行われるのは\
①データの読み込み\
②U-Netへの入力と順伝播計算\
③誤差の計算\
④誤差逆伝播法による勾配の計算\
⑤勾配降下法を用いたパラメータの更新（図6）\
です．①~⑤を繰り返すことにより，ニューラルネットワークの学習が進んでいきます．

勾配降下法（基本的な概念は図7を参照）にはSGDやAdamなど，これまで様々なアルゴリズムが提案されてきました．今回は，近年注目を浴びているRAdamと呼ばれるアルゴリズムを使っていきます．\
ここではtorch.optimに実装されているRAdamを使用し，アルゴリズムの詳細については触れません．\
興味のある方は元論文[リンク]や解説記事[リンク]を参照してください．

それでは，使用するモデルやアルゴリズム，誤差関数を改めて定義して，訓練ループを実装していきましょう．\
少々記述が長くなるため，細かな解説はコメントに付記していきます．

<div style="text-align: center;">
<IMG SRC="https://drive.google.com/uc?id=19-O2NZYUgtodnAe1GWufNKtaEXMXoqMY" width="70%"> 
<br>
図7　勾配降下法の復習
</div>

In [None]:
import torch.optim as optim

# モデルの定義
model = UNet()

# GPUを使う場合は，下記のコメントを外す
#model = model.to("cuda")

# optimizer（勾配降下法のアルゴリズム）の準備
optimizer = optim.RAdam(model.parameters())

# 誤差関数の定義
criterion = BCELoss()

# 学習ループ
epochs = 30 #ミニバッチのサンプリングが一巡 = 1 epoch

train_loss_list = [] # epoch毎のtrain_lossを保存しておくための入れ物
val_loss_list = [] # epoch毎のvalidation_lossを保存しておくための入れ物

loss_min = 100000 # validation_lossが小さくなった場合にのみモデルを保存しておくためのメモ

# ここからループ開始
for epoch in range(epochs):
    
    train_loss_add = 0 # 1エポック分の誤差を累積しておくための変数
    
    model.train() #学習モードであることを明示
   
    for i, data in enumerate(train_loader):
        
        x, t = data # ①データの読み込み
        
        #GPU環境で動かす際は，下記2行のコメントを外す
        #x = x.to("cuda")
        #t = t.to("cuda")
        
        predict = model(x) # ②順伝播計算
        
        loss = criterion(predict, t) # ③誤差の計算
        
        model.zero_grad()# 誤差逆伝播法のための準備
        loss.backward() # ④誤差逆伝播法による誤差の計算
        
        optimizer.step() # ⑤勾配を用いてパラメータを更新
        
        train_loss_add += loss.data # あとで平均を計算するために，誤差を累積しておく
        
    train_loss_mean = train_loss_add / int(len(chest_train)/train_loader.batch_size) # 1epochでの誤差の平均を計算
    print("epoch" + str(epoch+1))
    print("train_loss:" + str(train_loss_mean))
    train_loss_list.append(train_loss_mean.cpu())# 1epoch毎の平均を格納しておく
    
    # validation
    model.eval() # 評価モード（学習を行わない）であることを明示
    
    val_loss_add = 0
    for i, data in enumerate(val_loader):
            
        x, t = data
        
        #GPU環境で動かす際は，下記2行のコメントを外す
        #x = x.to("cuda")
        #t = t.to("cuda")
        
        predict = model(x) # 順伝播計算
        
        loss = criterion(predict, t) # 誤差の計算
        val_loss_add += loss.data
        
    val_loss_mean = val_loss_add / int(len(chest_val)/val_loader.batch_size)
    print("val_loss:" + str(val_loss_mean))
    val_loss_list.append(val_loss_mean.cpu())
    
    if val_loss_mean < loss_min: # 前に保存したモデルよりもvalidation lossが小さければ，モデルを保存する
        torch.save(model.state_dict(), "/content/drive/MyDrive/segmentation/models/best.model")
        print("saved best model!")
        loss_min = val_loss_mean # 今回保存したモデルのvalidation lossをメモしておく

### **モデルの学習過程を可視化してみよう**
上記の学習ループでは，trainとlossをリストに格納しておきました．\
これをグラフ描画ライブラリmatplotlibで可視化してみましょう．

In [None]:
import matplotlib.pyplot as plt
plt.plot(train_loss_list, label="train") # train時のlossをplot
plt.plot(val_loss_list, label="loss") # validation時のlossをplot
plt.xlabel("epoch") # X軸のラベルを設定
plt.ylabel("loss") # Y軸のラベルを設定
plt.legend() # 凡例を追加（plot時に指定したlabelが使われる）

### セグメンテーションの精度評価
セグメンテーションの課題では，実際に出力された画像を人目で見て確かめる「質的評価（Qualitative evaluation）」と，どれくらいきちんと抽出できているかを数値で表す「量的評価（Quantitative evaluation）」の両方を行うことが重要です．\
セグメンテーションの量的評価では，次のような評価指標が用いられます．
$$ \text{Precision} = \frac{TP}{TP+FP} $$

$$ \text{Recall} = \frac{TP}{TP+FN} $$

$$ \text{Dice Similarity Coefficient(DSC)} = \frac{TP}{TP+\frac{1}{2}(FP+FN)} $$

$$ \text{Intersection over Union(IoU)} = \frac{TP}{TP+FP+FN} $$

ただし，TP, TN, FP, FNは次のように定義されます．
- True Positive(TP): 肺野として正しく見分けられたピクセルの数
- True Negative(TN): 肺野以外として正しく見分けられたピクセルの数
- False Positive(FP): 肺野以外を肺とみなしてしまったピクセルの数
- False Negative(FN): 肺野を肺野以外とみなしてしまったピクセルの数

Precisionは誤検知の度合いを評価し，Recallは見逃しの度合いを評価する指標であると言えます．\
DSCとIoUは，総合的にどれくらい上手く色塗りができたかを表す指標となりますが，IoUの方が厳しめの評価となります．

それでは，testデータとして用意した画像を使って，質的評価と量的評価を行っていきましょう．

In [None]:
from sklearn.metrics import confusion_matrix # TP, TN, FP, FNを求めるための機能をインポート

def thresholding(inference,  threshold=0.5):
    # U-Netが出力するのは各ピクセルに対する確率値（0~1）．
    #ある閾値(threshold)を超えていたらそのピクセル値を255に変更する
    
    inference = inference.data.cpu() # 最後の一枚の１チャンネル目

    mask1 = inference >= threshold
    inference[mask1] = 255

    mask0 = inference < threshold
    inference[mask0] = 0
    
    return inference

def calc_all(tp, pp):
    # TP, TN, FP, FN, Accuracy, Precision, Recall, DSC, IoUを計算する関数
    
    mask = pp != 0
    pp[mask] = 1
    tn, fp, fn, tp = confusion_matrix(tp.flatten(), pp.flatten()).ravel() # TP, TN, FP, FNを計算
    presicion = tp / (tp + fp)
    recall = tp / (tp + fn)
    dice = tp / (tp + ((1/2)*(fp+fn)))
    iou = tp / (tp + fp + fn)
    return presicion, recall, dice, iou


model = UNet(input_channel=1, output_channel=1) # テストに使うためのU-Netを改めて定義

#GPU環境で動かす際は，下記のコメントを外す
#model = model.to("cuda")

#高屋が予め用意した学習済みモデルを使う場合は，best.modelをtakaya.modelに書き換えてください
model_path = "/content/drive/MyDrive/segmentation/models/best.model"

model.load_state_dict(torch.load(model_path)) # 学習時に保存しておいたモデルのパラメータをコピー

model.eval() # 評価モードであることを明示

# 各画像のPrecision, Recall, Dice, IoUを保存しておくためのリスト
precision_list = [] 
recall_list = []
dice_list = []
iou_list = []

for i, data in enumerate(test_loader):
    
    x, t = data
    
    #GPU環境で動かす際は，下記2行のコメントを外す
    #x = x.to("cuda")
    #t = t.to("cuda")
        
    predict = model(x) # 学習済みU-Netによる推論
    predict_imgs = thresholding(predict, threshold=0.5) #出力された確率値（0~1）を8bitに(0~255)に変換
    
    for j in range(test_loader.batch_size):
        img = np.array(predict_imgs[j][0]) # 1チャンネル目だけ取り出して，(256, 256)の形にする
        xx = np.array(x[j][0].cpu()) # 入力画像を表示するための準備（numpy行列への変換）
        tt = np.array(t[j][0].cpu()) # ラベルを表示したり，指標を計算するための準備（numpy行列への変換）
        
        precision, recall, dice, iou = calc_all(img/255, tt) # 評価指標の計算
        
        #計算された指標を各リストへ格納
        precision_list.append(precision)
        recall_list.append(recall)
        dice_list.append(dice)
        iou_list.append(iou)
        
        # 質的評価のための画像出力（入力画像，ラベル，出力画像を並べて表示したい）
        plt.subplot(1, 3, 1)#1桁目 -- グラフの行数、2桁目 -- グラフの列数、3桁目 -- グラフの番号、subplot(2,3,1)の記載でも良い。
        plt.axis("off") # 軸のメモリを表示しない
        plt.title("input")
        plt.imshow(xx, cmap = "gray")
        
        plt.subplot(1, 3, 2)
        plt.axis("off") # 軸のメモリを表示しない
        plt.title("target")
        plt.imshow(tt, cmap = "gray")
        
        plt.subplot(1, 3, 3)
        plt.axis("off") # 軸のメモリを表示しない
        plt.title("output\n(iou=" + str(round(iou, 4)) + ")") #小数第4位までのIoUを図の上に表示
        plt.imshow(img, cmap = "gray")
        plt.savefig("/content/drive/MyDrive/segmentation/results/results/" + str(i) + "_" + str(j) + ".png")

precision_list = np.array(precision_list)
recall_list = np.array(recall_list)
dice_list = np.array(dice_list)
iou_list = np.array(iou_list)

precision_mean = np.array(precision_list).mean()
recall_mean = np.array(recall_list).mean()
dice_mean = np.array(dice_list).mean()
iou_mean = np.array(iou_list).mean()

# 各種指標を表示
print("Precision: " + str(precision_mean))
print("Recall: " + str(recall_mean))
print("DSC: " + str(dice_mean))
print("IoU: " + str(iou_mean))

In [None]:
recall_mean