## **プログラム全体の流れ**
- データローダの作成
- ネットワークの定義
- 誤差関数の定義
- 学習ループの設計
- モデルの学習
- モデルの評価

# k-fold cross validationの仕組みを作っておく

- negative(165), positive(55)が混ざるようにしたい\
→別々で分割して，結合する
- 時期も混ざるようにしたい\
→症例でシャッフルしてから分割する

In [3]:
import glob
from sklearn.model_selection import KFold

In [8]:
# 症例リストを取り出す
neg = glob.glob("dataset/PAS_imgs/negative/*")
pos = glob.glob("dataset/PAS_imgs/positive/*")

In [49]:
def make_kfold_set(k):
    k = k

    kf = KFold(n_splits=k, shuffle=True)

    neg_train_test_list = []
    pos_train_test_list = []

    for train_index, test_index in kf.split(neg):
        kth_train = []
        kth_test = []
        for i in train_index:
            kth_train.append(neg[i])
        for i in test_index:
            kth_test.append(neg[i])
        neg_train_test_list.append((kth_train, kth_test))

    for train_index, test_index in kf.split(pos):
        kth_train = []
        kth_test = []
        for i in train_index:
            kth_train.append(pos[i])
        for i in test_index:
            kth_test.append(pos[i])
        pos_train_test_list.append((kth_train, kth_test))


    posneg_train_test_list = []

    for i in range(k):
        train = pos_train_test_list[i][0] + neg_train_test_list[i][0]
        test = pos_train_test_list[i][1] + neg_train_test_list[i][1]
        posneg_train_test_list.append((train, test))

    
    return posneg_train_test_list

<div style="text-align: center;">
<IMG SRC="https://drive.google.com/uc?id=1rWgWkMT0LLv17p21C2NQMjPh_bkJ_Fcu" width="70%"> 
<br>
図5　ミニバッチ学習のおさらい
</div>

## データセットクラスを作る

In [50]:
import numpy as np
import torch
from torch.utils.data import Dataset
from torch.utils.data import DataLoader

In [70]:
# クラスのわかりやすい例
class Human:
    def __init__(self):
        self.arms = 2
        self.legs = 2
    
    def walk(self):
        print("walking!")

In [60]:
class Takaya(Human):
    def __init__(self):
        super().__init__()
        self.hair = "curl"
    
    def program(self):
        print("coding!")

In [61]:
bob.walk()

walking!


In [69]:
takaya = Takaya() # インスタンス化

In [74]:
class PASDataset(Dataset):
    def __init__(self, kfold_list, fold_index):
        super().__init__()
        # 呼び出された瞬間に起こってほしいこと（コンストラクタ）
        self.k_train_test_list = make_kfold_set(k)
    
    def __len__(self):
        # データがいくつあるのかを数える
        return
    
    
    def __getitem__(self, index):
        # データが取り出される瞬間にどのような形であってほしいかを定義する
        image_path = self.k_train_test_list[index]
        
        return img

In [75]:
k = 5
kfold_list = make_kfold_set(k)

for i in range(5):
    PAS = PASDataset(ith_fold)
    predict = model(PAS)

In [76]:
len(PAS)

[(['dataset/PAS_imgs/positive/1029',
   'dataset/PAS_imgs/positive/1015',
   'dataset/PAS_imgs/positive/1016',
   'dataset/PAS_imgs/positive/1017',
   'dataset/PAS_imgs/positive/1012',
   'dataset/PAS_imgs/positive/1038',
   'dataset/PAS_imgs/positive/1039',
   'dataset/PAS_imgs/positive/1011',
   'dataset/PAS_imgs/positive/1049',
   'dataset/PAS_imgs/positive/1048',
   'dataset/PAS_imgs/positive/1043',
   'dataset/PAS_imgs/positive/1057',
   'dataset/PAS_imgs/positive/1056',
   'dataset/PAS_imgs/positive/1054',
   'dataset/PAS_imgs/positive/1040',
   'dataset/PAS_imgs/positive/1041',
   'dataset/PAS_imgs/positive/1051',
   'dataset/PAS_imgs/positive/1045',
   'dataset/PAS_imgs/positive/1044',
   'dataset/PAS_imgs/positive/1050',
   'dataset/PAS_imgs/positive/1046',
   'dataset/PAS_imgs/positive/1052',
   'dataset/PAS_imgs/positive/1053',
   'dataset/PAS_imgs/positive/1047',
   'dataset/PAS_imgs/positive/1020',
   'dataset/PAS_imgs/positive/1035',
   'dataset/PAS_imgs/positive/1009',
 