# 第1回：MedMNISTによる深層学習モデル入門

## 学習目標

- Google Colab の扱いを学ぶ
- 医用画像データセット MedMNIST の扱いを学ぶ
- 畳み込みニューラルネットワーク（CNN）の学習プロセスを理解する

---
## MedMNISTとは

MedMNISTは、医用画像を28×28ピクセルに標準化した教育用データセットです。病理画像、皮膚画像、胸部X線など、10種類以上の医療画像が含まれています。

## CNN（畳み込みニューラルネットワーク）とは

CNNは、画像認識に特化したニューラルネットワークです。画像の局所的な特徴（エッジや模様）を自動的に学習し、分類に活用します。

In [None]:
# 環境セットアップ
!pip install medmnist -q
import sys, os
!rm -rf /tmp/MedMNIST-Exercise
!git clone https://github.com/kshimoji8/MedMNIST-Exercise-Public.git /tmp/MedMNIST-Exercise -q
sys.path.insert(0, '/tmp/MedMNIST-Exercise')
sys.modules.pop('exercise_logic', None)
import exercise_logic
exercise_logic.initialize_environment()
print("✓ セットアップが完了しました。")

# --- 病理データのロード ---
(x_train, y_train), (x_test, y_test), info = exercise_logic.load_and_preprocess('pathmnist')
print(f"✓ データロード完了: {x_train.shape}, Label: {y_train.shape}")

---
## CNNモデルの構成要素

- **畳み込み層（Conv2D）**: 画像からエッジや模様などの特徴を抽出します
- **プーリング層（MaxPooling2D）**: 特徴マップのサイズを縮小し、重要な情報を残します
- **全結合層（Dense）**: 抽出された特徴を元に、最終的な分類を行います

In [None]:
# シンプルなCNNモデルを構築
model = exercise_logic.build_model(
    input_shape=(28, 28, 3), 
    num_classes=len(info['label']), 
    model_type='simple'
)

model.summary()

---
## 学習プロセスの用語

- **エポック（epochs）**: 全データを何回繰り返し学習するかを指定します
- **バッチサイズ（batch_size）**: 一度に処理するデータの数です
- **検証データ（validation_split）**: 学習中に性能を確認するために分けておくデータの割合です

In [None]:
# 学習の実行
history = model.fit(
    x_train, y_train, 
    epochs=10, 
    validation_split=0.1, 
    batch_size=128
)

---
## 評価指標の見方

- **学習曲線**: 損失（loss）が下がり、精度（accuracy）が上がれば学習が進んでいます
- **混同行列**: 実際のラベルと予測ラベルの対応を表にしたものです。対角線上の数値が多いほど正確です

In [None]:
# 評価と分析
exercise_logic.plot_history(history)
exercise_logic.show_evaluation_reports(model, x_test, y_test, info['label'])