# Day 25: CNNのアーキテクチャ（LeNet, AlexNet）

## Learning Objectives
- 古典的なCNNアーキテクチャを理解する
- 層の深さとパフォーマンスの関係を把握する
- パラメータ最適化の技術を学ぶ

---

# Part 1: Theory (2 hours)

## 25.1 CNNの誕生と歴史的背景

CNN（畳み込みニューラルネットワーク）は、画像認識の分野で革命的な進化を遂げたアーキテクチャでございます。

### 25.1.1 ネオコグニトロンの概念（1980年代）

福島邦彦博士による初期の視覚モデルで、以下の概念が生まれました：

- **S細胞**: 空間的な結合（畳み込みの原型）
- **C細胞**: 不変性の獲得（プーリングの原型）
- 層化された構造による特徴抽出

### 25.1.2 現代CNNの確立（2012年）

**AlexNet**のImageNet勝利が転機となりました：

- GPUによる並列計算の恩恵
- Dropoutによる過学習の防止
- ReLUによる勾配問題の解決
- Data Augmentationによる汎化性能向上

## 25.2 LeNet-5：最初の実用的CNN（1998年）

Yann LeCunによって開発され、手書き数字認識で成功を収めました。

### 25.2.1 LeNet-5のアーキテクチャ

```
【LeNet-5 アーキテクチャ】

入力: 32×32グレースケール画像
    ↓
C1: 畳み込み (6フィルタ, 5×5, stride=1) → tanh
    ↓ 28×28×6
S2: 平均プーリング (2×2, stride=2)
    ↓ 14×14×6
C3: 畳み込み (16フィルタ, 5×5, stride=1) → tanh
    ↓ 10×10×16
S4: 平均プーリング (2×2, stride=2)
    ↓ 5×5×16
C5: 畳み込み (120フィルタ, 5×5, stride=1) → tanh
    ↓ 1×1×120
F6: 全結合 (84ユニット) → tanh
    ↓
出力: 全結合 (10ユニット) → RBF
```

### 25.2.2 LeNet-5の特徴と革新点

#### 1. 層の役割の体系化

| 層 | 役割 | 特徴 |
|---|---|---|
| 畳み込み | 特徴抽出 | 局所的特徴の検出 |
| プーリング | 次元削減 | 位置不変性の獲得 |
| 全結合 | 分類 | 高レベル特徴の統合 |

#### 2. サブサンプリングの概念

平均プーリングにより、微小な位置変化への不変性を獲得：

```python
def average_pooling(X, pool_size=2, stride=2):
    """平均プーリングの実装"""
    N, C, H, W = X.shape
    out_h = (H - pool_size) // stride + 1
    out_w = (W - pool_size) // stride + 1
    
    out = np.zeros((N, C, out_h, out_w))
    
    for n in range(N):
        for c in range(C):
            for i in range(out_h):
                for j in range(out_w):
                    h_start = i * stride
                    h_end = h_start + pool_size
                    w_start = j * stride
                    w_end = w_start + pool_size
                    
                    # 平均を計算
                    out[n, c, i, j] = np.mean(X[n, c, h_start:h_end, w_start:w_end])
    
    return out
```

---

# Part 2: Practice (2 hours)

## Exercise 25.1: LeNet-5の実装

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical

# MNISTデータセットの読み込み
(X_train, y_train), (X_test, y_test) = mnist.load_data()

# 前処理
X_train = X_train.astype('float32') / 255.0
X_test = X_test.astype('float32') / 255.0
X_train = np.expand_dims(X_train, axis=1)  # (N, 1, 28, 28) -> (N, 1, 32, 32)にパディング
X_test = np.expand_dims(X_test, axis=1)

# パディングして32x32に
X_train = np.pad(X_train, ((0,0), (0,0), (2,2), (2,2)), 'constant')
X_test = np.pad(X_test, ((0,0), (0,0), (2,2), (2,2)), 'constant')

# ラベルをone-hotエンコーディング
y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

print(f"訓練データ形状: {X_train.shape}")
print(f"テストデータ形状: {X_test.shape}")
print(f"ラベル形状: {y_train.shape}")

---

# Self-Check (理解度確認)

本日の学習内容を確認しましょう：

## 基礎知識
- [ ] LeNet-5のアーキテクチャ（7層）を理解した
- [ ] AlexNetの革新点（ReLU, Dropout, Data Augmentation）を理解した
- [ ] CNN層の役割（畳み込み、プーリング、全結合）を説明できる

## 深層化の理解
- [ ] 層の深さと表現力の関係を理解した
- [ ] 深層化の課題（勾配消失、計算コスト）を理解した
- [ ] ResNetなどの解決策の概要を理解した

## 最適化技術
- [ ] Xavier/He初期化の違いを理解した
- [ ] 学習率スケジュールの種類と効果を理解した
- [ ] SGD, SGD+Momentum, Adamの特性を理解した

## 実践力
- [ ] LeNet-5の基本構造を実装した
- [ ] AlexNetのモデルを作成した
- [ ] 最適化アルゴリズムを比較した
- [ ] 学習率の影響を可視化した

**お疲れ様でした！** Day 25はこれで終了です。

次回（Day 26）は「転移学習（Transfer Learning）」を学びます。