## The Bias/Variance Tradeoff

### Bias là gì? 
Bias là sự sai khác giữa trung bình dự đoán của mô hình chúng ta xây dựng với giá trị chính xác đang cố gắng để dự đoán. Một mô hình với trị số bias cao đồng nghĩa với việc mô hình đó không quan tâm nhiều tới dữ liệu huấn luyện, khiến cho mô hình trở nên đơn giản quá. Nó thường dẫn đến việc mô hình có mức độ lỗi cao cả trên tập huấn luyện và tập kiểm thử.

**Lưu ý** không nhầm lẫn với bias parameter trong các mô hình ML thông thường.

### Variance là gì? 
Variance đặc trưng cho mức độ tản mát của giá trị dự đoán cho điểm dữ liệu. Mô hình với mức độ variance cao tập trung chú ý nhiều vào dữ liệu huấn luyện và không mang được tính tổng quát trên dữ liệu chưa gặp bao giờ. Từ đó dẫn đến mô hình đạt được kết quả cực kì tốt trên tập dữ liệu huấn luyện, tuy nhiên kết quả rất tệ với tập dữ liệu kiểm thử

<img src="images/bias_variance.png">

## CNNの概要

### 前回
- MNISTのデータセット
- 28×28のモノクロ画像
- 多層パーセプトロン（MLP）
- 入力数：784個
- パラメータ数：785(バイアス含む)

In [None]:
model = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dense(10, activation='softmax')
])

<img src="images/MLPModel_summary.png" style="margin-left: -10px;">

### 今回
- CIFAR-10のデータセット
- 32×32のカラー画像
- 畳み込みニューラルネットワーク（CNN）
- 入力数：120000個
パラメータが多くなるほど最適化が難しくなる
=> **畳み込みニューラルネットワーク（CNN）の導入**

Số lượng tham số càng lớn, việc tối ưu hóa càng khó khăn (ở đây 32* 32* 3 so với 28* 28 và có thể ảnh còn có kích thước lớn hơn nữa...). Khi đó nảy ra ý tưởng sử dụng mạng tích chập CNN.

### CNN
- CNNとは、入力データである画像の性質を利用して、パラメータの数を削減している。(*)
- CNNの一番の特徴は、畳み込み層とプーリング層の繰り返し。

Ý tưởng chính là từ ảnh đầu vào có thể trích suất các đặc trưng quan trọng (thay vì toàn bộ ảnh như lần trc). Nhờ đó mà giảm được số lượng tham số mô hình.

### 畳み込み層とプーリング層
- CNNの一番の特徴は、畳み込み層とプーリング層の繰り返し。Cấu trúc của CNN là sự lặp lại của lớp tích chập và lớp gộp.


- 畳み込み層とは、画像に対してカーネル（フィルタ）(kernel or filter)を適用していき、画像の特徴量を抽出するような役目を担う層。Lớp tích chập(Conv) là một lớp đóng vai trò áp dụng kernel (bộ lọc) cho hình ảnh và trích xuất các đặc trưng của hình ảnh.


- 最適化が必要な重みパラメータの数は画像のサイズではなくフィルタのサイズに依存するため、MLPと違い、画像のサイズが大きくなっても、パラメータ数が増大しない。Số lượng tham số cần được tối ưu hóa phụ thuộc vào số lượng các kernel trong bộ lọc, không phải kích thước của hình ảnh, vì vậy không giống như MLP, số lượng tham số không tăng ngay cả khi kích thước của hình ảnh tăng.


- プーリング層とは、画像を縮小するような層のことで、小さな位置変化に対して頑健にするような役目を担っている。Lớp gộp (Pooling) có vai trò giảm kích thước hình ảnh, đồng thời giảm nhiễu ở các điểm ảnh (lấy average/max của 1 vùng pixel).

### 畳み込み層

<img src="images/conv_sample.png" style="height: 300px;">

Ví dụ trên mô tả việc thực hiện tích chập với kernel 2 chiều. Phép tích chập gồm các tham số cơ bản: kernel size (3* 3 hay 5* 5 ...), stride, padding 

Đối với các bài toán đầu vào ảnh màu (3 channel), kernel 3 chiều được áp dụng như sau:

<img src="images/conv_kernel3D.png" style="height: 350px;">

<img src="images/conv_kernel3D(2).png" style="height: 200px;">

- MLPでは入力データのサイズが大きくなるほど、パラメータ数が増大していきます。
- 畳み込み層では、入力データのサイズが大きくなっても、特徴マップのサイズは増えますが、カーネルのサイズ、
つまり重みパラメータ数は変化しません。

## プーリング層

プーリング層にもいくつか種類がありますが、最もよく使われるマックスプーリングでは、入力データを小さな領域に分割し、各領域の最大値を取ってくることでデータを縮小します。データが縮小されるため、計算コストを下げることに加え、各領域内の位置の違いを無視するため、小さな位置変化に対してモデルを構築することが出来る。

Có 1 số kiểu pooling (phổ biến nhất trong đó là max-pooling マックスプーリング)

Việc thêm pooling layer vào mô hình vừa có tác dụng giảm số lượng tham số mô hình, vừa tránh sự khác biệt nhỏ phải học khi có 1 pixel sai khác trong vùng pooling 

<img src="images/pooling.png">