# Implementasi CNN untuk Image Classification menggunakan CIFAR-10

Outline dari notebook ini dijabarkan sebagai berikut:

1. **Pendahuluan**  
  
2. **Data pre-processing**  
     2.1. Ekstraksi Dataset
     2.2. Memeriksa Bentuk dan Tipe Data
     2.3. Visualisasi  
     2.4. Normalisasi  
     2.5. One-Hot Encoding  
     2.6. Memisahkan Data Training dan Data Validation      
      
3. **Convolutional Neural Network**  
    3.1. Pendahuluan tentang CNN  
    3.2. Membangun Arsitektur CNN dengan Keras  
    3.3. Konfigurasi Kompilasi Model CNN  
    3.4. Fitting Model CNN  

4. **Analisis Hasil**  
    4.1. Melakukan Visualisasi / Plotting Loss dan Accuracy  
    4.2. Melakukan Visualisasi / Plotting Confusion Matrix  
    4.4. Melakukan Visualisasi / Plotting Error  
  
5. **Prediksi Data Test dan Penyimpanan**  
    5.1. Prediksi Data  
    5.2. Menyimpan Hasil Prediksi dan Model CNN  

<hr>
# 1. Pendahuluan

__CIFAR 10-Dataset__ merupakan sebuah dataset besar yang umumnya digunakan untuk melakukan training dan testing untuk bidang ilmu *Machine Learning*. Dataset CIFAR-10 terdiri dari 60.000 gambar berwarna (RGB) berukuran 32x32 untuk 10 kelas objek, 6.000 gambar untuk setiap kelas.

<p>
    <img src="cifar10_example.png" > </img>
</p>
<p>
    <center><em>Gambar 1. CIFAR-10 Dataset</em></center>
</p>

Pembagian label untuk dataset CIFAR-10 adalah sebagai berikut:

0 : airplane <br>
1 : automobile <br>
2 : bird <br>
3 : cat <br>
4 : deer <br>
5 : dog  <br>
6 : frog  <br>
7 : horse  <br>
8 : ship  <br>
9 : truck  <br>

<hr>
# 2. Data Pre-Processing

Berikut adalah beberapa library yang digunakan untuk melakukan klasifikasi gambar pada notebook ini.

In [None]:
from __future__ import print_function

import numpy as np

from keras.callbacks import EarlyStopping
from keras.models import Sequential
from keras.layers.core import Dense, Dropout, Flatten
from keras.layers.convolutional import Conv2D
from keras.optimizers import Adam
from keras.layers.pooling import MaxPooling2D
from keras.utils import to_categorical
from keras.layers.normalization import BatchNormalization


Dataset yang digunakan kali ini berupa dataset CIFAR-10 yang sudah disediakan oleh library keras, sehingga dataset ini dapat langsung digunakan tanpa harus mengunduh data originalnya. 

Data original CIFAR-10 dapat diunduh di situs resmi: https://www.cs.toronto.edu/~kriz/cifar.html

In [None]:
from keras.datasets import cifar10

### Ekstraksi Dataset

Dataset CIFAR-10 yang didapatkan langsung dari library ini memiliki struktur:

    {(X_train, Y_train), (X_test, Y_test)}
    
dimana :

X_train adalah data gambar sebagai input untuk proses training

Y_train adalah label data untuk proses training

X_test adalah data gambar sebagai input untuk proses testing

Y_train adalah label data untuk proses testing

In [None]:
# Load the dataset
(X_train, Y_train), (X_test, Y_test) = cifar10.load_data()

# mengambil 20.000 data pertama

X_train = X_train[:20000]
X_test = X_test[:20000]
Y_train = Y_train[:20000]
Y_test = Y_test[:20000]

print(X_train.shape)
print(X_test.shape)
print(Y_test.shape)
print(Y_train.shape)


### Memeriksa Tipe Data

In [None]:
# Lengkapi kode program

# memeriksa tipe data



### Memeriksa Bentuk Data

In [None]:
# Lengkapi kode program

# memeriksa bentuk data


# memeriksa jumlah data



In [None]:
# Lengkapi kode program

# menampilkan data training pertama




### Visualisasi

In [None]:
# Lengkapi kode program 

# menampilkan gambar data training ke-lima
from matplotlib import pyplot as plt




### Normalisasi

In [None]:
# Lengkapi kode program

# melakukan normalisasi pada training data dan testing data



# menampilkan data training pertama (yang sudah dinormalisasi)




### One Hot Encoding


<p>
    <img src="one_hot.png" width=700> </img>
</p>
<p>
    <center><em>Gambar 2. One Hot Encoding untuk CIFAR-10 Dataset</em></center>
</p>


### Memisahkan Data Training dan Validasi

In [None]:
# kita gunakan class train_test_split untuk melakukan pembagian secara otomatis
from sklearn.model_selection import train_test_split

# kita buat class untuk melakukan random
seed = 2
np.random.seed(seed)

# kita pisahkan sebagian xtrain dan ytrain untuk xval dan yval


# mengganti tipe label dengan to_categorical()


<hr>
# 3. CNN Model

Proses selanjutnya adalah membuat model CNN untuk klasifikasi gambar objek. Arsitektur CNN yang akan dibuat pada program ini menggunakan arsitektur seperti yang terlihat di bawah ini: 
    
<p>
    <img src="cnn_arch.png" width=930> </img>
</p>
<p>
    <center><em>Gambar 3. Arsitektur CNN</em></center>
</p>

sumber: https://towardsdatascience.com/cifar-10-image-classification-in-tensorflow-5b501f7dc77c


Arsitektur CNN:

* Convolution dengan 64 filters ukuran (3x3), padding=same, strides=1


* Max Pooling dengan ukuran 2 (strides=2)
    - ReLU activation function
    - Batch Normalization


* Convolution dengan 128 filters ukuran (3x3), padding=same, strides=1


* Max Pooling dengan ukuran 2 (strides=2)
    - ReLU activation function
    - Batch Normalization


* Convolution dengan 256 filters ukuran (5x5), padding=same, strides=1


* Max Pooling dengan ukuran 2 (strides=2)
    - ReLU activation function
    - Batch Normalization


* Convolution dengan 512 filters ukuran (5x5), padding=same, strides=1


* Max Pooling dengan ukuran 2 (strides=2)
    - ReLU activation function
    - Batch Normalization


* Flattening the 3-D output


* Fully Connected Layer dengan 128 unit
    - Dropout
    - Batch Normalization


* Fully Connected Layer dengan 256 units
    - Dropout
    - Batch Normalization


* Fully Connected Layer dengan 512 units
    - Dropout
    - Batch Normalization


* Fully Connected Layer dengan 1024 units
    - Dropout
    - Batch Normalization


* Fully Connected Layer dengan 10 unit (jumlah kelas)

In [None]:
# Lengkapi kode program

# model
model = Sequential()

# membuat arsitektur cnn





In [None]:
# Lengkapi kode program

# menampilkan model summary




### Menentukan Konfigurasi Kompilasi CNN 

In [None]:
# Lengkapi kode program

# Kompilasi model
#    loss = categorical_crossentropy
#    optimizer = adam
#    learning rate = 0.001
#    metrics = accuracy




### Model Fitting

In [None]:
# Lengkapi kode program

# Fitting model
#   batch_size = 128
#   epoch = 3
#   verbose = 1





### Analisa Hasil

In [None]:
# Lengkapi kode program

#plot perbandingan training loss dan validation loss



#plot perbandingan training acc dan validation acc




#### Analisa

Berikan analisa terhadap grafik di atas.

### Prediksi

In [None]:
# Lengkapi kode program

# prediksi kelas menggunakan model yang dibuat (verbose=1)



In [None]:
# Lengkapi kode program

# cetak informasi variable prediksi



In [None]:
# Lengkapi kode program

# menampilkan shape dari hasil prediksi



# menyamakan dimensi


# menampilkan shape hasil prediksi dan label ground-truth (Y_test)



In [None]:
# Lengkapi kode program

# menghitung kesalahan prediksi



# menampilkan jumlah kesalahan


# menghitung tingkat akurasi prediksi 
#   jumlah kesalahan/total hasil prediksi



# menampilkan tingkat akurasi prediksi

