# CNN Primer dan Keras 101

Dalam <i>notebook</i> ini peserta akan dikenalkan pada Algoritma CNN, dan pengimplementasiannya menggunakan Keras. Untuk pemula <i>notebook</i> ini sangat baik sebagai awalan pemahaman mengenai CNN.

**Daftar isi :**

- [Bagaimana proyek Deep Learning direncanakan ?](#Machine-Learning-Pipeline)
- [Contoh kasus Deep Learning( Klasifikasi )](#Image-Classification-on-types-of-clothes)


**Setelah menyelesaikan <i>nobteook</i> ini diharapkan peserta dapat :**

- Memahami tentang <i>Pipeline Machine Learning</i>
- Membuat sebuah <i>Deep Learning Classifier</i> dan melatih model tersebut.

**Kita akan membuat _Pengklasifikasian Multi-kelas_ untuk mengklasifikasikan gambar pakaian ke kelasnya masing-masing**

## Machine Learning Pipeline

Selama bootcamp, kita akan menggunakan cakupan berikut untuk membantu memahami bagaimana proyek Machine Learning harus direncanakan dan dijalankan:

1. **Data**: Untuk memulai proyek ML apa pun, diperlukan data yang telah diproses sebelumnya dan dapat dimasukkan ke dalam jaringan.
2. **Task**: Terdapat banyak tugas dalam proyek ML, kita perlu memastikan bahwa kita memahami dan mendefinisikan pernyataan masalah secara akurat.
3. **Model**: Kita perlu membangun model, yang tidak terlalu dalam dan kompleks, sehingga membutuhkan banyak daya komputasi atau terlalu kecil sehingga tidak dapat mempelajari fitur-fitur penting.
4. **Loss**: Dari sekian banyak fungsi _loss_ yang ada, kita perlu hati-hati memilih fungsi _loss_ yang cocok untuk tugas yang akan kita lakukan.
5. **Learning**: Seperti yang telah disebutkan pada notebook sebelumnya, terdapat berbagai _optimizer_ masing-masing dengan kelebihan dan kekurangannya. Jadi di sini kita memilih _optimizer_ yang cocok untuk tugas kita dan melatih model kita menggunakan hyperparameter yang ditetapkan.
6. **Evaluation**:  Hal ini adalah langkah penting dalam proses untuk menentukan apakah model kita telah mempelajari fitur dengan benar dengan menganalisis kinerjanya saat data terbaru diberikan padanya.

**Disini akan membuat _Pengklasifikasian Multi-kelas_ untuk mengklasifikasikan gambar pakaian ke kelasnya masing-masing.**

Kita akan mengikuti <i>pipeline</i> diatas untuk menyelesaikan contoh kasus dibawah ini.

## Klasifikasi Gambar pada jenis pakaian

####  Step -1 : Data 

Kita akan menggunakan dataset **F-MNIST ( Fashion MNIST )**, yang merupakan dataset yang sangat populer. Kumpulan data ini berisi 70.000 gambar skala abu-abu dalam 10 kategori. Gambar menunjukkan masing-masing artikel pakaian dengan resolusi rendah (28 x 28 piksel).

<img src="images/fashion-mnist.png" alt="Fashion MNIST sprite"  width="600">

*Source: https://www.tensorflow.org/tutorials/keras/classification*

In [None]:
# Impor Library yang Diperlukan

from __future__ import absolute_import, division, print_function, unicode_literals

# TensorFlow dan tf.keras
import tensorflow as tf
from tensorflow import keras

# Library pendukung
import numpy as np
import matplotlib.pyplot as plt

print(tf.__version__)

In [None]:
# Import Dataset
fashion_mnist = keras.datasets.fashion_mnist

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

Memuat dataset mengembalikan empat array NumPy:

* `train_images` dan `train_labels` array merupakan data *training set*— yang akan digunakan model untuk pelatihan 
* Model akan di tes menggunakan *test set*,yaitu array `test_images`, dan `test_labels`.

Gambar yang digunakan adalah array NumPy 28x28, dengan nilai piksel mulai dari 0 hingga 255. *Label* adalah array bilangan bulat, mulai dari 0 hingga 9. Hal ini sesuai dengan *kelas* pakaian yang diwakili oleh gambar:

<table>
  <tr>
    <th>Label</th>
    <th>Class</th>
  </tr>
  <tr>
    <td>0</td>
    <td>T-shirt/top</td>
  </tr>
  <tr>
    <td>1</td>
    <td>Trouser</td>
  </tr>
    <tr>
    <td>2</td>
    <td>Pullover</td>
  </tr>
    <tr>
    <td>3</td>
    <td>Dress</td>
  </tr>
    <tr>
    <td>4</td>
    <td>Coat</td>
  </tr>
    <tr>
    <td>5</td>
    <td>Sandal</td>
  </tr>
    <tr>
    <td>6</td>
    <td>Shirt</td>
  </tr>
    <tr>
    <td>7</td>
    <td>Sneaker</td>
  </tr>
    <tr>
    <td>8</td>
    <td>Bag</td>
  </tr>
    <tr>
    <td>9</td>
    <td>Ankle boot</td>
  </tr>
</table>


Setiap gambar dipetakan ke satu label. Karena *nama kelas* tidak disertakan dengan kumpulan data, mari kita simpan dalam array sehingga kita dapat menggunakannya nanti saat memplot gambar:


In [None]:
|class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

## Memahami Data

In [None]:
#Mencetak Ukuran array Set Pelatihan
print("Ukuran data Gambar Latih:"+str(train_images.shape))
#Menceetak Ukuran array Label
print("Ukuran data Label Latih:"+str(train_labels.shape))

#Cetak Ukuran array Set Uji
print("Ukuran data Gambar Uji :"+str(test_images.shape))
#Cetak Ukuran array Label
print("Ukuran data Label Uji :"+str(test_labels.shape))

#Mencetak output 
print("Kumpulan Label Latih :"+str(train_labels))
print("Kumpulan Label Uji  :"+str(test_labels))

## Data Pre-processing


In [None]:
plt.figure()
plt.imshow(train_images[0])
plt.colorbar()
plt.grid(False)
plt.show()

Nilai piksel gambar berkisar dari 0 hingga 255. Sekarang, mari kita normalkan rentang data dari 0 - 255 hingga 0 - 1 dalam set *Train* dan *Test*. Normalisasi piksel ini membantu kita dengan mengoptimalkan proses di mana gradien dihitung.

In [None]:
train_images = train_images / 255.0
test_images = test_images / 255.0

In [None]:
# Cetak untuk Memverifikasi jika Data dalam format yang benar.
plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(train_images[i], cmap=plt.cm.binary)
    plt.xlabel(class_names[train_labels[i]])
plt.show()

## Mendefinisikan Model

Model terdapat 3 lapisan :

- 784 fitur Input ( 28 * 28 ) 
- 128 nodes di dalam <i>hidden layer</i> (Dibebaskan bereksperimen untuk jumlah nodes nya)
- 10 output nodes untuk menunjukkan Kelas

Menerapkan hal yang sama di Keras (kerangka Pembelajaran Mesin dibangun di atas Tensorflow, Theano, dll..)


In [None]:
from tensorflow.keras import backend as K
K.clear_session()
model = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dense(10, activation='softmax')
])

Lapisan pertama dalam jaringan ini, `tf.keras.layers.Flatten`, mengubah format gambar dari array dua dimensi (berukuran 28 kali 28 piksel) menjadi array satu dimensi (berukuran 28 * 28 = 784 piksel ). Perhatikan bahwa lapisan ini sebagai deretan piksel yang tidak tertumpuk pada gambar dan melapisinya. Lapisan ini tidak memiliki parameter untuk dipelajari; Flatten hanya memformat ulang data.

Setelah piksel diratakan, jaringan terdiri dari urutan dua lapisan `tf.keras.layers.Dense`. Lapisan ini adalah lapisan saraf yang terhubung dengan erat, atau terhubung sepenuhnya. Lapisan `Dense` pertama memiliki 128 node (atau neuron). Lapisan kedua (dan terakhir) adalah lapisan *softmax* 10-node yang mengembalikan larik 10 skor probabilitas yang berjumlah 1. Setiap node berisi skor yang menunjukkan probabilitas bahwa gambar saat ini termasuk dalam salah satu dari 10 kelas.

### Kompilasi Model

Sebelum model siap untuk pelatihan, diperlukan beberapa pengaturan tambahan. Hal ini ditambahkan selama langkah *kompilasi* model:

* *Loss function* — Hal ini mengukur seberapa akurat model selama pelatihan. 
* *Optimizer* —Berguna untuk bagaimana caranya model memperbaharui dirinya berdasarkan data yang dimiliki dan berdasarkan <i>loss function</i> yang didefinsikan.
* *Metrics* —Digunakan untuk memonitor fase <i>Training</i> dan <i>Testing</i>.Pada contoh ini menggunakan *akurasi* , sebagian kecil dari gambar yang diklasifikasikan dengan benar.

In [None]:
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

## Melatih Model

Melatih model jaringan saraf memerlukan langkah-langkah berikut:

1. Masukkan data pelatihan ke model. Dalam contoh ini, data pelatihan ada dalam array `train_images` dan `train_labels`.
2. Model belajar mengasosiasikan gambar dan label.
3. Model diminta untuk membuat prediksi tentang <i>test-set</i>dalam contoh ini, array `test_images`. Memverifikasi bahwa prediksi cocok dengan label dari array `test_labels`.

Untuk memulai pelatihan, panggil metode `model.fit` — hal ini disebut "fits" model untuk training data:

In [None]:
model.fit(train_images, train_labels ,epochs=5)

## Evaluasi Akurasi

Selanjutnya, bandingkan performa model pada set data uji:

In [None]:
#Mengevaluasi Model menggunakan Test Set

test_loss, test_acc = model.evaluate(test_images,  test_labels, verbose=2)

print('\nAkurasi Uji :', test_acc)

## Latihan

Coba tambahkan lapisan <i>dense layer</i> ke jaringan di atas dan amati perubahan akurasinya.

Kita mendapatkan Akurasi 87% dalam dataset Uji yang kurang dari 89% yang kita dapatkan selama fase Pelatihan, Masalah ini dalam <i>Machine Learning</i> disebut <i>Overfitting</i>

## Important:
<mark>Matikan Kernel Jupyter setelah menyelesaikan Hands-On.</mark>

## Licensing
This material is released by OpenACC-Standard.org, in collaboration with NVIDIA Corporation, under the Creative Commons Attribution 4.0 International (CC BY 4.0).