# Artificial Neural Network

Implementasi algoritma Artificial Neural Network menggunakan Keras dan Tensorflow.

## 1. Pendahuluan

**Tensorflow** adalah platform/framework untuk membangun sebuah model machine learning yang bersifat open source. Tensorflow menyediakan fitur end-to-end / full stack development, dari prototyping hingga deployment model machine learning ke dalam aplikasi.

**Keras** adalah high-level API untuk mengimplementasikan Deep Learning pada platform Tensorflow. Sehingga developer/engineer bisa fokus terhadap pemodelan machine learningnya daripada cara memprogram model machine learning.

In [None]:
import tensorflow as tf
from tensorflow import keras
import numpy as np

### 1.1 Inisialisasi model

Di bagian ini kita akan membangun model neural network yang paling sederhana, terdiri 1 input layer, 1 neuron, dan 1 layer output. Untuk mengimplementasikan ini kita bisa memanfaatkan kelas **`keras`** dari modul **`tensorflow`**. Kemudian memanggil method **`Sequential`** untuk mendefinisikan arsitektur neural networknya.

In [None]:
model = keras.Sequential([keras.layers.Dense(units=1, input_shape=[1])])

Di dalam method Sequential kita bisa mendefinisikan tumpukan layer-layer penyusun model pada kelas **`keras.layers.Dense()`**. Untuk lebih lengkap mengenai method `Sequential` bisa dilihat pada [dokumentasinya](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential?version=nightly).

In [None]:
tf.keras.backend.clear_session()
model.compile(optimizer='sgd', loss='mean_squared_error')

Selanjutnya adalah mengimplementasikan fungsi optimasi dengan memanggil method **`compile`** melalui objek `model`. Di dalamnya kita definisikan atribut `optimizer` dan juga `loss` function yang digunakan. Jenis-jenis [fungsi optimasi](https://www.tensorflow.org/api_docs/python/tf/keras/optimizers?version=nightly) dan [loss function](https://www.tensorflow.org/api_docs/python/tf/keras/losses) bisa langsung dibaca di dokumentasi resminya.

### 1.2 Dataset

Di bagian ini kita akan membuat dataset sederhana dalam bentuk array 1 dimensi menggunakan **`numpy`**. Data disimpan pada objek **`X`** dan label pada objek **`y`**.

In [None]:
X = np.array([-1.0,  0.0, 1.0, 2.0, 3.0, 4.0], dtype=float)
y = np.array([-3.0, -1.0, 1.0, 3.0, 5.0, 7.0], dtype=float)

### 1.3 Fitting

Setelah mempersiapkan dataset (biasanya proses pre-processing dataset adalah proses yang panjang, bahkan lebih panjang dari proses pemodelan neural networknya. Namun sebagai permulaan di bagian ini belum membahas pre-processing) hal selanjutnya dilakukan adalah fitting dataset ke dalam model.

Proses fitting diimplementasikan dengan memanggil method **`fit()`** melalui objek **`model`**. Method `fit()` menerima parameter input data, label data, dan epoch. Epoch mengacu pada satu kali putaran (_cycle_) untuk mendistribusikan seluruh dataset ke dalam model.

In [None]:
model.fit(X, y, epochs=10)

### 1.4 Prediksi

Setelah model di-training hal selanjutnya adalah melakukan prediksi. Implementasinya dapat dilakukan dengan memanggil method **`predict`** berdasarkan objek `model`, kemudian memasukkan nilai yang akan diprediksi ke dalam method tersebut. Seperti terlihat pada output di bawah, hasil prediksi untuk nilai input 10.0 adalah 7.837426.

In [None]:
print(model.predict([10.0]))

## Contoh 1

Pada bagian ini adalah implementasi neural network berdasarkan studi kasus materi [Neural Network Demystified](https://www.youtube.com/playlist?list=PLiaHhY2iBX9hdHaRr6b7XevZtgZRa1PoU) dengan Tensorflow. Pada contoh tersebut terdapat dua atribut yaitu "Hour of Study" dan "Hour of Sleep", dan satu output yaitu "Test Score". Contoh data dapat dilihat pada tabel di bawah.

|Hour of Study|Hour of Sleep|Test Score|
|-------------|-------------|----------|
|3|5|75|
|5|1|82|
|10|2|93|
|3|2|60|
|4|3|63|
|6|7|94|
|8|10|97|

Data tersebut disimpan ke dalam struktur data numpy array dua dimensi (untuk atribut/fitur) dan numpy array satu dimensi untuk output.

In [None]:
X = np.array([[3, 5], [5, 1], [10, 2], [3, 2], [4, 3], [6, 7], [8, 10]]) # Input
y = np.array([75, 82, 93, 60, 63, 94, 97]) # Output

In [None]:
print(X.shape) # Input dimensi array
print(y.shape) # Output dimensi array

### Data Preprocessing

Di bagian ini kita cukup melakukan scaling saja, karena datasetnya hanya bertipe numerikal saja. Scaling diimplementasikan dengan menggunakan kelas **`StandardScaler`** pada modul **`sklearn.preprocessing`**.

In [None]:
from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
X_scale = scaler.fit_transform(X)
y_scale = scaler.fit_transform(y.reshape(-1, 1))

### Modeling

Model neural network yang akan diimplementasikan berdasarkan gambar berikut ini:
![model](img/model-1.png)

Kemudian kita bisa me-review model yang kita buat dengan memanggil method **`summary()`** pada objek `model`.

In [None]:
tf.keras.backend.clear_session()
model = keras.Sequential([
    keras.layers.Dense(2, input_shape=(2,)),
    keras.layers.Dense(1, activation='sigmoid'),
    keras.layers.Dense(1)
])
model.compile(optimizer='sgd', loss='mean_squared_error')
model.summary()

### Model Fitting

In [None]:
model.fit(X, y, epochs=200)

### Prediksi

In [None]:
print(model.predict([[5, 5]]))

##  Studi Kasus 1


**Fashion MNIST**


<img src="img/fashion-mnist-sprite.png" alt="Drawing" style="width: 500px;"/>

Fashion MNIST adalah dataset gambar pakaian sebanyak 70,0000 gambar dengan resolusi 28x28 pixel dengan rentang nilai 0 sampai dengan 255. Dataset ini terdiri dari 10 kategori (label) seperti tertera di tabel bawah ini.

<table>
  <tr>
    <th>Label</th>
    <th>Class</th>
  </tr>
  <tr>
    <td>0</td>
    <td>T-shirt/top</td>
  </tr>
  <tr>
    <td>1</td>
    <td>Trouser</td>
  </tr>
    <tr>
    <td>2</td>
    <td>Pullover</td>
  </tr>
    <tr>
    <td>3</td>
    <td>Dress</td>
  </tr>
    <tr>
    <td>4</td>
    <td>Coat</td>
  </tr>
    <tr>
    <td>5</td>
    <td>Sandal</td>
  </tr>
    <tr>
    <td>6</td>
    <td>Shirt</td>
  </tr>
    <tr>
    <td>7</td>
    <td>Sneaker</td>
  </tr>
    <tr>
    <td>8</td>
    <td>Bag</td>
  </tr>
    <tr>
    <td>9</td>
    <td>Ankle boot</td>
  </tr>
</table>


Dataset ini sudah disediakan oleh Tensorflow sehingga kita tidak harus men-downloadnya secara terpisah. Dataset Fashion MNIST dapat di-download dengan memanggil modul **`tensorflow.keras.datasets.fashion_minist`**. 

Domain permasalahan yang bisa dipecahkan oleh neural network pada dataset ini adalah klasifikasi, sehingga kita harus memisahkan antara dataset yang digunakan untuk training dan dataset yang digunakan untuk testing.

In [None]:
mnist = tf.keras.datasets.fashion_mnist # download dataset
(training_images, training_labels), (test_images, test_labels) = mnist.load_data() # memisahkan dataset menjadi training dan testing

**Tampilkan Contoh Data**

In [None]:
import matplotlib.pyplot as plt

np.set_printoptions(linewidth=200)
plt.imshow(training_images[0])
print(training_images[0])

**Normalisasi Data**

Ini adalah tahap pre-processing data dengan cara menormalisasi nilai setiap pixel dari gambar dengan cara membagi nilai tersebut dengan 255.

In [None]:
training_images  = training_images / 255.0
test_images = test_images / 255.0

In [None]:
# Tampilkan data setelah dinormalisasi
print(np.around(training_images[0], 2)) # Dibulatkan sebanyak 2 angka sebagai contoh saja

**Modeling**

In [None]:
tf.keras.backend.clear_session()
model = tf.keras.models.Sequential([tf.keras.layers.Flatten(), 
                                    tf.keras.layers.Dense(128, activation='relu'), 
                                    tf.keras.layers.Dense(10, activation='softmax')])
model.compile(optimizer = tf.optimizers.Adam(), loss = 'sparse_categorical_crossentropy', metrics=['accuracy'])

**Model Fitting**

In [None]:
history = model.fit(training_images, training_labels, epochs=5)

**Evaluasi**

Setelah proses model fitting, maka dilakukan evaluasi kinerja model terhadap datatest.

In [None]:
model.evaluate(test_images, test_labels)

**Visualisasikan Hasil Training**

In [None]:
import matplotlib.pyplot as plt

acc = history.history['accuracy']
loss = history.history['loss']

epochs = range(len(acc))

plt.plot(epochs, acc, label='Training accuracy')
plt.title('Training accuracy')

plt.figure()

plt.plot(epochs, loss, label='Training Loss')
plt.title('Training loss')
plt.legend()

plt.show()

Kedua grafik di atas menunjukkan performa model neural network terhadap hasil training. Semakin tinggi grafik Training Accuracy maka sepatutnya semakin baik performa modelnya saat training. Berbanding terbalik dengan Training Loss, jika grafiknya semakin menurun maka semakin baik performa trainingnya.

**Latihan 1**

Jalankan kode program di bawah ini:

In [None]:
classifications = model.predict(test_images)

print(classifications[0])

**Apa arti angka dari output kode program di atas?**

1.   10 nilai random yang tidak ada artinya
2.   10 klasifikasi yang dihasilkan dari model
3.   Nilai probabilitas dari setiap label


Jawaban: (3)

**Latihan 2**

Review kode program pendefinisian model yang telah kita lakukan di atas, kemudian kita ubah jumlah neurons pada hidden layer menjadi 512. Apakah terjadi perubahan pada nilai traning loss? Bagaimana menurut pendapat anda?

In [None]:
mnist = tf.keras.datasets.mnist

(training_images, training_labels) ,  (test_images, test_labels) = mnist.load_data()

training_images = training_images/255.0
test_images = test_images/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(512, activation='relu'),
                                    tf.keras.layers.Dense(10, activation='softmax')])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy')

model.fit(training_images, training_labels, epochs=5)

model.evaluate(test_images, test_labels)

classifications = model.predict(test_images)

print(classifications[0])
print(test_labels[0])

## Latihan 3: 

Bagaimana kalau kita menghilangkan layer **`Flatten()`**? Apa yang akan terjadi?

In [None]:
mnist = tf.keras.datasets.mnist

(training_images, training_labels) ,  (test_images, test_labels) = mnist.load_data()

training_images = training_images/255.0
test_images = test_images/255.0

model = tf.keras.models.Sequential([#tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(512, activation='relu'),
                                    tf.keras.layers.Dense(10, activation='softmax')])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy')

model.fit(training_images, training_labels, epochs=5)

model.evaluate(test_images, test_labels)

classifications = model.predict(test_images)

print(classifications[0])
print(test_labels[0])

Anda mendapatkan error mengenai "shape of the data", artinya dimensi data tidak sama dengan dimensi input yang diterima oleh input layer pada model. Ingat kembali bahwa dataset yang kita gunakan adalah gambar dengan resolusi 28x28 pixel, maka kita harus membuat input layer yang bisa memfasilitasi hal tersebut (_membuat kode program untuk memfasilitasi input gambar 28x28 sangat kompleks_).

Oleh karena itu, layer `Flatten()` berguna dalam hal mempermudah implementasi hal tersebut. Layer ini secara otomatis akan mengubah input 28x28 pixel menjadi array 1 dimensi sepanjang 748 (28 x 28 = 748).

**Latihan 4**:

Bagaimana kalau kita ubah jumlah neurons pada output layer menjadi 5, apakah yang akan terjadi? Mengapa hal itu terjadi?

In [None]:
mnist = tf.keras.datasets.mnist

(training_images, training_labels) ,  (test_images, test_labels) = mnist.load_data()

training_images = training_images/255.0
test_images = test_images/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(512, activation='relu'),
                                    tf.keras.layers.Dense(5, activation='softmax')])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy')

model.fit(training_images, training_labels, epochs=5)

model.evaluate(test_images, test_labels)

classifications = model.predict(test_images)

print(classifications[0])
print(test_labels[0])

**Latihan 5**: 

Kita akan menambahkan hidden layer baru dengan jumlah neurons sebanyak 256. Apakah yang akan terjadi? Mengapa hal itu terjadi?

In [None]:
mnist = tf.keras.datasets.mnist

(training_images, training_labels) ,  (test_images, test_labels) = mnist.load_data()

training_images = training_images/255.0
test_images = test_images/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(512, activation='relu'),
                                    tf.keras.layers.Dense(256, activation='relu')
                                    tf.keras.layers.Dense(5, activation='softmax')])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy')

model.fit(training_images, training_labels, epochs=5)

model.evaluate(test_images, test_labels)

classifications = model.predict(test_images)

print(classifications[0])
print(test_labels[0])

**Latihan 6**: 

Cobalah untuk menambahkan jumlah epoch secara bertahap menjadi 15, 30, 50, kemudian 100. Apakah yang akan terjadi? Dan mengapa hal itu terjadi?

In [None]:
mnist = tf.keras.datasets.mnist

(training_images, training_labels) ,  (test_images, test_labels) = mnist.load_data()

training_images = training_images/255.0
test_images = test_images/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(512, activation='relu'),
                                    tf.keras.layers.Dense(5, activation='softmax')])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy')

model.fit(training_images, training_labels, epochs=30)

model.evaluate(test_images, test_labels)

classifications = model.predict(test_images)

print(classifications[34])
print(test_labels[34])

**Latihan 7**: 

Jika kita menghilangkan proses preprocessing, apa yang akan terjadi? Apakah anda akan mendapatkan hasil yang berbeda? 

In [None]:
mnist = tf.keras.datasets.mnist

(training_images, training_labels) ,  (test_images, test_labels) = mnist.load_data()

# Preprocessing
# Berikan tag komentar pada baris kode program 6 dan 7
training_images = training_images/255.0
test_images = test_images/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(512, activation='relu'),
                                    tf.keras.layers.Dense(5, activation='softmax')])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy')

model.fit(training_images, training_labels, epochs=30)

model.evaluate(test_images, test_labels)

classifications = model.predict(test_images)

print(classifications[34])
print(test_labels[34])