# Keras Exploration

In [2]:
from keras.models import Sequential
from keras.layers import Dense
from scipy.io import arff
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
from sklearn.compose import ColumnTransformer

Using TensorFlow backend.


## Data Preprocessing
Pada tahap ini, dilakukan prepocessing terhadap data weather. Data mentah weather terdiri atas 4 atribut, yaitu
- outlook, data nominal dengan range *sunny*, *overcast*, dan *rainy*
- temperature, data bertipe numerik
- humidity, data bertipe numerik
- windy, data bertipe nominal dengan range True atau False

Target pembelajaran adalah label dengan range 'yes' (bermain tenis) atau 'no' (tidak bermain tenis).

Untuk data masukan bertipe nominal, akan digunakan strategi *one hot encoding* sebagai *preprocessing* data. Data bertipe nominal akan dibiarkan (*passthrough*)

Dari dataset yang tersedia, 90% data akan digunakan sebagai data latih dan sisanya sebagai data test. Digunakan skema *hold-out* untuk melakukan evaluasi terhadap model yang dibangun. 

In [3]:
# Loading data
data, meta = arff.loadarff('weather.arff')
data_x = [list(d)[:4] for d in data]
data_y = [d[4] for d in data]

# encoding data
le = LabelEncoder()
data_y = le.fit_transform(data_y)

ct = ColumnTransformer([('ohe', OneHotEncoder(), [0, 3]),], remainder= 'passthrough')
data_x = ct.fit_transform(data_x)

# splitting data into train and test data
train_x, test_x, train_y, test_y = train_test_split(data_x, data_y, test_size= 0.1)

## Pembangunan Arsitektur Neural Network

Digunakan neural network dengan satu *hidden layer* dengan banyak neuron 50 buah. Output layer adalah layer dengan satu neuron dan menggunakan fungsi aktivasi sigmoid (supaya output berada pada range (0,1)) 

In [95]:
dense_size = [50, 1]

model = Sequential()
for i, size in enumerate(dense_size):
    if (i == 0):
        model.add(Dense(size, input_dim= train_x.shape[1], activation= 'relu'))
    elif (i != len(dense_size) -1 ):
        model.add(Dense(size, activation= 'relu', kernel_initializer= 'glorot_uniform', bias_initializer= 'glorot_uniform'))
    else:
        model.add(Dense(size, activation= 'sigmoid', kernel_initializer= 'glorot_uniform', bias_initializer= 'glorot_uniform'))

## Pelatihan Neural Network
Neural network dilatih dengan data latih yang tersedia. Pelatihan dilakukan selama 32 epoch dengan batch size sebesar 2. Selama pelatihan berlangsung, loss dan accuracy dari model akan dipantau.

In [96]:
model.compile(loss='binary_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])`
model.summary()
model.fit(train_x, train_y, epochs= 32, batch_size= 2)

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_67 (Dense)             (None, 50)                400       
_________________________________________________________________
dense_68 (Dense)             (None, 1)                 51        
Total params: 451
Trainable params: 451
Non-trainable params: 0
_________________________________________________________________
Epoch 1/32
Epoch 2/32
Epoch 3/32
Epoch 4/32
Epoch 5/32
Epoch 6/32
Epoch 7/32
Epoch 8/32
Epoch 9/32
Epoch 10/32
Epoch 11/32
Epoch 12/32
Epoch 13/32
Epoch 14/32
Epoch 15/32
Epoch 16/32
Epoch 17/32
Epoch 18/32
Epoch 19/32
Epoch 20/32
Epoch 21/32
Epoch 22/32
Epoch 23/32
Epoch 24/32
Epoch 25/32
Epoch 26/32
Epoch 27/32
Epoch 28/32
Epoch 29/32
Epoch 30/32
Epoch 31/32
Epoch 32/32


<keras.callbacks.History at 0x7fcb975dd128>

In [97]:
scores = model.evaluate(test_x, test_y)
print("\n%s: %.2f%%" % (model.metrics_names[1], scores[1]*100))


acc: 100.00%


In [98]:
model.predict(test_x)

array([[0.73346025],
       [0.5150487 ]], dtype=float32)