# ANN Classify 5 classes using Sparse categorical-entropy
- class: horse, bird, fish, cat & dog
- loss: compile(loss='sparse_categorical_crossentropy', .. )

In [None]:
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
import numpy as np

## Dataset

In [None]:
# Gen Dataset 1
X, y = make_blobs(n_samples=1000, centers=5, n_features=2, cluster_std=1.1, random_state=1)

In [None]:
# Dataset 2
X, y = make_blobs(n_samples=1000, centers=5, n_features=2, cluster_std=1.8, random_state=1)

In [None]:
X_df = pd.DataFrame(X, columns=['weight', 'height'])
y_df = pd.DataFrame(y, columns=['class'])

df = pd.concat([X_df, y_df], axis=1)   # รวม X_df และ y_df เข้าด้วยกัน 

target_map = {0:'horse', 1:'bird', 2:'fish', 3:'cat',4:'dog'}  # target (class)
df['class'] = df['class'].map(target_map)

# df.head()
df.sample(5, random_state=100)

In [None]:
sns.scatterplot(x='weight', y='height', data=df, s=70,
                hue=df['class'], style=df['class'])

plt.title('Scatter Plot')
plt.xticks([])
plt.yticks([])
plt.show()

In [None]:
sns.pairplot(df, hue='class')
plt.show()

In [None]:
# Label Encoding
class_names, y = np.unique(df['class'], return_inverse=True)
class_names

In [None]:
y[:10]

In [None]:
X = df.drop('class', axis=1)
X.head()

In [None]:
from sklearn.preprocessing import StandardScaler

sc = StandardScaler()
X_sc = sc.fit_transform(X)
X_sc[:4]

In [None]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X_sc, y, test_size=0.25, random_state=1) #

X_train.shape, X_test.shape

In [None]:
y_train.shape

In [None]:
y_train[:10]

## Model

In [None]:
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense 

# Case 1
model = Sequential()

model.add(Dense(100, activation='relu', input_shape=(2,)))  #  

model.add(Dense(5, activation='softmax'))  # สำหรับ 5 classes

In [None]:
# Case 2
model = Sequential()

model.add(Dense(100, activation='relu', input_shape=(2,)))  #  
model.add(Dense(64, activation='relu'))
model.add(Dense(64, activation='relu'))

model.add(Dense(5, activation='softmax'))  # สำหรับ 5 classes

In [None]:
model.summary()

In [None]:
model.compile(loss='sparse_categorical_crossentropy',    # <<---
             optimizer='adam', 
             metrics=['accuracy'])

In [None]:
import time

start = time.time()
history = model.fit(X_train, y_train, epochs=50, batch_size=32, verbose=0, validation_split=0.25) # no1
end = time.time()

print(f"Time Taken {end - start:.2f} secs")

In [None]:
score = model.evaluate(X_test, y_test, verbose=0)

print("Test loss:", score[0])
print(f"Test accuracy: {score[1]:.4f}")

## Loss and Accuracy Curves

In [None]:
# 2 Columns
plt.figure(figsize=(12, 4))

plt.subplot(1, 2, 1)   # row column index
plt.plot(history.history['loss'], '--', c='b', lw=2, label='Trainning')
plt.plot(history.history['val_loss'], c='r', lw=3, label='Validation')
plt.title('Loss Curve')
plt.legend()
plt.xlabel('Epoch')
plt.ylabel('Loss')

plt.subplot(1, 2, 2)   # row column index
plt.plot(history.history['accuracy'], '--', c='b', lw=2, label='Trainning')
plt.plot(history.history['val_accuracy'], c='r', lw=3, label='Validation')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend()
plt.title('Accuracy Curve')
plt.show()

## Predict

In [None]:
y_pred = model.predict(X_test)

y_pred[:4]
y_pred[:4].round(3)

In [None]:
y_pred_cat = np.argmax(y_pred, axis=1)
y_pred_cat[:4]

In [None]:
class_names[y_pred_cat[:4]]

## Confusion Matrix

In [None]:
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay

cm = confusion_matrix(y_test, y_pred_cat)   ## <-- 
ConfusionMatrixDisplay(cm, display_labels=class_names).plot()
plt.title('Confusion Matrix')
plt.show()

## Decision Regions

In [None]:
# 
class Onehot2Int(object):
    def __init__(self, model):
        self.model = model

    def predict(self, X):
        y_pred = self.model.predict(X)
        return np.argmax(y_pred, axis=1)

model_no_ohe = Onehot2Int(model)    

In [None]:
from mlxtend.plotting import plot_decision_regions

ax = plot_decision_regions(X_train, y_train, clf=model_no_ohe,
                          zoom_factor=1.)

handles, labels = ax.get_legend_handles_labels()
ax.legend(handles, class_names, framealpha=0.5)

plt.title('Model Regions') 
plt.xticks([])
plt.yticks([])
plt.xlabel('weight')
plt.ylabel('height')
plt.show()

## Drill: แบบฝึกหัด
- ปรับ Dataset ให้ค่าข้อมูล มีการคาบเกี่ยวกันมากขึ้น (เพิ่ม cluster_std เช่น 1.8) จะพบว่า Accuracy ลดลง เนื่องจากลักษณะการกระจายข้อมูลมีการคาบเกี่ยวกันมากขึ้น
- เพิ่มข้อมูล Dataset เป็น 2000 เพิ่มจำนวน Class เช่น 6, 7 Classes (กำหนด centers และ target_map)
- สร้าง NN ให้มีจำนวน Hidden Layer ต่าง ๆ เช่น 64, 128x64, 128x64x32 แล้วดูผล Accuracy
- วิเคราะห์ Loss Curve ว่ากำหนด Epochs เหมาะสมหรือไม่
- เพิ่มจำนวน Features ให้มากกว่า 2 เช่น 3 4 ... ฯลฯ (กำหนดที่ n_features, กำหนด columns ให้สอดคล้องกับจำนวน, และกำหนด input ที่ input_shape ด้วย) ** ไม่ต้องพล๊อต Decision Regions
