## UAP 1 (ELM)

Nama : (Nama Praktikan)

NIM : (NIM Praktikan)

### Regresi dengan ELM

Anda diminta membuat sebuah sistem untuk mendeteksi kualitas dari wine. Dikarenakan data yang banyak dan waktu anda yang terbatas, anda memutuskan untuk menggunakan ELM.

Catatan :
- Template kode yang diberikan dapat diubah sesuai dengan kebutuhan
- ELM untuk klasifikasi mirip dengan  ELM untuk regresi
- Apabila memerlukan informasi lebih lanjut terkait dataset, dapat melihat informasi dataset pada link berikut : https://archive.ics.uci.edu/dataset/186/wine+quality

Peraturan :
- Open Modul
- Dilarang menggunakan AI (Chatbot, Code Generator, dll) untuk membantu pengerjaan
- Dilarang menggunakan library yang mengimplementasikan ELM siap pakai
- Terindikasi menggunakan AI ataupun library akan terkena penalti nilai

## Data Loading and Preprocessing

In [1]:
from google.colab import files

# files.upload()

{}

In [2]:
import pandas as pd
import numpy as np

In [3]:
df = pd.read_csv('winequality.csv')

In [4]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4898 entries, 0 to 4897
Data columns (total 12 columns):
 #   Column                Non-Null Count  Dtype  
---  ------                --------------  -----  
 0   fixed acidity         4898 non-null   float64
 1   volatile acidity      4898 non-null   float64
 2   citric acid           4898 non-null   float64
 3   residual sugar        4898 non-null   float64
 4   chlorides             4898 non-null   float64
 5   free sulfur dioxide   4898 non-null   float64
 6   total sulfur dioxide  4898 non-null   float64
 7   density               4898 non-null   float64
 8   pH                    4898 non-null   float64
 9   sulphates             4898 non-null   float64
 10  alcohol               4898 non-null   float64
 11  quality               4898 non-null   int64  
dtypes: float64(11), int64(1)
memory usage: 459.3 KB


In [5]:
df.describe()

Unnamed: 0,fixed acidity,volatile acidity,citric acid,residual sugar,chlorides,free sulfur dioxide,total sulfur dioxide,density,pH,sulphates,alcohol,quality
count,4898.0,4898.0,4898.0,4898.0,4898.0,4898.0,4898.0,4898.0,4898.0,4898.0,4898.0,4898.0
mean,6.854788,0.278241,0.334192,6.391415,0.045772,35.308085,138.360657,0.994027,3.188267,0.489847,10.514267,5.877909
std,0.843868,0.100795,0.12102,5.072058,0.021848,17.007137,42.498065,0.002991,0.151001,0.114126,1.230621,0.885639
min,3.8,0.08,0.0,0.6,0.009,2.0,9.0,0.98711,2.72,0.22,8.0,3.0
25%,6.3,0.21,0.27,1.7,0.036,23.0,108.0,0.991723,3.09,0.41,9.5,5.0
50%,6.8,0.26,0.32,5.2,0.043,34.0,134.0,0.99374,3.18,0.47,10.4,6.0
75%,7.3,0.32,0.39,9.9,0.05,46.0,167.0,0.9961,3.28,0.55,11.4,6.0
max,14.2,1.1,1.66,65.8,0.346,289.0,440.0,1.03898,3.82,1.08,14.2,9.0


In [18]:
from sklearn.model_selection import train_test_split

X = df.iloc[:, :-1].values
y = df.iloc[:, -1].values
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3, random_state=42)

## Implementasi ELM

In [19]:
class ELM:
    def __init__(self, input_size, hidden_size, activation_function='sigmoid'):
        self.input_size = input_size
        self.hidden_size = hidden_size
        self.activation_function = activation_function
        self.input_weights = None
        self.biases = None
        self.output_weights = None

    def _activation(self, x):
        if self.activation_function == 'sigmoid':
            return 1 / (1 + np.exp(-x))
        elif self.activation_function == 'tanh':
            return np.tanh(x)
        elif self.activation_function == 'relu':
            return np.maximum(0, x)

    def fit(self, X, y):
        n_samples, n_features = X.shape

        self.input_weights = np.random.uniform(-1, 1, (self.hidden_size, self.input_size))
        self.biases = np.random.uniform(-1, 1, (self.hidden_size,))

        H = self._activation(np.dot(X, self.input_weights.T) + self.biases)

        H_pinv = np.linalg.pinv(H)
        self.output_weights = np.dot(H_pinv, y)

    def predict(self, X):
        H = self._activation(np.dot(X, self.input_weights.T) + self.biases)
        return np.dot(H, self.output_weights)

In [21]:
# @title Default title text
# Gunakan data yang telah dipersiapkan sebelumnya untuk melatih model ELM dan lakukan pengujian pada fungsi aktivasi dan hidden size yang berbeda-beda
# Evaluasi model dengan menggunakan MAE dan RMSE

from sklearn.metrics import mean_absolute_error, mean_squared_error

hidden_sizes = [10, 30, 50, 70, 90]
activation_functions = ['sigmoid', 'tanh', 'relu']

results = []

for hidden_size in hidden_sizes:
    for activation_function in activation_functions:
        elm = ELM(input_size=X_train.shape[1], hidden_size=hidden_size, activation_function=activation_function)
        elm.fit(X_train, y_train)
        y_pred = elm.predict(X_test)

        mae = mean_absolute_error(y_test, y_pred)
        rmse = np.sqrt(mean_squared_error(y_test, y_pred))
        results.append({
            'hidden_size': hidden_size,
            'activation_function': activation_function,
            'mae': mae,
            'rmse': rmse
        })
        print(f" HAsil dengan hidden size: {hidden_size}, fungsi aktivasi: {activation_function}, MAE: {mae:.4f}, RMSE: {rmse:.4f}")


 HAsil dengan hidden size: 10, fungsi aktivasi: sigmoid, MAE: 0.8963, RMSE: 9.1216
 HAsil dengan hidden size: 10, fungsi aktivasi: tanh, MAE: 264.1157, RMSE: 10101.3339
 HAsil dengan hidden size: 10, fungsi aktivasi: relu, MAE: 0.5905, RMSE: 0.7529
 HAsil dengan hidden size: 30, fungsi aktivasi: sigmoid, MAE: 241.0022, RMSE: 9215.2498
 HAsil dengan hidden size: 30, fungsi aktivasi: tanh, MAE: 5674.7683, RMSE: 217548.4564
 HAsil dengan hidden size: 30, fungsi aktivasi: relu, MAE: 0.5958, RMSE: 0.9647
 HAsil dengan hidden size: 50, fungsi aktivasi: sigmoid, MAE: 1650790.7777, RMSE: 63292231.0497
 HAsil dengan hidden size: 50, fungsi aktivasi: tanh, MAE: 4576083.5787, RMSE: 175449669.3268
 HAsil dengan hidden size: 50, fungsi aktivasi: relu, MAE: 0.5893, RMSE: 0.9406
 HAsil dengan hidden size: 70, fungsi aktivasi: sigmoid, MAE: 1131159.5399, RMSE: 43367744.1241
 HAsil dengan hidden size: 70, fungsi aktivasi: tanh, MAE: 5831329.7410, RMSE: 223576528.4651
 HAsil dengan hidden size: 70, fung

## Analisis


1. Dalam kasus yang diberikan, apakah ELM dapat memprediksi kualitas wine dengan akurat?
2. Apakah fungsi aktivasi dan jumlah hidden neuron berpengaruh signifikan terhadap hasil yang didapatkan?
3. Jalankan ELM beberapa kali, apakah terdapat kasus dimana ELM mendapatkan akurasi yang buruk? Jelaskan!

## Jawaban
1. Berdasarkan hasil evaluasi, ELM sudah cukup baik dalam prediksi terutama saat menggunakan fungsi sigmoid dan relu yang memiliki hidden neuron 10. Tetapi untuk percobaan lainnya dengan hyperparameter yang berbeda menghasilkann hasil yang sangat buruk.

2. Fungsi aktivasi dan jumlah neuron sangatlah berpengaruh. Dilihat dari hasil evaluasi. untuk fungsi aktivasi sigmoid dan relu  lebih konsisten dibandingkan tanh. Sedangkan untuk jumlah neuron, semakin banyak hidden neuron, maka kemungkinan overfitting akan semakin tinggi sehingga hidden size 10 - 30 memberikan hasil yang cukup baik.

3. Tentu ada, mungkin ada beberapa alasan seperti inisialisasi bobot(dan bias) secara acak sehingga hasil tiap dijalankan pasti berbeda dan overfitting apabila hidden neuron berjumlah terlalu besar.


In [23]:
#untuk no 3
from sklearn.metrics import mean_absolute_error, mean_squared_error

hidden_sizes = [10, 30, 50, 70, 90]
activation_functions = ['sigmoid', 'tanh', 'relu']

results = []

for hidden_size in hidden_sizes:
    for activation_function in activation_functions:
        elm = ELM(input_size=X_train.shape[1], hidden_size=hidden_size, activation_function=activation_function)
        elm.fit(X_train, y_train)
        y_pred = elm.predict(X_test)

        mae = mean_absolute_error(y_test, y_pred)
        rmse = np.sqrt(mean_squared_error(y_test, y_pred))
        results.append({
            'hidden_size': hidden_size,
            'activation_function': activation_function,
            'mae': mae,
            'rmse': rmse
        })
        print(f" HAsil dengan hidden size: {hidden_size}, fungsi aktivasi: {activation_function}, MAE: {mae:.4f}, RMSE: {rmse:.4f}")


 HAsil dengan hidden size: 10, fungsi aktivasi: sigmoid, MAE: 0.6761, RMSE: 0.9476
 HAsil dengan hidden size: 10, fungsi aktivasi: tanh, MAE: 1.2790, RMSE: 24.0879
 HAsil dengan hidden size: 10, fungsi aktivasi: relu, MAE: 0.5990, RMSE: 0.7689
 HAsil dengan hidden size: 30, fungsi aktivasi: sigmoid, MAE: 21321.0684, RMSE: 817436.8774
 HAsil dengan hidden size: 30, fungsi aktivasi: tanh, MAE: 1064767.2167, RMSE: 40823767.0577
 HAsil dengan hidden size: 30, fungsi aktivasi: relu, MAE: 0.5846, RMSE: 0.7514
 HAsil dengan hidden size: 50, fungsi aktivasi: sigmoid, MAE: 48161.0582, RMSE: 1846490.9743
 HAsil dengan hidden size: 50, fungsi aktivasi: tanh, MAE: 331659.1466, RMSE: 12715979.1451
 HAsil dengan hidden size: 50, fungsi aktivasi: relu, MAE: 0.5721, RMSE: 0.7895
 HAsil dengan hidden size: 70, fungsi aktivasi: sigmoid, MAE: 6813358.6925, RMSE: 261227978.5896
 HAsil dengan hidden size: 70, fungsi aktivasi: tanh, MAE: 8349389.9291, RMSE: 320120418.8651
 HAsil dengan hidden size: 70, fung