In [3]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from keras.models import Sequential
from keras.layers import Dense


di posttest 5 kali ini saya menggunakan dataset Wine Quality dari UCI Machine Learning Repository. Dataset ini berisi data tentang kualitas anggur merah dari Portugal, yang diukur dengan berbagai fitur fisikokimia.

In [4]:
url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-red.csv'
data = pd.read_csv(url, delimiter=';')

# Membagi data menjadi input dan target

saya memisahkan data menjadi input (X) dan target (y). Kolom 'quality' digunakan sebagai target, sedangkan fitur lainnya sebagai input.

In [5]:
X = data.drop('quality', axis=1)
y = data['quality']

# Standarisasi data

saya melakukan standardisasi data agar semua fitur memiliki skala yang sama menggunakan StandardScaler

In [7]:
scaler = StandardScaler()
X = scaler.fit_transform(X)

# Dibagi menjadi set pelatihan dan validasi

Data dibagi menjadi dua bagian: training dan validasi dengan perbandingan 80:20. Set training digunakan untuk melatih model, sementara set validasi digunakan untuk mengevaluasi performa model

In [8]:
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.2, random_state=42)

#Membuat Modelnya

saya menggunakan Sequential Model dari Keras untuk membuat jaringan neural sederhana:
1. Lapisan Input: Lapisan pertama memiliki 64 neuron dengan fungsi aktivasi ReLU.
2. Lapisan Tersembunyi: Lapisan kedua memiliki 32 neuron dengan fungsi aktivasi ReLU.
3. Lapisan Output: Lapisan terakhir memiliki 1 neuron dengan fungsi aktivasi linear, karena kita memprediksi nilai kontinu (kualitas anggur).

In [9]:
model = Sequential()
model.add(Dense(64, input_dim=X_train.shape[1], activation='relu'))
model.add(Dense(32, activation='relu'))
model.add(Dense(1, activation='linear'))

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


# Kompilasi model

Model dikompilasi dengan optimizer 'adam' dan loss function 'mean squared error' (MSE). saya menggunakan 'mean absolute error' sebagai metrik untuk mengevaluasi performa model.

In [11]:
model.compile(optimizer='adam', loss='mse', metrics=['mae'])

#Melatih Model

Model dilatih menggunakan data training selama 50 epoch dengan batch size 32. saya juga memasukkan data validasi untuk mengevaluasi performa model pada setiap epoch.

In [12]:
history = model.fit(X_train, y_train, epochs=50, batch_size=32, validation_data=(X_val, y_val))

Epoch 1/50
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 6ms/step - loss: 21.7967 - mae: 4.5042 - val_loss: 5.7284 - val_mae: 2.0962
Epoch 2/50
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 4.3043 - mae: 1.7314 - val_loss: 2.7456 - val_mae: 1.3083
Epoch 3/50
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - loss: 2.3483 - mae: 1.2119 - val_loss: 2.1601 - val_mae: 1.1601
Epoch 4/50
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - loss: 2.0428 - mae: 1.1276 - val_loss: 1.8000 - val_mae: 1.0644
Epoch 5/50
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - loss: 1.6916 - mae: 1.0251 - val_loss: 1.5588 - val_mae: 0.9927
Epoch 6/50
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - loss: 1.4354 - mae: 0.9565 - val_loss: 1.3724 - val_mae: 0.9300
Epoch 7/50
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - loss: 1.2688 

#Evaluasi Model

Setelah model dilatih, saya mengevaluasi performa model pada data training dan validasi. Metode evaluate memberikan nilai loss dan MAE untuk kedua set data.

In [13]:
train_loss, train_mae = model.evaluate(X_train, y_train)
val_loss, val_mae = model.evaluate(X_val, y_val)

print(f'Training MAE: {train_mae}, Validation MAE: {val_mae}')

[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step - loss: 0.3008 - mae: 0.4180  
[1m10/10[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - loss: 0.3916 - mae: 0.4863 
Training MAE: 0.4133481979370117, Validation MAE: 0.4835751950740814
