<a href="https://colab.research.google.com/github/Andicleomj/Machine-Learning/blob/main/Week11/Deep%20learning%20model/Heart%20Disease.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#### Andi Cleopatra Maryam Jamila
#### 1103213071
#### Deep learning model dengan dataset heart disease

In [1]:
# Import library
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset
import pandas as pd
import numpy as np
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split


* mengimpor berbagai pustaka untuk melakukan machine learning dengan PyTorch, seperti torch, nn (neural network), optim (optimizer), serta pustaka untuk pemrosesan data seperti pandas, numpy, dan sklearn.

In [2]:
# Load dataset
df = pd.read_csv('/content/sample_data/heart.csv')

# Menampilkan beberapa baris pertama untuk melihat struktur data
df.head()


Unnamed: 0,age,sex,cp,trestbps,chol,fbs,restecg,thalach,exang,oldpeak,slope,ca,thal,target
0,52,1,0,125,212,0,1,168,0,1.0,2,2,3,0
1,53,1,0,140,203,1,0,155,1,3.1,0,0,3,0
2,70,1,0,145,174,0,1,125,1,2.6,0,0,3,0
3,61,1,0,148,203,0,1,161,0,0.0,2,1,3,0
4,62,0,0,138,294,1,1,106,0,1.9,1,3,2,0


* Membaca dan Menampilkan dataset

#### **Pemrosesan Data**

In [5]:
# Pisahkan fitur dan target
X = df.drop('target', axis=1).values  # Semua kolom kecuali 'target' sebagai fitur
y = df['target'].values  # Kolom 'target' sebagai label


* X: Semua kolom kecuali kolom target disimpan sebagai fitur.
* y: Kolom target digunakan sebagai label atau target yang ingin diprediksi.

In [4]:
# Normalisasi fitur
scaler = StandardScaler()
X = scaler.fit_transform(X)

* StandardScaler digunakan untuk menormalisasi fitur agar data memiliki rata-rata 0 dan standar deviasi 1. Ini membantu model untuk belajar lebih cepat dan lebih baik.
* fit_transform() menghitung rata-rata dan deviasi standar pada data dan menerapkan normalisasi pada data.

In [6]:
# Split data menjadi train dan test set
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


* train_test_split membagi data menjadi data pelatihan (80%) dan data pengujian (20%) secara acak, sehingga model dapat dilatih pada sebagian data dan dievaluasi pada data lainnya.
* random_state=42 memastikan pembagian data yang konsisten setiap kali kode dijalankan.

In [7]:
# Konversi ke tensor PyTorch
X_train_tensor = torch.tensor(X_train, dtype=torch.float32)
X_test_tensor = torch.tensor(X_test, dtype=torch.float32)
y_train_tensor = torch.tensor(y_train, dtype=torch.long)  # target harus dalam bentuk long
y_test_tensor = torch.tensor(y_test, dtype=torch.long)

* PyTorch memerlukan data dalam format tensor, bukan array atau DataFrame. Oleh karena itu, fitur (X_train, X_test) dan target (y_train, y_test) dikonversi menjadi tensor PyTorch dengan tipe data yang sesuai (float32 untuk fitur dan long untuk target karena ini adalah masalah klasifikasi).

#### **Definisikan Model MLP**

In [8]:
# Fungsi untuk membuat model MLP dengan parameter yang dapat disesuaikan
class MLPModel(nn.Module):
    def __init__(self, input_dim, hidden_layers, hidden_units, activation_function):
        super(MLPModel, self).__init__()

        # Menentukan layers berdasarkan konfigurasi
        layers = []
        prev_units = input_dim
        for _ in range(hidden_layers):
            layers.append(nn.Linear(prev_units, hidden_units))  # Menambahkan layer linear
            if activation_function == 'ReLU':
                layers.append(nn.ReLU())  # Fungsi aktivasi ReLU
            elif activation_function == 'Sigmoid':
                layers.append(nn.Sigmoid())  # Fungsi aktivasi Sigmoid
            elif activation_function == 'Tanh':
                layers.append(nn.Tanh())  # Fungsi aktivasi Tanh
            elif activation_function == 'Softmax':
                layers.append(nn.Softmax(dim=1))  # Fungsi aktivasi Softmax
            prev_units = hidden_units

        layers.append(nn.Linear(prev_units, 2))  # Output layer untuk klasifikasi 2 kelas
        self.model = nn.Sequential(*layers)

    def forward(self, x):
        return self.model(x)


* MLPModel adalah kelas yang mendefinisikan model neural network menggunakan Multi-Layer Perceptron (MLP).
* Di dalam konstruktor __init__, model dibangun berdasarkan parameter yang diteruskan (jumlah hidden layers, jumlah neuron di setiap layer, dan fungsi aktivasi).
  * nn.Linear: Membuat layer linear yang menghubungkan neuron dari satu layer ke layer berikutnya.
  * Fungsi aktivasi seperti ReLU, Sigmoid, Tanh, dan Softmax ditambahkan sesuai dengan pilihan pengguna.
  * Layer output terdiri dari 2 neuron, sesuai dengan tugas klasifikasi biner (penyakit jantung atau tidak).
* forward: Mendefinisikan bagaimana input melewati layer-layer model untuk menghasilkan output.

#### **Melatih Model dengan Berbagai Konfigurasi**

In [9]:
# Parameter eksperimen
epochs = [1, 10, 25, 50, 100, 250]
learning_rates = [10, 1, 0.1, 0.01, 0.001, 0.0001]
batch_sizes = [16, 32, 64, 128, 256, 512]
hidden_layers = [1, 2, 3]
hidden_units = [4, 8, 16, 32, 64]
activation_functions = ['ReLU', 'Sigmoid', 'Tanh', 'Softmax']


* Menyimpan berbagai konfigurasi parameter eksperimen yang akan diuji selama pelatihan model, termasuk jumlah epoch, learning rate, ukuran batch, jumlah hidden layers, jumlah neuron di setiap hidden layer, dan fungsi aktivasi.

In [10]:
# Fungsi untuk melatih model
def train_model(X_train_tensor, y_train_tensor, epochs, learning_rate, batch_size, hidden_layers, hidden_units, activation_function):
    # Membuat DataLoader untuk batch training
    dataset = TensorDataset(X_train_tensor, y_train_tensor)
    train_loader = DataLoader(dataset, batch_size=batch_size, shuffle=True)

    # Inisialisasi model
    input_dim = X_train_tensor.shape[1]
    model = MLPModel(input_dim, hidden_layers, hidden_units, activation_function)

    # Inisialisasi loss function dan optimizer
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.Adam(model.parameters(), lr=learning_rate)

    # Melatih model
    for epoch in range(epochs):
        model.train()
        for data, target in train_loader:
            optimizer.zero_grad()  # Reset gradien
            output = model(data)  # Forward pass
            loss = criterion(output, target)  # Hitung loss
            loss.backward()  # Backward pass
            optimizer.step()  # Update parameter model

    return model


* Fungsi train_model melatih model MLP menggunakan konfigurasi parameter eksperimen yang diteruskan sebagai argumen.
* TensorDataset dan DataLoader digunakan untuk memproses data dalam batch selama pelatihan.
* Model diinisialisasi, loss function (CrossEntropyLoss) dan optimizer (Adam) digunakan untuk optimasi.
* Selama epochs, model dilatih dengan melakukan forward pass, menghitung loss, dan memperbarui parameter menggunakan backward pass.

In [11]:
# Menguji model dengan berbagai konfigurasi
best_model = None
best_accuracy = 0

for epoch in epochs:
    for lr in learning_rates:
        for batch_size in batch_sizes:
            for hl in hidden_layers:
                for hu in hidden_units:
                    for af in activation_functions:
                        model = train_model(X_train_tensor, y_train_tensor, epoch, lr, batch_size, hl, hu, af)
                        # Evaluasi akurasi model (di sini hanya contoh evaluasi dengan akurasi)
                        model.eval()
                        with torch.no_grad():
                            outputs = model(X_test_tensor)
                            _, predicted = torch.max(outputs, 1)
                            accuracy = (predicted == y_test_tensor).sum().item() / y_test_tensor.size(0)
                            if accuracy > best_accuracy:
                                best_accuracy = accuracy
                                best_model = model
                        print(f"Epoch: {epoch}, LR: {lr}, Batch Size: {batch_size}, Hidden Layers: {hl}, Units: {hu}, Activation: {af}, Accuracy: {accuracy}")


[1;30;43mStreaming output truncated to the last 5000 lines.[0m
Epoch: 50, LR: 0.001, Batch Size: 16, Hidden Layers: 3, Units: 4, Activation: ReLU, Accuracy: 0.7560975609756098
Epoch: 50, LR: 0.001, Batch Size: 16, Hidden Layers: 3, Units: 4, Activation: Sigmoid, Accuracy: 0.7560975609756098
Epoch: 50, LR: 0.001, Batch Size: 16, Hidden Layers: 3, Units: 4, Activation: Tanh, Accuracy: 0.7170731707317073
Epoch: 50, LR: 0.001, Batch Size: 16, Hidden Layers: 3, Units: 4, Activation: Softmax, Accuracy: 0.5024390243902439
Epoch: 50, LR: 0.001, Batch Size: 16, Hidden Layers: 3, Units: 8, Activation: ReLU, Accuracy: 0.7902439024390244
Epoch: 50, LR: 0.001, Batch Size: 16, Hidden Layers: 3, Units: 8, Activation: Sigmoid, Accuracy: 0.7658536585365854
Epoch: 50, LR: 0.001, Batch Size: 16, Hidden Layers: 3, Units: 8, Activation: Tanh, Accuracy: 0.6731707317073171
Epoch: 50, LR: 0.001, Batch Size: 16, Hidden Layers: 3, Units: 8, Activation: Softmax, Accuracy: 0.7902439024390244
Epoch: 50, LR: 0.00

* Model diuji dengan kombinasi parameter eksperimen yang berbeda-beda (epochs, learning rates, batch sizes, dll.).
* Setelah pelatihan selesai, model dievaluasi pada data pengujian (X_test_tensor dan y_test_tensor) untuk menghitung akurasi.
* Akurasi terbaik disimpan, dan kombinasi parameter yang memberikan akurasi terbaik dicatat.

#### **Menampilkan Hasil dan Analisis**

In [12]:
# Menganalisis hasil terbaik
print(f"Best Model Accuracy: {best_accuracy}")


Best Model Accuracy: 0.9853658536585366


* Menampilkan akurasi terbaik yang diperoleh dari kombinasi parameter yang diuji.

#### **Simpan Model dan Hasil**

In [13]:
# Menyimpan model terbaik
torch.save(best_model.state_dict(), 'best_heart_model.pth')


* Menyimpan model dengan akurasi terbaik ke dalam file 'best_heart_model.pth', agar model ini dapat digunakan kembali di masa depan tanpa perlu dilatih ulang.