In [None]:
import math                                                                      #fungsi math mengevaluasi operasi matematika yang kompleks, operasi trigonometri, operasi logaritma

class NaiveBayesClassifier:

    def __init__(self):
        self.class_probabilities = {}
        self.feature_given_class = {}

    def train(self, X_train, y_train):                                           # merujuk pada instance objek yang sedang digunakan.
        total_samples = len(y_train)
        unique_classes = set(y_train)

        # Hitung P(C): probabilitas setiap kelas
        for class_label in unique_classes:                                       # Ini adalah loop for yang akan iterasi melalui setiap kelas unik dalam dataset pelatihan.
            class_count = sum(1 for label in y_train if label == class_label)    # Ini menghitung jumlah kemunculan setiap kelas dalam dataset pelatihan.
            self.class_probabilities[class_label] = class_count / total_samples  # Ini menetapkan probabilitas kelas ke dalam atribut class_probabilities dari objek yang sedang dioperasikan (dengan menggunakan self).

        # Hitung P(X_i|C): probabilitas fitur dalam setiap kelas
        num_features = len(X_train[0])                                           # Ini mengambil satu sampel pertama dari dataset pelatihan.

        for class_label in unique_classes:                                       # digunakan untuk membuat kamus (dictionary) yang disebut feature_given_class untuk setiap kelas yang unik dalam dataset pelatihan.
            self.feature_given_class[class_label] = {}

            class_indices = [i for i, label in enumerate(y_train) if label == class_label]
            class_samples = [X_train[i] for i in class_indices]

            for feature_index in range(num_features):
                feature_values = [sample[feature_index] for sample in class_samples]

                mean = sum(feature_values) / len(feature_values)                 # Hitung Rata-rata dan Varians
                variance = sum((x - mean) ** 2 for x in feature_values) / len(feature_values)

                # Gunakan distribusi normal untuk perkiraan P(X_i|C)
                self.feature_given_class[class_label][feature_index] = {'mean': mean, 'variance': variance}

    def calculate_probability(self, x, mean, variance):                          # menghitung nilai probabilitas menggunakan distribusi normal (Gaussian)
        exponent = math.exp(-((x - mean) ** 2) / (2 * variance))                 # digunakan untuk mengukur seberapa jauh nilai x dari rata-rata (mean) dalam satuan varians (variance)
        return (1 / (math.sqrt(2 * math.pi * variance))) * exponent

    def predict(self, X_test):                                                   # prediksi pada data uji (X_test)
        predictions = []

        for sample in X_test:                                                    # loop yang mengiterasi melalui setiap sampel dalam data uji (X_test)
            max_prob = float('-inf')                                             # Inisialisasi Variabel
            predicted_class = None

            for class_label in self.class_probabilities:                         # Iterasi Melalui Kelas Probabilitas
                prob = math.log(self.class_probabilities[class_label])           # Hitung Log-Probabilitas

                for feature_index, feature_value in enumerate(sample):           # Iterasi Melalui Fitur dan Nilai Fitur
                    mean = self.feature_given_class[class_label][feature_index]['mean']   # Dapatkan Rata-rata dan Varians dari Model
                    variance = self.feature_given_class[class_label][feature_index]['variance']

                    # Gunakan log untuk menghindari underflow pada perhitungan probabilitas
                    prob += math.log(self.calculate_probability(feature_value, mean, variance))

                if prob > max_prob:                                              # Pengecekan Probabilitas Maksimum
                    max_prob = prob                                              # Pembaruan Probabilitas Maksimum dan Kelas Prediksi
                    predicted_class = class_label

            predictions.append(predicted_class)                                  # Menambahkan ke Daftar Prediksi

        return predictions


# Contoh Penggunaan
# berikut pengkonversian  setiap variabel ke dalam bentuk biner :
X_train = [
    [1, 1],
    [0, 0],
    [1, 1],
    [1, 1],
    [1, 1],
    [0, 0],
    [0, 0],
    [1, 1],
    [1, 1],
    [0, 0],
]

y_train = ['Go-out', 'Go-out', 'Go-out', 'Go-out', 'Go-out', 'Stay-home', 'Stay-home', 'Stay-home', 'Stay-home', 'Stay-home']

X_test = [
    [0, 1],
]

# Membuat dan melatih model Naive Bayes
nb_classifier = NaiveBayesClassifier()
nb_classifier.train(X_train, y_train)

# Melakukan prediksi
predictions = nb_classifier.predict(X_test)

# Menampilkan hasil prediksi
for i in range(len(predictions)):
    print(f"Prediction for sample {X_test[i]}: {predictions[i]}")


Prediction for sample [0, 1]: Stay-home
