In [1]:
import pandas as pd
import numpy as np
import warnings
warnings.simplefilter(action='ignore', category=FutureWarning)

# Membuat class Naive Bayes
class NaiveBayesClassifier:
    def __init__(self):
        self.classes = None
        self.class_priors = None
        self.feature_probabilities = None

    def train(self, X, y):
        self.classes = np.unique(y)
        self.class_priors = {}
        self.feature_probabilities = {}

        # Menghitung prior probability untuk setiap kelas
        total_samples = len(y)
        for c in self.classes:
            class_samples = X[y == c]
            self.class_priors[c] = len(class_samples) / total_samples

            # Menghitung probability untuk setiap fitur dalam kelas
            self.feature_probabilities[c] = {}
            for feature in X.columns:
                feature_values = class_samples[feature]
                unique_values, counts = np.unique(
                    feature_values, return_counts=True)
                self.feature_probabilities[c][feature] = dict(
                    zip(unique_values, counts / len(feature_values)))

    def predict(self, X_test):
        predictions = []

        for _, row in X_test.iterrows():
            class_scores = {}

            # Menghitung score untuk setiap kelas berdasarkan probability dan prior probability
            for c in self.classes:
                class_scores[c] = self.class_priors[c]
                for feature, value in row.iteritems():
                    if value in self.feature_probabilities[c][feature]:
                        class_scores[c] *= self.feature_probabilities[c][feature][value]

            # Memprediksi kelas dengan nilai score tertinggi
            predicted_class = max(class_scores, key=class_scores.get)
            predictions.append(predicted_class)

        return predictions


In [2]:
# Mengambil data dari data.csv
print("Data Utama")
data = pd.read_csv('data.csv')
print(pd.DataFrame(data))
print()

# Mengambil data baru
print("Data Baru")
data_new = pd.read_csv('data_baru.csv')
print(pd.DataFrame(data_new))
print()

Data Utama
  jenis_kelamin  umur_karyawan      gaji   status       transportasi
0     laki-laki             20   8000000   single  kendaraan_pribadi
1     laki-laki             35  14000000   single     kendaraan_umum
2     perempuan             26  10000000   single     kendaraan_umum
3     perempuan             27  12000000  menikah  kendaraan_pribadi
4     laki-laki             21   9000000   single  kendaraan_pribadi
5     laki-laki             22  11000000   single  kendaraan_pribadi
6     perempuan             32  15000000  menikah     kendaraan_umum
7     perempuan             26   8000000  menikah     kendaraan_umum
8     laki-laki             25   9000000   single     kendaraan_umum
9     perempuan             20  10000000   single  kendaraan_pribadi

Data Baru
  jenis_kelamin  umur_karyawan      gaji   status
0     perempuan             27  12000000   single
1     laki-laki             35  14000000  menikah



In [3]:
# Memisahkan fitur dan target, yakni transportasi
dataX = data.drop('transportasi', axis=1)
dataY = data['transportasi']

# Membuat objek untuk model menggunakan Naive Bayes
model = NaiveBayesClassifier()

# Melatih model
model.train(dataX, dataY)

# Memprediksi jenis transportasi untuk data baru
predictions = model.predict(data_new)

# Menampilkan hasil prediksi untuk data baru
print("Mendapatkan prediksi transportasi apa untuk data baru")
print()

for i in range(len(data_new)):
    print("Data baru ke-", i+1, ":")
    print("Jenis Kelamin :", data_new['jenis_kelamin'][i])
    print("Umur Karyawan :", data_new['umur_karyawan'][i])
    print("Gaji :", data_new['gaji'][i])
    print("Status :", data_new['status'][i])
    print("Transportasi :", predictions[i])
    print()

Mendapatkan prediksi transportasi apa untuk data baru

Data baru ke- 1 :
Jenis Kelamin : perempuan
Umur Karyawan : 27
Gaji : 12000000
Status : single
Transportasi : kendaraan_umum

Data baru ke- 2 :
Jenis Kelamin : laki-laki
Umur Karyawan : 35
Gaji : 14000000
Status : menikah
Transportasi : kendaraan_pribadi

