<a href="https://colab.research.google.com/github/anniseraa/fsd/blob/main/Naive_Bayes.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**Studi Kasus**

Klasifikasi Sinyal Darurat
Kita akan menggunakan data yang sama: Frekuensi dan Amplitudo untuk memprediksi Kelas (Yes/No).

In [None]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import classification_report, accuracy_score



*   import pandas as pd : Digunakan untuk mengelola data dalam bentuk DataFrame (seperti tabel atau spreadsheet). Ini memudahkan pemisahan data fitur (X) dan target (y).
*  Import numpy as np : Pustaka dasar untuk komputasi numerik di Python, terutama untuk operasi dengan array dan matriks.

*   from sklearn.naive_bayes import GaussianNB : Ini adalah inti dari kode. Kita mengimpor kelas GaussianNB dari pustaka Scikit-learn, yang merupakan implementasi standar algoritma Gaussian Naïve Bayes.
*   from sklearn.metrics import ...: (Tidak sepenuhnya digunakan dalam contoh prediksi tunggal ini, tetapi baik untuk disertakan) Ini digunakan untuk mengevaluasi kinerja model jika data dibagi menjadi training dan testing set.





In [None]:
## 1. Persiapan Data (Meniru Data Pelatihan)
print("1. Persiapan Data:")

# Membuat DataFrame dari data studi kasus
data = {
    'Frekuensi_Hz': [25, 22, 18, 20, 28],
    'Amplitudo_Volt': [10, 8, 7, 5, 12],
    'Kelas_Darurat': ['Yes', 'Yes', 'No', 'No', 'Yes']
}
df = pd.DataFrame(data)

# Memisahkan Fitur (X) dan Target (y)
X = df[['Frekuensi_Hz', 'Amplitudo_Volt']]
y = df['Kelas_Darurat']

print("Data Latihan:")
print(df)
print("-" * 50)

1. Persiapan Data:
Data Latihan:
   Frekuensi_Hz  Amplitudo_Volt Kelas_Darurat
0            25              10           Yes
1            22               8           Yes
2            18               7            No
3            20               5            No
4            28              12           Yes
--------------------------------------------------




*   data = {...} : Data Mentah	Mendefinisikan data kasus (Frekuensi_Hz, Amplitudo_Volt) dan kelas target (Kelas_Darurat) sebagai dictionary.
*   df = pd.DataFrame(data) : Pembuatan DataFrame Mengubah dictionary data mentah menjadi objek DataFrame Pandas agar mudah diolah.
*   X = df[['Frekuensi_Hz', 'Amplitudo_Volt']] : Fitur (X) Mendefinisikan variabel X sebagai data fitur/input. Ini adalah variabel independen yang akan digunakan untuk membuat prediksi.
*   y = df['Kelas_Darurat'] : Target (y)	Mendefinisikan variabel y sebagai variabel target/output. Ini adalah kelas yang ingin diprediksi.







In [None]:
## 2. Implementasi dan Pelatihan Model
print("2. Implementasi dan Pelatihan Model:")

# Inisialisasi model Gaussian Naive Bayes
model = GaussianNB()

# Melatih model dengan data pelatihan
model.fit(X, y)

print("Model Gaussian Naive Bayes telah dilatih.")
print("-" * 50)

2. Implementasi dan Pelatihan Model:
Model Gaussian Naive Bayes telah dilatih.
--------------------------------------------------


*   **`model = GaussianNB()`**: Menginisialisasi sebuah objek model Gaussian Naive Bayes. Model ini cocok untuk fitur kontinu yang diasumsikan berdistribusi Gaussian.
*   **`model.fit(X, y)`**: Melatih model menggunakan data fitur (`X`) dan target (`y`) yang telah disiapkan. Model akan belajar pola dari data ini untuk membuat prediksi di masa depan.

In [None]:
## 3. Prediksi Data Baru
print("3. Prediksi Data Baru:")

# Data input baru yang ingin diklasifikasikan
X_new = pd.DataFrame({
    'Frekuensi_Hz': [24],
    'Amplitudo_Volt': [9]
})

# Melakukan prediksi kelas
y_pred = model.predict(X_new)

# Melakukan prediksi probabilitas (Skor Posterior yang Dinormalisasi)
y_proba = model.predict_proba(X_new)

print(f"Data Input Baru: Frekuensi=24 Hz, Amplitudo=9 Volt")
print(f"Prediksi Kelas: {y_pred[0]}")
print("-" * 50)

3. Prediksi Data Baru:
Data Input Baru: Frekuensi=24 Hz, Amplitudo=9 Volt
Prediksi Kelas: Yes
--------------------------------------------------


*   **`X_new = pd.DataFrame({...})`**: Membuat DataFrame baru dengan satu data input (Frekuensi: 24 Hz, Amplitudo: 9 Volt) yang ingin diklasifikasikan.
*   **`y_pred = model.predict(X_new)`**: Melakukan prediksi kelas untuk `X_new`. Model akan mengembalikan kelas (`'Yes'` atau `'No'`) yang paling mungkin berdasarkan data input.
*   **`y_proba = model.predict_proba(X_new)`**: Melakukan prediksi probabilitas untuk `X_new`. Ini mengembalikan array yang menunjukkan probabilitas setiap kelas (e.g., `[probabilitas_No, probabilitas_Yes]`).

In [None]:
## 4. Analisis Probabilitas Posterior (Dinormalisasi)
print("4. Probabilitas Posterior (Dinormalisasi):")

# Dapatkan nama-nama kelas yang diprediksi
classes = model.classes_

# Hasil prediksi probabilitas adalah array (contoh: [probabilitas_No, probabilitas_Yes])
prob_no = y_proba[0][np.where(classes == 'No')[0][0]]
prob_yes = y_proba[0][np.where(classes == 'Yes')[0][0]]

print(f"Probabilitas Sinyal Darurat (Yes): {prob_yes:.4f}")
print(f"Probabilitas Sinyal Normal (No): {prob_no:.4f}")

# Verifikasi total probabilitas
print(f"Total Probabilitas: {prob_yes + prob_no:.4f}")

4. Probabilitas Posterior (Dinormalisasi):
Probabilitas Sinyal Darurat (Yes): 1.0000
Probabilitas Sinyal Normal (No): 0.0000
Total Probabilitas: 1.0000




*   Mengidentifikasi urutan kelas yang dipelajari model (classes).

*   Mengambil nilai probabilitas untuk masing-masing kelas ('Yes' dan 'No') dari hasil prediksi (y_proba).
*   Menampilkan probabilitas tersebut dan memverifikasi normalisasi (bahwa jumlah probabilitasnya adalah 1).














Kesimpulan:



1. Prediksi Utama =

Model Gaussian Naïve Bayes, yang dilatih dengan data 5 sampel, memprediksi bahwa sinyal baru dengan Frekuensi 24 Hz dan Amplitudo 9 Volt termasuk dalam Kelas Darurat: Yes.

2. Analisis Probabilitas =

Hasil prediksi probabilitas yang dinormalisasi menunjukkan kepastian yang sangat tinggi:

Probabilitas Sinyal Darurat (Yes): 1.0000

Probabilitas Sinyal Normal (No): 0.0000

  Ini berarti model tersebut sangat yakin bahwa sinyal baru ini adalah sinyal darurat, karena kombinasi Frekuensi (24 Hz) dan Amplitudo (9 Volt) sangat sesuai dengan pola statistik (rata-rata dan standar deviasi) dari data sinyal Darurat ('Yes') dan sangat jauh dari pola sinyal Normal ('No') dalam data pelatihan yang sangat kecil.
