In [2]:
import pandas as pd
from sklearn.model_selection import train_test_split, RandomizedSearchCV
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import classification_report

# Veri kümesini oku
dataset = pd.read_csv('C:\\Users\\berat\\OneDrive\\Masaüstü\\diabetes.csv')

# 'Unnamed: 0' sütununu düşür
if 'Unnamed: 0' in dataset.columns:
    dataset.drop(["Unnamed: 0"], axis=1, inplace=True)

# Bağımsız ve bağımlı değişkenleri ayır
x = dataset.drop(["Outcome"], axis=1)
y = dataset["Outcome"]

# Eğitim ve test setlerine ayır
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=42)

# Gaussian Naive Bayes modeli için hiperparametre aralığı
param_dist = {
    'priors': [[0.5, 0.5], [0.3, 0.7], [0.8, 0.2]],
    'var_smoothing': [1e-9, 1e-8, 1e-7]
}

# Gaussian Naive Bayes modeli oluştur
nb = GaussianNB()

# Randomized Search CV ile en iyi modeli bul
rs = RandomizedSearchCV(estimator=nb, param_distributions=param_dist, n_iter=5, cv=5, random_state=42)
rs.fit(x_train, y_train)

# En iyi modeli seç
best_model = rs.best_estimator_

# Test setinde doğruluk skorunu hesapla ve yazdır
accuracy = best_model.score(x_test, y_test)
print("Test setinde doğruluk:", accuracy)

# Eğitim ve test setleri üzerinde tahmin yap
y_train_pred = best_model.predict(x_train)
y_test_pred = best_model.predict(x_test)

# En iyi modelin hiperparametrelerini ve sınıflandırma raporlarını yazdır
print("En iyi hiperparametreler:", rs.best_params_, "\n")
print("Eğitim Seti Sınıflandırma Raporu:")
print(classification_report(y_train, y_train_pred))
print("\nTest Seti Sınıflandırma Raporu:")
print(classification_report(y_test, y_test_pred))


Test setinde doğruluk: 0.7662337662337663
En iyi hiperparametreler: {'var_smoothing': 1e-07, 'priors': [0.8, 0.2]} 

Eğitim Seti Sınıflandırma Raporu:
              precision    recall  f1-score   support

           0       0.76      0.90      0.83       401
           1       0.72      0.47      0.57       213

    accuracy                           0.75       614
   macro avg       0.74      0.69      0.70       614
weighted avg       0.75      0.75      0.74       614


Test Seti Sınıflandırma Raporu:
              precision    recall  f1-score   support

           0       0.79      0.87      0.83        99
           1       0.71      0.58      0.64        55

    accuracy                           0.77       154
   macro avg       0.75      0.73      0.73       154
weighted avg       0.76      0.77      0.76       154

