Machine Learning modellerinden KNN modeli ile şeker hastalığı tahmin etme

In [57]:
import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings('ignore')
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report


In [58]:
# Veri yükleme
data = pd.read_csv("diabetes.csv")

# X ve y belirleme
X = data.drop(columns=["Outcome"])  # Bağımsız değişkenler
y = data["Outcome"]  # Bağımlı değişken (0 veya 1 - Şeker hastalığı)

# Veriyi eğitim ve test setlerine bölme
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


In [60]:
# Standardizasyon
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)


In [61]:
# KNN modelini oluştur
knn = KNeighborsClassifier(n_neighbors=5)  # K = 5

# Modeli eğit
knn.fit(X_train, y_train)


KNeighborsClassifier()

In [62]:
# Test seti üzerinde tahmin
y_pred = knn.predict(X_test)

# Modelin doğruluğunu hesapla
accuracy = accuracy_score(y_test, y_pred)
print(f"Model Accuracy: {accuracy * 100:.2f}%")

# Confusion matrix ve classification report
print(confusion_matrix(y_test, y_pred))
print(classification_report(y_test, y_pred))


Model Accuracy: 69.48%
[[79 20]
 [27 28]]
              precision    recall  f1-score   support

           0       0.75      0.80      0.77        99
           1       0.58      0.51      0.54        55

    accuracy                           0.69       154
   macro avg       0.66      0.65      0.66       154
weighted avg       0.69      0.69      0.69       154



In [63]:
# Farklı k değerlerini deneme
accuracies = []
for k in range(1, 21):
    knn = KNeighborsClassifier(n_neighbors=k)
    knn.fit(X_train, y_train)
    y_pred_k = knn.predict(X_test)
    accuracies.append(accuracy_score(y_test, y_pred_k))

# En iyi k değerini bul
best_k = accuracies.index(max(accuracies)) + 1
print(f"En iyi K değeri: {best_k}")


En iyi K değeri: 18


In [64]:
import numpy as np
import pandas as pd
from sklearn.neighbors import KNeighborsClassifier

# Örnek eğitim verisi (x_ham_veri) oluştur
x_ham_veri = np.array([[22, 85, 66, 30], [25, 70, 75, 35], [30, 90, 80, 40]])  # Eğitim verisi
y_ham_veri = np.array([0, 1, 0])  # Sınıf etiketleri

# KNN modelini kur ve eğit
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(x_ham_veri, y_ham_veri)

# Kullanıcıdan veri al
bmi = float(input("BMI değerini girin: "))
glucose = float(input("Glukoz seviyesini girin: "))
blood_pressure = float(input("Kan basıncını girin: "))
age = int(input("Yaşınızı girin: "))

# Kullanıcının girdiği verileri NumPy dizisine dönüştür
yeni_veri = np.array([[bmi, glucose, blood_pressure, age]])

# Veriyi normalize et
# Burada x_ham_veri'nin min ve max değerlerini alıyoruz
min_values = np.min(x_ham_veri, axis=0)
max_values = np.max(x_ham_veri, axis=0)

yeni_veri_normalized = (yeni_veri - min_values) / (max_values - min_values)

# KNN modelimizi kullanarak tahmin yapalım
tahmin = knn.predict(yeni_veri_normalized)
print("Tahmin Sonucu:", "Şeker hastası" if tahmin[0] == 1 else "Şeker hastası değil")


BMI değerini girin: 23
Glukoz seviyesini girin: 80
Kan basıncını girin: 130
Yaşınızı girin: 25
Tahmin Sonucu: Şeker hastası değil
