# Alzheimer Hastalığı Tahmin Modeli
Bu dosyada veri temizleme, feature engineering ve modelleme adımları gerçekleştirilmiştir.

## 1. Veriyi Yükleme

In [6]:
import pandas as pd

df = pd.read_csv("C:/Users/aksan/Downloads/alzheimers_disease_data.csv")
df.head()

Unnamed: 0,PatientID,Age,Gender,Ethnicity,EducationLevel,BMI,Smoking,AlcoholConsumption,PhysicalActivity,DietQuality,...,MemoryComplaints,BehavioralProblems,ADL,Confusion,Disorientation,PersonalityChanges,DifficultyCompletingTasks,Forgetfulness,Diagnosis,DoctorInCharge
0,4751,73,0,0,2,22.927749,0,13.297218,6.327112,1.347214,...,0,0,1.725883,0,0,0,1,0,0,XXXConfid
1,4752,89,0,0,0,26.827681,0,4.542524,7.619885,0.518767,...,0,0,2.592424,0,0,0,0,1,0,XXXConfid
2,4753,73,0,3,1,17.795882,0,19.555085,7.844988,1.826335,...,0,0,7.119548,0,1,0,1,0,0,XXXConfid
3,4754,74,1,0,1,33.800817,1,12.209266,8.428001,7.435604,...,0,1,6.481226,0,0,0,0,0,0,XXXConfid
4,4755,89,0,0,0,20.716974,0,18.454356,6.310461,0.795498,...,0,0,0.014691,0,0,1,1,0,0,XXXConfid


## 2. Gereksiz Sütunları Kaldırma
Hasta ID'si ve Doktor bilgileri analiz için gereksizdir.

In [7]:
df = df.drop(columns=['PatientID', 'DoctorInCharge'])

## 3. Eksik Verilerin Temizlenmesi
Eksik veriler satır bazında silindi.

In [8]:
df = df.dropna()

## 4. Özellik ve Hedef Değişkenin Belirlenmesi

In [9]:
X = df.drop('Diagnosis', axis=1)
y = df['Diagnosis']

## 5. Veri Ölçeklendirme
Makine öğrenmesi algoritmaları için standartlaştırma yapılır.

In [10]:
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

## 6. Eğitim ve Test Verisi Ayırma

In [11]:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

## 7. Model Eğitimi
Random Forest algoritması kullanıldı.

In [12]:
from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier(random_state=42)
model.fit(X_train, y_train)

## 8. Model Değerlendirmesi

In [13]:
from sklearn.metrics import classification_report, confusion_matrix
y_pred = model.predict(X_test)
print(confusion_matrix(y_test, y_pred))
print(classification_report(y_test, y_pred))

[[272   5]
 [ 27 126]]
              precision    recall  f1-score   support

           0       0.91      0.98      0.94       277
           1       0.96      0.82      0.89       153

    accuracy                           0.93       430
   macro avg       0.94      0.90      0.92       430
weighted avg       0.93      0.93      0.92       430



[[272   5]
 [ 27 126]]
              precision    recall  f1-score   support

           0       0.91      0.98      0.94       277
           1       0.96      0.82      0.89       153

    accuracy                           0.93       430
   macro avg       0.94      0.90      0.92       430
weighted avg       0.93      0.93      0.92       430

272: Doğru şekilde "hasta değil" olarak tahmin edilen kişi sayısı (True Negative)

5: "Hasta değil" olduğu halde "hasta" tahmin edilen kişi sayısı (False Positive)

27: "Hasta" olduğu halde "hasta değil" tahmin edilen kişi sayısı (False Negative)

126: Doğru şekilde "hasta" olarak tahmin edilen kişi sayısı (True Positive)

