In [2]:
# Gerekli kütüphaneleri yükleyin
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, f1_score, accuracy_score
from sklearn.tree import DecisionTreeClassifier
from sklearn.svm import SVC
from sklearn.neighbors import KNeighborsClassifier
from sklearn.ensemble import GradientBoostingClassifier, RandomForestClassifier
from sklearn.neural_network import MLPClassifier
import xgboost as xgb
import lightgbm as lgb
import catboost as cb

# Veriyi yükleme
df = pd.read_csv(r'C:\Users\realb\Desktop\kalp krizi ihtimali hesaplayan model\heart.csv')

# Bağımsız ve bağımlı değişkenleri ayırma
X = df[['age', 'sex', 'cp', 'trestbps', 'chol', 'fbs', 'restecg', 'thalach', 'exang', 'oldpeak', 'slope', 'ca', 'thal']]
y = df['target']

# Eğitim ve test setlerine ayırma
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Model eğitim ve değerlendirme fonksiyonu
def evaluate_model(model):
    model.fit(X_train, y_train)
    y_pred = model.predict(X_test)
    mse = mean_squared_error(y_test, y_pred)
    f1 = f1_score(y_test, y_pred, average='weighted')
    accuracy = accuracy_score(y_test, y_pred)
    return mse, f1, accuracy

# Modelleri tanımlama
models = {
    "CART Model": DecisionTreeClassifier(),
    "SVC Model": SVC(),
    "KNN Model": KNeighborsClassifier(),
    "GBM Model": GradientBoostingClassifier(),
    "Random Forests Model": RandomForestClassifier(),
    "XGBoost Model": xgb.XGBClassifier(),
    "LightGBM Model": lgb.LGBMClassifier(),
    "CatBoost Model": cb.CatBoostClassifier(verbose=0),
    "Neural Network Model": MLPClassifier(max_iter=1000)
}

# Her modeli değerlendirme
results = {}
for name, model in models.items():
    mse, f1, accuracy = evaluate_model(model)
    results[name] = {
        "Mean Squared Error": mse,
        "F1 Score": f1,
        "Accuracy": accuracy
    }

# Sonuçları yazdırma
for model_name, metrics in results.items():
    print(f"Model: {model_name}")
    print(f"Mean Squared Error: {metrics['Mean Squared Error']}")
    print(f"F1 Score: {metrics['F1 Score']}")
    print(f"Accuracy: {metrics['Accuracy']}")
    print("-----------")

[LightGBM] [Info] Number of positive: 133, number of negative: 109
[LightGBM] [Info] Auto-choosing row-wise multi-threading, the overhead of testing was 0.000030 seconds.
You can set `force_row_wise=true` to remove the overhead.
And if memory is not enough, you can set `force_col_wise=true`.
[LightGBM] [Info] Total Bins 238
[LightGBM] [Info] Number of data points in the train set: 242, number of used features: 13
[LightGBM] [Info] [binary:BoostFromScore]: pavg=0.549587 -> initscore=0.199001
[LightGBM] [Info] Start training from score 0.199001
Model: CART Model
Mean Squared Error: 0.16393442622950818
F1 Score: 0.835889300193901
Accuracy: 0.8360655737704918
-----------
Model: SVC Model
Mean Squared Error: 0.29508196721311475
F1 Score: 0.6941182986264952
Accuracy: 0.7049180327868853
-----------
Model: KNN Model
Mean Squared Error: 0.3114754098360656
F1 Score: 0.6870031363302711
Accuracy: 0.6885245901639344
-----------
Model: GBM Model
Mean Squared Error: 0.22950819672131148
F1 Score: 0.77

Bu çalışmada, kalp krizi riskini tahmin etmek amacıyla çeşitli makine öğrenimi algoritmalarının performansını değerlendirdik. Kullanılan veri seti, yaş, cinsiyet, kan basıncı, kolesterol seviyeleri, EKG sonuçları ve egzersiz bilgileri gibi bir dizi sağlık ölçümünü içermektedir. Hedef değişkenimiz, kalp hastalığı olup olmadığını belirleyen bir sınıflandırma problemidir.

Çalışmada kullanılan modeller şunlardır:

Decision Tree (CART)
Support Vector Classifier (SVC)
K-Nearest Neighbors (KNN)
Gradient Boosting Machines (GBM)
Random Forests
XGBoost
LightGBM
CatBoost
Yapay Sinir Ağları (Neural Networks)
Her modelin performansını doğruluk, F1 skoru ve ortalama kare hatası (MSE) metrikleri ile değerlendirdik. Bu sayede, kalp krizi riskini tahmin etmede en etkili algoritmaları belirlemeyi amaçladık.

Sonuçlar, hangi algoritmaların sağlık verileri ile daha başarılı tahminler yaptığını göstererek, gelecekteki klinik uygulamalarda kullanılabilecek potansiyel araçları ortaya koymaktadır.