In [3]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from interpret.glassbox import ExplainableBoostingClassifier
from interpret import show

# Wczytanie danych
serce = pd.read_csv('serce.csv') 
X = serce[['wiek', 'plec', 'typ_bolu_klatka', 'cisnienie_krwi_spoczynek', 
            'cholesterol_we_krwi', 'cukier_we_krwi', 
            'wynik_ekg_spoczynek', 'ilosc_uderzen_serca', 
            'bol_klatka_wysilek', 'max_obnizka_st', 
            'przebieg_st_szczyt', 'zwapnienia_miazdzycowe', 
            'proba_ta']]

y = serce['diagnoza']

# Podział danych na zbiór treningowy i testowy
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.7, random_state=42)

model = RandomForestClassifier(n_estimators=50)
model.fit(X_train, y_train)
# Utworzenie i wytrenowanie modelu RandomForest
rf = RandomForestClassifier()                              
rf.fit(X_train, y_train)
# Dokonanie predykcji na zbiorze testowym
y_pred_rf = rf.predict(X_test)       
# Utworzenie i wytrenowanie modelu EBM                       
ebm = ExplainableBoostingClassifier()                       
ebm.fit(X_train, y_train)
# Dokonanie predykcji na zbiorze testowym
y_pred_ebm = ebm.predict(X_test)                           

# Wyświetlenie dokładności modeli
accuracy_rf = rf.score(X_test, y_test)
accuracy_ebm = ebm.score(X_test, y_test)
print(f"Dokładność RandomForest: {accuracy_rf*100:.2f}%")
print(f"Dokładność EBM: {accuracy_ebm*100:.2f}%")

# Wyświetlenie globalnej interpretacji modelu EBM
show(ebm.explain_global())      
                           
# Wyświetlenie lokalnej interpretacji dla próbek od 0 do 50
show(ebm.explain_local(X_test[:50], y_test[:50]), 0)


Dokładność RandomForest: 77.25%
Dokładność EBM: 77.78%
