In [5]:
# Importowanie bibliotek
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import ExtraTreesRegressor
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score
from lime.lime_tabular import LimeTabularExplainer

# Wczytanie danych
data = pd.read_csv("housing.csv")
print("Kolumny w danych:", data.columns.tolist())

# Identyfikacja zmiennej docelowej
target_column = "PRICE"  # Ustaw właściwą nazwę
X = data.drop(columns=[target_column])
y = data[target_column]

# Podział na zbiór treningowy i testowy
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.1, random_state=42
)

# Budowa modelu regresji (ExtraTreesRegressor)
model = ExtraTreesRegressor(random_state=42)
model.fit(X_train, y_train)

# Ewaluacja modelu na zbiorze testowym
y_pred = model.predict(X_test)
print("Metryki ewaluacji modelu:")
print(f"Mean Absolute Error (MAE): {mean_absolute_error(y_test, y_pred):.2f}")
print(f"Mean Squared Error (MSE): {mean_squared_error(y_test, y_pred):.2f}")
print(f"R2 Score: {r2_score(y_test, y_pred):.2f}")

# Tworzenie obiektu LimeTabularExplainer
explainer = LimeTabularExplainer(
    training_data=X_train.values,
    feature_names=X.columns.tolist(),
    discretize_continuous=True
)

# Wyjaśnienie lokalne dla 4 różnych przypadków predykcji
for idx in [0, 1, 2, 3]:  # Wybrane indeksy przypadków
    explanation = explainer.explain_instance(
        data_row=X_test.iloc[idx].values,
        predict_fn=model.predict
    )
    print(f"\nWyjaśnienie dla przypadku {idx}:")
    print(f"Rzeczywista cena domu: {y_test.iloc[idx]}")
    print(f"Przewidywana cena domu: {y_pred[idx]:.2f}")
    explanation.show_in_notebook(show_table=True)

# Wizualizacja wpływu cech dla jednego przypadku (np. indeks 0)
explanation_case_0 = explainer.explain_instance(
    data_row=X_test.iloc[0].values,
    predict_fn=model.predict
)
explanation_case_0.as_pyplot_figure()


Kolumny w danych: [' 0.00632  18.00   2.310  0  0.5380  6.5750  65.20  4.0900   1  296.0  15.30 396.90   4.98  24.00']


KeyError: "['PRICE'] not found in axis"