<a href="https://colab.research.google.com/github/ugurcun/Binalarin-Enerji-Verimliligi/blob/main/mainnnn_py.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [13]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

data = pd.read_csv("ENB2012_data.csv")

# Eksik değerleri kontrol edelim
print(data.isnull().sum())

# Kategorik değişken olup olmadığını kontrol edelim
print(data.dtypes)

# Veriyi ölçeklendirme
# Örneğin, StandardScaler kullanarak verileri standartlaştırabiliriz
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
numerical_features = ['X1', 'X2', 'X3', 'X4', 'X5', 'X6', 'X7', 'X8']
data[numerical_features] = scaler.fit_transform(data[numerical_features])

# Veriyi modele beslemeye hazır hale getirdik
print(data.head())


X1    0
X2    0
X3    0
X4    0
X5    0
X6    0
X7    0
X8    0
Y1    0
Y2    0
dtype: int64
X1    float64
X2    float64
X3    float64
X4    float64
X5    float64
X6      int64
X7    float64
X8      int64
Y1    float64
Y2    float64
dtype: object
         X1        X2        X3        X4   X5        X6        X7        X8  \
0  2.041777 -1.785875 -0.561951 -1.470077  1.0 -1.341641 -1.760447 -1.814575   
1  2.041777 -1.785875 -0.561951 -1.470077  1.0 -0.447214 -1.760447 -1.814575   
2  2.041777 -1.785875 -0.561951 -1.470077  1.0  0.447214 -1.760447 -1.814575   
3  2.041777 -1.785875 -0.561951 -1.470077  1.0  1.341641 -1.760447 -1.814575   
4  1.284979 -1.229239  0.000000 -1.198678  1.0 -1.341641 -1.760447 -1.814575   

      Y1     Y2  
0  15.55  21.33  
1  15.55  21.33  
2  15.55  21.33  
3  15.55  21.33  
4  20.84  28.28  


In [14]:
from sklearn.model_selection import train_test_split

# Veri setini train, validation ve test kümelerine bölelim
X = data.drop(['Y1', 'Y2'], axis=1)  # Bağımsız değişkenler
y = data[['Y1', 'Y2']]  # Bağımlı değişkenler

# Önce train ve test kümelerine bölelim
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Ardından train kümesini train ve validation kümelerine bölelim
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.25, random_state=42)

# Şimdi train, validation ve test kümelerimizi kullanarak modeli eğitebilir ve değerlendirebiliriz.
print("Train kümesi boyutu:", X_train.shape)
print("Validation kümesi boyutu:", X_val.shape)
print("Test kümesi boyutu:", X_test.shape)


Train kümesi boyutu: (460, 8)
Validation kümesi boyutu: (154, 8)
Test kümesi boyutu: (154, 8)


In [15]:
from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeRegressor
from sklearn.ensemble import RandomForestRegressor
from sklearn.svm import SVR
from sklearn.neighbors import KNeighborsRegressor
from sklearn.metrics import mean_squared_error

# Modelleri oluşturalım
models = {
    "Linear Regression": LinearRegression(),
    "Decision Tree": DecisionTreeRegressor(),
    "Random Forest": RandomForestRegressor(),
    "Support Vector Regression": SVR(),
    "K-Nearest Neighbors": KNeighborsRegressor()
}

# Hedef değişkenleri ayrı ayrı ele alalım
target_variables = ['Y1', 'Y2']

# Her hedef değişkeni için en iyi modeli bulalım
for target_variable in target_variables:
    # Her model için RMSE hesaplayalım ve sonuçları saklayalım
    results = {}
    for model_name, model in models.items():
        # Hedef değişkeni seç
        y_train_single = y_train[target_variable]
        y_val_single = y_val[target_variable]

        # Modeli eğit ve tahmin yap
        model.fit(X_train, y_train_single)  # Modeli train kümesiyle eğitelim
        y_pred = model.predict(X_val)  # Validation kümesiyle tahmin yapalım

        # RMSE hesapla
        rmse = np.sqrt(mean_squared_error(y_val_single, y_pred))  # RMSE hesaplayalım
        results[model_name] = rmse

    # En iyi performans gösteren modeli seçelim
    best_model_name = min(results, key=results.get)
    best_rmse = results[best_model_name]

    print(f"Hedef Değişken: {target_variable}")
    print("Model Performansları:")
    for model_name, rmse in results.items():
        print(f"{model_name}: RMSE = {rmse}")

    print(f"\nEn iyi model: {best_model_name}, RMSE = {best_rmse}")

    # En iyi modeli test kümesiyle değerlendirelim
    best_model = models[best_model_name]
    y_pred_test = best_model.predict(X_test)
    rmse_test = np.sqrt(mean_squared_error(y_test[target_variable], y_pred_test))
    print(f"\nTest Kümesi Performansı: RMSE = {rmse_test}\n")

Hedef Değişken: Y1
Model Performansları:
Linear Regression: RMSE = 3.0067479209962586
Decision Tree: RMSE = 0.6439054943967211
Random Forest: RMSE = 0.5317094757697813
Support Vector Regression: RMSE = 3.0595203177463963
K-Nearest Neighbors: RMSE = 2.5466458052000203

En iyi model: Random Forest, RMSE = 0.5317094757697813

Test Kümesi Performansı: RMSE = 0.5150079227735043

Hedef Değişken: Y2
Model Performansları:
Linear Regression: RMSE = 3.1360801641366387
Decision Tree: RMSE = 2.3686145876725213
Random Forest: RMSE = 1.8464256607603464
Support Vector Regression: RMSE = 3.146421371389911
K-Nearest Neighbors: RMSE = 2.668784829755383

En iyi model: Random Forest, RMSE = 1.8464256607603464

Test Kümesi Performansı: RMSE = 1.9329062859654325

