In [1]:

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error, r2_score
import matplotlib.pyplot as plt
import joblib

# CSV dosyasında veri okunarak data'ya aktarılır
data = pd.read_csv('genel_arac_verileri_egitim_icin.csv')

# Datada ögrnecek sütunları("fiyat") ve sonuc sütunları ayrılır
y = data["fiyat"].values
X = data.drop("fiyat", axis=1).values

# Veri eğitim ve test setleri olarak bölünür
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Random Forest Regresyon modeli oluşturulur ve eğitilir
rf_model = RandomForestRegressor(n_estimators=100, random_state=42)
rf_model.fit(X_train, y_train)

# Eğitim seti üzerinde tahmin yapılır
y_train_pred = rf_model.predict(X_train)

# Test seti üzerinde tahmin yapılır
y_test_pred = rf_model.predict(X_test)

# Modelin performansı değerlendirilir
r2_train = r2_score(y_train, y_train_pred)
r2_test = r2_score(y_test, y_test_pred)

print(f'Eğitim Seti R2 Skoru: {r2_train:.2f}')
print(f'Test Seti R2 Skoru: {r2_test:.2f}')


Eğitim Seti R2 Skoru: 0.99
Test Seti R2 Skoru: 0.94
Rastgele Test Örneği 1 İçin Gerçek Fiyat:  812000.00
Rastgele Test Örneği 1 İçin Tahmini Fiyat: 825784.50
---
Rastgele Test Örneği 2 İçin Gerçek Fiyat:  807500.00
Rastgele Test Örneği 2 İçin Tahmini Fiyat: 848825.00
---
Rastgele Test Örneği 3 İçin Gerçek Fiyat:  1110000.00
Rastgele Test Örneği 3 İçin Tahmini Fiyat: 1089455.00
---
Rastgele Test Örneği 4 İçin Gerçek Fiyat:  275000.00
Rastgele Test Örneği 4 İçin Tahmini Fiyat: 319955.00
---
Rastgele Test Örneği 5 İçin Gerçek Fiyat:  436000.00
Rastgele Test Örneği 5 İçin Tahmini Fiyat: 428437.00
---


In [2]:
import numpy as np

rastgele_ornek_sayisi = 5

rastgele_test_indeksleri = np.random.choice(len(X_test), rastgele_ornek_sayisi, replace=False)
rastgele_test_ornekleri = X_test[rastgele_test_indeksleri, :]

tahmin_fiyatlar = rf_model.predict(rastgele_test_ornekleri)

for i in range(len(tahmin_fiyatlar)):
    gercek_fiyat = y_test[rastgele_test_indeksleri[i]]
    tahmin_fiyat = tahmin_fiyatlar[i]

    print(f'Rastgele Test Örneği {i + 1} İçin Gerçek Fiyat:  {gercek_fiyat:.2f}')
    print(f'Rastgele Test Örneği {i + 1} İçin Tahmini Fiyat: {tahmin_fiyat:.2f}')
    print('---')

Rastgele Test Örneği 1 İçin Gerçek Fiyat:  349000.00
Rastgele Test Örneği 1 İçin Tahmini Fiyat: 393475.49
---
Rastgele Test Örneği 2 İçin Gerçek Fiyat:  672000.00
Rastgele Test Örneği 2 İçin Tahmini Fiyat: 659035.00
---
Rastgele Test Örneği 3 İçin Gerçek Fiyat:  1215000.00
Rastgele Test Örneği 3 İçin Tahmini Fiyat: 1079834.93
---
Rastgele Test Örneği 4 İçin Gerçek Fiyat:  360000.00
Rastgele Test Örneği 4 İçin Tahmini Fiyat: 373137.50
---
Rastgele Test Örneği 5 İçin Gerçek Fiyat:  327000.00
Rastgele Test Örneği 5 İçin Tahmini Fiyat: 358970.49
---


In [11]:
# Test setinden bir örnek seçilir
ornek_index = 753  # İstenilen index seçilebilir
test_ornek = X_test[ornek_index, :].reshape(1, -1)

# Modeli kullanarak tahmin yapılır
tahmin_fiyat_test_ornek = rf_model.predict(test_ornek)

# Gerçek değer alınır
gercek_fiyat_test_ornek = y_test[ornek_index]

print(f'Test Örneği İçin Gerçek Fiyat:  {gercek_fiyat_test_ornek:.2f}')
print(f'Test Örneği İçin Tahmini Fiyat: {tahmin_fiyat_test_ornek[0]:.2f}')


Test Örneği İçin Gerçek Fiyat:  809500.00
Test Örneği İçin Tahmini Fiyat: 761683.00


In [4]:
# RANDOM FOREST REGRESYON MODELİNİN DIŞA AKTARILMASI 

import joblib
joblib.dump(rf_model, 'random_forest_regresyon_modeli.pkl')

['random_forest_regresyon_modeli.pkl']