In [28]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error, r2_score

# Veriyi oku
data = pd.read_csv('data/data_preprocessed.csv')

# Kategorik verileri sayısal verilere dönüştür
label_encoders = {}
for column in ['sm-feat', 'sm-feat 2', 'sm-feat 3', 'sm-feat 4', 'sm-feat 5', 'sm-feat 6', 'sm-feat 7', 'sm-feat 8', 'brand', 'score']:
    le = LabelEncoder()
    data[column] = le.fit_transform(data[column])
    label_encoders[column] = le


# Özellik ve hedef değişkenleri oluştur
X = data.drop('price', axis=1)
y = data['price']

# Veriyi eğitim ve test setlerine ayır
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1, random_state=42)

# Modeli oluştur ve eğit
model = RandomForestRegressor(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# Test seti ile tahmin yap
y_pred = model.predict(X_test)

# Performansı değerlendir
mse = mean_squared_error(y_test, y_pred)
print(f'Mean Squared Error: {mse}')

# R^2 score hesapla
r2 = r2_score(y_test, y_pred)
print(f'R^2 Score: {r2}')

# INR to TRY conversion rate
conversion_rate = 0.4013

# Convert predicted prices and actual prices from INR to TRY
y_pred_try = y_pred * conversion_rate
y_test_try = y_test * conversion_rate

# Örnek bir tahmin sonucu yazdır
print(f'Tahmin Edilen Fiyat (ilk test örneği, TRY olarak): {y_pred_try[0]}')
print(f'Gerçek Fiyat (ilk test örneği, TRY olarak): {y_test_try.iloc[0]}')

# Gerçek ve tahmin edilen fiyatları karşılaştırmak için
comparison_df = pd.DataFrame({
    'Gerçek Fiyat (INR)': y_test.values,
    'Tahmin Edilen Fiyat (INR)': y_pred,
    'Gerçek Fiyat (TRY)': y_test_try,
    'Tahmin Edilen Fiyat (TRY)': y_pred_try
})

# İlk 10 satırı yazdır
print(comparison_df.head(10))

# Belirli bir test örneği için özellikler ve fiyatları yazdır
example_index = 0  # Örnek bir index seçin
example_features = X_test.iloc[example_index]
print(f'Örnek {example_index} - Özellikler ve Değerler:')
for feature_name, value in example_features.items():
    print(f'{feature_name}: {value}')
print(f'Gerçek Fiyat (INR): {y_test.iloc[example_index]}')
print(f'Gerçek Fiyat (TRY): {y_test_try.iloc[example_index]}')
print(f'Tahmin Edilen Fiyat (INR): {y_pred[example_index]}')
print(f'Tahmin Edilen Fiyat (TRY): {y_pred_try[example_index]}')

Mean Squared Error: 465781177.32254267
R^2 Score: 0.9178644921615742
Tahmin Edilen Fiyat (ilk test örneği, TRY olarak): 25841.117569499995
Gerçek Fiyat (ilk test örneği, TRY olarak): 26084.0987
     Gerçek Fiyat (INR)  Tahmin Edilen Fiyat (INR)  Gerçek Fiyat (TRY)  \
523             64999.0               64393.515000          26084.0987   
602             60590.0               71749.440000          24314.7670   
526            219990.0              131294.210000          88281.9870   
31              77889.0               73777.895000          31256.8557   
616             77499.0               94759.529167          31100.3487   
585            179990.0              198970.270000          72229.9870   
444             36990.0               34747.870000          14844.0870   
732             52599.0               50496.830000          21107.9787   
76              37990.0               52359.153333          15245.3870   
411            339990.0              341980.100000         136437.