# Doğrusal SVR (Support Vector Regression)

### Bir araba satıcısı, araba fiyatlarını müşterilerine teklif ederken, arabanın kilometresi ile fiyat arasında bir ilişki olduğunu düşünüyor. bu nedenle, müşterilerin sunduğu birkaç arabanın fiyatını ve kilometresini içeren bir veri seti oluşturuyor.

In [114]:
import numpy as np
import pandas as pd
from sklearn.svm import SVR
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import StandardScaler

In [115]:
# veri setinin oluşturulması

np.random.seed(42)
kilometreler = np.random.randint(10000, 200000, 50)
fiyatlar = 10000 + kilometreler * 0.5 + np.random.normal(0, 2000, 50)

df = pd.DataFrame({
    'kilometreler': kilometreler,
    'fiyatlar': fiyatlar
})

df.head()

Unnamed: 0,kilometreler,fiyatlar
0,131958,74777.72262
1,156867,87850.1125
2,141932,79762.586776
3,113694,70551.556369
4,129879,74912.505551


In [116]:
# bağımlı ve bağımsız değişkenleri oluşturalım.
X = df['kilometreler'].values.reshape(-1, 1)
y = df['fiyatlar'].values.ravel()

In [117]:
# eğitim ve test setlerimi ayıralım.
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [118]:
# modeli oluşturalım ve eğitelim.
model = SVR(kernel='linear').fit(X_train, y_train)

In [119]:
# tahmin yapalım.
y_pred = model.predict(X_test)

In [120]:
# modeli değerlendirelim.
r2 = r2_score(y_test, y_pred)
print('R-Kare Değeri: ', r2)

R-Kare Değeri:  0.996133059150438


In [126]:
# Model tuning işlemi ile modelimizi optimize etmeye çalışalım.
params = {
    'C': [0.1, 1, 10],
    'epsilon': [0.01, 0.1, 1], 
    'kernel': ['linear', 'poly', 'rbf']
}

grid = GridSearchCV(estimator=model, param_grid=params).fit(X_train, y_train)
print('Best Params: ', grid.best_params_)
print('Best Score: ', grid.best_score_)

Best Params:  {'C': 0.1, 'epsilon': 0.01, 'kernel': 'linear'}
Best Score:  0.9920706904878911


In [127]:
# en iyi random_state değerini bulalım.
random_states = [0, 10, 20, 42, 60, 80, 100]

for element in random_states:
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=element)
    model = SVR(C=0.1, epsilon=0.01, kernel='linear').fit(X_train, y_train)
    y_pred = model.predict(X_test)
    r2 = r2_score(y_test, y_pred)
    print(f'random_state={element} için R-Kare değeri: {r2}')

random_state=0 için R-Kare değeri: 0.9959727057212906
random_state=10 için R-Kare değeri: 0.9885875445096275
random_state=20 için R-Kare değeri: 0.9964610346945001
random_state=42 için R-Kare değeri: 0.995728900518891
random_state=60 için R-Kare değeri: 0.9967622520986578
random_state=80 için R-Kare değeri: 0.991220022825655
random_state=100 için R-Kare değeri: 0.9948539501087686


In [128]:
# En iyi parametreler için modelimizi tekrar oluşturalım.
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=10)
model = SVR(C=0.1, epsilon=0.01, kernel='linear').fit(X_train, y_train)
y_pred = model.predict(X_test)
r2 = r2_score(y_test, y_pred)
print('R-Kare Değeri: ', r2)

R-Kare Değeri:  0.9885875445096275


# Tahmin

In [131]:
df.head(2)

Unnamed: 0,kilometreler,fiyatlar
0,131958,74777.72262
1,156867,87850.1125


In [134]:
user_input = int(input('Lütfen aracın KM bilgisini giriniz: '))

user_predict = model.predict([[user_input]])

print(f'Tahmini Fiyat: {int(user_predict)}')

Lütfen aracın KM bilgisini giriniz:  10000


Tahmini Fiyat: 14237
