# DESTEK VEKTÖR REGRESYON ( SUPPORT VEKTOR REGRESSION)

In [27]:
from sklearn.svm import SVR
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.metrics import mean_squared_error, r2_score

In [28]:
#Veri Seti
df = pd.read_csv("beyzbol_veri.csv")
df = df.dropna()
dms = pd.get_dummies(df[["League", "Division", "NewLeague"]])
X_ = df.drop(["Salary", "League", "Division", "NewLeague"], axis=1).astype("float64")
X = pd.concat([X_ , dms[["League_N", "Division_W", "NewLeague_N"]]], axis = 1)
y = df["Salary"]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state = 42)

In [21]:
#model oluşturmak
svr_model = SVR("linear").fit(X_train, y_train)

In [22]:
svr_model #linear olarak oluşturulann model

SVR(C=1.0, cache_size=200, coef0=0.0, degree=3, epsilon=0.1, gamma='scale',
    kernel='linear', max_iter=-1, shrinking=True, tol=0.001, verbose=False)

In [23]:
svr_model.intercept_

array([-80.15196151])

In [24]:
svr_model.coef_

array([[ -1.21839037,   6.09602969,  -3.67574533,   0.14217075,
          0.51435919,   1.28388986,  12.55922537,  -0.08693755,
          0.46597184,   2.98259944,   0.52944523,  -0.79820799,
         -0.16015534,   0.30872794,   0.28842348,  -1.79560067,
          6.41868985, -10.74313783,   1.33374317]])

In [25]:
y_pred = svr_model.predict(X_test)

In [26]:
# tamin 
RMSE = np.sqrt(mean_squared_error(y_test, y_pred))

### Model Tuning

* **SVR modellemede hiperparametre "C" ceza parametresidir. Optimum "C" yi bulmak için GridSearchCV kullanılacaktır.**
* **Hem cross validation(gruplama) hemde hiperparametreler devreye girdiğinden model oluşturma işlemi uzun sürebilir. Bunu daha hızlı hale getirebilmek için "n_jobs = -1 " yazılırsa daha hızlı oluşturulabilir.**

### optimum C ifadesinin bulunması

In [43]:
svr_model = SVR()
optimum_c = {"C": [0.1, 0.5, 3, 5]}
svr_cv_model = GridSearchCV(svr_model, optimum_c, cv = 5, n_jobs = -1 ).fit(X_train, y_train)
#n_jobs = -1 ifadesi işlemcinin yüklenmesini artırarak  işlemleri hızlandırılır.

In [44]:
# optimum C ile final modeli kurulur ve tahmin işlemi yapılır.
svr_cv_model.best_params_

{'C': 5}

In [49]:
#final model
svr_model = SVR("linear", C = 0.5).fit(X_train, y_train)
y_pred = svr_model.predict(X_test)

In [50]:
RMSE = np.sqrt(mean_squared_error(y_test, y_pred))

In [51]:
RMSE

367.9874739022889