# Оценка стоимости недвижимости с использованием регрессора на основе машины опорных векторов

Применим концепцию SVM для создания регрессора, позволяющего оценивать стоимость жилья. Для этого воспользуемся набором данных из sklearn, в котором каждая точка определяется 13 атрибутами. Наша задача заключается в прогнозировании стоимости жилья на основе значений этих атрибутов

In [1]:
import numpy as np
from sklearn import datasets
from sklearn.svm import SVR
from sklearn.metrics import mean_squared_error, explained_variance_score
from sklearn.utils import shuffle

import warnings
warnings.filterwarnings('ignore')

In [2]:
#Загрузка данных с ценами на жилье
data = datasets.load_boston()

In [3]:
#Перемешаем данные, чтобы усилить объективность анализа
X, y = shuffle(data.data, data.target, random_state = 7)

#Разобьем данные на обучающий и тестовый наборы в соотношении 80\20
num_training = int(0.8 * len(X))
X_train, y_train = X[:num_training], y[:num_training]
X_test, y_test = X[num_training:], y[num_training:]

Создадим и обучим SVM-регрессор, используя линейное ядро. <br>
- Параметр $C$ представляет штраф за ошибки обучения. Если вы увеличите значение $C$, то модель более точно подстроится под обучающие данные. Однако это может привести к пререобучению модели и потере ее ощности.<br> 
- Параметр $epsilon$ задает пороговое значение: штраф за ошибки в обучении не налагается, если расхождение между фактическими и предсказанными значниями не превышает этой величины

In [4]:
#создание регрессионной модели на основе SVM 
sv_regressor = SVR(kernel = 'linear', C = 1.0, epsilon = 0.1)

#обучение регрессора svm
sv_regressor.fit(X_train, y_train)

In [5]:
#Оценка эффективности работы регрессора
y_test_pred = sv_regressor.predict(X_test)

mse = mean_squared_error(y_test, y_test_pred)
evs = explained_variance_score(y_test, y_test_pred)

print('Perfomance')
print('Mean squared error =', round(mse, 2))
print('Explane variance score =', round(evs, 2))

Perfomance
Mean squared error = 15.38
Explane variance score = 0.82


In [6]:
'''Выберем тестовую точку данных и спрогнозируем для нее результат'''
#тестирование регрессора на тестовой точке данных
test_data = [3.7, 0, 18.4, 1, 0.87, 5.95, 91, 2.5052, 
             26, 666, 20.2, 351.34, 15.27]

print('Predicted price: ', sv_regressor.predict([test_data]))

Predicted price:  [18.52170748]
