In [None]:
import numpy as np
from sklearn import datasets
from sklearn.svm import SVR
from sklearn.metrics import mean_squared_error, explained_variance_score
from sklearn.utils import shuffle

# Создаем синтетические данные для регрессии
np.random.seed(7)
n_samples = 506  # такое же количество, как в оригинальном Boston dataset
n_features = 13  # такое же количество признаков, как в оригинале

X = np.random.randn(n_samples, n_features) * 10 + 5
# Создаем целевую переменную с некоторой зависимостью от признаков
y = (X[:, 0] * 0.5 +
     X[:, 1] * 1.2 +
     X[:, 2] * (-0.8) +
     X[:, 5] * 0.3 +
     np.random.randn(n_samples) * 5)

# Перемешивание данных
X, y = shuffle(X, y, random_state=7)

# Разделение данных на обучающую и тестовую выборки
num_training = int(0.8 * len(X))
X_train, y_train = X[:num_training], y[:num_training]
X_test, y_test = X[num_training:], y[num_training:]

# Создание регрессионной модели на основе SVM
sv_regressor = SVR(kernel='linear', C=1.0, epsilon=0.1)

# Обучение SVM регрессора
sv_regressor.fit(X_train, y_train)

# Тестирование модели
y_test_pred = sv_regressor.predict(X_test)
mse = mean_squared_error(y_test, y_test_pred)
evs = explained_variance_score(y_test, y_test_pred)
print("\n#### Производительность модели ####")
print("Среднеквадратичная ошибка =", round(mse, 2))
print("Объясненная дисперсия =", round(evs, 2))

# Тестирование на тестовой точке (используем оригинальные 13 признаков)
test_data = [3.7, 0, 18.4, 1, 0.87, 5.95, 91, 2.5052, 26, 666, 20.2, 351.34, 15.27]
print("\nПредсказанная цена:", sv_regressor.predict([test_data])[0])


#### Производительность модели ####
Среднеквадратичная ошибка = 19.9
Объясненная дисперсия = 0.93

Предсказанная цена: -7.4348146149837735
