## Метод опорных векторов
### Лабораторная работа №2

#### Задание 1
Провести классификацию найденного датасета, методом машины опорных векторов. В формате Markdown писать пояснения. Объяснить почему были выбраны именно такие гиперпараметры, была ли перекрестная проверка, и т.д.

In [1]:
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.svm import SVC
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, classification_report
from tqdm import tqdm
import pandas as pd

file_path = "../Electric_Vehicle_Population_Data.csv"
df = pd.read_csv(file_path)
df.dropna(inplace=True)
# Разделение на признаки (X) и целевую переменную (y)
X = df[['Postal Code', 'Model Year', 'Electric Range', 'Base MSRP', 'Legislative District', 'DOL Vehicle ID', '2020 Census Tract']][0:10000]
y = df['Electric Range'][0:10000]

# Разделение данных на тренировочный и тестовый наборы
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Масштабирование признаков (нормализация)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)



Гиперпараметры:
   - C: Определяет силу регуляризации в модели SVM.
   - gamma: Определяет влияние одного тренировочного примера на другие.
   - kernel: Определяет тип использованного ядра.

In [2]:
param_grid = {'C': [0.01, 0.1, 1], 'kernel': ['linear', 'rbf', 'sigmoid'], 'gamma': [0.1, 1, 10]}
# Подбор гиперпараметров с помощью перекрестной проверки
grid = GridSearchCV(SVC(), param_grid, refit=True, verbose=3)
grid.fit(X_train_scaled, y_train)

best_params = grid.best_params_
best_score = grid.best_score_

Fitting 5 folds for each of 27 candidates, totalling 135 fits




[CV 1/5] END ..C=0.01, gamma=0.1, kernel=linear;, score=0.574 total time=   1.9s
[CV 2/5] END ..C=0.01, gamma=0.1, kernel=linear;, score=0.581 total time=   2.0s
[CV 3/5] END ..C=0.01, gamma=0.1, kernel=linear;, score=0.574 total time=   1.9s
[CV 4/5] END ..C=0.01, gamma=0.1, kernel=linear;, score=0.573 total time=   2.0s
[CV 5/5] END ..C=0.01, gamma=0.1, kernel=linear;, score=0.577 total time=   2.3s
[CV 1/5] END .....C=0.01, gamma=0.1, kernel=rbf;, score=0.524 total time=   3.2s
[CV 2/5] END .....C=0.01, gamma=0.1, kernel=rbf;, score=0.522 total time=   3.0s
[CV 3/5] END .....C=0.01, gamma=0.1, kernel=rbf;, score=0.522 total time=   3.0s
[CV 4/5] END .....C=0.01, gamma=0.1, kernel=rbf;, score=0.521 total time=   3.3s
[CV 5/5] END .....C=0.01, gamma=0.1, kernel=rbf;, score=0.519 total time=   3.2s
[CV 1/5] END .C=0.01, gamma=0.1, kernel=sigmoid;, score=0.530 total time=   4.7s
[CV 2/5] END .C=0.01, gamma=0.1, kernel=sigmoid;, score=0.529 total time=   4.4s
[CV 3/5] END .C=0.01, gamma=

[CV 3/5] END ....C=1, gamma=0.1, kernel=sigmoid;, score=0.608 total time=   2.7s
[CV 4/5] END ....C=1, gamma=0.1, kernel=sigmoid;, score=0.616 total time=   2.7s
[CV 5/5] END ....C=1, gamma=0.1, kernel=sigmoid;, score=0.623 total time=   2.7s
[CV 1/5] END .......C=1, gamma=1, kernel=linear;, score=0.820 total time=   1.6s
[CV 2/5] END .......C=1, gamma=1, kernel=linear;, score=0.836 total time=   1.5s
[CV 3/5] END .......C=1, gamma=1, kernel=linear;, score=0.821 total time=   1.1s
[CV 4/5] END .......C=1, gamma=1, kernel=linear;, score=0.823 total time=   1.1s
[CV 5/5] END .......C=1, gamma=1, kernel=linear;, score=0.824 total time=   1.1s
[CV 1/5] END ..........C=1, gamma=1, kernel=rbf;, score=0.748 total time=   2.6s
[CV 2/5] END ..........C=1, gamma=1, kernel=rbf;, score=0.751 total time=   2.7s
[CV 3/5] END ..........C=1, gamma=1, kernel=rbf;, score=0.736 total time=   2.7s
[CV 4/5] END ..........C=1, gamma=1, kernel=rbf;, score=0.737 total time=   2.8s
[CV 5/5] END ..........C=1, 

In [3]:
print("Лучшие гиперпараметры:", grid.best_params_)
best_svc = grid.best_estimator_
y_pred = best_svc.predict(X_test_scaled)
accuracy = accuracy_score(y_test, y_pred)
print(f"Точность модели: {accuracy}")

# Получение отчета о классификации с предупреждениями
report = classification_report(y_test, y_pred, zero_division=1)
print(f'Отчет о классификации:\n{report}')

Лучшие гиперпараметры: {'C': 1, 'gamma': 0.1, 'kernel': 'linear'}
Точность модели: 0.84
Отчет о классификации:
              precision    recall  f1-score   support

           0       1.00      1.00      1.00       971
           6       0.70      0.88      0.78         8
           8       1.00      0.00      0.00         1
          10       1.00      0.00      0.00         1
          12       1.00      0.00      0.00         1
          13       1.00      0.00      0.00         6
          14       0.20      0.30      0.24        10
          16       1.00      0.00      0.00        13
          17       0.00      0.00      1.00         5
          18       0.30      0.44      0.36        18
          19       0.79      0.75      0.77        36
          20       1.00      0.00      0.00        10
          21       0.55      0.90      0.68        39
          22       1.00      0.00      0.00         6
          23       1.00      0.00      0.00         1
          25       0.40 