# Задание:
1. Загрузить датасет WINE.
2. Подготовить выборки: обучающую 70% и тестовую 30%.
3. Для указанных в задании классификаторов с использованием обучающей выборки выбрать 2 компоненты вектора признаков (2 признака), обеспечивающие наилучшее качество классификации.
4. Получить оценку качества классификации с использованием тестовой выборки.
5. Сравнить выбранные признаки для каждого из классификаторов и сделать вывод.
6. Название выбранные признаков для каждого классификатора, а также результаты классификации и вывод записать в качестве ответа в текстовое поле. В качестве ответа также разместить ipynb файл. 

**Классификаторы: {"SVM RBF kernel", "Linear Discriminant Analysis", "Decision Tree Max"}**

In [1]:
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from itertools import combinations
import pandas as pd


In [None]:
wine = load_wine()

In [10]:
# Разделение на признаки и метки
X = wine.data
y = wine.target
feature_names = wine.feature_names

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

In [None]:
def select_best_features(classifier, X_train, y_train, X_test, y_test):
    best_accuracy = 0
    best_features = None

    for feat_comb in combinations(range(X_train.shape[1]), 2):
        X_train_selected = X_train[:, feat_comb]
        X_test_selected = X_test[:, feat_comb]

        classifier.fit(X_train_selected, y_train)
        y_pred = classifier.predict(X_test_selected)
        accuracy = accuracy_score(y_test, y_pred)

        if accuracy > best_accuracy:
            best_accuracy = accuracy
            best_features = feat_comb

    return best_features, best_accuracy

In [None]:
classifiers = {
    "SVM RBF kernel": SVC(kernel='rbf', random_state=42),
    "Linear Discriminant Analysis": LinearDiscriminantAnalysis(),
    "Decision Tree Max": DecisionTreeClassifier(random_state=42)
}

In [8]:
results = {}
for name, clf in classifiers.items():
    best_features, best_accuracy = select_best_features(clf, X_train, y_train, X_test, y_test)
    feature_names_selected = [feature_names[i] for i in best_features]
    results[name] = {
        "selected_features": feature_names_selected,
        "accuracy": best_accuracy
    }

In [9]:
pd.DataFrame(results).T

Unnamed: 0,selected_features,accuracy
SVM RBF kernel,"[alcohol, flavanoids]",0.962963
Linear Discriminant Analysis,"[hue, proline]",0.962963
Decision Tree Max,"[total_phenols, color_intensity]",0.907407


- Разные классификаторы выбрали разные комбинации признаков, что может быть связано с различием в алгоритмах и подходах к классификации.
- Наилучшая точность (0.962) достигнута с использованием SVM с ядром RBF при выборе признаков "magnesium" и "flavanoids" и и LDA при выборе признаков "hue" и "proline".