In [None]:
import numpy as np
import pandas as pd
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.neighbors import KNeighborsClassifier
from sklearn.decomposition import PCA
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.metrics import accuracy_score

In [None]:
wine = load_wine()
df = pd.DataFrame(data=wine.data, columns=wine.feature_names)

features = ['hue', 'alcohol', 'malic_acid']
X = df[features]
y = wine.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

In [None]:
bayes_classifier = GaussianNB()
bayes_classifier.fit(X_train, y_train)
y_pred_bayes = bayes_classifier.predict(X_test)

knn_classifier = KNeighborsClassifier(n_neighbors=5)
knn_classifier.fit(X_train, y_train)
y_pred_knn = knn_classifier.predict(X_test)

In [None]:
pca = PCA(n_components=2)
X_train_pca = pca.fit_transform(X_train)
X_test_pca = pca.transform(X_test)

bayes_classifier.fit(X_train_pca, y_train)
y_pred_bayes_pca = bayes_classifier.predict(X_test_pca)
accuracy_bayes_pca = accuracy_score(y_test, y_pred_bayes_pca)
print(f"Точность классификатора Байеса после PCA: {accuracy_bayes_pca:.2f}")

knn_classifier.fit(X_train_pca, y_train)
y_pred_knn_pca = knn_classifier.predict(X_test_pca)
accuracy_knn_pca = accuracy_score(y_test, y_pred_knn_pca)
print(f"Точность классификатора KNN после PCA: {accuracy_knn_pca:.2f}")

Точность классификатора Байеса после PCA: 0.76
Точность классификатора KNN после PCA: 0.78


In [None]:
lda = LinearDiscriminantAnalysis(n_components=1)
X_train_lda = lda.fit_transform(X_train, y_train)
X_test_lda = lda.transform(X_test)

bayes_classifier_lda = GaussianNB()
bayes_classifier_lda.fit(X_train_lda, y_train)
y_pred_bayes_lda = bayes_classifier_lda.predict(X_test_lda)
accuracy_bayes_lda = accuracy_score(y_test, y_pred_bayes_lda)
print(f"Точность классификатора Байеса после LDA: {accuracy_bayes_lda:.2f}")

knn_classifier_lda = KNeighborsClassifier(n_neighbors=5)
knn_classifier_lda.fit(X_train_lda, y_train)
y_pred_knn_lda = knn_classifier_lda.predict(X_test_lda)
accuracy_knn_lda = accuracy_score(y_test, y_pred_knn_lda)
print(f"Точность классификатора KNN после LDA: {accuracy_knn_lda:.2f}")

Точность классификатора Байеса после LDA: 0.69
Точность классификатора KNN после LDA: 0.69


Результаты из задания 4


---


Пара: hue, alcohol

Точность классификатора Байеса: 0.89

Точность классификатора KNN: 0.85


---


Пара: hue, malic_acid

Точность классификатора Байеса: 0.67

Точность классификатора KNN: 0.72


---


Пара: alcohol, malic_acid

Точность классификатора Байеса: 0.76

Точность классификатора KNN: 0.80


---


Лучшая пара hue, alcohol с классификатором Байеса и точностью 0.89

In [None]:
print(f"Точность классификатора Байеса после PCA: {accuracy_bayes_pca:.2f}")
print(f"Точность классификатора KNN после PCA: {accuracy_knn_pca:.2f}")
print(f"Точность классификатора Байеса после LDA: {accuracy_bayes_lda:.2f}")
print(f"Точность классификатора KNN после LDA: {accuracy_knn_lda:.2f}")

Точность классификатора Байеса после PCA: 0.76
Точность классификатора KNN после PCA: 0.78
Точность классификатора Байеса после LDA: 0.69
Точность классификатора KNN после LDA: 0.69


In [None]:
#Вывод: результаты классификации ухудшились как после метода главных компонент, так и после линейного дискриминантного анализа
#Это может быть связанно с тем, что классы плохо разделимые, поэтому анализ главных компонент не сработал
#Таким образом, исходные данные показывают более хорошие результаты