In [None]:
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, confusion_matrix
from sklearn.decomposition import PCA
import pandas as pd

# Загрузка данных
iris = load_iris()
X = iris.data
y = iris.target
feature_names = iris.feature_names
target_names = iris.target_names

# Преобразование в DataFrame
df = pd.DataFrame(X, columns=feature_names)
df['target'] = y

# Распределения признаков
sns.pairplot(df, hue='target', palette='Set1')
plt.suptitle('Начальная разметка по классам', y=1.02)
plt.show()

# PCA для визуализации результатов классификации
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X)

# Обучение модели
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
clf = RandomForestClassifier(random_state=42)
clf.fit(X_train, y_train)
y_pred = clf.predict(X_test)

# Метрики
print("Отчет по классификации:")
print(classification_report(y_test, y_pred, target_names=target_names))

# Матрица ошибок
sns.heatmap(confusion_matrix(y_test, y_pred), annot=True, fmt='d', xticklabels=target_names, yticklabels=target_names)
plt.xlabel('Предсказано')
plt.ylabel('Истинное значение')
plt.title('Матрица ошибок')
plt.show()

# График результатов PCA
plt.figure(figsize=(8, 6))
scatter = plt.scatter(X_pca[:, 0], X_pca[:, 1], c=y_pred, cmap='Set1', edgecolor='k')
plt.legend(handles=scatter.legend_elements()[0], labels=target_names)
plt.title('Предсказанная классификация (PCA)')
plt.xlabel('PCA 1')
plt.ylabel('PCA 2')
plt.show()