# Визуализация проекции на 2 главные компоненты
---
Проецируя высокомерные данные на плоскость первых двух главных компонент, можно визуально оценить, есть ли кластеры, как объекты распределены по главным направлениям. Часто 2D-проекция дает интуитивное представление о данных, хотя и теряет часть информации. Для визуализации напишем функцию plot_pca_projection(X_proj) – она предполагает, что $X_{\text{proj}}$ имеет 2 столбца (первая и вторая главные компоненты для каждого объекта). Функция должна построить диаграмму рассеяния (scatter-plot) – точки на плоскости $(\text{PC1}, \text{PC2})$.

---

In [4]:
import matplotlib.pyplot as plt
from matplotlib.figure import Figure
from src.pca import pca

In [5]:
def plot_pca_projection(X_proj: 'Matrix') -> Figure:
    """
    Вход: проекция данных X_proj (n×2) – двумерное представление данных
    Выход: объект Figure с графиком рассеяния точек в новом пространстве
    """
    if X_proj.cols != 2:
        raise ValueError("Для визуализации размерность проекции должна быть 2")

    x_coords = [X_proj.data[i][0] for i in range(X_proj.rows)]
    y_coords = [X_proj.data[i][1] for i in range(X_proj.rows)]
    fig = plt.figure(figsize=(6, 5))
    ax = fig.add_subplot(1, 1, 1)
    ax.scatter(x_coords, y_coords, c='blue', s=10, alpha=0.7)
    ax.set_title("Проекция данных на 2 главные компоненты")
    ax.set_xlabel("Главная компонента 1")
    ax.set_ylabel("Главная компонента 2")
    return fig


---