# Вычисление матрицы ковариаций
---
Теория: Ковариационная матрица характеризует разброс и взаимосвязь признаков. Каждый элемент ковариационной матрицы $C$ определяется как:

$$
C_{ij} \;=\; \frac{1}{n - 1} \sum_{k=1}^{n} X_{k i}\,X_{k j}
$$

где $X$ – уже центрированная матрица данных (то есть $X_{ki}$ – значение $i$-го признака $k$-го объекта после вычитания среднего). Здесь $n-1$ используется, если вычисляется выборочная ковариация (несмещенная оценка дисперсии), что обычно и делается при PCA. В матричном виде:

$$
C \;=\; \frac{1}{n - 1}\,X^\mathsf{T}X
$$

где $X^T$ – транспонированная матрица. Таким образом, $C$ будет $m \times m$ (для $m$ признаков).

---

In [1]:
def covariance_matrix(X_centered: 'Matrix') -> 'Matrix':
    """
    Вход:
    X_centered: центрированная матрица данных (n×m)
    Выход:
    матрица ковариаций C (m×m)
    """
    n, m = X_centered.rows, X_centered.cols
    denom = n - 1 if n > 1 else 1  # если одно наблюдение, делитель 1 (хотя случай тривиальный)
    # Вычисляем X^T * X
    X_T = X_centered.transpose()
    C = X_T @ X_centered  # матрица ковариаций до деления
    # Делим каждую компоненту на (n-1)
    for i in range(C.rows):
        for j in range(C.cols):
            C.data[i][j] /= denom
    return C

Функция возвращает ковариационную матрицу размером $m \times m$. Ковариационная матрица симметрична, ее диагональные элементы – дисперсии признаков, внедиагональные – ковариации между признаками.

---