## 1. Метод Гаусса (прямой и обратный ход)

**Идея.**  
Решаем систему  
$$
A x = b,\quad A\in\mathbb R^{n\times n},\;x,b\in\mathbb R^n
$$  
методом последовательного исключения «строка за строкой»:

1. **Прямой ход**  
   - Для каждого столбца \(j=1\ldots n\):  
     1. Выбираем строку \(i\ge j\) с максимальным \(\lvert A_{ij}\rvert\) и меняем её со строкой \(j\).  
     2. Нормируем строку \(j\):  
        $$
          \forall k\ge j:\quad
          A_{jk}\;\leftarrow\;\frac{A_{jk}}{A_{jj}},\quad
          b_j\;\leftarrow\;\frac{b_j}{A_{jj}}.
        $$
     3. Зануляем все остальные строки \(i\ne j\):  
        $$
          A_{ik}\;\leftarrow\;A_{ik} - A_{ij}\,A_{jk},\quad
          b_i\;\leftarrow\;b_i - A_{ij}\,b_j.
        $$

2. **Обратный ход**  
   После того как расширенная матрица приведена к единичной диагонали, решения сразу читаются:  
   $$
     x_j = b_j,\quad j=n,n-1,\dots,1.
   $$

**Стабильность.**  
Частичное pivoting (выбор максимального по модулю ведущего элемента) минимизирует численные ошибки и защищает от деления на ноль.

---

## 2. Центрирование данных

**Идея.**  
Убираем среднее по каждому признаку, чтобы каждый столбец имел нулевое среднее:

$$
\mu_j = \frac{1}{n}\sum_{i=1}^n X_{ij},
\quad
X_c = X - \mathbf{1}\,\mu^T,
\quad
(X_c)_{ij} = X_{ij} - \mu_j.
$$

**Зачем.**  
Без центрирования ковариации будут включать «смещение» из‑за разных средних, и собственные векторы PCA сместятся.

---

## 3. Матрица ковариаций

**Определение.**  
Для центрированных данных \(X_c\in\mathbb R^{n\times m}\) матрица выборочных ковариаций задаётся как

$$
C = \frac{1}{n-1}\,X_c^T X_c,
\quad
C_{ij} = \frac{1}{n-1}\sum_{k=1}^n (X_c)_{k i}\,(X_c)_{k j}.
$$

**Свойства.**  
- \(C\) симметрична: \(C_{ij}=C_{ji}\).  
- Диагональные элементы \(C_{ii}\) — дисперсии признаков.

---

## 4. Нахождение собственных значений (метод бисекции)

Ищем корни уравнения  
$$
\det\bigl(C - \lambda I\bigr) = 0
$$  
алгоритмом бискции:

1. **Гершгорин**  
   Все \(\lambda\) лежат в объединении интервалов  
   $$
     [C_{ii} - R_i,\;C_{ii} + R_i],\quad
     R_i = \sum_{j\neq i} \lvert C_{ij}\rvert.
   $$
   Вводим  
   $$
     \lambda_{\min} = \min_i (C_{ii}-R_i),
     \quad
     \lambda_{\max} = \max_i (C_{ii}+R_i).
   $$

2. **Изоляция корней**  
   Делим отрезок \([\lambda_{\min},\lambda_{\max}]\) на \(N=20m\) равных частей и вычисляем  
   $$
     f(x_k) = \det(C - x_k I).
   $$  
   Сохраняем все интервалы \([x_k,x_{k+1}]\), где \(f(x_k)\,f(x_{k+1})<0\).

3. **Бисекция**  
   Для каждого интервала \([a,b]\) повторяем до точности \(\varepsilon\):  
   $$
     c = \frac{a+b}{2},\quad f(c)=\det(C - cI),
     \quad
     \text{если }f(a)f(c)\le0\text{, то }b=c\text{, иначе }a=c.
   $$  
   Корень приближается к \(\tfrac{a+b}{2}\).

---

## 5. Нахождение собственных векторов

Для каждого найденного \(\lambda_k\) решаем систему  
$$
(C - \lambda_k I)\,v = 0.
$$  
В коде делается расширенная матрица \([\,C - \lambda_kI\mid 0]\) и используется метод Гаусса. Первое ненулевое базисное решение даёт вектор \(v\).

---

## 6. Доля объяснённой дисперсии

Пусть \(\lambda_1\ge\lambda_2\ge\cdots\ge\lambda_m\). Определяем

$$
\gamma(k) \;=\;
\frac{\sum_{i=1}^k \lambda_i}{\sum_{i=1}^m \lambda_i}.
$$

Эта величина показывает, какую часть общей дисперсии данных удерживают первые \(k\) главных компонент.

---

## 7. Полный алгоритм PCA

1. **Центрирование:** \(X\to X_c\).  
2. **Ковариационная матрица:** \(C = \tfrac1{n-1}X_c^T X_c\).  
3. **Собственные значения и векторы:** \(\{\lambda_i,v_i\}\) через бисекцию и Gauss.  
4. **Матрица компонент:** \(W = [v_1,\dots,v_k]\).  
5. **Проекция:**  
   $$
     X_{\mathrm{proj}} = X_c\,W,\quad
     X_{\mathrm{proj}}\in\mathbb R^{n\times k}.
   $$

In [116]:
import math
from typing import List, Tuple
from matplotlib.figure import Figure

In [117]:
class Matrix:
    def __init__(self, rows: int, cols: int, fill: float = 0.0):
        self.rows = rows
        self.cols = cols
        self.data = [[fill for _ in range(cols)] for _ in range(rows)]

    def __getitem__(self, i: int) -> List[float]:
        return self.data[i]

    def __setitem__(self, i: int, row: List[float]):
        if len(row) != self.cols:
            raise ValueError("Неверная длина строки")
        self.data[i] = row

    def copy(self) -> 'Matrix':
        m = Matrix(self.rows, self.cols)
        m.data = [row[:] for row in self.data]
        return m

    def transpose(self) -> 'Matrix':
        m = Matrix(self.cols, self.rows)
        for i in range(self.rows):
            for j in range(self.cols):
                m.data[j][i] = self.data[i][j]
        return m

    def __str__(self) -> str:
        lines = []
        for row in self.data:
            lines.append("[" + "  ".join(f"{v:8.4f}" for v in row) + "]")
        return "\n".join(lines)
    __repr__ = __str__

In [118]:
# Вспомогательная: ввод матрицы с консоли
# ---------------------------------------------------------------------------
def input_matrix(r: int, c: int, prompt: str) -> Matrix:
    print(prompt)
    M = Matrix(r, c)
    for i in range(r):
        vals = input(f"  строка {i+1} ({c} чисел через пробел): ").split()
        if len(vals) != c:
            raise ValueError(f"Ожидалось {c} чисел, получили {len(vals)}")
        for j in range(c):
            M[i][j] = float(vals[j])
    return M

In [119]:
# 1. Gauss Solver
# ---------------------------------------------------------------------------
def gauss_solver(A: Matrix, b: Matrix) -> List[Matrix]:
    n = A.rows
    M = Matrix(n, n+1)
    for i in range(n):
        for j in range(n): M[i][j] = A[i][j]
        M[i][n] = b[i][0]
    pivot_cols, row = [], 0
    for col in range(n):
        sel = max(range(row, n), key=lambda i: abs(M[i][col]))
        if abs(M[sel][col]) < 1e-12: continue
        M.data[row], M.data[sel] = M.data[sel], M.data[row]
        pivot_cols.append(col)
        fac = M[row][col]
        for j in range(col, n+1): M[row][j] /= fac
        for i in range(n):
            if i==row: continue
            f = M[i][col]
            for j in range(col, n+1): M[i][j] -= f * M[row][j]
        row += 1
        if row==n: break
    for i in range(row, n):
        if abs(M[i][n])>1e-12: raise ValueError("Система несовместна")
    free_vars = [j for j in range(n) if j not in pivot_cols]
    x_part = Matrix(n,1)
    for i, pc in enumerate(pivot_cols): x_part[pc][0] = M[i][n]
    basis = []
    for fv in free_vars:
        xh = Matrix(n,1); xh[fv][0] = 1.0
        for i, pc in enumerate(pivot_cols): xh[pc][0] = -M[i][fv]
        basis.append(xh)
    sols = [x_part] + basis
    print(f"[gauss_solver] solutions count={len(sols)}")
    for idx, sol in enumerate(sols):
        print(f" solution {idx}:"); print(sol)
    return sols

In [120]:
# 2. Center Data
# ---------------------------------------------------------------------------
def center_data(X: Matrix) -> Matrix:
    n, m = X.rows, X.cols
    means = [sum(X[i][j] for i in range(n))/n for j in range(m)]
    XC = X.copy()
    for i in range(n):
        for j in range(m): XC[i][j] = X[i][j] - means[j]
    print(f"[center_data] means={means}"); print(XC)
    return XC

In [121]:
# 3. Covariance Matrix
# ---------------------------------------------------------------------------
def covariance_matrix(Xc: Matrix) -> Matrix:
    n, m = Xc.rows, Xc.cols
    XT = Xc.transpose(); C = Matrix(m,m)
    for i in range(m):
        for j in range(m): C[i][j] = sum(XT[i][k]*Xc[k][j] for k in range(n))/(n-1)
    print(f"[covariance_matrix]"); print(C)
    return C

In [122]:
# 4. Determinant for Bisection
# ---------------------------------------------------------------------------
def determinant(A: Matrix) -> float:
    n = A.rows; M=A.copy(); det=1.0
    for i in range(n):
        sel=max(range(i,n), key=lambda r: abs(M[r][i]))
        if abs(M[sel][i])<1e-14: return 0.0
        if sel!=i: M.data[i],M.data[sel]=M.data[sel],M.data[i]; det=-det
        det*=M[i][i]
        for j in range(i+1,n):
            f=M[j][i]/M[i][i]
            for k in range(i,n): M[j][k]-=f*M[i][k]
    print(f"[determinant]={det}")
    return det

In [123]:
# 5. Find Eigenvalues (Bisection)
# ---------------------------------------------------------------------------
def find_eigenvalues(C: Matrix, tol: float = 1e-6) -> List[float]:
    """
    Ищем собственные значения C методом бисекции на det(C - λI)=0
    """
    m = C.rows
    # 1) Теорема Гершгорина для оценки спектра
    discs = []
    for i in range(m):
        R = sum(abs(C[i][j]) for j in range(m) if j != i)
        discs.append((C[i][i] - R, C[i][i] + R))
    lo = min(d[0] for d in discs)
    hi = max(d[1] for d in discs)

    # 2) Функция f(λ)=det(C - λI)
    def f(lam: float) -> float:
        M = C.copy()
        for i in range(m):
            M[i][i] -= lam
        return determinant(M)

    # 3) Изоляция корней: ищем интервалы со сменой знака
    intervals = []
    N = 20 * m
    xs = [lo + (hi - lo) * i / N for i in range(N + 1)]
    fs = [f(x) for x in xs]
    for i in range(N):
        # точный корень в узле
        if fs[i] == 0.0:
            intervals.append((xs[i], xs[i]))
        # точный корень в следующем узле
        if fs[i+1] == 0.0:
            intervals.append((xs[i+1], xs[i+1]))
        # смена знака => корень внутри отрезка
        elif fs[i] * fs[i+1] < 0:
            intervals.append((xs[i], xs[i+1]))

    # 4) Бисекция для уточнения корней
    roots = []
    for a, b in intervals:
        fa, fb = f(a), f(b)
        if fa == 0.0:
            roots.append(a)
            continue
        while b - a > tol:
            c = 0.5 * (a + b)
            fc = f(c)
            if fa * fc <= 0:
                b, fb = c, fc
            else:
                a, fa = c, fc
        roots.append(0.5 * (a + b))

    roots.sort(reverse=True)
    print(f"[find_eigenvalues] eigenvalues = {roots}")
    return roots

In [124]:
# 6. Find Eigenvectors
# ---------------------------------------------------------------------------
def find_eigenvectors(C: Matrix, lambdas: List[float]) -> List[Matrix]:
    vecs=[]
    for lam in lambdas:
        M=C.copy()
        for i in range(M.rows): M[i][i]-=lam
        sols=gauss_solver(M, Matrix(M.rows,1))
        v=sols[1] if len(sols)>1 else sols[0]
        print(f"[find_eigenvectors] lam={lam}"); print(v)
        vecs.append(v)
    return vecs

In [125]:
# 7. Explained Variance Ratio
# ---------------------------------------------------------------------------
def explained_variance_ratio(lambdas: List[float], k:int)->float:
    total=sum(lambdas)
    ratio=sum(lambdas[:k])/total if total>0 else 0.0
    print(f"[explained_variance_ratio]={ratio}")
    return ratio

In [126]:
# 8. PCA Full
# ---------------------------------------------------------------------------
def pca(X: Matrix, k: int) -> Tuple[Matrix, float]:
    Xc = center_data(X)
    C = covariance_matrix(Xc)
    lambdas = find_eigenvalues(C)
    vecs = find_eigenvectors(C, lambdas)
    m=X.cols; W=Matrix(m,k)
    for j in range(k):
        for i in range(m): W[i][j]=vecs[j][i][0]
    n=X.rows; Xp=Matrix(n,k)
    for i in range(n):
        for j in range(k): Xp[i][j]=sum(Xc[i][t]*W[t][j] for t in range(m))
    print(f"[pca] X_proj:"); print(Xp)
    ratio=explained_variance_ratio(lambdas, k)
    return Xp, ratio

In [127]:
# 9. Plot PCA Projection
# ---------------------------------------------------------------------------
def plot_pca_projection(X_proj: Matrix) -> Figure:
    fig=Figure(); ax=fig.subplots()
    xs=[X_proj[i][0] for i in range(X_proj.rows)]
    ys=[X_proj[i][1] for i in range(X_proj.rows)]
    ax.scatter(xs, ys)
    print(f"[plot] {X_proj.rows} points")
    return fig

In [128]:
# 10. Reconstruction Error
# ---------------------------------------------------------------------------
def reconstruction_error(X_orig: Matrix, X_recon: Matrix) -> float:
    n,m=X_orig.rows, X_orig.cols; sse=0.0
    for i in range(n):
        for j in range(m):
            d=X_orig[i][j]-X_recon[i][j]; sse+=d*d
    mse=sse/(n*m)
    print(f"[reconstruction_error]={mse}")
    return mse

In [129]:
# Main
# ---------------------------------------------------------------------------

def main():
    print("=== Выберите операцию ===")
    print("1) Решить СЛАУ Ax = b (метод Гаусса)")
    print("2) Центрирование, ковариации, собственные значения/векторы (PCA шаги)")
    print("3) Полный PCA: проекция на k компонент")
    print("4) Визуализация PCA-проекции (ввод n и X_proj)")
    print("5) MSE восстановления данных")
    choice = input("Ваш выбор (1-5): ").strip()

    if choice == '1':
        n = int(input("Введите размерность n: "))
        A = input_matrix(n, n, "Ввод матрицы A:")
        b = input_matrix(n, 1, "Ввод вектора b:")
        try:
            gauss_solver(A, b)
        except ValueError as e:
            print("Ошибка:", e)

    elif choice == '2':
        n = int(input("Число наблюдений n: "))
        m = int(input("Число признаков m: "))
        X = input_matrix(n, m, "Ввод матрицы данных X:")
        Xc = center_data(X)
        C = covariance_matrix(Xc)
        eigs = find_eigenvalues(C)
        vecs = find_eigenvectors(C, eigs)

    elif choice == '3':
        n = int(input("Число наблюдений n: "))
        m = int(input("Число признаков m: "))
        X = input_matrix(n, m, "Ввод матрицы данных X:")
        k = int(input("Число компонент k: "))
        Xp, ratio = pca(X, k)
        print(f"Доля объяснённой дисперсии: {ratio:.6f}")

    elif choice == '4':
        n = int(input("Число наблюдений n: "))
        X_proj = Matrix(n, 2)
        print("Ввод X_proj (n×2):")
        for i in range(n):
            vals = input(f"  строка {i+1} (2 числа): ").split()
            X_proj[i][0] = float(vals[0]); X_proj[i][1] = float(vals[1])
        fig = plot_pca_projection(X_proj)
        try:
            fig.show()
        except:
            fig.savefig('pca_projection.png')
            print("Сохранено в pca_projection.png")

    elif choice == '5':
        n = int(input("Число наблюдений n: "))
        m = int(input("Число признаков m: "))
        Xo = input_matrix(n, m, "Ввод X_orig:")
        Xr = input_matrix(n, m, "Ввод X_recon:")
        reconstruction_error(Xo, Xr)

    else:
        print("Неверный выбор.")

if __name__ == '__main__':
    main()
3

=== Выберите операцию ===
1) Решить СЛАУ Ax = b (метод Гаусса)
2) Центрирование, ковариации, собственные значения/векторы (PCA шаги)
3) Полный PCA: проекция на k компонент
4) Визуализация PCA-проекции (ввод n и X_proj)
5) MSE восстановления данных
Ваш выбор (1-5): 3
Число наблюдений n: 3
Число признаков m: 2
Ввод матрицы данных X:
  строка 1 (2 чисел через пробел): 1 2 
  строка 2 (2 чисел через пробел): 3 4
  строка 3 (2 чисел через пробел): 5 6
Число компонент k: 1
[center_data] means=[3.0, 4.0]
[ -2.0000   -2.0000]
[  0.0000    0.0000]
[  2.0000    2.0000]
[covariance_matrix]
[  4.0000    4.0000]
[  4.0000    4.0000]
[determinant]=-1.5600000000000005
[determinant]=-3.039999999999999
[determinant]=-4.440000000000001
[determinant]=-5.759999999999998
[determinant]=-7.0
[determinant]=-8.16
[determinant]=-9.239999999999998
[determinant]=-10.24
[determinant]=-11.16
[determinant]=-12.0
[determinant]=-12.760000000000002
[determinant]=-13.44
[determinant]=-14.040000000000001
[determinant]=-1

3