# Занятие 4
# Прикладная алгебра и численные методы
## Сингулярное разложение (SVD), линейная регрессия
https://numpy.org/doc/stable/reference/generated/numpy.linalg.svd.html#numpy.linalg.svd

In [None]:
import numpy as np
import scipy.linalg
import sympy
import matplotlib.pyplot as plt
from copy import deepcopy
from sympy import latex
import pandas as pd
from IPython.display import Math, Pretty
from google.colab import files

## Сингулярное разложение (SVD)
$$
A = Q\Sigma P^*, \quad A_{m\times n},\ Q_{m\times m}, \ \Sigma_{m\times n}, \ P_{n\times n},
$$
$Q$, $P$ - ортогональные матрицы, $\Sigma$ - диагональная, на диагонали сингулярные числа.


## Задача 1
Найти SVD c sympy и numpy
$$
\left(
\begin{matrix}
1 & 0 & 0 & -2\\
0 & 1 & 0 & 1\\
0 & 0 & 3 & 1
\end{matrix}
\right)
$$

In [None]:
A = sympy.Matrix([[1, 0, 0, -2], [0, 1, 0, 1], [0, 0, 3, 1]])
A_star_A = A.T * A

A_star_A_sympy_ev = sympy.Matrix(A_star_A).eigenvects()

A_star_A_sympy_ev_sorted = sorted([(item[0], item[1], [elem.normalized() for elem in item[2]]) for item in A_star_A_sympy_ev], key = lambda item : item[0], reverse = True)
ev_norm = [elem[2][0] for elem in A_star_A_sympy_ev_sorted]
eig_nums = [elem[0] for elem in A_star_A_sympy_ev_sorted]
ev_norm_ort = [item for item in sympy.matrices.dense.GramSchmidt(ev_norm)]
ev_norm_ort_nonzero = [elem for i, elem in enumerate(ev_norm_ort) if A_star_A_sympy_ev_sorted[i][0] != 0]
P = sympy.Matrix([elem[:] for elem in(ev_norm_ort)]).T
display(Math(f'P = {latex(P)}'))

sigma = [sympy.sqrt(item) for item in eig_nums if item > 0]

q_list = [(A * ei / sigma[i])[:] for i, ei in enumerate(ev_norm_ort_nonzero)]
Q = sympy.Matrix(q_list).T
display(Math(f'Q = {latex(Q)}'))

sig_list = []
col_nums = A.shape[1]
for i, sig in enumerate(sigma):
  row_line = [0 for k in range(col_nums)]
  row_line[i] = sig
  sig_list.append(row_line)
#Sig = sympy.Matrix([[row_line lambda row_line[i] : sig for i, sig in enumerate(sigma)]])
Sig = sympy.Matrix(sig_list)
display(Math(f'Sig = {latex(Sig)}'))

display(Math('Q = {}, Sig = {}, P = {}, Q  Sig  P^T = {}'.format(*[latex(item) for item in (Q, Sig, P, sympy.simplify(Q * Sig * P.T))])))

<IPython.core.display.Math object>

<IPython.core.display.Math object>

<IPython.core.display.Math object>

<IPython.core.display.Math object>

## Построение псевдообратной матрицы при помощи SVD
$$
A^+ = P\Sigma^+Q^*,\quad 
\Sigma^+ =
\left(
\begin{matrix}
\sigma_1^{-1} & ... & ... & ... & ... & 0\\
0 & \sigma_1^{-1} & ... & ... & ... & 0\\
0 & ... & ... & ... & ... & 0\\
0 & ... & ... & \sigma_r^{-1}  & ... & 0\\
0 & ... & ... & ... & ... & 0\\
\end{matrix}
\right)
$$
## Задача 2
Построить с помощью найденного SVD псевдообратную матрицу к А из Задачи 1.

## Задача 3
Построить с помощью  SVD из numpy.linalg псевдообратную матрицу к А из Задачи 1. Вывести на экран $P^T$, $\Sigma$, $Q$, $Q\Sigma P^T$.

## Линейная регрессия
Составим матрицу $A$ столбцы которой образуют значения $X_1$, $X_2$, ... , $X_n$.
Также составим матрицу-столбец $Y$ из значений $y$,
тогда
$$
Y = a_1X_1 + a_2X_2 + ... + a_nX_n,\qquad
\left[\begin{matrix}a_1\\a_2\\...\\a_n\end{matrix}\right] = A^+Y_1
$$
## Задача 4
http://archive.ics.uci.edu/ml/machine-learning-databases/00242/

В датасете, записанном в файле xlsx

$X_1$	Относительная компактность	
$X_2$	Площадь	
$X_3$	Площадь стены	
$X_4$	Площадь потолка	
$X_5$	Общая высота	
$X_6$	Ориентация	
$X_7$	Площадь остекления	
$X_8$	Распределенная площадь остекления	
$y_1$	Нагрузка при обогреве	
$y_2$	Нагрузка при охлаждении

Построить линейную модель зависимости нагрузки (при обогреве и при охлаждении)
от $X_1$, $X_2$, $X_4$, $X_7$.

С помощью псевдообратной матрицы найти коэффициенты линейной модели, вычислить средние отклонения экспериментальных данных от модельных значений.

In [None]:
uploaded = files.upload()

for fn in uploaded.keys():

  print(f'Загружен файл "{fn}"')