In [22]:
import numpy as np

""" 
nessa aula estamos vendo:
    algoritmos que minimizam o ||(Ax-b)||
    mínimos quadrados
    os diferentes algoritmos são:
        - solução de sistemas
        - svd
        - qr
    os métodos mudam em relação ao gasto de memória e tempo de processamento
"""


' \nnessa aula estamos vendo:\n    algoritmos que minimizam o ||(Ax-b)||\n    mínimos quadrados\n    os diferentes algoritmos são:\n        - solução de sistemas\n        - svd\n        - qr\n    os métodos mudam em relação ao gasto de memória e tempo de processamento\n'

## Solução dos Mínimos Quadrados

$$
\begin{align}
\hat{x} = arg \min_x \|A x - b \|^2 & \Rightarrow A^TA\hat{x} = A^Tb\\
&\Rightarrow \hat{x} = (A^T A)^{-1}A^Tb\\
&\Rightarrow \hat{x} = A^+b\\
\end{align}
$$

Onde $A^+$ é a pseudo inversa de Moore-Penrose

__OBS__: Se $Ax=b$ possui solução exata, então $\hat{x}$ é a solução

### Verificação direta que $\hat{x}$ é solução

Para todo $x \neq \hat{x}$, vamos mostrar que $\|A\hat{x} -b\|^2 <\  $\||Ax -b\||^2$

__Lembrete__: $ \| u + v|\^2 = (u+v)^T(u+v) = \|u\|^2 + \|v\|^2 + 2 u^Tv$.

Temos:
$$
\begin{align*}
\|Ax-b\|^2 &= \|Ax\  {\color{cyan}- A\hat{x} + A\hat{x}} - b\|^2 \\
&=\|Ax - A\hat{x}\|^2 + \| A\hat{x} - b\|^2 + 2\  \color{yellow}{(Ax - A\hat{x})^T( A\hat{x} - b)}.
\end{align*}
$$

Observe que:

$$
\begin{align*}
\color{yellow}{(Ax - A\hat{x})^T( A\hat{x} - b)} &= (x^TA^T - \hat{x}^TA^T)( A\hat{x} - b)\\
&=(x^T - \hat{x}^T)A^T( A\hat{x} - b)\\
&=(x - \hat{x})^TA^T( A\hat{x} - b)\\
&=(x - \hat{x})^T( A^TA\hat{x} - A^Tb)\\
&=(x - \hat{x})^T( A^TA\hat{x} - A^Tb)\\
&=(x - \hat{x})^T\mathbf{0}\\
&=0\\
\end{align*}
$$

Dessa forma:

$$
\begin{align*}
\|Ax-b\|^2 =\|A(x - \hat{x})\|^2 + \| A\hat{x} - b\|^2.
\end{align*}
$$

como $\|A(x - \hat{x})\|^2 > 0$, pois $A$ tem colunas linearmente independentes e $x - \hat{x} = 0 \iff x = \hat{x}$, temos: 

$$
\begin{align*}
\|Ax-b\|^2 >  \| A\hat{x} - b\|^2.
\end{align*}
$$


In [None]:
""" 
Como estamos fazendo Ax -> [a1, ..., an] x = a1 x1, ..., an xn

como afirmamos que A tem colunas li -> x1 = x2 = ... = xn = 0

///

como x != x_chapeu E norma resulta em algo maior que 0 (provamos que é positivo e não nula)

entao ||A(x-x_chapeu)||^2 > 0 e, consequentemente, ||Ax - b||^2 > ||Ax_chapeu - b||^2

 """



# Implementação da solução

A = np.random.rand(10, 3) # matriz
b = np.random.rand(10, 1) # vetor
    
    # consequentemente, o x_chapeu precisa ter 3 linhas e 1 uma coluna 
    # o [0] só pega a primeira componente da resposta (se nn, vem algumas coisas de estatística)
    # o rconde evita fazer aproximações
x = np.linalg.lstsq(A, b, rcond=0)[0]
print (f"\n{x}\n")


# essa solução (sistema linear) tem solução com tempo O(n^2)
def mmq_1(A, b):
    M = A.T @ A
    y = A.T @ b
    x = np.linalg.solve(M, y)
    return x

x_1 = mmq_1(A,b)
print (f"\n\n{x_1}")




# SVD
# essa solução é um pouco maior que O(n^2)

""" A+ = (AT A)-1 AT  -> pseudoinversa
    
    A = U S Vt -> AT = V S Ut
    A+ = (V S Ut U S Vt)-1  V S Ut
    A+ = (V S  S Vt)-1  V S Ut
    A+ = (V S^2 Vt)-1  V S Ut
    A+ = V^-t1 S^-2 V^-1  V S Ut
    A+ = V^-t S^-2 S Ut
    A+ = V^-t S^-1 Ut
    A+ = (V^t)^-1 S^-1 Ut
    A+ = V S^-1 Ut
    

"""


def mmq_2 (A, b):
    U, S, Vt = np.linalg.svd(A, full_matrices=False)
    pseudoinversa_S = 1. / S
    pseudoinversa_A = Vt.T @ np.diag(pseudoinversa_S) @ U.T
    x = pseudoinversa_A @ b
    return x


x_svd = mmq_2 (A, b)
print (f"\n\n{x_svd}\n\n")



# QR - mais usada
""" 
Q - matriz ortonormal - facilita no cálculo da inversa
R - matriz triangular - facilita na resolução de sistemas
    AT = QR

    A+ = (AT A)-1 AT  
    A+ = (RT QT QR)-1 RT QT
    A+ = (RT R)-1 RT QT
    A+ = R-1 R^-T RT QT
    A+ = R-1 QT

    x_chapeu = Ax b = R-1 QT b
    R x_chapeu = R R-1 QT b
    R x_chapeu = QT b
        assumindo y = QT b
    R x_chapeu = y  -> matriz triangular + sistema linear -> solução com tempo O(n)   
                    
    

"""

def mmq_qr (A, b):
    Q, R = np.linalg.qr(A)

    y = Q.T @ b
    x = np.linalg.solve(R, y)


    return x


x_qr = mmq_qr(A, b)

print(f"\n\n{x_qr}")





[[ 0.5803719 ]
 [-0.13712945]
 [ 0.47709383]]



[[ 0.5803719 ]
 [-0.13712945]
 [ 0.47709383]]


[[ 0.5803719 ]
 [-0.13712945]
 [ 0.47709383]]




[[ 0.5803719 ]
 [-0.13712945]
 [ 0.47709383]]
