In [None]:
import numpy as np
import matplotlib.pyplot as plt
import scipy.linalg as spla
import scipy.optimize as spo

# Resolvendo equa√ß√µes

Sistemas lineares de equa√ß√µes surgem naturalmente em muitos contextos na engenharia e
ci√™ncia. O NumPy, especialmente atrav√©s do seu subm√≥dulo `numpy.linalg`, oferece v√°rios
m√©todos para calcular solu√ß√µes exatas ou aproximadas para tais sistemas, e para resolver
problemas relacionados, como encontrar os autovalores e autovetores de uma matriz ou
determinar suas v√°rias decomposi√ß√µes. Neste notebook, tamb√©m aprenderemos como
usar outra biblioteca fundamental no ecossistema Python chamada __SciPy__ que
pode nos ajudar a resolver equa√ß√µes n√£o lineares e problemas de otimiza√ß√£o.

## $ \S 1 $ Sistemas lineares quadrados

### $ 1.1 $ Terminologia b√°sica

Considere um conjunto de $ n $ equa√ß√µes lineares em $ n $ inc√≥gnitas $ x_1, \dots, x_n $:
\begin{equation*}
\begin{cases}
& a_{11} x_1 &+& a_{12}x_2 &+& \cdots &+& a_{1n}x_n &=& b_1 \\
& a_{21} x_1 &+& a_{22}x_2 &+& \cdots &+& a_{2n}x_n &=& b_2 \\
& \vdots &+& \vdots &+& \cdots &+& \vdots &=&\vdots \\
& a_{n1} x_1 &+& a_{n2}x_2 &+& \cdots &+& a_{nn}x_n &=& b_n
\end{cases}
\end{equation*}

Tais equa√ß√µes s√£o chamadas de __lineares__ porque as express√µes no lado esquerdo
s√£o lineares nas vari√°veis, ou seja, n√£o envolvem pot√™ncias como
$ x_1^3 $ nem produtos das vari√°veis como $ x_1x_2 $ nem fun√ß√µes mais complicadas
como $ \sin(x_1) $ ou $ e^{x_2} $.

Equivalentemente, usando nota√ß√£o matricial, este sistema de equa√ß√µes pode ser reescrito como:
\begin{equation*}
A\,\mathbf x =
\begin{bmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nn}
\end{bmatrix}
\begin{bmatrix}
x_1 \\
x_2 \\
\vdots \\
x_n
\end{bmatrix} =
\begin{bmatrix}
b_1 \\
b_2 \\
\vdots \\
b_n
\end{bmatrix} = \mathbf b
\end{equation*}
ou mais concisamente
$$
\boxed{\ A\,\mathbf{x} = \mathbf{b}\ }
$$

A matriz $ A $ √© chamada de __matriz de coeficientes__. Observe que em nosso
caso, ela √© _quadrada_ (ou seja, o n√∫mero de linhas √© o mesmo que o
n√∫mero de colunas). Sistemas de $ m $ equa√ß√µes lineares em $ n $ inc√≥gnitas onde
$ m \ne n $ ser√£o considerados apenas na pr√≥xima se√ß√£o, por simplicidade.

üìù Dependendo das propriedades de $ A $ e $ \mathbf{b} $, um sistema linear
$ A\,\mathbf{x} = \mathbf{b} $ pode ter exatamente uma solu√ß√£o, nenhuma solu√ß√£o, ou
infinitas solu√ß√µes.

__Exerc√≠cio:__ Escreva como arrays NumPy as matrizes de coeficientes $ A $ e os
vetores $ \mathbf x $ e $ \mathbf b $ para os sistemas de equa√ß√µes lineares
abaixo:

(a) $$ \left\{
\begin{align*}
2x &+ 3y &\ =& \ 5 \\
4x &- \ y &\ =& \ 1
\end{align*} \right.$$

(b)
$$
\left\{\begin{align*}
x &\ \ +\ &2y & \ \ - & z & \ = & \ 4 \\
2x &\ \ - &y & \ \ + &3z & \ = & -6 \\
-3x &\ \ + &4y &\ \ + & z & \ = & 10
\end{align*} \right.
$$

O __posto__ de uma matriz √© o n√∫mero m√°ximo de linhas linearmente independentes ou,
equivalentemente, colunas na matriz. Podemos calcular o posto de uma matriz em
NumPy com `linalg.matrix_rank`. Por exemplo, as duas primeiras colunas da matriz
abaixo s√£o claramente linearmente independentes, mas a terceira coluna √© apenas a soma das
duas primeiras, portanto o posto da matriz √© $ 2 $:
$$
    A = \begin{bmatrix}
    1 & -1 & \phantom{-}0 \\
    2 & -3 & -1 \\
    0 & \phantom{-}1 & \phantom{-}1
    \end{bmatrix}
$$

In [None]:
A = np.array([[1, -1,  0],
              [2, -3, -1],
              [0,  1,  1]])

# Verificar o posto:
rank = np.linalg.matrix_rank(A)
print(f"Posto de A: {rank}")

### $ 1.2 $ Resolvendo sistemas lineares quadrados de equa√ß√µes

__Exemplo:__ Considere o sistema de equa√ß√µes:
$$
\left\{\begin{alignat*}{4}
3x\  &+\ 2y\ &&-\ &z\ &=&\ 1\\
2x\ &-\ 2y\ &&+\ 4&z\ &=&\ -2\\
-x\  &+\ \tfrac{1}{2}y\ &&- &z\ &=&\ 0
\end{alignat*}\right.
$$
ou, na forma matricial,
$$
\begin{align*}
\begin{bmatrix}
3 & 2 & -1 \\
2 & -2 & 4 \\
-1 & 0.5 & -1
\end{bmatrix}
\begin{bmatrix}
x \\
y \\
z
\end{bmatrix}
=
\begin{bmatrix}
\phantom{-}1 \\
-2 \\
\phantom{-}0
\end{bmatrix}
\end{align*}
$$

Podemos pedir ao NumPy para resolv√™-lo usando a fun√ß√£o `linalg.solve`:

In [None]:
# Matriz de coeficientes A e vetor constante b:
A = np.array([[3, 2, -1],
              [2, -2, 4],
              [-1, 0.5, -1]])
b = np.array([1, -2, 0])

# Resolver o sistema de equa√ß√µes:
x = np.linalg.solve(A, b)
print(x)  # Vetor solu√ß√£o x

__Exerc√≠cio:__ Verifique por substitui√ß√£o direta que $ (1, -2, -2) $ √©, de fato,
a solu√ß√£o para as equa√ß√µes anteriores. _Dica:_ Multiplique $ A $ por $ (1, -2, -2)
$ e verifique se o resultado coincide com $ \mathbf{b} $ (dentro dos erros de arredondamento).

__Exerc√≠cio:__ Resolva o seguinte sistema de equa√ß√µes lineares usando NumPy e
depois verifique a solu√ß√£o substituindo-a em $ A\,\mathbf{x} = \mathbf{b} $:
$$
\left\{\begin{alignat*}{4}
2x_1\  &-\ x_2\ &&+\ 3&x_3\ &=&\ 5\\
4x_1\ &+\ 4x_2\ &&-\ 3&x_3\ &=&\ 3\\
-2x_1\  &+\ 5x_2\ &&+ &x_3\ &=&\ 7
\end{alignat*}\right.
$$

__Exerc√≠cio:__ Sejam $ y = a_1 x + b_1 $ e $ y = a_2 x + b_2 $ equa√ß√µes que descrevem duas
retas (n√£o verticais). Escreva um procedimento `meeting_point` que recebe como entrada
esses coeficientes e retorna o ponto onde as duas retas se encontram.
Teste seu procedimento nas retas
$$
\begin{align*}
    y &= 2x + 1 \\
    y &= -x + 4
\end{align*}
$$
que se intersectam em $ (1, 3) $.
_Dica:_ Converta o problema para o de resolver equa√ß√µes lineares e use a
fun√ß√£o `linalg.solve`.

__Exerc√≠cio:__ Escreva um procedimento `meeting_planes` que calcula o ponto onde
tr√™s planos dados 
$$
\begin{align*}
    z &= a_1y + b_1x + c_1 \\
    z &= a_2y + b_2x + c_2 \\
    z &= a_3y + b_3x + c_3
\end{align*}
$$
se encontram. Teste seu c√≥digo verificando que os seguintes tr√™s planos se intersectam em $ (-3, -5, -10) $:
$$
\begin{align*}
    z &= x + 2y + 3 \\
    z &= 2x + y + 1 \\
    z &= -x + 3y  + 2
\end{align*}
$$

__Exerc√≠cio:__ Considere um circuito el√©trico simples com tr√™s malhas e tr√™s
resistores. As correntes de malha $ I_1 $, $ I_2 $ e $ I_3 $ satisfazem as seguintes
equa√ß√µes (derivadas das leis de Kirchhoff):
$$
\left\{\begin{alignat*}{4}
5I_1\ &-\ 2I_2\ &&-\ &I_3\ &=&\ 12\\
-2I_1\ &+\ 8I_2\ &&-\ 3&I_3\ &=&\ -4\\
-I_1\ &-\ 3I_2\ &&+\ 6&I_3\ &=&\ 6
\end{alignat*}\right.
$$
onde os lados direitos representam fontes de tens√£o nas malhas. Resolva para as correntes de malha.

### $ 1.3 $ Observa√ß√µes adicionais sobre `linalg.solve`

__Exerc√≠cio:__ Considere os seguintes dois sistemas lineares de equa√ß√µes. Tente resolv√™-los usando NumPy e explique o resultado em cada caso.

(a)
$$
\begin{align*}
\begin{bmatrix}
1 & -2 \\
-3 & 6 \\
\end{bmatrix}
\begin{bmatrix}
x \\
y
\end{bmatrix}
=
\begin{bmatrix}
1 \\
3
\end{bmatrix}
\end{align*}
$$

(b) 
$$
\begin{align*}
\begin{bmatrix}
1 & -2 \\
-3 & 6 \\
\end{bmatrix}
\begin{bmatrix}
x \\
y
\end{bmatrix}
=
\begin{bmatrix}
\phantom{-}1 \\
-3
\end{bmatrix}
\end{align*}
$$

(c)
$$
\begin{align*}
\begin{bmatrix}
1 & -2 & 3 \\
-3 & 6 & 4 \\
\end{bmatrix}
\begin{bmatrix}
x \\
y \\
z
\end{bmatrix}
=
\begin{bmatrix}
1 \\
3
\end{bmatrix}
\end{align*}
$$

(d) Voc√™ consegue encontrar (manualmente) as solu√ß√µes para os sistemas nos itens (a) e (b)?

O exerc√≠cio anterior ilustra que:
* `linalg.solve` deve ser usado apenas em sistemas _quadrados_ de equa√ß√µes lineares
  (onde o n√∫mero de equa√ß√µes √© o mesmo que o n√∫mero de inc√≥gnitas).
* Se a matriz de coeficientes √© quadrada mas __singular__
  (ou seja, seu posto √© $ < n $ ou equivalentemente seu determinante √© igual a zero), 
  ent√£o o sistema correspondente n√£o admitir√° uma solu√ß√£o √∫nica: pode
  n√£o ter solu√ß√£o alguma ou ter um n√∫mero infinito delas. Como regra,
  `linalg.solve` n√£o deve ser usado neste caso, pois pode fornecer um resultado errado
  ou apenas uma solu√ß√£o.

‚ö° Por baixo dos panos, `linalg.solve` resolve um sistema linear (quadrado) $ A\mathbf x =
\mathbf b $ encontrando primeiro a decomposi√ß√£o $ LU $ de $ A $, depois reescrevendo
o sistema original como
$$
\left\{
\begin{alignat*}{4}
L\,\mathbf y &= \mathbf b \\
U\,\mathbf x &= \mathbf y
\end{alignat*}
\right.
$$
Como $ L $ √© triangular inferior e $ U $ √© triangular superior, o primeiro
destes sistemas pode ser facilmente resolvido por substitui√ß√£o direta, e o segundo
por substitui√ß√£o reversa. Para encontrar a pr√≥pria decomposi√ß√£o $ LU $, a elimina√ß√£o gaussiana
√© aplicada a $ A $. Isso √© discutido em qualquer curso de √Ålgebra Linear,
onde voc√™ far√° muitos desses c√°lculos manualmente.

A complexidade temporal para encontrar a decomposi√ß√£o $ LU $ de (ou, equivalentemente,
realizar a elimina√ß√£o gaussiana em) uma matriz $ n \times n $ $ A $ √© $ O(n^3)
$, mas uma vez que esta decomposi√ß√£o est√° dispon√≠vel, a complexidade de resolver
$ A \mathbf{x} = \mathbf{b} $ da maneira descrita acima √© apenas $ O(n^2) $.

### $ 1.4 $ Resolvendo m√∫ltiplos sistemas quadrados compartilhando a mesma matriz de coeficientes

Para sistemas com m√∫ltiplos lados direitos, podemos passar uma matriz $ B $ como o segundo argumento.
Mais precisamente, considere o sistema linear
$$
AX = B
$$
onde $ A $ √© uma matriz quadrada $ n \times n $ como antes, $ X $ √© uma matriz $ n \times
p $ de inc√≥gnitas, e $ B $ tamb√©m √© uma matriz $ n \times p $, contendo
m√∫ltiplos vetores coluna $ \mathbf{b}_1,\, \mathbf{b}_2, \cdots,\, \mathbf{b}_p $ em $
\mathbb{R}^n $. Em outras palavras, queremos resolver simultaneamente $ p $ sistemas de
equa√ß√µes lineares compartilhando a mesma matriz de coeficientes $ A $ mas com diferentes
vetores do lado direito $ \mathbf{b}_i $. Podemos fazer isso usando
`linalg.solve` assim como para um √∫nico $ \mathbf{b} $:

In [None]:
# Definir a matriz de coeficientes A:
A = np.array([[3, 1, -1],
              [2, -2, 4],
              [1, 5, -3]])

# Definir dois vetores do lado direito como colunas de uma matriz B:
B = np.array([[4, 9],
              [6, 1],
              [2, -5]])

# Resolver AX = B para X:
X = np.linalg.solve(A, B)
print("Matriz solu√ß√£o X:")
print(X)

# Verificando a solu√ß√£o:
verification = A @ X
print("\nVerifica√ß√£o (A @ X deve ser igual a B):", '\n')
print(verification, '\n')
print(B)

__Exerc√≠cio:__ Na an√°lise de circuitos, frequentemente precisamos resolver m√∫ltiplos sistemas com a mesma matriz de conectividade, mas diferentes excita√ß√µes. Considere um circuito com $ 4 $ n√≥s descrito pela seguinte matriz de admit√¢ncia nodal (sim√©trica):
$$
Y = \begin{bmatrix} 
10 & -4 & -6 & 0 \\ 
-4 & 8 & 0 & -4 \\ 
-6 & 0 & 10 & -3 \\ 
0 & -4 & -3 & 7
\end{bmatrix}
$$
Resolva para as tens√µes nodais dados os seguintes tr√™s vetores de excita√ß√£o de corrente (lados direitos):
$$
\mathbf{i}_1 = 
\begin{bmatrix}
18 \\ 0 \\ 0 \\ 0
\end{bmatrix}
\quad
\mathbf{i}_2 = 
\begin{bmatrix}
0 \\ 18 \\ 0 \\ 0
\end{bmatrix}
\quad
\mathbf{i}_3 = 
\begin{bmatrix}
0 \\ 0 \\ 18 \\ 0
\end{bmatrix}
$$

### ‚ö° $ 1.5 $ Invers√£o de matriz vs. solu√ß√£o direta

Em teoria, podemos resolver um sistema linear $A\,\mathbf{x} = \mathbf{b}$ calculando
$\mathbf{x} = A^{-1}\,\mathbf{b}$, desde que $ A $ seja invert√≠vel (ou seja,
n√£o singular). Lembre-se que a inversa de $ A $ pode ser encontrada com `linalg.inv`.
No entanto, essa abordagem para resolver sistemas lineares geralmente √© evitada na pr√°tica
porque:
* √â computacionalmente mais cara que m√©todos de solu√ß√£o direta.
* Pode ser numericamente menos est√°vel (significando que pequenos erros podem ser amplificados).

Informalmente, o __n√∫mero de condi√ß√£o__ de uma matriz $ A $ mede qu√£o sens√≠vel
o produto $ A \,\mathbf{x} $ √© a perturba√ß√µes nas entradas de $ A $. √â
dado por
$$
\kappa(A) = \|A\|\  \|A^{-1}\|
$$
onde $\|\cdot\|$ denota uma norma matricial. Uma matriz __bem condicionada__ √© aquela
cujo n√∫mero de condi√ß√£o √© relativamente pequeno. Matrizes que s√£o quase singulares,
ou seja, cujo determinante est√° pr√≥ximo de $ 0 $, t√™m n√∫meros de condi√ß√£o muito grandes
porque suas inversas ter√£o entradas muito grandes. O n√∫mero de condi√ß√£o de
uma matriz singular √© infinito.

O n√∫mero de condi√ß√£o de $ A $ pode ser calculado com `linalg.cond(A)`. Por
padr√£o, isso usa a norma $ L_2 $ (raiz quadrada do maior autovalor de $
A^TA $), embora outras normas tamb√©m possam ser usadas; veja a [documenta√ß√£o](https://numpy.org/doc/stable/reference/generated/numpy.linalg.cond.html).

Embora resolver um sistema linear usando invers√£o ou um m√©todo direto produza
essencialmente a mesma resposta para problemas bem condicionados, a diferen√ßa na
estabilidade num√©rica torna-se importante para matrizes de coeficientes mal condicionadas.

__Exerc√≠cio:__ Calcule os n√∫meros de condi√ß√£o das seguintes tr√™s matrizes:
$$
\text{(a)}\quad A_1 = \begin{bmatrix}
3 & 0 \\
0 & 1
\end{bmatrix} \qquad
\text{(b)}\quad A_2 = \begin{bmatrix}
1 & 2 \\
1.001 & 2.001
\end{bmatrix} \qquad
\text{(c)}\quad A_3 = \begin{bmatrix}
1 & 2 \\
2 & 4
\end{bmatrix}
$$

In [None]:
A1 = np.array([[3, 0],
               [0, 1]])  # N√£o singular

A2 = np.array([[1, 2],
               [1.001, 2.001]])  # Quase singular

A3 = np.array([[1, 2],
               [2, 4]])  # Singular

## $ \S 2 $ Solu√ß√µes por m√≠nimos quadrados

O sistema linear de equa√ß√µes mais geral √© $ A \mathbf x = \mathbf b $ onde
$$
A \text{ √© $ m \times n $}, \quad \mathbf x \in \mathbb{R}^n \quad \text{e} \quad \mathbf b \in \mathbb{R}^m\,. 
$$
Geometricamente, uma solu√ß√£o $ \mathbf x $ corresponde a uma escolha de escalares $ x_k
$ que expressaria $ \mathbf b $ como uma combina√ß√£o linear $ \mathbf b = x_1\,
\mathbf a_1 + \cdots + x_n\, \mathbf a_n $ dos $ n $ vetores coluna de $ A $:
$$
\begin{bmatrix}
b_{1} \\
b_{2} \\
\vdots \\
b_{m}
\end{bmatrix}
=
x_1
\begin{bmatrix}
a_{11} \\
a_{21} \\
\vdots \\
a_{m1}
\end{bmatrix}
+
x_2
\begin{bmatrix}
a_{12} \\
a_{22} \\
\vdots \\
a_{m2}
\end{bmatrix}
+
x_n
\begin{bmatrix}
a_{1n} \\
a_{2n} \\
\vdots \\
a_{mn}
\end{bmatrix}\,.
$$
Portanto, haver√° uma solu√ß√£o se e somente se $ \mathbf b $ por acaso estiver no
hiperplano $ W \subset \mathbb{R}^m $ que passa pela origem gerado pelos
$ n $ vetores coluna de $ A $.

Agora, a dimens√£o do subespa√ßo $ W $ √© no m√°ximo $ n $, j√° que por defini√ß√£o
ele √© gerado por $ n $ vetores. Portanto, se o sistema √© __sobredeterminado__,
ou seja, se temos menos inc√≥gnitas que equa√ß√µes ($ n < m $), ent√£o $ W $ n√£o pode
coincidir com todo o $ \mathbb R^m $. Assim, para a maioria das escolhas de
$ \mathbf b \in \mathbb R^m $, n√£o existe solu√ß√£o exata. Nesta situa√ß√£o,
_o melhor que podemos fazer √© escolher o vetor $ \mathbf{p} $ em $ W $ que minimiza
a dist√¢ncia at√© $ \mathbf b $ e encontrar a solu√ß√£o correspondente $
\mathbf{\hat{x}} $ para o sistema linear_
$$
A \mathbf{x} = \mathbf{p}\,.
$$
Este $ \mathbf{p} $ √© a __proje√ß√£o ortogonal__ de $ \mathbf b $ em $ W $. √â o
vetor mais pr√≥ximo de $ \mathbf b $ em $ W $, de modo que $ \mathbf{\hat x} $ √© tal que a dist√¢ncia
de $ A\mathbf{\hat x} $ a $ \mathbf b $ √© a menor poss√≠vel, ou seja,
√© a solu√ß√£o para o problema de otimiza√ß√£o:
$$
\boxed{\ \underset{\mathbf{x}}{\text{minimizar}}\ \Vert A\,\mathbf{x} - \mathbf{b} \Vert^2\ }
$$
Devido a esta interpreta√ß√£o, este m√©todo de obter uma solu√ß√£o aproximada $ \mathbf{\hat x} $
para o sistema original $ A\mathbf x = \mathbf b $ √© conhecido como __m√©todo dos m√≠nimos quadrados__.
No NumPy, ele √© implementado atrav√©s da fun√ß√£o `linalg.lstsq`.

üìù Assumimos tacitamente na discuss√£o anterior que o sistema modificado $ A \mathbf{x} = \mathbf{p} $
tem uma solu√ß√£o _√∫nica_ $ \mathbf{\hat x} $. Este ser√° o caso se e somente se os vetores coluna
$ \mathbf a_1,\cdots,\mathbf a_n $ de $ A $ que geram $ W $ s√£o _linearmente independentes_. Se isso
n√£o for o caso, ent√£o haver√° um n√∫mero infinito de solu√ß√µes para o sistema modificado. Nesta
situa√ß√£o, geralmente escolhe-se a solu√ß√£o $ \mathbf{\hat x} $ que minimiza a norma euclidiana
$ \Vert \mathbf{\hat x} \Vert $. Este √© tamb√©m o comportamento padr√£o de `linalg.lstsq`.

__Exerc√≠cio:__ Para o sistema linear dado abaixo:
$$
\left\{\begin{align*}
    x + 2y &= 2 \\
    3x + 4y &= 5 \\
    5x + 6y &= 5
\end{align*}\right.
$$

(a) Mostre manualmente que n√£o existe uma solu√ß√£o exata.

(b) Mostre que a solu√ß√£o aproximada por m√≠nimos quadrados para o seguinte
sistema linear √© dada por $ \mathbf{\hat x} = \big(-1, \frac{7}{4}\big) $.
_Dica:_ Configure a matriz de coeficientes $ A $, o vetor $ \mathbf b $ e aplique
`linalg.lstsq`.

In [None]:
# Defina a matriz A e o vetor b:
# A = ...
# b = ...

# Calcule a solu√ß√£o de m√≠nimos quadrados:
x_hat, _, _, _ = np.linalg.lstsq(A, b, rcond=None)
# Esta fun√ß√£o retorna tr√™s outros valores al√©m da solu√ß√£o aproximada, da√≠ os '_'s.
print(x_hat)

Quando um sistema tem o mesmo n√∫mero de equa√ß√µes e inc√≥gnitas, mas a matriz
de coeficientes associada √© singular, ent√£o h√° ou nenhuma solu√ß√£o
ou infinitas solu√ß√µes. Em qualquer uma dessas situa√ß√µes, devemos
usar `linalg.lstsq` em vez de `linalg.solve` para resolv√™-lo. 
* Se o sistema tem infinitas solu√ß√µes, ent√£o o resultado √© a
  solu√ß√£o verdadeira que tem norma euclidiana m√≠nima entre todas as solu√ß√µes de
  $ A\,\mathbf{x} = \mathbf{b} $.
* Se o sistema n√£o tem solu√ß√µes, ent√£o m√≠nimos quadrados fornece a solu√ß√£o
  _aproximada_ de norma m√≠nima, ou seja, a solu√ß√£o para $ A\,\mathbf{x} = \mathbf{p} $
  que tem a menor norma euclidiana entre todas essas solu√ß√µes. (Aqui $
  \mathbf{p} $ √© a proje√ß√£o ortogonal de $ \mathbf{b} $ no subespa√ßo
  gerado pelas colunas de $ A $.)

__Exerc√≠cio:__ Resolva ou encontre solu√ß√µes aproximadas para os seguintes sistemas de equa√ß√µes:
$$
\begin{array}{cc}
\text{(a)} \quad
\left\{
\begin{array}{rcl}
x & + & y & =\ 2\\
2x & + & 2y & =\ 4
\end{array}
\right.
& \qquad
\text{(b)} \quad
\left\{
\begin{array}{rcl}
x & + & y &=\ 2\\
2x & + & 2y &=\ 2
\end{array}
\right.
\end{array}
$$

(c) Encontre (manualmente) _todas_ as solu√ß√µes para (a) e verifique que a solu√ß√£o de m√≠nimos quadrados
√© de fato aquela que tem norma m√≠nima entre todas as solu√ß√µes poss√≠veis.

(d) Mostre que (b) n√£o tem solu√ß√µes. Em seguida, encontre a proje√ß√£o ortogonal $ \mathbf{p} $
de $ \mathbf{b} = (2, 2) $ no subespa√ßo gerado pelas colunas de $ A $ e 
finalmente verifique que a solu√ß√£o $ \hat{\mathbf{x}} $ produzida por `lstsq` √© a
que tem norma m√≠nima entre todas as solu√ß√µes para $ A\,\mathbf{x} = \mathbf{p} $.

In [None]:
A = np.array([[1, 1],
              [2, 2]])
b = np.array([2, 2])
x_hat, _, _, _ = np.linalg.lstsq(A, b, rcond=None)
print(x_hat)

## $ \S 3 $ Autovalores e autovetores

Dada uma matriz quadrada $ A $, um __autovetor__ $ \mathbf{v} $ √© um
vetor n√£o nulo tal que quando $ A $ atua sobre $ \mathbf{v} $,
o resultado √© um m√∫ltiplo escalar de $ \mathbf{v} $, ou seja,
$$
\boxed{\ A\mathbf{v} = \lambda\mathbf{v}\ }
$$
para algum escalar $ \lambda $, que √© chamado de __autovalor__ correspondente ao
autovetor $ \mathbf{v} $. Autovalores e autovetores t√™m numerosas
aplica√ß√µes em engenharia e ci√™ncias. O NumPy fornece a fun√ß√£o `linalg.eig`
para calcular os autovalores e autovetores de uma matriz quadrada:

In [None]:
A = np.array([[0, 0, 6],
              [1, 0, -11],
              [0, 1, 6]])
print(f"Matriz A:\n{A}")
# Calcular autovalores e autovetores
eigenvalues, eigenvectors = np.linalg.eig(A)

print("\nAutovalores:")
print(eigenvalues)
print("\nAutovetores (cada coluna corresponde a um autovalor):")
print(np.round(eigenvectors, 2))

üìù Os autovetores retornados pelo NumPy s√£o normalizados para ter comprimento unit√°rio (ou seja,
$ \|\mathbf{v}\| = 1 $). Al√©m disso, eles aparecem na mesma ordem que seus
autovalores correspondentes.

Autovetores e autovalores t√™m numerosas aplica√ß√µes em campos
que v√£o da mec√¢nica qu√¢ntica ao aprendizado de m√°quina. Eles tamb√©m s√£o um dos
conceitos centrais na pr√≥pria √°lgebra linear. Algumas de suas
propriedades mais importantes incluem:

* O _determinante_ de uma matriz √© igual ao produto de seus autovalores.
* O _tra√ßo_ de uma matriz (soma dos elementos diagonais) √© igual √† soma de seus autovalores.
* Uma matriz √© _invert√≠vel_ se e somente se todos os seus autovalores s√£o n√£o nulos.
* _Matrizes semelhantes_ t√™m os mesmos autovalores.

__Exerc√≠cio:__ Lembre-se que qualquer matriz _sim√©trica_ real $ S $ $ n \times n $ pode
ser diagonalizada sobre $ \mathbb R $ , e que podemos encontrar uma base para $ \mathbb
R^n $ consistindo de autovetores ortogonais de $ S $. Verifique que a matriz
abaixo tem um conjunto completo de autovalores e que seus autovetores s√£o de fato
ortogonais.

In [None]:
S = np.array([[2, -1, 0],
              [-1, 2, -1],
              [0, -1, 2]])

üìù A fun√ß√£o `linalg.eigh` √© especificamente projetada para calcular os
autovalores e autovetores de uma matriz sim√©trica ou hermitiana. (Uma matriz hermitiana
√© uma matriz complexa igual √† sua transposta conjugada.)
Ela √© mais eficiente que o `linalg.eig` geral e garante autovalores reais.

__Exerc√≠cio:__ Refa√ßa o exerc√≠cio anterior usando `eigh` em vez de `eig`. Voc√™
obt√©m os mesmos resultados? Se n√£o, eles podem ser reconciliados (ou seja, voc√™ pode explicar as discrep√¢ncias)?

Se precisarmos apenas dos autovalores, podemos usar `linalg.eigvals` (ou `linalg.eigvalsh` para matrizes sim√©tricas).
Por exemplo, a matriz
$$
R = \begin{bmatrix}
0 & -1 \\
1 & 0
\end{bmatrix}
$$
corresponde a uma rota√ß√£o no sentido anti-hor√°rio de $ \mathbb{R}^2 $ por $
\frac{\pi}{2} $ radianos ($ 90 $ graus). Seus autovalores s√£o $ \pm i $, onde
$ i $ √© a unidade imagin√°ria. Podemos verificar isso com a ajuda do NumPy (mas
lembre-se que em Python, a unidade imagin√°ria √© denotada por `j`).

In [None]:
R = np.array([[0, -1],
              [1, 0]])

print(np.linalg.eigvals(R))

__Exerc√≠cio (Cadeias de Markov):__
Uma _cadeia de Markov_ √© um sistema matem√°tico que sofre transi√ß√µes de um
estado para outro de acordo com certas regras probabil√≠sticas. Em uma cadeia de Markov,
a distribui√ß√£o de probabilidade do pr√≥ximo estado depende apenas do estado atual.
A _distribui√ß√£o estacion√°ria_ √© a propor√ß√£o de tempo a longo prazo que a
cadeia de Markov passa em cada estado, independentemente do estado inicial. 

Considere uma cadeia de Markov simples representando transi√ß√µes entre
tr√™s estados clim√°ticos: ensolarado, nublado e chuvoso, ou estados $ 0 $, $ 1 $ e $ 2
$, respectivamente. A _matriz de transi√ß√£o_ $ P $ √© dada por
$$
P = \begin{bmatrix}
0.7 & 0.2 & 0.1 \\
0.3 & 0.4 & 0.3 \\
0.2 & 0.3 & 0.5
\end{bmatrix}
$$
onde a entrada $ P_{ij} $ representa a probabilidade de transi√ß√£o do estado $
i $ para o estado $ j $.

(a) Encontre os autovalores e autovetores de $ P^T $ (a transposta de $ P $).

(b) Use o autovetor de $ P^T $ correspondente ao autovalor $ 1 $ para
determinar a distribui√ß√£o de probabilidade de longo prazo $ \mathbf{s} $ dos estados
clim√°ticos (ou seja, a distribui√ß√£o estacion√°ria). Isso pode ser obtido
escalando este autovetor para que a soma das coordenadas se torne $ 1 $.

(c) Verifique sua resposta elevando a matriz de transi√ß√£o $ P $ a uma alta pot√™ncia
$ n $: Pode-se mostrar que √† medida que $ n \to \infty $, cada linha de $ P^n $ converge
para $ \mathbf{s} $.

In [None]:
P = np.array([
    [0.7, 0.2, 0.1],  # Ensolarado -> Ensolarado, Nublado, Chuvoso
    [0.3, 0.4, 0.3],  # Nublado -> Ensolarado, Nublado, Chuvoso
    [0.2, 0.3, 0.5]   # Chuvoso -> Ensolarado, Nublado, Chuvoso
])

## $ \S 4 $ SciPy para Resolver Equa√ß√µes

__SciPy__ √© uma biblioteca constru√≠da sobre o NumPy que fornece extensa
funcionalidade para computa√ß√£o cient√≠fica. √â um dos pacotes mais importantes
no mundo Python. Devido ao seu amplo escopo, n√£o podemos esperar cobri-lo em
detalhes aqui. Em vez disso, vamos nos concentrar em apresentar as ferramentas b√°sicas para resolver
equa√ß√µes gerais (n√£o lineares) e problemas de otimiza√ß√£o.

### $ 4.1 $ M√≥dulo de √°lgebra linear do SciPy

O SciPy tem um m√≥dulo `linalg` que se sobrep√µe substancialmente ao do NumPy, mas
tamb√©m fornece rotinas de √°lgebra linear mais avan√ßadas, incluindo
solvers especializados para v√°rios tipos de matrizes (sim√©trica, em banda,
triangular, etc.) e solucionadores diretos para sistemas densos e esparsos. Como
estes envolvem t√≥picos mais especializados, n√£o entraremos neles aqui.
Em vez disso, vamos comparar em um exemplo simples como o NumPy e o SciPy podem resolver
sistemas lineares:

In [None]:
A = np.array([[4, 2, 1],
              [2, 5, 3],
              [1, 3, 6]])
b = np.array([7, 10, 8])

# Solu√ß√£o NumPy:
x_np = np.linalg.solve(A, b)
print("Solu√ß√£o NumPy:")
print(x_np)

# Solu√ß√£o SciPy:
x_sp = spla.solve(A, b)
print("\nSolu√ß√£o SciPy:")
print(x_sp)

### $ 4.2 $ Resolvendo uma √∫nica equa√ß√£o n√£o-linear

O m√≥dulo `optimize` do SciPy fornece fun√ß√µes para resolver equa√ß√µes n√£o-lineares.
Para uma √∫nica vari√°vel, podemos usar `optimize.root_scalar` para encontrar uma raiz (zero)
de uma fun√ß√£o. Para que `root_scalar` fa√ßa seu trabalho, devemos fornecer ou um
__intervalo de delimita√ß√£o__ $ [a, b] $, ou seja, um intervalo dentro do dom√≠nio
da fun√ß√£o tal que $ f(a) $ e $ f(b) $ tenham sinais
opostos, ou uma estimativa inicial $ x_0 $ para uma raiz mais alguns par√¢metros opcionais.

Por exemplo, considere o problema de localizar uma raiz do polin√¥mio c√∫bico
$$
f(x) = x^3 - 2x^2 + 4x - 8\,.
$$
Verificamos facilmente que
$$
f(1) = 1 -2 + 4 - 8 < 0 \qquad \text{enquanto} \qquad f(3) = 27 - 18 + 12 - 8 > 0
$$
Logo, pelo teorema do valor intermedi√°rio, deve existir uma raiz de $ f $ dentro
de $ [1, 3] $. Vamos verificar isso:

In [None]:
f = lambda x: x**3 - 2*x**2 + 4*x - 8  # definindo f

# Usando root_scalar com m√©todo de bracket:
solution = spo.root_scalar(f, bracket=[1, 3], method='brentq')
print("Raiz encontrada:")
print(round(solution.root, 4))
print("Valor da fun√ß√£o na raiz:")
print(round(f(solution.root), 4))

O valor de retorno de `root_scalar` cont√©m outras informa√ß√µes √∫teis al√©m do
valor da raiz:

In [None]:
print(solution)

Vamos verificar a resposta plotando o gr√°fico de $ f $:

In [None]:
xs = np.linspace(0, 3, 1000)
ys = f(xs)

fig, ax = plt.subplots(figsize=(8, 5))
ax.plot(xs, ys)
ax.axhline(y=0, color='k', linestyle='--', alpha=0.3)
ax.grid(linestyle="--", alpha=0.3)
ax.plot(sol.root, 0, 'ro', markersize=6)
ax.set_xlabel("$ x $")
ax.set_ylabel("$ f(x) $")
ax.set_title("Encontrar uma raiz de $ f(x) = x^3 - 2 x^2 + 4 x - 8 $")
plt.show()

üìù `root_scalar` n√£o encontra todas as ra√≠zes, encontra apenas uma √∫nica raiz pr√≥xima a uma estimativa
inicial ou dentro de um intervalo especificado.

__Exerc√≠cio:__ Resolva a seguinte equa√ß√£o n√£o-linear usando `root_scalar` e um
intervalo de delimita√ß√£o.
$$ e^x - 5x = 2 $$
Fa√ßa um gr√°fico da fun√ß√£o que voc√™ usou para encontrar uma raiz e marque a solu√ß√£o.

Para usar `root_scalar` com uma estimativa, tamb√©m precisamos especificar um m√©todo que n√£o
requeira delimita√ß√£o, como o m√©todo de Newton ou o m√©todo da secante. Veja
como fazer isso:

In [None]:
f = lambda x: x**2 - 4

# Use root_scalar com uma estimativa:
result = spo.root_scalar(f, 
                         x0=1.0,           # Estimativa inicial
                         method="newton")  # M√©todo que usa uma estimativa

print(f"Raiz: {round(result.root, 4)}")
print(f"Valor da fun√ß√£o na raiz: {round(f(result.root), 4)}")

__Exerc√≠cio:__ O que acontece se voc√™ tentar encontrar uma raiz de $ g(x) = x^2 + 1 $?
Certifique-se de exibir as informa√ß√µes completas sobre a solu√ß√£o, n√£o apenas seu valor.

In [None]:
f = lambda x: x**2 + 4

# Use root_scalar com uma estimativa:
result = spo.root_scalar(f, 
                         x0=1.0,           # Estimativa inicial
                         method='newton')  # M√©todo que usa uma estimativa

print(f"Raiz: {round(result.root, 4)}")
print(f"Valor da fun√ß√£o na raiz: {round(f(result.root), 4)}")
result

### $ 4.3 $ Encontrando ra√≠zes de polin√¥mios

Polin√¥mios t√™m propriedades especiais que permitem algoritmos de busca de ra√≠zes mais eficientes e precisos. Dado um polin√¥mio
$$
p(x) = a_n x^n + a_{n-1} x^{n-1} + \cdots + a_1 x + a_0\,,
$$
podemos encontrar todas as suas ra√≠zes usando a fun√ß√£o `roots` do NumPy, que recebe um
array de coeficientes $ [a_n, a_{n-1}, \ldots, a_1, a_0] $ como entrada. Como
ilustra√ß√£o, considere o problema de encontrar as ra√≠zes de
$$
p(x) = x^3 - 2x^2 - 5x + 6
$$

In [None]:
coeffs = np.array([1, -2, -5, 6])  # coeficientes, do maior para o menor grau
roots = np.roots(coeffs)
print("Ra√≠zes do polin√¥mio:", roots)

__Exerc√≠cio:__ Verifique que estas s√£o de fato todas as ra√≠zes de $ p $.

__Exerc√≠cio:__ Determine todas as ra√≠zes de
$$
q(x) = x^4 - 17x^3 + 101x^2 - 247x + 210\,.
$$

### $ 4.4 $ Resolvendo um sistema de equa√ß√µes n√£o-lineares

Considere o
problema de encontrar a interse√ß√£o entre o c√≠rculo centrado em
$ \big(1, \frac{1}{2}\big) $ com raio de $ 1 $ e o gr√°fico da curva
senoidal. Em outras palavras, queremos resolver o sistema de equa√ß√µes (n√£o-linear)
$$
\begin{cases}
\ (x - 1)^2 + (y - 0.5)^2 = 1 \\
\ \,y = \sin x
\end{cases}
$$
Vamos fazer um gr√°fico da situa√ß√£o:

In [None]:
fig, ax = plt.subplots(figsize=(8, 5))

# Plotar a curva senoidal:
xs = np.linspace(-1, 3, 1000)
ax.plot(xs, np.sin(xs), "r-", label="Seno: $ y = \\operatorname{sen}(x) $")
# Plotar o c√≠rculo:
theta = np.linspace(0, 2 * np.pi, 100)
circle_xs = 1 + np.cos(theta)
circle_ys = 0.5 + np.sin(theta)
ax.plot(circle_xs, circle_ys, "b-", label="C√≠rculo: $ (x-1)^2 + (y-0.5)^2 = 1 $")

ax.set_xlabel("$ x $")
ax.set_ylabel("$ y $")
ax.set_title("Interse√ß√£o de um c√≠rculo e uma curva senoidal")
ax.grid(linestyle="--", alpha=0.3)
ax.axis("equal")
ax.legend()
plt.show()

Tais sistemas de equa√ß√µes podem ser resolvidos com `scipy.optimize.root` fornecendo
uma estimativa inicial. Veja como podemos encontrar ambos os pontos de interse√ß√£o:

In [None]:
# Definir o sistema de equa√ß√µes:
def equations(vars):
   x, y = vars
   eq1 = (x - 1)**2 + (y - 0.5)**2 - 1  # Equa√ß√£o do c√≠rculo = 0
   eq2 = y - np.sin(x)                  # Equa√ß√£o da curva senoidal = 0
   return [eq1, eq2]

# Encontrar interse√ß√µes usando diferentes estimativas iniciais:
initial_guesses = [
   [0, 0],   # Estimativa para interse√ß√£o √† esquerda
   [2, 1]    # Estimativa para interse√ß√£o √† direita
]

# Resolver para cada estimativa inicial:
for i, guess in enumerate(initial_guesses):
   solution = spo.root(equations, guess)
   
   print(f"\nSolu√ß√£o {i+1} (a partir da estimativa inicial {guess}):")
   print(f"x, y = {np.round(solution.x, 2)}")
   print("Valores da fun√ß√£o na solu√ß√£o:")
   print(f"f(x,y) = {np.round(solution.fun, 2)}")

__Exerc√≠cio:__ Encontre os pontos de interse√ß√£o das curvas descritas pelas
seguintes duas equa√ß√µes n√£o-lineares. Visualize as curvas e seus
pontos de interse√ß√£o:
$$
\begin{cases}
\ \sin x + \cos y = 0.5 \\
\ x^2 + y^2 = 1
\end{cases}
$$

### $ 4.5 $ Problemas de otimiza√ß√£o

O m√≥dulo `optimize` tamb√©m fornece fun√ß√µes para resolver problemas de otimiza√ß√£o.
Vamos examinar o problema de minimizar a fun√ß√£o
$$
x^2 + y^2 + (x + y - 2)^2\,.
$$

In [None]:
# Definir a fun√ß√£o a minimizar:
f = lambda vars: vars[0]**2 + vars[1]**2 + (vars[0] + vars[1] - 2)**2

# Estimativa inicial:
x0 = [0, 0]

# Minimizar a fun√ß√£o:
result = spo.minimize(f, x0, method="BFGS")

print("M√≠nimo encontrado em:")
print(result.x)
print("\nValor da fun√ß√£o no m√≠nimo:")
print(result.fun)
print("\nN√∫mero de itera√ß√µes:")
print(result.nit)
print("\nMensagem de converg√™ncia:")
print(result.message)

__Exerc√≠cio:__ Verifique manualmente que $ (2/3, 2/3) $ √© o √∫nico ponto cr√≠tico de
$ f(x) $, e que este √© de fato um m√≠nimo global.

Vamos verificar esta resposta visualmente plotando as curvas de n√≠vel de $ f $ e
marcando o ponto m√≠nimo encontrado pelo SciPy. (Focaremos em contornos e outros
tipos de gr√°ficos em um notebook futuro; por enquanto, voc√™ pode ignorar o c√≥digo abaixo e
concentrar-se no pr√≥prio gr√°fico.)

In [None]:
xs = np.linspace(-2, 2, 100)
ys = np.linspace(-2, 2, 100)
X, Y = np.meshgrid(xs, ys)
Z = X**2 + Y**2 + (X + Y - 2)**2

fig, ax = plt.subplots(figsize=(8, 5))
contour = ax.contour(X, Y, Z, 20, cmap="viridis")
fig.colorbar(contour, ax=ax)
ax.scatter(result.x[0], result.x[1], color="red", s=100, marker="x")
ax.grid(True)
ax.set_xlabel("x")
ax.set_ylabel("y")
ax.grid(linestyle="--", alpha=0.3)
ax.set_title("Gr√°fico de Contorno de $ x^2 + y^2 + (x + y - 2)^2 $")
plt.show()

üìù Por padr√£o, `minimize` encontra um m√≠nimo _local_, n√£o necessariamente o m√≠nimo
_global_, pr√≥ximo √† sua estimativa inicial. Para encontrar m√°ximos usando SciPy, voc√™ pode chamar
`minimize` no negativo da sua fun√ß√£o. 

__Exerc√≠cio:__ Encontre um m√°ximo (local) de 
$$
f(x, y) = x\sin(4x) + y\sin(2y)\,.
$$
Experimente com v√°rias estimativas iniciais diferentes e verifique se os
resultados mudam.