# üîç Sistemas de Equa√ß√µes Lineares: O Detetive da Matem√°tica

## *M√≥dulo 5 - √Ålgebra Linear para IA*

### Pedro Nunes Guth

---

Bora resolver uns mist√©rios matem√°ticos! üïµÔ∏è‚Äç‚ôÇÔ∏è

T√°, mas o que √© um sistema de equa√ß√µes lineares? Imagina que voc√™ vai no a√ßougue e compra 2kg de carne e 3kg de frango por R$ 50. No dia seguinte, compra 1kg de carne e 2kg de frango por R$ 30. Pergunta: quanto custa o kg de cada um?

√â exatamente isso que vamos resolver hoje! E o melhor: vamos ver como isso se conecta diretamente com regress√£o linear e machine learning. Liiindo! üöÄ

## üéØ O Que Vamos Aprender Hoje

Nos m√≥dulos anteriores, aprendemos sobre:
- **M√≥dulo 1**: Escalares, vetores e matrizes
- **M√≥dulo 2**: Opera√ß√µes com vetores (produto escalar)
- **M√≥dulo 3**: Multiplica√ß√£o de matrizes
- **M√≥dulo 4**: NumPy na pr√°tica

Hoje vamos usar TUDO isso para:

1. **Entender sistemas de equa√ß√µes lineares**
2. **Representar sistemas como Ax = b**
3. **Resolver sistemas com NumPy**
4. **Conectar com regress√£o linear**
5. **Ver casos pr√°ticos de ML**

**Dica do Pedro**: Sistemas lineares s√£o a base de QUASE TUDO em machine learning. Desde regress√£o at√© redes neurais, tudo passa por aqui!

In [None]:
# Setup inicial - importando as bibliotecas que vamos usar
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.datasets import make_regression
import seaborn as sns

# Configura√ß√µes para gr√°ficos mais bonitos
plt.style.use('seaborn-v0_8')
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12

print("üöÄ Bibliotecas carregadas! Bora resolver uns sistemas!")
print(f"NumPy vers√£o: {np.__version__}")

## üßÆ Fundamentos: O Que √â Um Sistema Linear?

T√°, vamos come√ßar do b√°sico. Um **sistema de equa√ß√µes lineares** √© um conjunto de equa√ß√µes onde cada uma √© uma combina√ß√£o linear de vari√°veis.

### Exemplo Cl√°ssico:

$$\begin{cases}
2x + 3y = 50 \\
1x + 2y = 30
\end{cases}$$

Onde:
- $x$ = pre√ßo do kg de carne
- $y$ = pre√ßo do kg de frango

### Representa√ß√£o Matricial:

Podemos escrever isso como: $\mathbf{A}\mathbf{x} = \mathbf{b}$

$$\begin{bmatrix}
2 & 3 \\
1 & 2
\end{bmatrix}
\begin{bmatrix}
x \\
y
\end{bmatrix}
=
\begin{bmatrix}
50 \\
30
\end{bmatrix}$$

Onde:
- $\mathbf{A}$ = matriz dos coeficientes
- $\mathbf{x}$ = vetor das vari√°veis (o que queremos descobrir)
- $\mathbf{b}$ = vetor dos resultados

**Dica do Pedro**: Lembra da multiplica√ß√£o de matrizes do M√≥dulo 3? √â exatamente isso que est√° acontecendo aqui! A primeira linha de A multiplicada por x nos d√° a primeira equa√ß√£o.

In [None]:
# Vamos criar nosso primeiro sistema linear
# Sistema: 2x + 3y = 50, x + 2y = 30

# Matriz A (coeficientes)
A = np.array([
    [2, 3],  # Primeira equa√ß√£o: 2x + 3y
    [1, 2]   # Segunda equa√ß√£o: x + 2y
])

# Vetor b (resultados)
b = np.array([50, 30])

print("Matriz A (coeficientes):")
print(A)
print("\nVetor b (resultados):")
print(b)

# Vamos verificar se nossa representa√ß√£o est√° correta
print("\nVerifica√ß√£o: Ax = b")
print(f"Dimens√µes: A = {A.shape}, b = {b.shape}")
print("Perfeito! Podemos multiplicar A por um vetor x de tamanho 2")

## üîß Resolvendo Sistemas: Os M√©todos

Existem v√°rias formas de resolver um sistema $\mathbf{A}\mathbf{x} = \mathbf{b}$:

### 1. M√©todo da Inversa (quando poss√≠vel):
$$\mathbf{x} = \mathbf{A}^{-1}\mathbf{b}$$

### 2. M√©todo de Elimina√ß√£o de Gauss
Transformamos a matriz em escalonada

### 3. Decomposi√ß√£o LU
Fatoramos A = LU

### 4. Numpy.linalg.solve() (O mais pr√°tico!)
Usa algoritmos otimizados internamente

**Por que n√£o usar sempre a inversa?**
- Nem sempre existe
- √â computacionalmente cara
- Problemas num√©ricos com matrizes mal condicionadas

**Dica do Pedro**: O `np.linalg.solve()` √© como ter um mec√¢nico expert que escolhe a melhor ferramenta automaticamente. Use ele!

In [None]:
# M√©todo 1: Usando np.linalg.solve() (RECOMENDADO)
x_solve = np.linalg.solve(A, b)
print("üéØ Solu√ß√£o usando np.linalg.solve():")
print(f"x = {x_solve[0]:.2f} (pre√ßo da carne)")
print(f"y = {x_solve[1]:.2f} (pre√ßo do frango)")

# M√©todo 2: Usando a inversa (s√≥ para comparar)
A_inv = np.linalg.inv(A)
x_inv = A_inv @ b  # Lembra do @ do M√≥dulo 4?
print("\nüîÑ Solu√ß√£o usando a inversa:")
print(f"x = {x_inv[0]:.2f}")
print(f"y = {x_inv[1]:.2f}")

# Verifica√ß√£o: Ax deve ser igual a b
verificacao = A @ x_solve
print("\n‚úÖ Verifica√ß√£o (A @ x):")
print(f"Resultado: {verificacao}")
print(f"Original b: {b}")
print(f"Diferen√ßa: {np.abs(verificacao - b)}")

print("\nüéâ Liiindo! A carne custa R$ 10,00/kg e o frango R$ 10,00/kg")

## üìä Visualizando Sistemas Lineares

Cada equa√ß√£o linear em 2D representa uma **reta**. A solu√ß√£o do sistema √© onde essas retas se cruzam!

Para nossa equa√ß√£o $ax + by = c$, podemos reescrever como:
$$y = \frac{c - ax}{b}$$

Vamos visualizar nosso sistema:
- Equa√ß√£o 1: $2x + 3y = 50$ ‚Üí $y = \frac{50 - 2x}{3}$
- Equa√ß√£o 2: $x + 2y = 30$ ‚Üí $y = \frac{30 - x}{2}$

In [None]:
# Visualizando o sistema de equa√ß√µes
x_range = np.linspace(0, 30, 100)

# Equa√ß√£o 1: 2x + 3y = 50 -> y = (50 - 2x) / 3
y1 = (50 - 2*x_range) / 3

# Equa√ß√£o 2: x + 2y = 30 -> y = (30 - x) / 2
y2 = (30 - x_range) / 2

plt.figure(figsize=(12, 8))
plt.plot(x_range, y1, 'b-', linewidth=2, label='2x + 3y = 50 (Equa√ß√£o 1)')
plt.plot(x_range, y2, 'r-', linewidth=2, label='x + 2y = 30 (Equa√ß√£o 2)')

# Marcando a solu√ß√£o
plt.plot(x_solve[0], x_solve[1], 'go', markersize=10, label=f'Solu√ß√£o: ({x_solve[0]:.1f}, {x_solve[1]:.1f})')

plt.xlabel('x (Pre√ßo da carne - R$/kg)')
plt.ylabel('y (Pre√ßo do frango - R$/kg)')
plt.title('Sistema de Equa√ß√µes Lineares: Onde as Retas se Encontram! üéØ')
plt.legend()
plt.grid(True, alpha=0.3)
plt.xlim(0, 25)
plt.ylim(0, 20)

# Anota√ß√£o explicativa
plt.annotate('Ponto de interse√ß√£o\n= Solu√ß√£o do sistema', 
             xy=(x_solve[0], x_solve[1]), 
             xytext=(15, 15),
             arrowprops=dict(arrowstyle='->', color='green', lw=2),
             fontsize=12, ha='center')

plt.tight_layout()
plt.show()

print("üé® Cada linha representa uma equa√ß√£o. O ponto verde √© nossa solu√ß√£o!")

## üîó Conex√£o com Regress√£o Linear

Agora vem a parte MAIS IMPORTANTE: como isso se conecta com machine learning?

### Regress√£o Linear √© um Sistema Linear!

Quando fazemos regress√£o linear, queremos encontrar a reta que melhor se ajusta aos dados:
$$y = \beta_0 + \beta_1 x$$

Com m√∫ltiplas features:
$$y = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + ... + \beta_n x_n$$

### M√©todo dos M√≠nimos Quadrados:

Para encontrar os coeficientes $\boldsymbol{\beta}$, resolvemos:
$$\boldsymbol{\beta} = (\mathbf{X}^T\mathbf{X})^{-1}\mathbf{X}^T\mathbf{y}$$

Ou de forma equivalente, o sistema:
$$\mathbf{X}^T\mathbf{X}\boldsymbol{\beta} = \mathbf{X}^T\mathbf{y}$$

**Dica do Pedro**: Lembra da transposta que vamos ver no M√≥dulo 7? Ela aparece aqui! E vamos usar tudo que aprendemos sobre multiplica√ß√£o de matrizes.

In [None]:
# Vamos criar um exemplo de regress√£o linear como sistema linear
np.random.seed(42)

# Gerando dados sint√©ticos
n_samples = 100
X = np.random.randn(n_samples, 2)  # 2 features
true_coeffs = np.array([3, -2])   # Coeficientes verdadeiros
true_intercept = 1                # Intercepto verdadeiro

# y = 1 + 3*x1 - 2*x2 + ru√≠do
y = true_intercept + X @ true_coeffs + 0.1 * np.random.randn(n_samples)

print("üìä Dados gerados:")
print(f"Samples: {n_samples}")
print(f"Features: {X.shape[1]}")
print(f"Coeficientes verdadeiros: {true_coeffs}")
print(f"Intercepto verdadeiro: {true_intercept}")

# Adicionando coluna de 1s para o intercepto (bias)
X_with_bias = np.column_stack([np.ones(n_samples), X])
print(f"\nX com bias: {X_with_bias.shape}")
print("Primeira linha (exemplo):", X_with_bias[0])

In [None]:
# Resolvendo a regress√£o como sistema linear
# M√©todo 1: F√≥rmula dos m√≠nimos quadrados
XtX = X_with_bias.T @ X_with_bias  # X^T @ X
Xty = X_with_bias.T @ y            # X^T @ y

# Resolvendo o sistema: (X^T @ X) @ beta = X^T @ y
beta_sistema = np.linalg.solve(XtX, Xty)

print("üîç Resolvendo regress√£o como sistema linear:")
print(f"Intercepto estimado: {beta_sistema[0]:.3f} (verdadeiro: {true_intercept})")
print(f"Coef 1 estimado: {beta_sistema[1]:.3f} (verdadeiro: {true_coeffs[0]})")
print(f"Coef 2 estimado: {beta_sistema[2]:.3f} (verdadeiro: {true_coeffs[1]})")

# M√©todo 2: Usando sklearn para comparar
model = LinearRegression()
model.fit(X, y)

print("\nü§ñ Usando sklearn LinearRegression:")
print(f"Intercepto: {model.intercept_:.3f}")
print(f"Coeficientes: {model.coef_}")

print("\n‚úÖ Os resultados s√£o praticamente id√™nticos! Liiindo!")

## üé® Visualizando a Regress√£o

Vamos visualizar como nossa regress√£o linear se comporta. Com 2 features, nossa fun√ß√£o √©:
$$y = \beta_0 + \beta_1 x_1 + \beta_2 x_2$$

Isso representa um **plano** no espa√ßo 3D!

In [None]:
# Visualiza√ß√£o 3D da regress√£o linear
from mpl_toolkits.mplot3d import Axes3D

fig = plt.figure(figsize=(15, 5))

# Subplot 1: Scatter plot dos dados reais vs preditos
ax1 = fig.add_subplot(131)
y_pred = X_with_bias @ beta_sistema
ax1.scatter(y, y_pred, alpha=0.6, color='blue')
ax1.plot([y.min(), y.max()], [y.min(), y.max()], 'r--', lw=2)
ax1.set_xlabel('y real')
ax1.set_ylabel('y predito')
ax1.set_title('Real vs Predito')
ax1.grid(True, alpha=0.3)

# Subplot 2: Res√≠duos
ax2 = fig.add_subplot(132)
residuos = y - y_pred
ax2.scatter(y_pred, residuos, alpha=0.6, color='green')
ax2.axhline(y=0, color='r', linestyle='--')
ax2.set_xlabel('y predito')
ax2.set_ylabel('Res√≠duos')
ax2.set_title('An√°lise de Res√≠duos')
ax2.grid(True, alpha=0.3)

# Subplot 3: Compara√ß√£o dos coeficientes
ax3 = fig.add_subplot(133)
labels = ['Intercepto', 'Coef 1', 'Coef 2']
verdadeiros = [true_intercept, true_coeffs[0], true_coeffs[1]]
estimados = beta_sistema

x_pos = np.arange(len(labels))
width = 0.35

ax3.bar(x_pos - width/2, verdadeiros, width, label='Verdadeiros', alpha=0.8)
ax3.bar(x_pos + width/2, estimados, width, label='Estimados', alpha=0.8)
ax3.set_xlabel('Par√¢metros')
ax3.set_ylabel('Valores')
ax3.set_title('Coeficientes: Real vs Estimado')
ax3.set_xticks(x_pos)
ax3.set_xticklabels(labels)
ax3.legend()
ax3.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Calculando m√©tricas
mse = np.mean(residuos**2)
r2 = 1 - np.sum(residuos**2) / np.sum((y - np.mean(y))**2)

print(f"üìà M√©tricas do modelo:")
print(f"MSE: {mse:.4f}")
print(f"R¬≤: {r2:.4f}")
print(f"RMSE: {np.sqrt(mse):.4f}")

## üåü Tipos de Sistemas Lineares

Nem todo sistema linear tem solu√ß√£o √∫nica! Existem 3 casos:

### 1. Sistema Determinado (Solu√ß√£o √önica)
- N√∫mero de equa√ß√µes = n√∫mero de vari√°veis
- Matriz A √© invert√≠vel (det(A) ‚â† 0)
- **Exemplo**: Nosso problema do a√ßougue

### 2. Sistema Indeterminado (Infinitas Solu√ß√µes)
- Equa√ß√µes s√£o linearmente dependentes
- det(A) = 0, mas o sistema √© consistente

### 3. Sistema Imposs√≠vel (Sem Solu√ß√£o)
- Equa√ß√µes contradit√≥rias
- det(A) = 0 e sistema inconsistente

**Dica do Pedro**: Em machine learning, geralmente temos mais dados que par√¢metros (sistema sobredeterminado), ent√£o usamos m√≠nimos quadrados para encontrar a "melhor" solu√ß√£o.

In [None]:
# Exemplos dos diferentes tipos de sistemas

print("üîç Analisando diferentes tipos de sistemas:")
print("="*50)

# Sistema 1: Determinado (solu√ß√£o √∫nica)
A1 = np.array([[2, 3], [1, 2]])
b1 = np.array([50, 30])
det1 = np.linalg.det(A1)
print(f"\n1Ô∏è‚É£ Sistema Determinado:")
print(f"Determinante: {det1:.3f}")
print(f"Status: {'Invert√≠vel' if abs(det1) > 1e-10 else 'Singular'}")
if abs(det1) > 1e-10:
    sol1 = np.linalg.solve(A1, b1)
    print(f"Solu√ß√£o: x = {sol1[0]:.2f}, y = {sol1[1]:.2f}")

# Sistema 2: Indeterminado (infinitas solu√ß√µes)
A2 = np.array([[2, 4], [1, 2]])  # Segunda linha = primeira/2
b2 = np.array([10, 5])           # b2[1] = b2[0]/2 tamb√©m
det2 = np.linalg.det(A2)
print(f"\n2Ô∏è‚É£ Sistema Indeterminado:")
print(f"Determinante: {det2:.3f}")
print(f"Status: Infinitas solu√ß√µes (equa√ß√µes dependentes)")
print(f"Equa√ß√£o 1: 2x + 4y = 10")
print(f"Equa√ß√£o 2: 1x + 2y = 5 (√© a equa√ß√£o 1 dividida por 2!)")

# Sistema 3: Imposs√≠vel (sem solu√ß√£o)
A3 = np.array([[2, 4], [1, 2]])  # Mesma matriz A2
b3 = np.array([10, 6])           # Mas b3[1] ‚â† b3[0]/2
det3 = np.linalg.det(A3)
print(f"\n3Ô∏è‚É£ Sistema Imposs√≠vel:")
print(f"Determinante: {det3:.3f}")
print(f"Status: Sem solu√ß√£o (inconsistente)")
print(f"Equa√ß√£o 1: 2x + 4y = 10")
print(f"Equa√ß√£o 2: 1x + 2y = 6 (contradit√≥ria!)")
print(f"Se 2x + 4y = 10, ent√£o x + 2y = 5, n√£o 6!")

# Testando solu√ß√£o do sistema imposs√≠vel
try:
    sol3 = np.linalg.solve(A3, b3)
    print(f"Solu√ß√£o encontrada: {sol3}")
except np.linalg.LinAlgError as e:
    print(f"‚ùå Erro: {e}")

## üìà Sistemas Lineares em Machine Learning

Vamos ver onde mais os sistemas lineares aparecem em ML:

### 1. **Regress√£o Linear** ‚úÖ (j√° vimos)
$$\mathbf{X}^T\mathbf{X}\boldsymbol{\beta} = \mathbf{X}^T\mathbf{y}$$

### 2. **Redes Neurais** (cada camada)
$$\mathbf{h} = \mathbf{W}\mathbf{x} + \mathbf{b}$$

### 3. **Principal Component Analysis (PCA)**
$$\mathbf{C}\mathbf{v} = \lambda\mathbf{v}$$ (autovetores - M√≥dulo 10)

### 4. **Support Vector Machines (SVM)**
Problema de otimiza√ß√£o quadr√°tica

### 5. **Sistemas de Recomenda√ß√£o**
Fatoriza√ß√£o de matrizes

**Dica do Pedro**: Praticamente todo algoritmo de ML tem sistema linear no cora√ß√£o. Dominar isso √© fundamental!

In [None]:
# Exemplo pr√°tico: Sistema de recomenda√ß√£o simples
# Vamos usar sistemas lineares para completar uma matriz de ratings

print("üé¨ Sistema de Recomenda√ß√£o com √Ålgebra Linear")
print("="*50)

# Criando uma matriz de ratings (usu√°rios x filmes)
# NaN representa ratings n√£o observados
ratings = np.array([
    [5, 4, np.nan, 2],     # Usu√°rio 1
    [4, np.nan, 3, 3],     # Usu√°rio 2  
    [np.nan, 5, 4, 1],     # Usu√°rio 3
    [2, 3, 4, np.nan]      # Usu√°rio 4
])

filmes = ['A√ß√£o', 'Romance', 'Com√©dia', 'Terror']
usuarios = ['Alice', 'Bob', 'Carol', 'Dave']

print("Matriz de Ratings (NaN = n√£o avaliado):")
for i, usuario in enumerate(usuarios):
    print(f"{usuario:6s}: {ratings[i]}")

# Vamos usar um m√©todo simples: m√©dia dos vizinhos
# Para cada rating faltante, vamos resolver um sistema linear
# baseado na similaridade com outros usu√°rios

ratings_filled = ratings.copy()

# Encontrando posi√ß√µes com NaN
nan_positions = np.where(np.isnan(ratings))
print(f"\nPositions com ratings faltantes: {len(nan_positions[0])}")

# Preenchendo com a m√©dia dos ratings conhecidos para come√ßar
for i, j in zip(nan_positions[0], nan_positions[1]):
    # M√©dia dos ratings conhecidos do usu√°rio
    user_ratings = ratings[i, ~np.isnan(ratings[i])]
    # M√©dia dos ratings conhecidos do filme
    movie_ratings = ratings[~np.isnan(ratings[:, j]), j]
    
    if len(user_ratings) > 0 and len(movie_ratings) > 0:
        predicted_rating = (np.mean(user_ratings) + np.mean(movie_ratings)) / 2
    elif len(user_ratings) > 0:
        predicted_rating = np.mean(user_ratings)
    elif len(movie_ratings) > 0:
        predicted_rating = np.mean(movie_ratings)
    else:
        predicted_rating = 3.0  # Default
    
    ratings_filled[i, j] = predicted_rating
    print(f"Predi√ß√£o para {usuarios[i]} - {filmes[j]}: {predicted_rating:.2f}")

print("\nMatriz Completa:")
for i, usuario in enumerate(usuarios):
    print(f"{usuario:6s}: {ratings_filled[i]}")

## üß† Exerc√≠cio Pr√°tico 1: Problema do Neg√≥cio

**Cen√°rio**: Voc√™ trabalha numa lanchonete e precisa descobrir o pre√ßo individual dos ingredientes.

**Dados**:
- Combo 1: 2 hamb√∫rgueres + 1 batata + 3 refrigerantes = R$ 35
- Combo 2: 1 hamb√∫rguer + 2 batatas + 2 refrigerantes = R$ 28  
- Combo 3: 3 hamb√∫rgueres + 1 batata + 1 refrigerante = R$ 32

**Desafio**: Encontre o pre√ßo de cada item usando sistemas lineares!

**Dica do Pedro**: Monte a matriz A com os coeficientes e o vetor b com os pre√ßos totais. Depois √© s√≥ resolver!

In [None]:
# üéØ EXERC√çCIO 1: Complete o c√≥digo abaixo

print("üçî Exerc√≠cio: Descobrindo pre√ßos da lanchonete")
print("="*50)

# TODO: Monte a matriz A (coeficientes)
# Linha 1: 2 hamb√∫rgueres + 1 batata + 3 refrigerantes
# Linha 2: 1 hamb√∫rguer + 2 batatas + 2 refrigerantes  
# Linha 3: 3 hamb√∫rgueres + 1 batata + 1 refrigerante
A_lanchonete = np.array([
    # COMPLETE AQUI
    [2, 1, 3],  # Combo 1
    [1, 2, 2],  # Combo 2
    [3, 1, 1]   # Combo 3
])

# TODO: Monte o vetor b (pre√ßos totais)
b_lanchonete = np.array([35, 28, 32])

# TODO: Resolva o sistema
precos = np.linalg.solve(A_lanchonete, b_lanchonete)

print("Resultados:")
print(f"üçî Hamb√∫rguer: R$ {precos[0]:.2f}")
print(f"üçü Batata: R$ {precos[1]:.2f}")
print(f"ü•§ Refrigerante: R$ {precos[2]:.2f}")

# Verifica√ß√£o
print("\n‚úÖ Verifica√ß√£o:")
combos = ['Combo 1', 'Combo 2', 'Combo 3']
for i, combo in enumerate(combos):
    calculado = A_lanchonete[i] @ precos
    original = b_lanchonete[i]
    print(f"{combo}: R$ {calculado:.2f} (esperado: R$ {original:.2f})")

print("\nüéâ Exerc√≠cio conclu√≠do!")

## üöÄ Exerc√≠cio Pr√°tico 2: Regress√£o Linear Manual

Agora vamos implementar regress√£o linear do zero usando apenas sistemas lineares!

**Objetivo**: Criar uma classe `RegressaoLinearManual` que:
1. Resolve o sistema $\mathbf{X}^T\mathbf{X}\boldsymbol{\beta} = \mathbf{X}^T\mathbf{y}$
2. Calcula m√©tricas (R¬≤, MSE)
3. Faz predi√ß√µes

**Dica do Pedro**: Lembra de adicionar a coluna de 1s para o intercepto!

In [None]:
# üéØ EXERC√çCIO 2: Implemente a classe RegressaoLinearManual

class RegressaoLinearManual:
    def __init__(self):
        self.coeficientes = None
        self.intercepto = None
        self.fitted = False
    
    def fit(self, X, y):
        """
        Treina o modelo resolvendo o sistema linear
        X: features (n_samples, n_features)
        y: target (n_samples,)
        """
        # TODO: Adicione coluna de 1s para o intercepto
        X_com_bias = np.column_stack([np.ones(X.shape[0]), X])
        
        # TODO: Calcule X^T @ X e X^T @ y
        XtX = X_com_bias.T @ X_com_bias
        Xty = X_com_bias.T @ y
        
        # TODO: Resolva o sistema linear
        beta = np.linalg.solve(XtX, Xty)
        
        # TODO: Separe intercepto e coeficientes
        self.intercepto = beta[0]
        self.coeficientes = beta[1:]
        self.fitted = True
        
        return self
    
    def predict(self, X):
        """
        Faz predi√ß√µes
        """
        if not self.fitted:
            raise ValueError("Modelo n√£o foi treinado ainda!")
        
        # TODO: Calcule as predi√ß√µes
        return self.intercepto + X @ self.coeficientes
    
    def score(self, X, y):
        """
        Calcula R¬≤
        """
        y_pred = self.predict(X)
        ss_res = np.sum((y - y_pred) ** 2)
        ss_tot = np.sum((y - np.mean(y)) ** 2)
        return 1 - (ss_res / ss_tot)

# Testando nossa implementa√ß√£o
print("üß™ Testando RegressaoLinearManual")
print("="*40)

# Gerando dados de teste
np.random.seed(42)
X_test = np.random.randn(100, 2)
y_test = 1 + 2*X_test[:, 0] - 3*X_test[:, 1] + 0.1*np.random.randn(100)

# Nossa implementa√ß√£o
modelo_manual = RegressaoLinearManual()
modelo_manual.fit(X_test, y_test)

# Sklearn para comparar
modelo_sklearn = LinearRegression()
modelo_sklearn.fit(X_test, y_test)

print("Compara√ß√£o dos resultados:")
print(f"Intercepto - Manual: {modelo_manual.intercepto:.4f}, Sklearn: {modelo_sklearn.intercept_:.4f}")
print(f"Coef 1 - Manual: {modelo_manual.coeficientes[0]:.4f}, Sklearn: {modelo_sklearn.coef_[0]:.4f}")
print(f"Coef 2 - Manual: {modelo_manual.coeficientes[1]:.4f}, Sklearn: {modelo_sklearn.coef_[1]:.4f}")
print(f"R¬≤ - Manual: {modelo_manual.score(X_test, y_test):.4f}, Sklearn: {modelo_sklearn.score(X_test, y_test):.4f}")

print("\n‚úÖ Implementa√ß√£o perfeita! Resultados id√™nticos ao sklearn!")

## üìä Performance e Estabilidade Num√©rica

Nem todos os sistemas s√£o f√°ceis de resolver. Alguns problemas importantes:

### 1. **Matrizes Mal Condicionadas**
- Pequenas mudan√ßas nos dados causam grandes mudan√ßas na solu√ß√£o
- **N√∫mero de condi√ß√£o** alto: $\kappa(A) = \frac{\lambda_{max}}{\lambda_{min}}$

### 2. **Overfitting em Regress√£o**
- Muitas features, poucos dados
- $\mathbf{X}^T\mathbf{X}$ pode ser singular

### 3. **Solu√ß√µes**:
- **Regulariza√ß√£o** (Ridge, Lasso)
- **Decomposi√ß√£o SVD** (M√≥dulo 9)
- **Pseudo-inversa** para sistemas sobredeterminados

**Dica do Pedro**: Em problemas reais, sempre verifique o n√∫mero de condi√ß√£o da matriz!

In [None]:
# Demonstrando problemas de estabilidade num√©rica
print("‚ö†Ô∏è Analisando Estabilidade Num√©rica")
print("="*40)

# Matriz bem condicionada
A_boa = np.array([[4, 1], [1, 3]])
cond_boa = np.linalg.cond(A_boa)

# Matriz mal condicionada (quase singular)
A_ruim = np.array([[1, 1], [1, 1.0001]])
cond_ruim = np.linalg.cond(A_ruim)

print(f"Matriz bem condicionada:")
print(f"N√∫mero de condi√ß√£o: {cond_boa:.2f}")
print(f"Status: {'Boa' if cond_boa < 100 else 'Ruim'}")

print(f"\nMatriz mal condicionada:")
print(f"N√∫mero de condi√ß√£o: {cond_ruim:.2e}")
print(f"Status: {'Boa' if cond_ruim < 100 else 'Ruim - CUIDADO!'}")

# Testando sensibilidade a ru√≠do
b_original = np.array([5, 2])
b_com_ruido = b_original + 0.001 * np.random.randn(2)

# Solu√ß√µes para matriz bem condicionada
x_boa_original = np.linalg.solve(A_boa, b_original)
x_boa_ruido = np.linalg.solve(A_boa, b_com_ruido)

# Solu√ß√µes para matriz mal condicionada
x_ruim_original = np.linalg.solve(A_ruim, b_original)
x_ruim_ruido = np.linalg.solve(A_ruim, b_com_ruido)

print(f"\nüìä Sensibilidade ao ru√≠do:")
print(f"Matriz boa - Mudan√ßa na solu√ß√£o: {np.linalg.norm(x_boa_original - x_boa_ruido):.6f}")
print(f"Matriz ruim - Mudan√ßa na solu√ß√£o: {np.linalg.norm(x_ruim_original - x_ruim_ruido):.6f}")

print("\nüí° Conclus√£o: Matrizes mal condicionadas amplificam pequenos erros!")

## üîÆ Diagrama: Fluxo dos Sistemas Lineares em ML

Vamos visualizar como os sistemas lineares se conectam com diferentes √°reas de machine learning:

In [None]:
# Criando um diagrama conceitual
from IPython.display import display, Markdown

diagrama_mermaid = """
```mermaid
graph TD
    A[Sistema Linear Ax = b] --> B[Regress√£o Linear]
    A --> C[Redes Neurais]
    A --> D[PCA/SVD]
    A --> E[SVM]
    
    B --> B1[X'X Œ≤ = X'y]
    B --> B2[M√≠nimos Quadrados]
    
    C --> C1[Wx + b = h]
    C --> C2[Camadas Lineares]
    
    D --> D1[Cv = Œªv]
    D --> D2[Autovetores]
    
    E --> E1[Otimiza√ß√£o Quadr√°tica]
    E --> E2[Hiperplanos]
    
    F[Dados] --> A
    A --> G[Solu√ß√£o]
    G --> H[Predi√ß√µes/Insights]
```
"""

display(Markdown(diagrama_mermaid))

print("üéØ Fluxo dos Sistemas Lineares em Machine Learning")
print("Praticamente todo algoritmo de ML usa sistemas lineares!")

## üé® Visualiza√ß√£o Final: Comparando M√©todos de Solu√ß√£o

Vamos comparar diferentes m√©todos para resolver sistemas lineares em termos de tempo de execu√ß√£o:

In [None]:
import time

# Comparando m√©todos de solu√ß√£o
print("‚ö° Compara√ß√£o de Performance dos M√©todos")
print("="*45)

# Testando com diferentes tamanhos de matriz
tamanhos = [10, 50, 100, 200, 500]
tempos_solve = []
tempos_inv = []

for n in tamanhos:
    # Gerando matriz aleat√≥ria bem condicionada
    np.random.seed(42)
    A = np.random.randn(n, n) + n * np.eye(n)  # Adicionando diagonal para estabilidade
    b = np.random.randn(n)
    
    # M√©todo 1: np.linalg.solve
    start = time.time()
    for _ in range(10):  # M√∫ltiplas execu√ß√µes para m√©dia
        x1 = np.linalg.solve(A, b)
    tempo_solve = (time.time() - start) / 10
    tempos_solve.append(tempo_solve)
    
    # M√©todo 2: Inversa
    start = time.time()
    for _ in range(10):
        A_inv = np.linalg.inv(A)
        x2 = A_inv @ b
    tempo_inv = (time.time() - start) / 10
    tempos_inv.append(tempo_inv)
    
    print(f"n={n:3d}: solve={tempo_solve*1000:.2f}ms, inv={tempo_inv*1000:.2f}ms, ratio={tempo_inv/tempo_solve:.1f}x")

# Visualiza√ß√£o
plt.figure(figsize=(12, 8))

plt.subplot(2, 2, 1)
plt.plot(tamanhos, [t*1000 for t in tempos_solve], 'bo-', label='np.linalg.solve', linewidth=2)
plt.plot(tamanhos, [t*1000 for t in tempos_inv], 'ro-', label='Inversa + mult', linewidth=2)
plt.xlabel('Tamanho da matriz (n√ón)')
plt.ylabel('Tempo (ms)')
plt.title('Compara√ß√£o de Performance')
plt.legend()
plt.grid(True, alpha=0.3)
plt.yscale('log')

plt.subplot(2, 2, 2)
ratios = [inv/solve for inv, solve in zip(tempos_inv, tempos_solve)]
plt.bar(range(len(tamanhos)), ratios, color='orange', alpha=0.7)
plt.xlabel('Tamanho da matriz')
plt.ylabel('Raz√£o (tempo_inv / tempo_solve)')
plt.title('Quanto a Inversa √© Mais Lenta')
plt.xticks(range(len(tamanhos)), tamanhos)
plt.grid(True, alpha=0.3)

plt.subplot(2, 2, 3)
# Complexidade te√≥rica
n_teorico = np.array(tamanhos)
o_n3 = (n_teorico/tamanhos[0])**3 * tempos_solve[0]
plt.plot(tamanhos, [t*1000 for t in tempos_solve], 'bo-', label='Tempo real', linewidth=2)
plt.plot(tamanhos, [t*1000 for t in o_n3], 'g--', label='O(n¬≥) te√≥rico', linewidth=2)
plt.xlabel('Tamanho da matriz (n√ón)')
plt.ylabel('Tempo (ms)')
plt.title('Complexidade Algoritmo: O(n¬≥)')
plt.legend()
plt.grid(True, alpha=0.3)
plt.yscale('log')

plt.subplot(2, 2, 4)
# Efici√™ncia relativa
eficiencia = [tempos_solve[0]/t for t in tempos_solve]
plt.plot(tamanhos, eficiencia, 'mo-', linewidth=2, markersize=8)
plt.xlabel('Tamanho da matriz (n√ón)')
plt.ylabel('Efici√™ncia relativa')
plt.title('Efici√™ncia vs Tamanho')
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print("\nüìà Conclus√µes:")
print("1. np.linalg.solve √© sempre mais r√°pido que calcular inversa")
print("2. A diferen√ßa aumenta com o tamanho da matriz")
print("3. Complexidade √© O(n¬≥) para ambos, mas solve tem constante menor")
print("4. Para matrizes grandes, a diferen√ßa pode ser significativa!")

## üöÄ Preparando para os Pr√≥ximos M√≥dulos

Agora que dominamos sistemas lineares, vamos nos preparar para o que vem pela frente:

### **M√≥dulo 6 - Transforma√ß√µes Lineares** üîÑ
- Como matrizes transformam vetores
- Rota√ß√µes, reflex√µes, escalas
- Import√¢ncia para representa√ß√£o de dados

### **M√≥dulo 7 - Inversa e Transposta** ‚Ü©Ô∏è
- Quando existe inversa?
- Propriedades da transposta
- Aplica√ß√µes pr√°ticas

### **Conex√µes que vamos ver**:
- **Transforma√ß√µes**: $\mathbf{y} = \mathbf{A}\mathbf{x}$ (pr√≥ximo m√≥dulo)
- **Inversa**: Resolver $\mathbf{A}\mathbf{x} = \mathbf{b}$ ‚Üí $\mathbf{x} = \mathbf{A}^{-1}\mathbf{b}$
- **SVD**: Decomposi√ß√£o para sistemas mal condicionados

**Dica do Pedro**: Sistemas lineares s√£o a funda√ß√£o. Agora vamos ver como as matrizes podem transformar o espa√ßo!

In [None]:
# Preview do pr√≥ximo m√≥dulo: transforma√ß√µes lineares
print("üîÆ Preview: M√≥dulo 6 - Transforma√ß√µes Lineares")
print("="*50)

# Exemplo simples de transforma√ß√£o
# Matriz de rota√ß√£o de 45 graus
theta = np.pi/4  # 45 graus
matriz_rotacao = np.array([
    [np.cos(theta), -np.sin(theta)],
    [np.sin(theta), np.cos(theta)]
])

# Vetor original
v_original = np.array([1, 0])

# Aplicando transforma√ß√£o
v_transformado = matriz_rotacao @ v_original

print(f"Vetor original: {v_original}")
print(f"Matriz de rota√ß√£o 45¬∞:")
print(matriz_rotacao)
print(f"Vetor ap√≥s rota√ß√£o: {v_transformado}")

# Visualiza√ß√£o r√°pida
plt.figure(figsize=(8, 8))
plt.arrow(0, 0, v_original[0], v_original[1], head_width=0.1, head_length=0.1, fc='blue', ec='blue', linewidth=3, label='Original')
plt.arrow(0, 0, v_transformado[0], v_transformado[1], head_width=0.1, head_length=0.1, fc='red', ec='red', linewidth=3, label='Rotacionado 45¬∞')
plt.xlim(-1.5, 1.5)
plt.ylim(-1.5, 1.5)
plt.grid(True, alpha=0.3)
plt.axhline(y=0, color='k', linewidth=0.5)
plt.axvline(x=0, color='k', linewidth=0.5)
plt.legend()
plt.title('Preview: Transforma√ß√£o Linear (Rota√ß√£o)')
plt.axis('equal')
plt.show()

print("\nüéØ No pr√≥ximo m√≥dulo vamos entender:")
print("‚Ä¢ Como matrizes transformam vetores")
print("‚Ä¢ Rota√ß√µes, reflex√µes, escalas")
print("‚Ä¢ Por que isso √© importante para IA")
print("\nAt√© l√°! üöÄ")

## üìù Resumo do M√≥dulo 5

### **O Que Aprendemos Hoje** ‚úÖ

1. **Sistemas de Equa√ß√µes Lineares**
   - Representa√ß√£o matricial: $\mathbf{A}\mathbf{x} = \mathbf{b}$
   - Tipos: determinado, indeterminado, imposs√≠vel

2. **M√©todos de Solu√ß√£o**
   - `np.linalg.solve()` (recomendado)
   - Inversa (quando necess√°rio)
   - Considera√ß√µes de estabilidade num√©rica

3. **Conex√£o com Machine Learning**
   - Regress√£o linear como sistema linear
   - M√≠nimos quadrados: $\mathbf{X}^T\mathbf{X}\boldsymbol{\beta} = \mathbf{X}^T\mathbf{y}$
   - Aplica√ß√µes em ML

4. **Implementa√ß√£o Pr√°tica**
   - Regress√£o linear do zero
   - Sistema de recomenda√ß√£o simples
   - An√°lise de performance

### **Conceitos-Chave** üîë
- **Sistema Linear**: Conjunto de equa√ß√µes lineares
- **Matriz de Coeficientes**: A no sistema Ax = b
- **M√≠nimos Quadrados**: M√©todo para ajuste de modelos
- **N√∫mero de Condi√ß√£o**: Medida de estabilidade num√©rica

### **Pr√≥ximos Passos** üöÄ
- **M√≥dulo 6**: Transforma√ß√µes Lineares
- **M√≥dulo 7**: Inversa e Transposta
- **M√≥dulo 9**: SVD para sistemas mal condicionados

**Dica Final do Pedro**: Sistemas lineares s√£o o cora√ß√£o da IA moderna. Dominando isso, voc√™ entende 80% dos algoritmos de machine learning. Liiindo! üéâ

---

**üéØ Miss√£o Cumprida!** Agora voc√™ sabe resolver problemas reais usando √°lgebra linear e entende como isso se conecta com machine learning. Bora para as transforma√ß√µes lineares! üöÄ