# 🔍 Sistemas de Equações Lineares: O Detetive da Matemática

## *Módulo 5 - Álgebra Linear para IA*

### Pedro Nunes Guth

---

Bora resolver uns mistérios matemáticos! 🕵️‍♂️

Tá, mas o que é um sistema de equações lineares? Imagina que você vai no açougue e compra 2kg de carne e 3kg de frango por R$ 50. No dia seguinte, compra 1kg de carne e 2kg de frango por R$ 30. Pergunta: quanto custa o kg de cada um?

É exatamente isso que vamos resolver hoje! E o melhor: vamos ver como isso se conecta diretamente com regressão linear e machine learning. Liiindo! 🚀

## 🎯 O Que Vamos Aprender Hoje

Nos módulos anteriores, aprendemos sobre:
- **Módulo 1**: Escalares, vetores e matrizes
- **Módulo 2**: Operações com vetores (produto escalar)
- **Módulo 3**: Multiplicação de matrizes
- **Módulo 4**: NumPy na prática

Hoje vamos usar TUDO isso para:

1. **Entender sistemas de equações lineares**
2. **Representar sistemas como Ax = b**
3. **Resolver sistemas com NumPy**
4. **Conectar com regressão linear**
5. **Ver casos práticos de ML**

**Dica do Pedro**: Sistemas lineares são a base de QUASE TUDO em machine learning. Desde regressão até redes neurais, tudo passa por aqui!

In [None]:
# Setup inicial - importando as bibliotecas que vamos usar
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.datasets import make_regression
import seaborn as sns

# Configurações para gráficos mais bonitos
plt.style.use('seaborn-v0_8')
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12

print("🚀 Bibliotecas carregadas! Bora resolver uns sistemas!")
print(f"NumPy versão: {np.__version__}")

## 🧮 Fundamentos: O Que É Um Sistema Linear?

Tá, vamos começar do básico. Um **sistema de equações lineares** é um conjunto de equações onde cada uma é uma combinação linear de variáveis.

### Exemplo Clássico:

$$\begin{cases}
2x + 3y = 50 \\
1x + 2y = 30
\end{cases}$$

Onde:
- $x$ = preço do kg de carne
- $y$ = preço do kg de frango

### Representação Matricial:

Podemos escrever isso como: $\mathbf{A}\mathbf{x} = \mathbf{b}$

$$\begin{bmatrix}
2 & 3 \\
1 & 2
\end{bmatrix}
\begin{bmatrix}
x \\
y
\end{bmatrix}
=
\begin{bmatrix}
50 \\
30
\end{bmatrix}$$

Onde:
- $\mathbf{A}$ = matriz dos coeficientes
- $\mathbf{x}$ = vetor das variáveis (o que queremos descobrir)
- $\mathbf{b}$ = vetor dos resultados

**Dica do Pedro**: Lembra da multiplicação de matrizes do Módulo 3? É exatamente isso que está acontecendo aqui! A primeira linha de A multiplicada por x nos dá a primeira equação.

In [None]:
# Vamos criar nosso primeiro sistema linear
# Sistema: 2x + 3y = 50, x + 2y = 30

# Matriz A (coeficientes)
A = np.array([
    [2, 3],  # Primeira equação: 2x + 3y
    [1, 2]   # Segunda equação: x + 2y
])

# Vetor b (resultados)
b = np.array([50, 30])

print("Matriz A (coeficientes):")
print(A)
print("\nVetor b (resultados):")
print(b)

# Vamos verificar se nossa representação está correta
print("\nVerificação: Ax = b")
print(f"Dimensões: A = {A.shape}, b = {b.shape}")
print("Perfeito! Podemos multiplicar A por um vetor x de tamanho 2")

## 🔧 Resolvendo Sistemas: Os Métodos

Existem várias formas de resolver um sistema $\mathbf{A}\mathbf{x} = \mathbf{b}$:

### 1. Método da Inversa (quando possível):
$$\mathbf{x} = \mathbf{A}^{-1}\mathbf{b}$$

### 2. Método de Eliminação de Gauss
Transformamos a matriz em escalonada

### 3. Decomposição LU
Fatoramos A = LU

### 4. Numpy.linalg.solve() (O mais prático!)
Usa algoritmos otimizados internamente

**Por que não usar sempre a inversa?**
- Nem sempre existe
- É computacionalmente cara
- Problemas numéricos com matrizes mal condicionadas

**Dica do Pedro**: O `np.linalg.solve()` é como ter um mecânico expert que escolhe a melhor ferramenta automaticamente. Use ele!

In [None]:
# Método 1: Usando np.linalg.solve() (RECOMENDADO)
x_solve = np.linalg.solve(A, b)
print("🎯 Solução usando np.linalg.solve():")
print(f"x = {x_solve[0]:.2f} (preço da carne)")
print(f"y = {x_solve[1]:.2f} (preço do frango)")

# Método 2: Usando a inversa (só para comparar)
A_inv = np.linalg.inv(A)
x_inv = A_inv @ b  # Lembra do @ do Módulo 4?
print("\n🔄 Solução usando a inversa:")
print(f"x = {x_inv[0]:.2f}")
print(f"y = {x_inv[1]:.2f}")

# Verificação: Ax deve ser igual a b
verificacao = A @ x_solve
print("\n✅ Verificação (A @ x):")
print(f"Resultado: {verificacao}")
print(f"Original b: {b}")
print(f"Diferença: {np.abs(verificacao - b)}")

print("\n🎉 Liiindo! A carne custa R$ 10,00/kg e o frango R$ 10,00/kg")

## 📊 Visualizando Sistemas Lineares

Cada equação linear em 2D representa uma **reta**. A solução do sistema é onde essas retas se cruzam!

Para nossa equação $ax + by = c$, podemos reescrever como:
$$y = \frac{c - ax}{b}$$

Vamos visualizar nosso sistema:
- Equação 1: $2x + 3y = 50$ → $y = \frac{50 - 2x}{3}$
- Equação 2: $x + 2y = 30$ → $y = \frac{30 - x}{2}$

In [None]:
# Visualizando o sistema de equações
x_range = np.linspace(0, 30, 100)

# Equação 1: 2x + 3y = 50 -> y = (50 - 2x) / 3
y1 = (50 - 2*x_range) / 3

# Equação 2: x + 2y = 30 -> y = (30 - x) / 2
y2 = (30 - x_range) / 2

plt.figure(figsize=(12, 8))
plt.plot(x_range, y1, 'b-', linewidth=2, label='2x + 3y = 50 (Equação 1)')
plt.plot(x_range, y2, 'r-', linewidth=2, label='x + 2y = 30 (Equação 2)')

# Marcando a solução
plt.plot(x_solve[0], x_solve[1], 'go', markersize=10, label=f'Solução: ({x_solve[0]:.1f}, {x_solve[1]:.1f})')

plt.xlabel('x (Preço da carne - R$/kg)')
plt.ylabel('y (Preço do frango - R$/kg)')
plt.title('Sistema de Equações Lineares: Onde as Retas se Encontram! 🎯')
plt.legend()
plt.grid(True, alpha=0.3)
plt.xlim(0, 25)
plt.ylim(0, 20)

# Anotação explicativa
plt.annotate('Ponto de interseção\n= Solução do sistema', 
             xy=(x_solve[0], x_solve[1]), 
             xytext=(15, 15),
             arrowprops=dict(arrowstyle='->', color='green', lw=2),
             fontsize=12, ha='center')

plt.tight_layout()
plt.show()

print("🎨 Cada linha representa uma equação. O ponto verde é nossa solução!")

## 🔗 Conexão com Regressão Linear

Agora vem a parte MAIS IMPORTANTE: como isso se conecta com machine learning?

### Regressão Linear é um Sistema Linear!

Quando fazemos regressão linear, queremos encontrar a reta que melhor se ajusta aos dados:
$$y = \beta_0 + \beta_1 x$$

Com múltiplas features:
$$y = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + ... + \beta_n x_n$$

### Método dos Mínimos Quadrados:

Para encontrar os coeficientes $\boldsymbol{\beta}$, resolvemos:
$$\boldsymbol{\beta} = (\mathbf{X}^T\mathbf{X})^{-1}\mathbf{X}^T\mathbf{y}$$

Ou de forma equivalente, o sistema:
$$\mathbf{X}^T\mathbf{X}\boldsymbol{\beta} = \mathbf{X}^T\mathbf{y}$$

**Dica do Pedro**: Lembra da transposta que vamos ver no Módulo 7? Ela aparece aqui! E vamos usar tudo que aprendemos sobre multiplicação de matrizes.

In [None]:
# Vamos criar um exemplo de regressão linear como sistema linear
np.random.seed(42)

# Gerando dados sintéticos
n_samples = 100
X = np.random.randn(n_samples, 2)  # 2 features
true_coeffs = np.array([3, -2])   # Coeficientes verdadeiros
true_intercept = 1                # Intercepto verdadeiro

# y = 1 + 3*x1 - 2*x2 + ruído
y = true_intercept + X @ true_coeffs + 0.1 * np.random.randn(n_samples)

print("📊 Dados gerados:")
print(f"Samples: {n_samples}")
print(f"Features: {X.shape[1]}")
print(f"Coeficientes verdadeiros: {true_coeffs}")
print(f"Intercepto verdadeiro: {true_intercept}")

# Adicionando coluna de 1s para o intercepto (bias)
X_with_bias = np.column_stack([np.ones(n_samples), X])
print(f"\nX com bias: {X_with_bias.shape}")
print("Primeira linha (exemplo):", X_with_bias[0])

In [None]:
# Resolvendo a regressão como sistema linear
# Método 1: Fórmula dos mínimos quadrados
XtX = X_with_bias.T @ X_with_bias  # X^T @ X
Xty = X_with_bias.T @ y            # X^T @ y

# Resolvendo o sistema: (X^T @ X) @ beta = X^T @ y
beta_sistema = np.linalg.solve(XtX, Xty)

print("🔍 Resolvendo regressão como sistema linear:")
print(f"Intercepto estimado: {beta_sistema[0]:.3f} (verdadeiro: {true_intercept})")
print(f"Coef 1 estimado: {beta_sistema[1]:.3f} (verdadeiro: {true_coeffs[0]})")
print(f"Coef 2 estimado: {beta_sistema[2]:.3f} (verdadeiro: {true_coeffs[1]})")

# Método 2: Usando sklearn para comparar
model = LinearRegression()
model.fit(X, y)

print("\n🤖 Usando sklearn LinearRegression:")
print(f"Intercepto: {model.intercept_:.3f}")
print(f"Coeficientes: {model.coef_}")

print("\n✅ Os resultados são praticamente idênticos! Liiindo!")

## 🎨 Visualizando a Regressão

Vamos visualizar como nossa regressão linear se comporta. Com 2 features, nossa função é:
$$y = \beta_0 + \beta_1 x_1 + \beta_2 x_2$$

Isso representa um **plano** no espaço 3D!

In [None]:
# Visualização 3D da regressão linear
from mpl_toolkits.mplot3d import Axes3D

fig = plt.figure(figsize=(15, 5))

# Subplot 1: Scatter plot dos dados reais vs preditos
ax1 = fig.add_subplot(131)
y_pred = X_with_bias @ beta_sistema
ax1.scatter(y, y_pred, alpha=0.6, color='blue')
ax1.plot([y.min(), y.max()], [y.min(), y.max()], 'r--', lw=2)
ax1.set_xlabel('y real')
ax1.set_ylabel('y predito')
ax1.set_title('Real vs Predito')
ax1.grid(True, alpha=0.3)

# Subplot 2: Resíduos
ax2 = fig.add_subplot(132)
residuos = y - y_pred
ax2.scatter(y_pred, residuos, alpha=0.6, color='green')
ax2.axhline(y=0, color='r', linestyle='--')
ax2.set_xlabel('y predito')
ax2.set_ylabel('Resíduos')
ax2.set_title('Análise de Resíduos')
ax2.grid(True, alpha=0.3)

# Subplot 3: Comparação dos coeficientes
ax3 = fig.add_subplot(133)
labels = ['Intercepto', 'Coef 1', 'Coef 2']
verdadeiros = [true_intercept, true_coeffs[0], true_coeffs[1]]
estimados = beta_sistema

x_pos = np.arange(len(labels))
width = 0.35

ax3.bar(x_pos - width/2, verdadeiros, width, label='Verdadeiros', alpha=0.8)
ax3.bar(x_pos + width/2, estimados, width, label='Estimados', alpha=0.8)
ax3.set_xlabel('Parâmetros')
ax3.set_ylabel('Valores')
ax3.set_title('Coeficientes: Real vs Estimado')
ax3.set_xticks(x_pos)
ax3.set_xticklabels(labels)
ax3.legend()
ax3.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Calculando métricas
mse = np.mean(residuos**2)
r2 = 1 - np.sum(residuos**2) / np.sum((y - np.mean(y))**2)

print(f"📈 Métricas do modelo:")
print(f"MSE: {mse:.4f}")
print(f"R²: {r2:.4f}")
print(f"RMSE: {np.sqrt(mse):.4f}")

## 🌟 Tipos de Sistemas Lineares

Nem todo sistema linear tem solução única! Existem 3 casos:

### 1. Sistema Determinado (Solução Única)
- Número de equações = número de variáveis
- Matriz A é invertível (det(A) ≠ 0)
- **Exemplo**: Nosso problema do açougue

### 2. Sistema Indeterminado (Infinitas Soluções)
- Equações são linearmente dependentes
- det(A) = 0, mas o sistema é consistente

### 3. Sistema Impossível (Sem Solução)
- Equações contraditórias
- det(A) = 0 e sistema inconsistente

**Dica do Pedro**: Em machine learning, geralmente temos mais dados que parâmetros (sistema sobredeterminado), então usamos mínimos quadrados para encontrar a "melhor" solução.

In [None]:
# Exemplos dos diferentes tipos de sistemas

print("🔍 Analisando diferentes tipos de sistemas:")
print("="*50)

# Sistema 1: Determinado (solução única)
A1 = np.array([[2, 3], [1, 2]])
b1 = np.array([50, 30])
det1 = np.linalg.det(A1)
print(f"\n1️⃣ Sistema Determinado:")
print(f"Determinante: {det1:.3f}")
print(f"Status: {'Invertível' if abs(det1) > 1e-10 else 'Singular'}")
if abs(det1) > 1e-10:
    sol1 = np.linalg.solve(A1, b1)
    print(f"Solução: x = {sol1[0]:.2f}, y = {sol1[1]:.2f}")

# Sistema 2: Indeterminado (infinitas soluções)
A2 = np.array([[2, 4], [1, 2]])  # Segunda linha = primeira/2
b2 = np.array([10, 5])           # b2[1] = b2[0]/2 também
det2 = np.linalg.det(A2)
print(f"\n2️⃣ Sistema Indeterminado:")
print(f"Determinante: {det2:.3f}")
print(f"Status: Infinitas soluções (equações dependentes)")
print(f"Equação 1: 2x + 4y = 10")
print(f"Equação 2: 1x + 2y = 5 (é a equação 1 dividida por 2!)")

# Sistema 3: Impossível (sem solução)
A3 = np.array([[2, 4], [1, 2]])  # Mesma matriz A2
b3 = np.array([10, 6])           # Mas b3[1] ≠ b3[0]/2
det3 = np.linalg.det(A3)
print(f"\n3️⃣ Sistema Impossível:")
print(f"Determinante: {det3:.3f}")
print(f"Status: Sem solução (inconsistente)")
print(f"Equação 1: 2x + 4y = 10")
print(f"Equação 2: 1x + 2y = 6 (contraditória!)")
print(f"Se 2x + 4y = 10, então x + 2y = 5, não 6!")

# Testando solução do sistema impossível
try:
    sol3 = np.linalg.solve(A3, b3)
    print(f"Solução encontrada: {sol3}")
except np.linalg.LinAlgError as e:
    print(f"❌ Erro: {e}")

## 📈 Sistemas Lineares em Machine Learning

Vamos ver onde mais os sistemas lineares aparecem em ML:

### 1. **Regressão Linear** ✅ (já vimos)
$$\mathbf{X}^T\mathbf{X}\boldsymbol{\beta} = \mathbf{X}^T\mathbf{y}$$

### 2. **Redes Neurais** (cada camada)
$$\mathbf{h} = \mathbf{W}\mathbf{x} + \mathbf{b}$$

### 3. **Principal Component Analysis (PCA)**
$$\mathbf{C}\mathbf{v} = \lambda\mathbf{v}$$ (autovetores - Módulo 10)

### 4. **Support Vector Machines (SVM)**
Problema de otimização quadrática

### 5. **Sistemas de Recomendação**
Fatorização de matrizes

**Dica do Pedro**: Praticamente todo algoritmo de ML tem sistema linear no coração. Dominar isso é fundamental!

In [None]:
# Exemplo prático: Sistema de recomendação simples
# Vamos usar sistemas lineares para completar uma matriz de ratings

print("🎬 Sistema de Recomendação com Álgebra Linear")
print("="*50)

# Criando uma matriz de ratings (usuários x filmes)
# NaN representa ratings não observados
ratings = np.array([
    [5, 4, np.nan, 2],     # Usuário 1
    [4, np.nan, 3, 3],     # Usuário 2  
    [np.nan, 5, 4, 1],     # Usuário 3
    [2, 3, 4, np.nan]      # Usuário 4
])

filmes = ['Ação', 'Romance', 'Comédia', 'Terror']
usuarios = ['Alice', 'Bob', 'Carol', 'Dave']

print("Matriz de Ratings (NaN = não avaliado):")
for i, usuario in enumerate(usuarios):
    print(f"{usuario:6s}: {ratings[i]}")

# Vamos usar um método simples: média dos vizinhos
# Para cada rating faltante, vamos resolver um sistema linear
# baseado na similaridade com outros usuários

ratings_filled = ratings.copy()

# Encontrando posições com NaN
nan_positions = np.where(np.isnan(ratings))
print(f"\nPositions com ratings faltantes: {len(nan_positions[0])}")

# Preenchendo com a média dos ratings conhecidos para começar
for i, j in zip(nan_positions[0], nan_positions[1]):
    # Média dos ratings conhecidos do usuário
    user_ratings = ratings[i, ~np.isnan(ratings[i])]
    # Média dos ratings conhecidos do filme
    movie_ratings = ratings[~np.isnan(ratings[:, j]), j]
    
    if len(user_ratings) > 0 and len(movie_ratings) > 0:
        predicted_rating = (np.mean(user_ratings) + np.mean(movie_ratings)) / 2
    elif len(user_ratings) > 0:
        predicted_rating = np.mean(user_ratings)
    elif len(movie_ratings) > 0:
        predicted_rating = np.mean(movie_ratings)
    else:
        predicted_rating = 3.0  # Default
    
    ratings_filled[i, j] = predicted_rating
    print(f"Predição para {usuarios[i]} - {filmes[j]}: {predicted_rating:.2f}")

print("\nMatriz Completa:")
for i, usuario in enumerate(usuarios):
    print(f"{usuario:6s}: {ratings_filled[i]}")

## 🧠 Exercício Prático 1: Problema do Negócio

**Cenário**: Você trabalha numa lanchonete e precisa descobrir o preço individual dos ingredientes.

**Dados**:
- Combo 1: 2 hambúrgueres + 1 batata + 3 refrigerantes = R$ 35
- Combo 2: 1 hambúrguer + 2 batatas + 2 refrigerantes = R$ 28  
- Combo 3: 3 hambúrgueres + 1 batata + 1 refrigerante = R$ 32

**Desafio**: Encontre o preço de cada item usando sistemas lineares!

**Dica do Pedro**: Monte a matriz A com os coeficientes e o vetor b com os preços totais. Depois é só resolver!

In [None]:
# 🎯 EXERCÍCIO 1: Complete o código abaixo

print("🍔 Exercício: Descobrindo preços da lanchonete")
print("="*50)

# TODO: Monte a matriz A (coeficientes)
# Linha 1: 2 hambúrgueres + 1 batata + 3 refrigerantes
# Linha 2: 1 hambúrguer + 2 batatas + 2 refrigerantes  
# Linha 3: 3 hambúrgueres + 1 batata + 1 refrigerante
A_lanchonete = np.array([
    # COMPLETE AQUI
    [2, 1, 3],  # Combo 1
    [1, 2, 2],  # Combo 2
    [3, 1, 1]   # Combo 3
])

# TODO: Monte o vetor b (preços totais)
b_lanchonete = np.array([35, 28, 32])

# TODO: Resolva o sistema
precos = np.linalg.solve(A_lanchonete, b_lanchonete)

print("Resultados:")
print(f"🍔 Hambúrguer: R$ {precos[0]:.2f}")
print(f"🍟 Batata: R$ {precos[1]:.2f}")
print(f"🥤 Refrigerante: R$ {precos[2]:.2f}")

# Verificação
print("\n✅ Verificação:")
combos = ['Combo 1', 'Combo 2', 'Combo 3']
for i, combo in enumerate(combos):
    calculado = A_lanchonete[i] @ precos
    original = b_lanchonete[i]
    print(f"{combo}: R$ {calculado:.2f} (esperado: R$ {original:.2f})")

print("\n🎉 Exercício concluído!")

## 🚀 Exercício Prático 2: Regressão Linear Manual

Agora vamos implementar regressão linear do zero usando apenas sistemas lineares!

**Objetivo**: Criar uma classe `RegressaoLinearManual` que:
1. Resolve o sistema $\mathbf{X}^T\mathbf{X}\boldsymbol{\beta} = \mathbf{X}^T\mathbf{y}$
2. Calcula métricas (R², MSE)
3. Faz predições

**Dica do Pedro**: Lembra de adicionar a coluna de 1s para o intercepto!

In [None]:
# 🎯 EXERCÍCIO 2: Implemente a classe RegressaoLinearManual

class RegressaoLinearManual:
    def __init__(self):
        self.coeficientes = None
        self.intercepto = None
        self.fitted = False
    
    def fit(self, X, y):
        """
        Treina o modelo resolvendo o sistema linear
        X: features (n_samples, n_features)
        y: target (n_samples,)
        """
        # TODO: Adicione coluna de 1s para o intercepto
        X_com_bias = np.column_stack([np.ones(X.shape[0]), X])
        
        # TODO: Calcule X^T @ X e X^T @ y
        XtX = X_com_bias.T @ X_com_bias
        Xty = X_com_bias.T @ y
        
        # TODO: Resolva o sistema linear
        beta = np.linalg.solve(XtX, Xty)
        
        # TODO: Separe intercepto e coeficientes
        self.intercepto = beta[0]
        self.coeficientes = beta[1:]
        self.fitted = True
        
        return self
    
    def predict(self, X):
        """
        Faz predições
        """
        if not self.fitted:
            raise ValueError("Modelo não foi treinado ainda!")
        
        # TODO: Calcule as predições
        return self.intercepto + X @ self.coeficientes
    
    def score(self, X, y):
        """
        Calcula R²
        """
        y_pred = self.predict(X)
        ss_res = np.sum((y - y_pred) ** 2)
        ss_tot = np.sum((y - np.mean(y)) ** 2)
        return 1 - (ss_res / ss_tot)

# Testando nossa implementação
print("🧪 Testando RegressaoLinearManual")
print("="*40)

# Gerando dados de teste
np.random.seed(42)
X_test = np.random.randn(100, 2)
y_test = 1 + 2*X_test[:, 0] - 3*X_test[:, 1] + 0.1*np.random.randn(100)

# Nossa implementação
modelo_manual = RegressaoLinearManual()
modelo_manual.fit(X_test, y_test)

# Sklearn para comparar
modelo_sklearn = LinearRegression()
modelo_sklearn.fit(X_test, y_test)

print("Comparação dos resultados:")
print(f"Intercepto - Manual: {modelo_manual.intercepto:.4f}, Sklearn: {modelo_sklearn.intercept_:.4f}")
print(f"Coef 1 - Manual: {modelo_manual.coeficientes[0]:.4f}, Sklearn: {modelo_sklearn.coef_[0]:.4f}")
print(f"Coef 2 - Manual: {modelo_manual.coeficientes[1]:.4f}, Sklearn: {modelo_sklearn.coef_[1]:.4f}")
print(f"R² - Manual: {modelo_manual.score(X_test, y_test):.4f}, Sklearn: {modelo_sklearn.score(X_test, y_test):.4f}")

print("\n✅ Implementação perfeita! Resultados idênticos ao sklearn!")

## 📊 Performance e Estabilidade Numérica

Nem todos os sistemas são fáceis de resolver. Alguns problemas importantes:

### 1. **Matrizes Mal Condicionadas**
- Pequenas mudanças nos dados causam grandes mudanças na solução
- **Número de condição** alto: $\kappa(A) = \frac{\lambda_{max}}{\lambda_{min}}$

### 2. **Overfitting em Regressão**
- Muitas features, poucos dados
- $\mathbf{X}^T\mathbf{X}$ pode ser singular

### 3. **Soluções**:
- **Regularização** (Ridge, Lasso)
- **Decomposição SVD** (Módulo 9)
- **Pseudo-inversa** para sistemas sobredeterminados

**Dica do Pedro**: Em problemas reais, sempre verifique o número de condição da matriz!

In [None]:
# Demonstrando problemas de estabilidade numérica
print("⚠️ Analisando Estabilidade Numérica")
print("="*40)

# Matriz bem condicionada
A_boa = np.array([[4, 1], [1, 3]])
cond_boa = np.linalg.cond(A_boa)

# Matriz mal condicionada (quase singular)
A_ruim = np.array([[1, 1], [1, 1.0001]])
cond_ruim = np.linalg.cond(A_ruim)

print(f"Matriz bem condicionada:")
print(f"Número de condição: {cond_boa:.2f}")
print(f"Status: {'Boa' if cond_boa < 100 else 'Ruim'}")

print(f"\nMatriz mal condicionada:")
print(f"Número de condição: {cond_ruim:.2e}")
print(f"Status: {'Boa' if cond_ruim < 100 else 'Ruim - CUIDADO!'}")

# Testando sensibilidade a ruído
b_original = np.array([5, 2])
b_com_ruido = b_original + 0.001 * np.random.randn(2)

# Soluções para matriz bem condicionada
x_boa_original = np.linalg.solve(A_boa, b_original)
x_boa_ruido = np.linalg.solve(A_boa, b_com_ruido)

# Soluções para matriz mal condicionada
x_ruim_original = np.linalg.solve(A_ruim, b_original)
x_ruim_ruido = np.linalg.solve(A_ruim, b_com_ruido)

print(f"\n📊 Sensibilidade ao ruído:")
print(f"Matriz boa - Mudança na solução: {np.linalg.norm(x_boa_original - x_boa_ruido):.6f}")
print(f"Matriz ruim - Mudança na solução: {np.linalg.norm(x_ruim_original - x_ruim_ruido):.6f}")

print("\n💡 Conclusão: Matrizes mal condicionadas amplificam pequenos erros!")

## 🔮 Diagrama: Fluxo dos Sistemas Lineares em ML

Vamos visualizar como os sistemas lineares se conectam com diferentes áreas de machine learning:

In [None]:
# Criando um diagrama conceitual
from IPython.display import display, Markdown

diagrama_mermaid = """
```mermaid
graph TD
    A[Sistema Linear Ax = b] --> B[Regressão Linear]
    A --> C[Redes Neurais]
    A --> D[PCA/SVD]
    A --> E[SVM]
    
    B --> B1[X'X β = X'y]
    B --> B2[Mínimos Quadrados]
    
    C --> C1[Wx + b = h]
    C --> C2[Camadas Lineares]
    
    D --> D1[Cv = λv]
    D --> D2[Autovetores]
    
    E --> E1[Otimização Quadrática]
    E --> E2[Hiperplanos]
    
    F[Dados] --> A
    A --> G[Solução]
    G --> H[Predições/Insights]
```
"""

display(Markdown(diagrama_mermaid))

print("🎯 Fluxo dos Sistemas Lineares em Machine Learning")
print("Praticamente todo algoritmo de ML usa sistemas lineares!")

## 🎨 Visualização Final: Comparando Métodos de Solução

Vamos comparar diferentes métodos para resolver sistemas lineares em termos de tempo de execução:

In [None]:
import time

# Comparando métodos de solução
print("⚡ Comparação de Performance dos Métodos")
print("="*45)

# Testando com diferentes tamanhos de matriz
tamanhos = [10, 50, 100, 200, 500]
tempos_solve = []
tempos_inv = []

for n in tamanhos:
    # Gerando matriz aleatória bem condicionada
    np.random.seed(42)
    A = np.random.randn(n, n) + n * np.eye(n)  # Adicionando diagonal para estabilidade
    b = np.random.randn(n)
    
    # Método 1: np.linalg.solve
    start = time.time()
    for _ in range(10):  # Múltiplas execuções para média
        x1 = np.linalg.solve(A, b)
    tempo_solve = (time.time() - start) / 10
    tempos_solve.append(tempo_solve)
    
    # Método 2: Inversa
    start = time.time()
    for _ in range(10):
        A_inv = np.linalg.inv(A)
        x2 = A_inv @ b
    tempo_inv = (time.time() - start) / 10
    tempos_inv.append(tempo_inv)
    
    print(f"n={n:3d}: solve={tempo_solve*1000:.2f}ms, inv={tempo_inv*1000:.2f}ms, ratio={tempo_inv/tempo_solve:.1f}x")

# Visualização
plt.figure(figsize=(12, 8))

plt.subplot(2, 2, 1)
plt.plot(tamanhos, [t*1000 for t in tempos_solve], 'bo-', label='np.linalg.solve', linewidth=2)
plt.plot(tamanhos, [t*1000 for t in tempos_inv], 'ro-', label='Inversa + mult', linewidth=2)
plt.xlabel('Tamanho da matriz (n×n)')
plt.ylabel('Tempo (ms)')
plt.title('Comparação de Performance')
plt.legend()
plt.grid(True, alpha=0.3)
plt.yscale('log')

plt.subplot(2, 2, 2)
ratios = [inv/solve for inv, solve in zip(tempos_inv, tempos_solve)]
plt.bar(range(len(tamanhos)), ratios, color='orange', alpha=0.7)
plt.xlabel('Tamanho da matriz')
plt.ylabel('Razão (tempo_inv / tempo_solve)')
plt.title('Quanto a Inversa é Mais Lenta')
plt.xticks(range(len(tamanhos)), tamanhos)
plt.grid(True, alpha=0.3)

plt.subplot(2, 2, 3)
# Complexidade teórica
n_teorico = np.array(tamanhos)
o_n3 = (n_teorico/tamanhos[0])**3 * tempos_solve[0]
plt.plot(tamanhos, [t*1000 for t in tempos_solve], 'bo-', label='Tempo real', linewidth=2)
plt.plot(tamanhos, [t*1000 for t in o_n3], 'g--', label='O(n³) teórico', linewidth=2)
plt.xlabel('Tamanho da matriz (n×n)')
plt.ylabel('Tempo (ms)')
plt.title('Complexidade Algoritmo: O(n³)')
plt.legend()
plt.grid(True, alpha=0.3)
plt.yscale('log')

plt.subplot(2, 2, 4)
# Eficiência relativa
eficiencia = [tempos_solve[0]/t for t in tempos_solve]
plt.plot(tamanhos, eficiencia, 'mo-', linewidth=2, markersize=8)
plt.xlabel('Tamanho da matriz (n×n)')
plt.ylabel('Eficiência relativa')
plt.title('Eficiência vs Tamanho')
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print("\n📈 Conclusões:")
print("1. np.linalg.solve é sempre mais rápido que calcular inversa")
print("2. A diferença aumenta com o tamanho da matriz")
print("3. Complexidade é O(n³) para ambos, mas solve tem constante menor")
print("4. Para matrizes grandes, a diferença pode ser significativa!")

## 🚀 Preparando para os Próximos Módulos

Agora que dominamos sistemas lineares, vamos nos preparar para o que vem pela frente:

### **Módulo 6 - Transformações Lineares** 🔄
- Como matrizes transformam vetores
- Rotações, reflexões, escalas
- Importância para representação de dados

### **Módulo 7 - Inversa e Transposta** ↩️
- Quando existe inversa?
- Propriedades da transposta
- Aplicações práticas

### **Conexões que vamos ver**:
- **Transformações**: $\mathbf{y} = \mathbf{A}\mathbf{x}$ (próximo módulo)
- **Inversa**: Resolver $\mathbf{A}\mathbf{x} = \mathbf{b}$ → $\mathbf{x} = \mathbf{A}^{-1}\mathbf{b}$
- **SVD**: Decomposição para sistemas mal condicionados

**Dica do Pedro**: Sistemas lineares são a fundação. Agora vamos ver como as matrizes podem transformar o espaço!

In [None]:
# Preview do próximo módulo: transformações lineares
print("🔮 Preview: Módulo 6 - Transformações Lineares")
print("="*50)

# Exemplo simples de transformação
# Matriz de rotação de 45 graus
theta = np.pi/4  # 45 graus
matriz_rotacao = np.array([
    [np.cos(theta), -np.sin(theta)],
    [np.sin(theta), np.cos(theta)]
])

# Vetor original
v_original = np.array([1, 0])

# Aplicando transformação
v_transformado = matriz_rotacao @ v_original

print(f"Vetor original: {v_original}")
print(f"Matriz de rotação 45°:")
print(matriz_rotacao)
print(f"Vetor após rotação: {v_transformado}")

# Visualização rápida
plt.figure(figsize=(8, 8))
plt.arrow(0, 0, v_original[0], v_original[1], head_width=0.1, head_length=0.1, fc='blue', ec='blue', linewidth=3, label='Original')
plt.arrow(0, 0, v_transformado[0], v_transformado[1], head_width=0.1, head_length=0.1, fc='red', ec='red', linewidth=3, label='Rotacionado 45°')
plt.xlim(-1.5, 1.5)
plt.ylim(-1.5, 1.5)
plt.grid(True, alpha=0.3)
plt.axhline(y=0, color='k', linewidth=0.5)
plt.axvline(x=0, color='k', linewidth=0.5)
plt.legend()
plt.title('Preview: Transformação Linear (Rotação)')
plt.axis('equal')
plt.show()

print("\n🎯 No próximo módulo vamos entender:")
print("• Como matrizes transformam vetores")
print("• Rotações, reflexões, escalas")
print("• Por que isso é importante para IA")
print("\nAté lá! 🚀")

## 📝 Resumo do Módulo 5

### **O Que Aprendemos Hoje** ✅

1. **Sistemas de Equações Lineares**
   - Representação matricial: $\mathbf{A}\mathbf{x} = \mathbf{b}$
   - Tipos: determinado, indeterminado, impossível

2. **Métodos de Solução**
   - `np.linalg.solve()` (recomendado)
   - Inversa (quando necessário)
   - Considerações de estabilidade numérica

3. **Conexão com Machine Learning**
   - Regressão linear como sistema linear
   - Mínimos quadrados: $\mathbf{X}^T\mathbf{X}\boldsymbol{\beta} = \mathbf{X}^T\mathbf{y}$
   - Aplicações em ML

4. **Implementação Prática**
   - Regressão linear do zero
   - Sistema de recomendação simples
   - Análise de performance

### **Conceitos-Chave** 🔑
- **Sistema Linear**: Conjunto de equações lineares
- **Matriz de Coeficientes**: A no sistema Ax = b
- **Mínimos Quadrados**: Método para ajuste de modelos
- **Número de Condição**: Medida de estabilidade numérica

### **Próximos Passos** 🚀
- **Módulo 6**: Transformações Lineares
- **Módulo 7**: Inversa e Transposta
- **Módulo 9**: SVD para sistemas mal condicionados

**Dica Final do Pedro**: Sistemas lineares são o coração da IA moderna. Dominando isso, você entende 80% dos algoritmos de machine learning. Liiindo! 🎉

---

**🎯 Missão Cumprida!** Agora você sabe resolver problemas reais usando álgebra linear e entende como isso se conecta com machine learning. Bora para as transformações lineares! 🚀