# 🎯 Autovetores e Autovalores: Os Eixos de Rotação da IA

## Módulo 10 - Álgebra Linear para IA

### Pedro Nunes Guth

---

Bora pro grande final do nosso curso! 🚀

Tá, mas o que são esses **autovetores** e **autovalores**? E por que eles são tão importantes pra IA?

Imagina que você tá dirigindo na estrada e precisa fazer uma curva. Tem direções que quando você aplica força no volante, o carro simplesmente "estica" naquela direção sem mudar a orientação - esses são os **autovetores**! E a quantidade de "esticamento" é o **autovalor**.

Na IA, esses caras são os **eixos principais** dos nossos dados. Eles nos mostram as direções mais importantes da informação!

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-10_img_01.png)

In [None]:
# Setup inicial - Nossos companheiros de jornada! 🛠️
import numpy as np
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA
from sklearn.datasets import make_blobs, load_iris
from sklearn.preprocessing import StandardScaler
import seaborn as sns
import pandas as pd
from mpl_toolkits.mplot3d import Axes3D

# Configuração dos gráficos
plt.style.use('seaborn-v0_8')
plt.rcParams['figure.figsize'] = (12, 8)
plt.rcParams['font.size'] = 12

print("📚 Bibliotecas carregadas! Bora mergulhar nos autovetores!")
print(f"NumPy versão: {np.__version__}")

## 🎭 O Conceito Fundamental: O que São Autovetores?

Vamos começar com uma analogia brasileira clássica!

Imagina o **Carnaval do Rio** - você tá na Sapucaí e vê milhares de pessoas se movendo. Tem gente indo pra todo lado, mas existem algumas **direções principais** do movimento:

1. 📍 **Direção da Passarela**: Todo mundo se move principalmente nessa direção
2. 📍 **Direção das Arquibancadas**: Movimento secundário, mas importante

Os **autovetores** são exatamente essas direções principais! E os **autovalores** nos dizem o quanto de movimento acontece em cada direção.

### 🧮 Definição Matemática

Para uma matriz quadrada $A$, um vetor $\mathbf{v}$ é um **autovetor** se:

$$A\mathbf{v} = \lambda\mathbf{v}$$

Onde:
- $\mathbf{v}$ é o **autovetor** (direção que não muda)
- $\lambda$ é o **autovalor** (fator de escalonamento)
- $A$ é nossa matriz de transformação

**Traduzindo**: Quando aplicamos a matriz $A$ no vetor $\mathbf{v}$, ele não muda de direção, apenas de tamanho!

**🎯 Dica do Pedro**: Pensa assim - é como se o autovetor fosse uma mangueira de jardim apontada numa direção fixa, e o autovalor fosse a pressão da água!

In [None]:
# Vamos criar um exemplo visual simples! 🎨

# Matriz exemplo 2x2
A = np.array([[3, 1],
              [0, 2]])

print("🎯 Nossa matriz de transformação A:")
print(A)
print()

# Calculando autovetores e autovalores
autovalores, autovetores = np.linalg.eig(A)

print("🔥 Autovalores (λ):")
for i, val in enumerate(autovalores):
    print(f"λ{i+1} = {val:.3f}")

print("\n🎯 Autovetores (v):")
for i, vec in enumerate(autovetores.T):
    print(f"v{i+1} = [{vec[0]:.3f}, {vec[1]:.3f}]")

print("\n✅ Verificação da equação Av = λv:")
for i in range(len(autovalores)):
    v = autovetores[:, i]
    Av = A @ v
    lambda_v = autovalores[i] * v
    
    print(f"\nAutovetor {i+1}:")
    print(f"A*v = [{Av[0]:.3f}, {Av[1]:.3f}]")
    print(f"λ*v = [{lambda_v[0]:.3f}, {lambda_v[1]:.3f}]")
    print(f"São iguais? {np.allclose(Av, lambda_v)}")

## 🎨 Visualizando a Magia dos Autovetores

Agora vamos ver isso visualmente! Lembra das **transformações lineares** do Módulo 6? Os autovetores são as direções que **não mudam** quando aplicamos a transformação!

É como se fossem as **"estradas fixas"** no meio de um terremoto - tudo ao redor se move, mas elas mantêm a direção!

In [None]:
# Visualização épica dos autovetores! 🎭

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))

# Vetores originais (antes da transformação)
vetores_originais = np.array([[1, 0], [0, 1], [1, 1], [-1, 1]])
cores = ['red', 'blue', 'green', 'orange']
labels = ['[1,0]', '[0,1]', '[1,1]', '[-1,1]']

# Plot 1: Antes da transformação
ax1.set_title('🎯 Antes da Transformação A', fontsize=14, fontweight='bold')
for i, (vec, cor, label) in enumerate(zip(vetores_originais, cores, labels)):
    ax1.arrow(0, 0, vec[0], vec[1], head_width=0.1, head_length=0.1, 
              fc=cor, ec=cor, linewidth=2, label=f'v{i+1} = {label}')

# Adicionando os autovetores
for i, vec in enumerate(autovetores.T):
    ax1.arrow(0, 0, vec[0], vec[1], head_width=0.15, head_length=0.15,
              fc='black', ec='black', linewidth=3, linestyle='--',
              label=f'Autovetor {i+1}')

ax1.grid(True, alpha=0.3)
ax1.set_xlim(-2, 2)
ax1.set_ylim(-2, 2)
ax1.legend()
ax1.set_aspect('equal')

# Plot 2: Depois da transformação
ax2.set_title('🚀 Depois da Transformação A', fontsize=14, fontweight='bold')
for i, (vec, cor, label) in enumerate(zip(vetores_originais, cores, labels)):
    vec_transformado = A @ vec
    ax2.arrow(0, 0, vec_transformado[0], vec_transformado[1], 
              head_width=0.1, head_length=0.1, fc=cor, ec=cor, linewidth=2,
              label=f'A*v{i+1}')

# Autovetores transformados (só mudam de tamanho!)
for i, (vec, val) in enumerate(zip(autovetores.T, autovalores)):
    vec_transformado = A @ vec
    ax2.arrow(0, 0, vec_transformado[0], vec_transformado[1], 
              head_width=0.15, head_length=0.15, fc='black', ec='black', 
              linewidth=3, linestyle='--', label=f'A*Autovetor {i+1} (λ={val:.1f})')

ax2.grid(True, alpha=0.3)
ax2.set_xlim(-4, 4)
ax2.set_ylim(-4, 4)
ax2.legend()
ax2.set_aspect('equal')

plt.tight_layout()
plt.show()

print("🎉 Olha só que liiindo! Os autovetores (linhas tracejadas pretas) mantiveram a direção!")
print("📍 Só mudaram de tamanho pelos autovalores correspondentes!")

## 🧠 Por Que Autovetores São Cruciais na IA?

Tá, mas por que diabos isso é importante pra IA? Excelente pergunta! 🤔

Os autovetores nos ajudam a encontrar as **direções mais importantes** nos nossos dados. É como se fosse um GPS que nos mostra:

### 🎯 1. **Redução de Dimensionalidade**
- Pega 1000 features e reduz para 50 mais importantes
- Mantém a informação essencial, elimina o "ruído"

### 🎯 2. **Compressão de Dados**
- Imagens, áudio, texto - todos podem ser comprimidos
- Lembra da **SVD do Módulo 9**? Os autovetores estão lá!

### 🎯 3. **Análise de Padrões**
- Encontra as "tendências principais" nos dados
- Como as pessoas se comportam, que produtos vendem mais, etc.

### 🔄 Diagrama do Fluxo de Informação

```mermaid
graph TD
    A[Dados Originais<br/>Alta Dimensionalidade] --> B[Cálculo da Matriz<br/>de Covariância]
    B --> C[Autovetores e<br/>Autovalores]
    C --> D[Ordenação por<br/>Importância]
    D --> E[Seleção dos<br/>Componentes Principais]
    E --> F[Dados Reduzidos<br/>Mantendo Informação]
```

**🎯 Dica do Pedro**: É como escolher as melhores fotos de uma viagem - você quer manter as que capturam a "essência" da experiência!

In [None]:
# Vamos criar dados sintéticos para entender melhor! 🎲

# Gerando dados com correlação (lembra das matrizes de covariância?)
np.random.seed(42)
n_pontos = 200

# Dados correlacionados - como altura e peso
altura = np.random.normal(170, 10, n_pontos)  # cm
peso = 0.8 * altura + np.random.normal(0, 5, n_pontos) - 100  # kg

# Criando nossa matriz de dados
dados = np.column_stack([altura, peso])

print("📊 Dados sintéticos criados: Altura vs Peso")
print(f"Shape dos dados: {dados.shape}")
print(f"\nMédia - Altura: {np.mean(altura):.1f}cm, Peso: {np.mean(peso):.1f}kg")
print(f"Desvio - Altura: {np.std(altura):.1f}cm, Peso: {np.std(peso):.1f}kg")

# Centralizando os dados (importante para PCA!)
dados_centralizados = dados - np.mean(dados, axis=0)

# Calculando matriz de covariância
cov_matrix = np.cov(dados_centralizados.T)
print("\n🎯 Matriz de Covariância:")
print(cov_matrix)

# Autovetores e autovalores da matriz de covariância
autovalores_cov, autovetores_cov = np.linalg.eig(cov_matrix)

print("\n🔥 Autovalores da Covariância:")
for i, val in enumerate(autovalores_cov):
    variancia_explicada = val / np.sum(autovalores_cov) * 100
    print(f"PC{i+1}: {val:.2f} ({variancia_explicada:.1f}% da variância)")

print("\n🎯 Autovetores (Componentes Principais):")
for i, vec in enumerate(autovetores_cov.T):
    print(f"PC{i+1}: [{vec[0]:.3f}, {vec[1]:.3f}]")

In [None]:
# Visualização dos Componentes Principais! 🎨

fig, ax = plt.subplots(figsize=(12, 8))

# Scatter plot dos dados
ax.scatter(altura, peso, alpha=0.6, color='skyblue', s=50, label='Dados Originais')

# Centro dos dados
centro_x, centro_y = np.mean(altura), np.mean(peso)
ax.scatter(centro_x, centro_y, color='red', s=100, marker='x', linewidth=3, label='Centro')

# Plotando os autovetores (componentes principais)
escala = 30  # Para visualização

for i, (vec, val) in enumerate(zip(autovetores_cov.T, autovalores_cov)):
    # Autovetor escalado pelo autovalor
    vec_escalado = vec * np.sqrt(val) * escala
    
    ax.arrow(centro_x, centro_y, vec_escalado[0], vec_escalado[1],
             head_width=2, head_length=2, fc=f'C{i}', ec=f'C{i}', 
             linewidth=4, label=f'PC{i+1} (λ={val:.0f})')
    
    ax.arrow(centro_x, centro_y, -vec_escalado[0], -vec_escalado[1],
             head_width=2, head_length=2, fc=f'C{i}', ec=f'C{i}', 
             linewidth=4)

ax.set_xlabel('Altura (cm)', fontsize=14)
ax.set_ylabel('Peso (kg)', fontsize=14)
ax.set_title('🎯 Componentes Principais: As Direções Mais Importantes!', 
             fontsize=16, fontweight='bold')
ax.legend(fontsize=12)
ax.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print("🎉 Liiindo! Veja como:")
print("📍 PC1 (laranja): Captura a direção principal da variação (altura-peso correlacionados)")
print("📍 PC2 (azul): Captura a variação secundária (perpendicular ao PC1)")
print("\n🎯 Dica do Pedro: O PC1 é onde os dados 'se espalham' mais!")

## 🎪 PCA: A Estrela Principal dos Autovetores

Agora vamos para o **prato principal**: a **Análise de Componentes Principais (PCA)**!

O PCA é como um **organizador profissional** que entra na sua casa (dados) e diz:
- "Olha, essa direção aqui é a mais importante" (PC1)
- "Essa segunda direção também importa, mas menos" (PC2)
- "E essas outras... podemos descartar!" (PCs menores)

### 🧮 Matemática do PCA

**Passo 1**: Centralizar os dados
$$\mathbf{X}_{centrado} = \mathbf{X} - \bar{\mathbf{X}}$$

**Passo 2**: Calcular matriz de covariância
$$\mathbf{C} = \frac{1}{n-1}\mathbf{X}_{centrado}^T\mathbf{X}_{centrado}$$

**Passo 3**: Encontrar autovetores e autovalores de $\mathbf{C}$
$$\mathbf{C}\mathbf{v}_i = \lambda_i\mathbf{v}_i$$

**Passo 4**: Ordenar por autovalores (maior → menor)

**Passo 5**: Projetar dados nos componentes principais
$$\mathbf{Y} = \mathbf{X}_{centrado}\mathbf{V}$$

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-10_img_02.png)

In [None]:
# PCA na raça (implementação manual)! 💪

def pca_do_pedro(dados, n_componentes=2):
    """
    PCA implementado na unha pelo Pedro! 🔨
    """
    print("🚀 Executando PCA do Pedro...")
    
    # Passo 1: Centralizar
    dados_centrados = dados - np.mean(dados, axis=0)
    print("✅ Passo 1: Dados centralizados")
    
    # Passo 2: Matriz de covariância
    cov_matrix = np.cov(dados_centrados.T)
    print("✅ Passo 2: Matriz de covariância calculada")
    
    # Passo 3: Autovetores e autovalores
    autovalores, autovetores = np.linalg.eig(cov_matrix)
    print("✅ Passo 3: Autovetores e autovalores encontrados")
    
    # Passo 4: Ordenar por importância
    idx_ordenado = np.argsort(autovalores)[::-1]
    autovalores_ordenados = autovalores[idx_ordenado]
    autovetores_ordenados = autovetores[:, idx_ordenado]
    print("✅ Passo 4: Ordenação por importância")
    
    # Passo 5: Selecionar componentes principais
    componentes_principais = autovetores_ordenados[:, :n_componentes]
    
    # Passo 6: Projetar dados
    dados_transformados = dados_centrados @ componentes_principais
    print("✅ Passo 5: Projeção concluída")
    
    # Calculando variância explicada
    variancia_explicada = autovalores_ordenados / np.sum(autovalores_ordenados)
    
    return {
        'dados_transformados': dados_transformados,
        'componentes_principais': componentes_principais,
        'autovalores': autovalores_ordenados,
        'variancia_explicada': variancia_explicada,
        'dados_centrados': dados_centrados
    }

# Aplicando nosso PCA!
resultado_pca = pca_do_pedro(dados, n_componentes=2)

print("\n🎉 Resultados do PCA:")
print(f"Variância explicada por PC1: {resultado_pca['variancia_explicada'][0]*100:.1f}%")
print(f"Variância explicada por PC2: {resultado_pca['variancia_explicada'][1]*100:.1f}%")
print(f"Variância total explicada: {np.sum(resultado_pca['variancia_explicada'][:2])*100:.1f}%")

print("\n🎯 Componentes Principais:")
for i, cp in enumerate(resultado_pca['componentes_principais'].T):
    print(f"PC{i+1}: [{cp[0]:.3f}, {cp[1]:.3f}]")

In [None]:
# Comparando com o PCA do scikit-learn! ⚖️

# PCA do scikit-learn
pca_sklearn = PCA(n_components=2)
dados_pca_sklearn = pca_sklearn.fit_transform(dados)

print("🔬 Comparação: PCA do Pedro vs Scikit-learn")
print("\nVariância explicada:")
print(f"Pedro:    PC1={resultado_pca['variancia_explicada'][0]*100:.1f}%, PC2={resultado_pca['variancia_explicada'][1]*100:.1f}%")
print(f"Sklearn:  PC1={pca_sklearn.explained_variance_ratio_[0]*100:.1f}%, PC2={pca_sklearn.explained_variance_ratio_[1]*100:.1f}%")

print("\nComponentes principais:")
print("Pedro:")
for i, cp in enumerate(resultado_pca['componentes_principais'].T):
    print(f"  PC{i+1}: [{cp[0]:.3f}, {cp[1]:.3f}]")

print("Sklearn:")
for i, cp in enumerate(pca_sklearn.components_):
    print(f"  PC{i+1}: [{cp[0]:.3f}, {cp[1]:.3f}]")

# Visualização comparativa
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))

# PCA do Pedro
ax1.scatter(resultado_pca['dados_transformados'][:, 0], 
           resultado_pca['dados_transformados'][:, 1], 
           alpha=0.6, color='skyblue')
ax1.set_title('🔨 PCA do Pedro', fontsize=14, fontweight='bold')
ax1.set_xlabel('PC1')
ax1.set_ylabel('PC2')
ax1.grid(True, alpha=0.3)
ax1.axhline(y=0, color='r', linestyle='--', alpha=0.5)
ax1.axvline(x=0, color='r', linestyle='--', alpha=0.5)

# PCA do Scikit-learn
ax2.scatter(dados_pca_sklearn[:, 0], dados_pca_sklearn[:, 1], 
           alpha=0.6, color='lightcoral')
ax2.set_title('🔬 PCA do Scikit-learn', fontsize=14, fontweight='bold')
ax2.set_xlabel('PC1')
ax2.set_ylabel('PC2')
ax2.grid(True, alpha=0.3)
ax2.axhline(y=0, color='r', linestyle='--', alpha=0.5)
ax2.axvline(x=0, color='r', linestyle='--', alpha=0.5)

plt.tight_layout()
plt.show()

print("\n🎉 Resultados praticamente idênticos! Nosso PCA tá funcionando perfeitamente!")

## 🌺 Exemplo Real: Dataset Iris

Bora aplicar PCA num dataset clássico: o **Iris**! 🌸

O Iris tem 4 dimensões (features):
1. Comprimento da sépala
2. Largura da sépala  
3. Comprimento da pétala
4. Largura da pétala

Vamos usar PCA para reduzir de **4D para 2D** e ainda assim manter a informação essencial!

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-10_img_03.png)

In [None]:
# Carregando o famoso dataset Iris! 🌺

iris = load_iris()
X_iris = iris.data
y_iris = iris.target
nomes_features = iris.feature_names
nomes_especies = iris.target_names

print("🌺 Dataset Iris carregado!")
print(f"Shape: {X_iris.shape}")
print(f"Features: {nomes_features}")
print(f"Espécies: {nomes_especies}")

# Estatísticas básicas
df_iris = pd.DataFrame(X_iris, columns=nomes_features)
df_iris['especie'] = y_iris

print("\n📊 Estatísticas por espécie:")
for i, especie in enumerate(nomes_especies):
    dados_especie = df_iris[df_iris['especie'] == i]
    print(f"\n{especie.capitalize()}:")
    print(dados_especie.describe().round(2))

# Padronizando os dados (importante para PCA!)
scaler = StandardScaler()
X_iris_scaled = scaler.fit_transform(X_iris)

print("\n✅ Dados padronizados (média=0, std=1)")
print(f"Médias após padronização: {np.mean(X_iris_scaled, axis=0).round(3)}")
print(f"Desvios após padronização: {np.std(X_iris_scaled, axis=0).round(3)}")

In [None]:
# Aplicando PCA no Iris! 🎯

# PCA para 2 componentes
pca_iris = PCA(n_components=4)  # Primeiro vamos ver todos os componentes
X_iris_pca = pca_iris.fit_transform(X_iris_scaled)

print("🔥 Análise de Componentes Principais - Iris")
print("\nVariância explicada por cada componente:")
for i, var_exp in enumerate(pca_iris.explained_variance_ratio_):
    print(f"PC{i+1}: {var_exp*100:.1f}%")

print(f"\nVariância acumulada:")
var_acumulada = np.cumsum(pca_iris.explained_variance_ratio_)
for i, var_acc in enumerate(var_acumulada):
    print(f"PC1 até PC{i+1}: {var_acc*100:.1f}%")

print("\n🎯 Componentes Principais (autovetores):")
componentes_df = pd.DataFrame(
    pca_iris.components_.T,
    columns=[f'PC{i+1}' for i in range(4)],
    index=nomes_features
)
print(componentes_df.round(3))

# Interpretação dos componentes
print("\n🧠 Interpretação dos Componentes:")
print("PC1: Captura o tamanho geral da flor (todas as features com pesos similares)")
print("PC2: Contraste entre sépala e pétala (sépala positiva, pétala negativa)")
print("PC3 e PC4: Variações mais sutis")

In [None]:
# Visualização épica do PCA no Iris! 🎨

fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(16, 12))

cores = ['red', 'green', 'blue']
markers = ['o', 's', '^']

# Plot 1: Variância explicada
ax1.bar(range(1, 5), pca_iris.explained_variance_ratio_*100, 
        color=['#FF6B6B', '#4ECDC4', '#45B7D1', '#96CEB4'], alpha=0.8)
ax1.set_xlabel('Componente Principal')
ax1.set_ylabel('Variância Explicada (%)')
ax1.set_title('📊 Variância Explicada por Componente', fontweight='bold')
ax1.set_xticks(range(1, 5))
for i, v in enumerate(pca_iris.explained_variance_ratio_*100):
    ax1.text(i+1, v+1, f'{v:.1f}%', ha='center', fontweight='bold')

# Plot 2: Variância acumulada
ax2.plot(range(1, 5), var_acumulada*100, 'o-', linewidth=3, markersize=8, color='#FF6B6B')
ax2.fill_between(range(1, 5), var_acumulada*100, alpha=0.3, color='#FF6B6B')
ax2.axhline(y=95, color='green', linestyle='--', alpha=0.7, label='95% threshold')
ax2.set_xlabel('Número de Componentes')
ax2.set_ylabel('Variância Acumulada (%)')
ax2.set_title('📈 Variância Acumulada', fontweight='bold')
ax2.set_xticks(range(1, 5))
ax2.legend()
ax2.grid(True, alpha=0.3)

# Plot 3: PC1 vs PC2
for i, especie in enumerate(nomes_especies):
    mask = y_iris == i
    ax3.scatter(X_iris_pca[mask, 0], X_iris_pca[mask, 1], 
               c=cores[i], marker=markers[i], s=80, alpha=0.7, 
               label=especie.capitalize())

ax3.set_xlabel(f'PC1 ({pca_iris.explained_variance_ratio_[0]*100:.1f}%)')
ax3.set_ylabel(f'PC2 ({pca_iris.explained_variance_ratio_[1]*100:.1f}%)')
ax3.set_title('🌺 Iris no Espaço dos Componentes Principais', fontweight='bold')
ax3.legend()
ax3.grid(True, alpha=0.3)

# Plot 4: Heatmap dos componentes
im = ax4.imshow(pca_iris.components_, cmap='RdBu_r', aspect='auto')
ax4.set_xticks(range(len(nomes_features)))
ax4.set_xticklabels([nome.replace(' (cm)', '').replace('sepal', 'sep').replace('petal', 'pet') 
                    for nome in nomes_features], rotation=45)
ax4.set_yticks(range(4))
ax4.set_yticklabels([f'PC{i+1}' for i in range(4)])
ax4.set_title('🎯 Pesos dos Componentes Principais', fontweight='bold')

# Adicionando valores no heatmap
for i in range(4):
    for j in range(4):
        text = ax4.text(j, i, f'{pca_iris.components_[i, j]:.2f}',
                       ha="center", va="center", color="black", fontweight='bold')

plt.colorbar(im, ax=ax4, shrink=0.8)
plt.tight_layout()
plt.show()

print("🎉 Liiindo! Veja como PC1 e PC2 capturam 95.8% da variância!")
print("📍 As três espécies ficaram bem separadas no espaço 2D!")

## 📊 Diagrama do Processo PCA

Vamos visualizar todo o processo do PCA de forma clara:

```mermaid
graph LR
    A[Dados Originais<br/>4D: Iris] --> B[Padronização<br/>μ=0, σ=1]
    B --> C[Matriz Covariância<br/>4x4]
    C --> D[Autovetores<br/>Autovalores]
    D --> E[Ordenação<br/>por Importância]
    E --> F[Seleção PC1, PC2<br/>95.8% variância]
    F --> G[Projeção<br/>4D → 2D]
    G --> H[Visualização<br/>Classes Separadas]
```

## 🏋️‍♂️ Exercício 1: PCA em Dados Sintéticos

Agora é sua vez! Vamos criar um desafio prático para você fixar o conhecimento.

**🎯 Seu desafio:**
1. Crie dados sintéticos 3D com correlações específicas
2. Aplique PCA e analise os resultados
3. Visualize antes e depois da transformação

**🎯 Dica do Pedro**: Lembre-se de centralizar os dados antes de calcular a covariância!

In [None]:
# 🏋️‍♂️ EXERCÍCIO 1: Complete o código abaixo!

np.random.seed(123)
n_samples = 300

# TODO: Crie dados 3D correlacionados
# Dica: Use np.random.multivariate_normal com uma matriz de covariância interessante

# Matriz de covariância (você pode modificar!)
cov_matrix_ex = np.array([[4, 2, 1],
                         [2, 3, 0.5],
                         [1, 0.5, 1]])

# TODO: Gere os dados usando a matriz de covariância
dados_3d = # SEU CÓDIGO AQUI

print(f"📊 Dados 3D criados: {dados_3d.shape}")

# TODO: Aplique PCA usando nossa função pca_do_pedro
resultado_3d = # SEU CÓDIGO AQUI

# TODO: Calcule quantos componentes explicam 90% da variância
var_acum = # SEU CÓDIGO AQUI
n_comp_90 = # SEU CÓDIGO AQUI

print(f"\n🎯 Componentes necessários para 90% da variância: {n_comp_90}")

# TODO: Crie uma visualização 3D dos dados originais e 2D dos transformados
# Use matplotlib para plotar side-by-side

# ESPAÇO PARA SEU CÓDIGO DE VISUALIZAÇÃO

print("\n🎉 Exercício concluído! Como ficaram seus resultados?")

## 🎮 Exercício 2: PCA para Compressão de Imagens

Agora vamos aplicar PCA para **compressão de imagens**! 📸

Vamos criar uma imagem sintética e usar PCA para comprimi-la, mantendo apenas os componentes mais importantes.

**🎯 Conceito**: Cada linha da imagem é tratada como um ponto no espaço de alta dimensionalidade. O PCA encontra as "direções principais" da variação entre as linhas.

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-10_img_04.png)

In [None]:
# 🎮 EXERCÍCIO 2: Compressão de Imagem com PCA

# Criando uma imagem sintética interessante
def criar_imagem_sintetica(altura=100, largura=100):
    """
    Cria uma imagem sintética com padrões interessantes
    """
    x = np.linspace(-2, 2, largura)
    y = np.linspace(-2, 2, altura)
    X, Y = np.meshgrid(x, y)
    
    # Padrão interessante: ondas + gradiente
    imagem = np.sin(3*X) * np.cos(3*Y) + 0.5 * (X + Y)
    
    # Normalizando para [0, 1]
    imagem = (imagem - imagem.min()) / (imagem.max() - imagem.min())
    
    return imagem

# TODO: Crie a imagem sintética
imagem_original = criar_imagem_sintetica(80, 80)

print(f"🖼️ Imagem criada: {imagem_original.shape}")

# TODO: Aplique PCA para diferentes números de componentes
# Dica: Trate cada linha da imagem como um ponto de dados

componentes_testados = [5, 10, 20, 40]
imagens_comprimidas = {}

for n_comp in componentes_testados:
    # TODO: Aplique PCA com n_comp componentes
    pca_img = PCA(n_components=n_comp)
    
    # Transforme e depois reconstrua a imagem
    # DICA: fit_transform() e depois inverse_transform()
    
    # SEU CÓDIGO AQUI
    dados_transformados = # COMPLETE
    imagem_reconstruida = # COMPLETE
    
    imagens_comprimidas[n_comp] = {
        'imagem': imagem_reconstruida,
        'variancia_explicada': pca_img.explained_variance_ratio_.sum(),
        'taxa_compressao': n_comp / imagem_original.shape[1]
    }

# TODO: Visualize os resultados
# Crie um subplot mostrando a imagem original e as compressões

fig, axes = plt.subplots(1, 5, figsize=(20, 4))

# Imagem original
axes[0].imshow(imagem_original, cmap='viridis')
axes[0].set_title('🖼️ Original')
axes[0].axis('off')

# TODO: Complete o loop de visualização
for i, n_comp in enumerate(componentes_testados):
    # SEU CÓDIGO DE VISUALIZAÇÃO AQUI
    pass

plt.tight_layout()
plt.show()

# TODO: Calcule e mostre as métricas de compressão
print("\n📊 Métricas de Compressão:")
for n_comp in componentes_testados:
    dados = imagens_comprimidas[n_comp]
    print(f"{n_comp:2d} componentes: {dados['variancia_explicada']*100:.1f}% variância, "
          f"taxa compressão: {dados['taxa_compressao']*100:.1f}%")

## 🔗 Conexões com os Módulos Anteriores

Agora que dominamos autovetores e PCA, vamos conectar com tudo que aprendemos no curso!

### 🎯 **Módulo 2 - Produto Escalar**
- A **projeção** nos componentes principais usa produto escalar!
- $PC_i = \mathbf{X} \cdot \mathbf{v}_i$ (onde $\mathbf{v}_i$ é o autovetor)

### 🎯 **Módulo 3 - Multiplicação de Matrizes**
- Toda transformação PCA é multiplicação: $\mathbf{Y} = \mathbf{X}\mathbf{V}$
- Lembra da ordem das matrizes? Crucial aqui!

### 🎯 **Módulo 6 - Transformações Lineares**
- PCA **é** uma transformação linear!
- Mudamos de base: do espaço original para o espaço dos PCs

### 🎯 **Módulo 7 - Transposta**
- Matriz de covariância: $\mathbf{C} = \mathbf{X}^T\mathbf{X}$
- Autovetores são **ortonormais** (lembra das propriedades?)

### 🎯 **Módulo 9 - SVD**
- **PLOT TWIST**: PCA e SVD são primos! 🤯
- Os autovetores da covariância são os **vetores singulares direitos** da SVD!

In [None]:
# Conectando PCA e SVD - A revelação final! 🤯

# Usando dados do Iris padronizados
X = X_iris_scaled

print("🔗 Conectando PCA e SVD - A Revelação Final!")
print("="*50)

# Método 1: PCA clássico (autovetores da matriz de covariância)
pca_classico = PCA(n_components=2)
X_pca = pca_classico.fit_transform(X)

# Método 2: SVD direto nos dados centralizados
X_centrado = X - np.mean(X, axis=0)
U, s, Vt = np.linalg.svd(X_centrado, full_matrices=False)

# Os componentes principais são as colunas de Vt.T!
componentes_svd = Vt.T[:, :2]
X_svd = X_centrado @ componentes_svd

print("🎯 Componentes Principais - PCA:")
print(pca_classico.components_.T[:, :2].round(3))

print("\n🎯 Componentes Principais - SVD:")
print(componentes_svd.round(3))

print("\n🤝 São iguais? (pode ter sinais opostos)")
for i in range(2):
    pc_pca = pca_classico.components_[i]
    pc_svd = Vt[i]
    
    # Testando se são iguais ou opostos
    igual = np.allclose(pc_pca, pc_svd) or np.allclose(pc_pca, -pc_svd)
    print(f"PC{i+1}: {igual}")

# Visualização da equivalência
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))

cores = ['red', 'green', 'blue']
for i, especie in enumerate(nomes_especies):
    mask = y_iris == i
    
    ax1.scatter(X_pca[mask, 0], X_pca[mask, 1], 
               c=cores[i], alpha=0.7, label=especie.capitalize())
    
    ax2.scatter(X_svd[mask, 0], X_svd[mask, 1], 
               c=cores[i], alpha=0.7, label=especie.capitalize())

ax1.set_title('🎯 PCA Clássico (Autovetores)', fontweight='bold')
ax1.set_xlabel('PC1')
ax1.set_ylabel('PC2')
ax1.legend()
ax1.grid(True, alpha=0.3)

ax2.set_title('🔗 SVD (Vetores Singulares)', fontweight='bold')
ax2.set_xlabel('PC1')
ax2.set_ylabel('PC2')
ax2.legend()
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print("\n🎉 LIIINDO! PCA e SVD são dois caminhos para o mesmo destino!")
print("🔗 Os autovetores da covariância = vetores singulares direitos da SVD!")
print("\n🎯 Dica do Pedro: Na prática, SVD é mais estável numericamente!")

## 🎯 Aplicações Reais dos Autovetores na IA

Bora ver onde esses conceitos aparecem no mundo real da IA! 🚀

### 🧠 **1. Redes Neurais Convolucionais (CNNs)**
- **Pooling layers** fazem uma forma de redução dimensional
- **Feature maps** capturam as "direções importantes" da imagem

### 🔍 **2. Sistemas de Recomendação**
- **Matrix Factorization**: Netflix, Spotify, Amazon
- Encontra "gostos principais" (autovetores) dos usuários

### 📊 **3. Análise de Sentimentos**
- **Embeddings** de palavras (Word2Vec, GloVe)
- PCA reduz dimensionalidade para visualização

### 🎭 **4. Reconhecimento Facial**
- **Eigenfaces**: rostos como combinação de "faces principais"
- Cada autovetor é uma "face base"

### 🏥 **5. Análise de Dados Médicos**
- Reduz milhares de genes para padrões principais
- Identifica **biomarcadores** importantes

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-10_img_05.png)

In [None]:
# Simulando um Sistema de Recomendação com PCA! 🎬

print("🎬 Simulando Netflix com PCA!")
print("="*40)

# Criando dados sintéticos de avaliação de filmes
np.random.seed(42)

# 100 usuários, 50 filmes
n_usuarios = 100
n_filmes = 50

# Tipos de usuários (gostos latentes)
tipos_usuarios = {
    'acao': [1, 0, 0],      # Gosta de ação
    'romance': [0, 1, 0],   # Gosta de romance  
    'comedia': [0, 0, 1],   # Gosta de comédia
    'misto': [0.5, 0.5, 0.5] # Gosta de tudo
}

# Tipos de filmes
tipos_filmes = np.random.choice(['acao', 'romance', 'comedia'], n_filmes)
filmes_features = np.zeros((n_filmes, 3))

for i, tipo in enumerate(tipos_filmes):
    if tipo == 'acao':
        filmes_features[i] = [1, 0, 0]
    elif tipo == 'romance':
        filmes_features[i] = [0, 1, 0]
    else:  # comédia
        filmes_features[i] = [0, 0, 1]

# Gerando preferências dos usuários
usuarios_preferencias = np.zeros((n_usuarios, 3))
for i in range(n_usuarios):
    tipo_usuario = np.random.choice(list(tipos_usuarios.keys()))
    usuarios_preferencias[i] = tipos_usuarios[tipo_usuario]
    # Adicionando um pouco de ruído
    usuarios_preferencias[i] += np.random.normal(0, 0.1, 3)

# Matriz de avaliações (usuários x filmes)
avaliacoes = usuarios_preferencias @ filmes_features.T
# Convertendo para escala 1-5 e adicionando ruído
avaliacoes = 3 + 2 * avaliacoes + np.random.normal(0, 0.3, avaliacoes.shape)
avaliacoes = np.clip(avaliacoes, 1, 5)

print(f"📊 Matriz de avaliações: {avaliacoes.shape}")
print(f"Média das avaliações: {np.mean(avaliacoes):.2f}")
print(f"Filmes por gênero: {dict(zip(*np.unique(tipos_filmes, return_counts=True)))}")

# Aplicando PCA para encontrar "gostos principais"
pca_recomendacao = PCA(n_components=3)
usuarios_pca = pca_recomendacao.fit_transform(avaliacoes)

print("\n🎯 Componentes Principais (Gostos Latentes):")
for i, var_exp in enumerate(pca_recomendacao.explained_variance_ratio_):
    print(f"Gosto {i+1}: {var_exp*100:.1f}% da variação")

# Visualização dos usuários no espaço dos gostos
fig = plt.figure(figsize=(15, 5))

# Plot 1: PC1 vs PC2
ax1 = fig.add_subplot(131)
scatter = ax1.scatter(usuarios_pca[:, 0], usuarios_pca[:, 1], 
                     c=usuarios_preferencias[:, 0], cmap='viridis', alpha=0.7)
ax1.set_xlabel('Gosto Principal 1')
ax1.set_ylabel('Gosto Principal 2')
ax1.set_title('🎭 Usuários por Gostos Latentes')
plt.colorbar(scatter, ax=ax1, label='Preferência Ação')

# Plot 2: Variância explicada
ax2 = fig.add_subplot(132)
ax2.bar(range(1, 4), pca_recomendacao.explained_variance_ratio_*100, 
        color=['#FF6B6B', '#4ECDC4', '#45B7D1'])
ax2.set_xlabel('Componente')
ax2.set_ylabel('Variância Explicada (%)')
ax2.set_title('📊 Importância dos Gostos')

# Plot 3: Heatmap dos componentes
ax3 = fig.add_subplot(133)
# Calculando quais filmes mais representam cada componente
filmes_transformados = pca_recomendacao.transform(avaliacoes.T)
im = ax3.imshow(pca_recomendacao.components_[:, :20], cmap='RdBu_r', aspect='auto')
ax3.set_xlabel('Primeiros 20 Filmes')
ax3.set_ylabel('Componentes')
ax3.set_title('🎬 Filmes vs Gostos')
plt.colorbar(im, ax=ax3)

plt.tight_layout()
plt.show()

print("\n🎉 Sistema de recomendação funcionando!")
print("📍 Cada usuário agora tem coordenadas nos 'gostos principais'")
print("📍 Usuários próximos no espaço PCA têm gostos similares!")
print("\n🎯 Dica do Pedro: Netflix usa técnicas similares, mas muito mais sofisticadas!")

## 🎊 Resumo Final: A Jornada dos Autovetores

Parabéns! 🎉 Você completou a jornada pelos **autovetores e autovalores**!

### 🧠 **O que aprendemos:**

1. **🎯 Conceito Fundamental**
   - Autovetores: direções que **não mudam** na transformação
   - Autovalores: **quanto** a direção é esticada/comprimida
   - Equação: $A\mathbf{v} = \lambda\mathbf{v}$

2. **📊 PCA (Análise de Componentes Principais)**
   - Encontra as **direções de maior variação** nos dados
   - Reduz dimensionalidade mantendo informação essencial
   - Baseado nos autovetores da matriz de covariância

3. **🔗 Conexões Profundas**
   - PCA = autovetores da covariância
   - SVD = outra forma de chegar no mesmo resultado
   - Transformações lineares em ação!

4. **🚀 Aplicações Práticas**
   - Compressão de dados/imagens
   - Sistemas de recomendação
   - Análise exploratória de dados
   - Preprocessamento para ML

### 🎯 **Dicas Finais do Pedro:**

✅ **Sempre centralize** os dados antes do PCA  
✅ **Padronize** quando as features têm escalas diferentes  
✅ **Analise a variância explicada** para escolher quantos componentes manter  
✅ **Interprete os componentes** - eles têm significado real!  
✅ **SVD é mais estável** numericamente que autovetores  

### 🏆 **Você agora domina:**
- ✅ **Módulo 1**: Vetores e Matrizes  
- ✅ **Módulo 2**: Produto Escalar  
- ✅ **Módulo 3**: Multiplicação de Matrizes  
- ✅ **Módulo 4**: NumPy  
- ✅ **Módulo 5**: Sistemas Lineares  
- ✅ **Módulo 6**: Transformações Lineares  
- ✅ **Módulo 7**: Inversa e Transposta  
- ✅ **Módulo 8**: Determinante  
- ✅ **Módulo 9**: SVD  
- ✅ **Módulo 10**: **Autovetores e PCA** 🎯

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-10_img_06.png)

In [None]:
# 🎊 CELEBRAÇÃO FINAL! 🎊

import matplotlib.patches as patches
from matplotlib.patches import FancyBboxPatch

# Criando um certificado visual! 🏆
fig, ax = plt.subplots(figsize=(16, 10))

# Fundo do certificado
fancy_box = FancyBboxPatch((0.05, 0.05), 0.9, 0.9, 
                          boxstyle="round,pad=0.02", 
                          facecolor='lightblue', 
                          edgecolor='navy', 
                          linewidth=3)
ax.add_patch(fancy_box)

# Título principal
ax.text(0.5, 0.85, '🏆 CERTIFICADO DE CONCLUSÃO 🏆', 
        fontsize=24, fontweight='bold', ha='center', va='center',
        color='navy')

ax.text(0.5, 0.75, 'ÁLGEBRA LINEAR PARA IA', 
        fontsize=20, fontweight='bold', ha='center', va='center',
        color='darkblue')

# Conteúdo
ax.text(0.5, 0.65, 'Você dominou com sucesso:', 
        fontsize=16, ha='center', va='center', color='black')

modulos = [
    '✅ Autovetores e Autovalores',
    '✅ Análise de Componentes Principais (PCA)', 
    '✅ Redução de Dimensionalidade',
    '✅ Aplicações em IA e ML',
    '✅ Conexões com SVD e Transformações'
]

y_pos = 0.55
for modulo in modulos:
    ax.text(0.5, y_pos, modulo, fontsize=14, ha='center', va='center', 
            color='darkgreen', fontweight='bold')
    y_pos -= 0.06

# Assinatura do Pedro
ax.text(0.5, 0.15, 'Pedro Nunes Guth', 
        fontsize=18, ha='center', va='center', 
        color='navy', fontweight='bold', style='italic')

ax.text(0.5, 0.08, 'Expert em IA, Matemática e AWS', 
        fontsize=12, ha='center', va='center', color='gray')

# Removendo eixos
ax.set_xlim(0, 1)
ax.set_ylim(0, 1)
ax.axis('off')

plt.tight_layout()
plt.show()

print("🎉" * 50)
print("🎊 PARABÉNS! CURSO CONCLUÍDO COM SUCESSO! 🎊")
print("🎉" * 50)
print()
print("🚀 Você agora tem uma base sólida em Álgebra Linear para IA!")
print("🧠 Entende como funcionam PCA, SVD, transformações lineares...")
print("💪 Pode aplicar esses conceitos em projetos reais de IA!")
print()
print("🎯 Próximos passos sugeridos:")
print("   📚 Deep Learning (CNNs, RNNs, Transformers)")
print("   📊 Machine Learning avançado")
print("   🔬 Estatística e Probabilidade")
print("   ☁️  MLOps e deploy na AWS")
print()
print("Obrigado por essa jornada incrível! 🙏")
print("Lembre-se: a matemática é a linguagem da IA! 🤖")
print()
print("#AlgebraLinear #IA #MachineLearning #PCA #Autovetores")
print("🎉" * 50)