# 🎯 Matrizes em Python: NumPai de Todos

## Módulo 4: Álgebra Linear para IA

**Por: Pedro Nunes Guth**

---

Bora colocar a mão na massa! 🚀 Nos módulos anteriores você aprendeu a teoria por trás de escalares, vetores e matrizes. Agora chegou a hora de fazer a mágica acontecer com Python e NumPy!

Tá, mas por que NumPy? Simples: é o **pai de todos** quando se trata de computação numérica em Python. É como se fosse o motor V8 do seu carro - você pode até não ver, mas é ele que faz tudo funcionar liindamente!

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-04_img_01.png)

## 📚 O que vamos aprender?

Neste notebook, você vai dominar:

- ✅ Criação eficiente de vetores e matrizes
- ✅ Manipulação e indexação avançada
- ✅ Operações matemáticas otimizadas
- ✅ Broadcasting: a mágica por trás das operações
- ✅ Performance: NumPy vs Python puro

```mermaid
graph TD
    A[Python Lists] -->|Lento e Ineficiente| B[Problemas de Performance]
    C[NumPy Arrays] -->|Rápido e Otimizado| D[Operações Vetorizadas]
    D --> E[Machine Learning Eficiente]
    E --> F[IA de Alto Performance]
```

In [None]:
# Primeiro, vamos importar nosso NumPai de todos! 🎉
import numpy as np
import matplotlib.pyplot as plt
import time

# Configurações para visualização
plt.rcParams['figure.figsize'] = (10, 6)
np.set_printoptions(precision=3, suppress=True)

print("🎯 NumPy versão:", np.__version__)
print("💪 Pronto para dominar as matrizes!")

## 🎯 Seção 1: Criando Vetores - Os Blocos Fundamentais

Lembra dos vetores que vimos no Módulo 1? Agora vamos criar eles na prática! Um vetor em NumPy é como uma fila de números organizados, tipo aquela fila do pão de açúcar - cada posição tem seu valor específico.

Matematicamente, um vetor $\vec{v}$ pode ser representado como:

$$\vec{v} = \begin{pmatrix} v_1 \\ v_2 \\ \vdots \\ v_n \end{pmatrix}$$

**Dica do Pedro:** NumPy arrays são MUITO mais eficientes que listas Python. É como comparar uma Ferrari com uma carroça! 🏎️

In [None]:
# Várias formas de criar vetores

# 1. A partir de uma lista Python
vetor_lista = np.array([1, 2, 3, 4, 5])
print("Vetor da lista:", vetor_lista)
print("Tipo:", type(vetor_lista))
print("Shape (formato):", vetor_lista.shape)
print("Dimensões:", vetor_lista.ndim)
print()

# 2. Usando funções especiais do NumPy
zeros = np.zeros(5)  # Vetor de zeros
ones = np.ones(5)    # Vetor de uns
range_vec = np.arange(0, 10, 2)  # De 0 a 10, pulando de 2 em 2
linspace_vec = np.linspace(0, 1, 5)  # 5 pontos entre 0 e 1

print("Zeros:", zeros)
print("Ones:", ones)
print("Range:", range_vec)
print("Linspace:", linspace_vec)
print()

# 3. Vetores aleatórios (muito usados em IA!)
np.random.seed(42)  # Para resultados reproduzíveis
random_vec = np.random.random(5)  # Entre 0 e 1
normal_vec = np.random.normal(0, 1, 5)  # Distribuição normal

print("Random:", random_vec)
print("Normal:", normal_vec)

## 🔢 Seção 2: Matrizes - O Poder dos Dados Organizados

Agora vamos para as matrizes! Lembra do Módulo 1 onde vimos que uma matriz é como uma tabela de números? É exatamente isso que vamos criar aqui.

Uma matriz $A$ de dimensão $m \times n$ é representada como:

$$A = \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix}$$

**Dica do Pedro:** Pense numa matriz como uma planilha do Excel - linhas e colunas organizadas perfeitamente! 📊

In [None]:
# Criando matrizes de diferentes formas

# 1. A partir de listas aninhadas
matriz_2x3 = np.array([[1, 2, 3], 
                       [4, 5, 6]])
print("Matriz 2x3:")
print(matriz_2x3)
print("Shape:", matriz_2x3.shape)
print("Dimensões:", matriz_2x3.ndim)
print()

# 2. Matrizes especiais
matriz_zeros = np.zeros((3, 4))  # 3 linhas, 4 colunas
matriz_ones = np.ones((2, 5))
matriz_identidade = np.eye(4)  # Matriz identidade 4x4
matriz_diagonal = np.diag([1, 2, 3, 4])  # Matriz diagonal

print("Matriz de zeros (3x4):")
print(matriz_zeros)
print()

print("Matriz identidade (4x4):")
print(matriz_identidade)
print()

# 3. Reshaping - mudando o formato
vetor_original = np.arange(12)
matriz_3x4 = vetor_original.reshape(3, 4)
matriz_2x6 = vetor_original.reshape(2, 6)

print("Vetor original:", vetor_original)
print("\nReshape para 3x4:")
print(matriz_3x4)
print("\nReshape para 2x6:")
print(matriz_2x6)

## 🎯 Indexação e Slicing - Navegando pela Matriz

Tá, mas como acessar elementos específicos da matriz? É como encontrar um assento específico no estádio do Maracanã - você precisa da setor (linha) e da cadeira (coluna)!

A indexação em NumPy usa a notação: `array[linha, coluna]`

**Dica do Pedro:** Lembre-se que Python começa contando do 0, não do 1! É como andar de elevador - térreo é 0! 🏢

In [None]:
# Criando uma matriz para demonstrar indexação
matriz_demo = np.array([[10, 20, 30, 40],
                        [50, 60, 70, 80],
                        [90, 100, 110, 120]])

print("Matriz original:")
print(matriz_demo)
print()

# Acessando elementos individuais
print("Elemento [0,0]:", matriz_demo[0, 0])  # Primeiro elemento
print("Elemento [1,2]:", matriz_demo[1, 2])  # Segunda linha, terceira coluna
print("Último elemento:", matriz_demo[-1, -1])  # Índices negativos!
print()

# Slicing - pegando pedaços da matriz
print("Primeira linha completa:", matriz_demo[0, :])  # : significa "todos"
print("Segunda coluna completa:", matriz_demo[:, 1])
print("Submatriz 2x2 do canto superior esquerdo:")
print(matriz_demo[0:2, 0:2])
print()

# Indexação avançada
linhas_desejadas = [0, 2]  # Primeira e terceira linha
colunas_desejadas = [1, 3]  # Segunda e quarta coluna
print("Submatriz com linhas [0,2] e colunas [1,3]:")
print(matriz_demo[np.ix_(linhas_desejadas, colunas_desejadas)])

## ⚡ Seção 3: Operações Matemáticas - Revendo os Conceitos

Agora vamos implementar na prática as operações que vimos no Módulo 2 (vetores) e Módulo 3 (matrizes)!

### Produto Escalar (Dot Product)
Lembra da fórmula do produto escalar? Para dois vetores $\vec{a}$ e $\vec{b}$:

$$\vec{a} \cdot \vec{b} = \sum_{i=1}^{n} a_i b_i = a_1b_1 + a_2b_2 + \cdots + a_nb_n$$

### Multiplicação de Matrizes
Para matrizes $A_{m \times k}$ e $B_{k \times n}$, o elemento $(i,j)$ do produto é:

$$C_{ij} = \sum_{k=1}^{K} A_{ik} B_{kj}$$

**Dica do Pedro:** NumPy faz tudo isso numa velocidade absurda usando otimizações em C! É magia pura! ✨

In [None]:
# Operações com vetores (revisando Módulo 2)
vetor_a = np.array([1, 2, 3])
vetor_b = np.array([4, 5, 6])

print("Vetor A:", vetor_a)
print("Vetor B:", vetor_b)
print()

# Operações básicas
soma = vetor_a + vetor_b
subtracao = vetor_a - vetor_b
multiplicacao_elemento = vetor_a * vetor_b  # Element-wise!

print("Soma:", soma)
print("Subtração:", subtracao)
print("Mult. elemento a elemento:", multiplicacao_elemento)
print()

# Produto escalar (DOT PRODUCT) - super importante para IA!
produto_escalar = np.dot(vetor_a, vetor_b)
# Ou pode usar o operador @
produto_escalar_2 = vetor_a @ vetor_b

print("Produto escalar:", produto_escalar)
print("Usando @:", produto_escalar_2)
print()

# Norma do vetor (comprimento)
norma_a = np.linalg.norm(vetor_a)
print(f"Norma do vetor A: {norma_a:.3f}")

# Similaridade por cosseno (muito usado em IA!)
similaridade = produto_escalar / (np.linalg.norm(vetor_a) * np.linalg.norm(vetor_b))
print(f"Similaridade por cosseno: {similaridade:.3f}")

In [None]:
# Operações com matrizes (revisando Módulo 3)
matriz_A = np.array([[1, 2], 
                     [3, 4]])

matriz_B = np.array([[5, 6], 
                     [7, 8]])

print("Matriz A:")
print(matriz_A)
print("\nMatriz B:")
print(matriz_B)
print()

# Operações elemento a elemento
soma_matrizes = matriz_A + matriz_B
mult_elemento = matriz_A * matriz_B

print("Soma das matrizes:")
print(soma_matrizes)
print("\nMultiplicação elemento a elemento:")
print(mult_elemento)
print()

# MULTIPLICAÇÃO DE MATRIZES (a verdadeira!)
produto_matricial = np.dot(matriz_A, matriz_B)
# Ou usando @
produto_matricial_2 = matriz_A @ matriz_B

print("Produto matricial (A × B):")
print(produto_matricial)
print("\nUsando @:")
print(produto_matricial_2)

# Verificando se são iguais
print("\nSão iguais?", np.array_equal(produto_matricial, produto_matricial_2))

## 🎨 Visualizando Matrizes

Uma imagem vale mais que mil palavras! Vamos visualizar nossas matrizes para entender melhor o que está acontecendo.

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-04_img_02.png)

In [None]:
# Criando uma matriz interessante para visualizar
x = np.linspace(-2, 2, 50)
y = np.linspace(-2, 2, 50)
X, Y = np.meshgrid(x, y)
Z = np.sin(X) * np.cos(Y)  # Função matemática bonita!

# Criando subplots
fig, axes = plt.subplots(1, 3, figsize=(15, 4))

# Heatmap da matriz
im1 = axes[0].imshow(Z, cmap='viridis', extent=[-2, 2, -2, 2])
axes[0].set_title('Heatmap da Matriz')
axes[0].set_xlabel('X')
axes[0].set_ylabel('Y')
plt.colorbar(im1, ax=axes[0])

# Gráfico 3D (representação de superfície)
im2 = axes[1].contour(X, Y, Z, levels=20)
axes[1].set_title('Contorno da Matriz')
axes[1].set_xlabel('X')
axes[1].set_ylabel('Y')

# Uma matriz simples
matriz_simples = np.random.rand(10, 10)
im3 = axes[2].imshow(matriz_simples, cmap='hot')
axes[2].set_title('Matriz Aleatória 10x10')
plt.colorbar(im3, ax=axes[2])

plt.tight_layout()
plt.show()

print("Liiiindo! Agora você pode VER as matrizes! 🎨")

## 🚀 Broadcasting - A Mágica do NumPy

Broadcasting é o superpoder do NumPy! É como ele consegue fazer operações entre arrays de tamanhos diferentes. É tipo aquele amigo que sempre se adapta a qualquer situação! 😄

**Regras do Broadcasting:**
1. Se os arrays têm dimensões diferentes, o menor é "esticado"
2. Se as dimensões não são compatíveis, dá erro
3. O resultado tem o tamanho do maior array

```mermaid
graph LR
    A[Array 3x3] -->|Broadcasting| C[Resultado 3x3]
    B[Array 1x3] -->|Broadcasting| C
    D[Escalar] -->|Broadcasting| A
```

**Dica do Pedro:** Broadcasting é fundamental para eficiência em IA - evita loops desnecessários! 🏃‍♂️💨

In [None]:
# Exemplos de Broadcasting

# 1. Escalar com matriz
matriz = np.array([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])

escalar = 10
resultado_escalar = matriz + escalar  # Soma 10 a cada elemento!

print("Matriz original:")
print(matriz)
print("\nMatriz + 10 (broadcasting):")
print(resultado_escalar)
print()

# 2. Vetor com matriz
vetor_linha = np.array([10, 20, 30])  # Shape: (3,)
resultado_vetor = matriz + vetor_linha  # Soma o vetor a cada linha!

print("Vetor:", vetor_linha)
print("\nMatriz + Vetor (broadcasting):")
print(resultado_vetor)
print()

# 3. Exemplo mais complexo
matriz_2d = np.ones((4, 3))
vetor_coluna = np.array([[1], [2], [3], [4]])  # Shape: (4, 1)
vetor_linha_2 = np.array([10, 20, 30])  # Shape: (3,)

# Broadcasting mágico!
resultado_complexo = matriz_2d + vetor_coluna + vetor_linha_2

print("Broadcasting complexo:")
print("Matriz 4x3 + Vetor coluna 4x1 + Vetor linha 1x3")
print(resultado_complexo)

## ⚡ Performance - Por que NumPy é Tão Rápido?

Vamos fazer um teste prático! NumPy é implementado em C e usa **operações vetorizadas**. É como comparar um carro de Fórmula 1 com uma carroça!

**Dica do Pedro:** Em IA, performance é CRUCIAL. Uma operação que demora 1 segundo pode demorar horas quando repetida milhões de vezes! ⏱️

In [None]:
# Teste de performance: Python puro vs NumPy

# Criando dados grandes
tamanho = 1000000  # 1 milhão de elementos
lista_python_1 = list(range(tamanho))
lista_python_2 = list(range(tamanho, 2*tamanho))

array_numpy_1 = np.arange(tamanho)
array_numpy_2 = np.arange(tamanho, 2*tamanho)

print(f"Testando com {tamanho:,} elementos")
print("="*50)

# Teste 1: Soma com Python puro
inicio = time.time()
resultado_python = [a + b for a, b in zip(lista_python_1, lista_python_2)]
tempo_python = time.time() - inicio

print(f"Python puro: {tempo_python:.4f} segundos")

# Teste 2: Soma com NumPy
inicio = time.time()
resultado_numpy = array_numpy_1 + array_numpy_2
tempo_numpy = time.time() - inicio

print(f"NumPy:       {tempo_numpy:.4f} segundos")

# Calculando o speedup
speedup = tempo_python / tempo_numpy
print(f"\n🚀 NumPy é {speedup:.1f}x mais rápido!")

# Verificando se os resultados são iguais
print(f"\nResultados iguais? {np.array_equal(resultado_python, resultado_numpy)}")

## 📊 Gráfico de Performance

Vamos visualizar como a performance varia com o tamanho dos dados:

In [None]:
# Testando diferentes tamanhos
tamanhos = [1000, 5000, 10000, 50000, 100000, 500000]
tempos_python = []
tempos_numpy = []

for tam in tamanhos:
    # Dados de teste
    lista_1 = list(range(tam))
    lista_2 = list(range(tam, 2*tam))
    array_1 = np.arange(tam)
    array_2 = np.arange(tam, 2*tam)
    
    # Teste Python
    inicio = time.time()
    _ = [a + b for a, b in zip(lista_1, lista_2)]
    tempos_python.append(time.time() - inicio)
    
    # Teste NumPy
    inicio = time.time()
    _ = array_1 + array_2
    tempos_numpy.append(time.time() - inicio)

# Plotando os resultados
plt.figure(figsize=(12, 6))

plt.subplot(1, 2, 1)
plt.plot(tamanhos, tempos_python, 'ro-', label='Python Puro', linewidth=2)
plt.plot(tamanhos, tempos_numpy, 'bo-', label='NumPy', linewidth=2)
plt.xlabel('Tamanho dos Arrays')
plt.ylabel('Tempo (segundos)')
plt.title('Comparação de Performance')
plt.legend()
plt.grid(True, alpha=0.3)

plt.subplot(1, 2, 2)
speedups = [p/n for p, n in zip(tempos_python, tempos_numpy)]
plt.bar(range(len(tamanhos)), speedups, color='green', alpha=0.7)
plt.xlabel('Tamanho dos Arrays')
plt.ylabel('Speedup (vezes mais rápido)')
plt.title('Aceleração do NumPy')
plt.xticks(range(len(tamanhos)), [f'{t//1000}k' for t in tamanhos])
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print("NumPy não é brincadeira! Olha essa performance! 🚀")

## 🎯 Aplicações Práticas para IA

Agora vamos ver como essas operações se conectam com Inteligência Artificial! Lembra que estamos construindo a base para entender redes neurais?

### Exemplo 1: Camada Linear de uma Rede Neural

Uma camada linear faz exatamente a multiplicação que vimos no Módulo 3:

$$\vec{y} = W \vec{x} + \vec{b}$$

Onde:
- $W$ é a matriz de pesos
- $\vec{x}$ é o vetor de entrada
- $\vec{b}$ é o vetor de bias
- $\vec{y}$ é a saída

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-04_img_03.png)

In [None]:
# Simulando uma camada linear simples

# Parâmetros da camada
entrada_dim = 4  # 4 features de entrada
saida_dim = 3    # 3 neurônios na saída

# Inicializando pesos aleatórios (como numa rede neural real!)
np.random.seed(42)
W = np.random.randn(saida_dim, entrada_dim) * 0.5  # Matriz de pesos
b = np.random.randn(saida_dim) * 0.1               # Vetor de bias

print("Matriz de pesos W (3x4):")
print(W)
print("\nVetor de bias b:")
print(b)
print()

# Entrada exemplo (poderia ser uma imagem processada, texto, etc.)
x = np.array([1.0, 2.0, -0.5, 3.0])
print("Entrada x:", x)

# Operação da camada linear: y = Wx + b
y = W @ x + b  # Aqui está a mágica!

print("\nSaída y = Wx + b:")
print(y)

# Em redes neurais, geralmente aplicamos uma função de ativação
# Exemplo: ReLU (Rectified Linear Unit)
y_relu = np.maximum(0, y)  # ReLU: max(0, x)
print("\nApós ReLU:")
print(y_relu)

print("\n🧠 Parabéns! Você acabou de implementar uma camada neural!")

### Exemplo 2: Calculando Similaridades (Base para Sistemas de Recomendação)

Vamos usar o produto escalar do Módulo 2 para calcular similaridades entre usuários:

In [None]:
# Sistema de recomendação simples usando similaridade por cosseno

# Matriz de preferências: cada linha é um usuário, cada coluna é um filme
# Valores de 1-5 (nota que o usuário daria)
preferencias = np.array([
    [5, 3, 0, 1, 4],  # Usuário 1
    [3, 1, 0, 2, 3],  # Usuário 2  
    [4, 3, 0, 1, 5],  # Usuário 3
    [3, 3, 0, 5, 4],  # Usuário 4
    [0, 0, 0, 2, 0],  # Usuário 5
])

filmes = ['Vingadores', 'Romance', 'Terror', 'Comédia', 'Ficção']
usuarios = ['Ana', 'Bruno', 'Carlos', 'Diana', 'Eduardo']

print("Matriz de Preferências:")
print("Usuários x Filmes")
print(preferencias)
print()

# Calculando similaridade entre todos os usuários
def similaridade_cosseno(u1, u2):
    """Calcula similaridade por cosseno entre dois vetores"""
    dot_product = np.dot(u1, u2)
    norma_u1 = np.linalg.norm(u1)
    norma_u2 = np.linalg.norm(u2)
    
    if norma_u1 == 0 or norma_u2 == 0:
        return 0
    
    return dot_product / (norma_u1 * norma_u2)

# Matriz de similaridades
n_usuarios = len(usuarios)
matriz_similaridade = np.zeros((n_usuarios, n_usuarios))

for i in range(n_usuarios):
    for j in range(n_usuarios):
        matriz_similaridade[i, j] = similaridade_cosseno(preferencias[i], preferencias[j])

print("Matriz de Similaridade:")
print(matriz_similaridade.round(3))
print()

# Encontrando usuários mais similares à Ana (usuário 0)
ana_similaridades = matriz_similaridade[0, 1:]  # Excluindo ela mesma
usuario_mais_similar = np.argmax(ana_similaridades) + 1  # +1 porque pulamos Ana

print(f"Usuário mais similar à Ana: {usuarios[usuario_mais_similar]}")
print(f"Similaridade: {ana_similaridades[usuario_mais_similar-1]:.3f}")

print("\n🎬 Sistema de recomendação básico funcionando!")

## 🏋️ Exercício Prático 1: Construindo uma Mini Rede Neural

Agora é sua vez! Vamos construir uma rede neural simples para classificar se um número é positivo ou negativo.

**Sua missão:**
1. Criar dados de treino
2. Implementar forward pass
3. Calcular a acurácia

In [None]:
# EXERCÍCIO 1: Complete o código abaixo

# 1. Criar dados de treino
np.random.seed(42)
X = np.random.randn(100, 1)  # 100 amostras, 1 feature
y = (X > 0).astype(int).flatten()  # 1 se positivo, 0 se negativo

print("Primeiros 10 exemplos:")
for i in range(10):
    print(f"X[{i}] = {X[i,0]:.3f} -> y[{i}] = {y[i]}")
print()

# 2. Parâmetros da rede neural
# TODO: Complete os parâmetros
W1 = np.random.randn(5, 1) * 0.5   # Primeira camada: 1 -> 5 neurônios
b1 = np.zeros(5)                   # Bias primeira camada
W2 = np.random.randn(1, 5) * 0.5   # Segunda camada: 5 -> 1 neurônio
b2 = np.zeros(1)                   # Bias segunda camada

def sigmoid(x):
    """Função sigmoide"""
    return 1 / (1 + np.exp(-np.clip(x, -500, 500)))  # Clip para evitar overflow

def forward_pass(X):
    """Forward pass da rede neural"""
    # TODO: Implemente o forward pass
    # Dica: z1 = X @ W1.T + b1, a1 = relu(z1), z2 = a1 @ W2.T + b2, a2 = sigmoid(z2)
    
    z1 = X @ W1.T + b1                    # Primeira camada linear
    a1 = np.maximum(0, z1)               # ReLU
    z2 = a1 @ W2.T + b2                  # Segunda camada linear  
    a2 = sigmoid(z2)                     # Sigmoide (probabilidade)
    
    return a2

# 3. Fazer predições
predictions = forward_pass(X)
predicted_classes = (predictions > 0.5).astype(int).flatten()

# 4. Calcular acurácia
accuracy = np.mean(predicted_classes == y)
print(f"Acurácia: {accuracy:.2%}")

# Mostrar alguns resultados
print("\nPrimeiras 10 predições:")
for i in range(10):
    prob = predictions[i, 0]
    pred = predicted_classes[i]
    real = y[i]
    status = "✓" if pred == real else "✗"
    print(f"X={X[i,0]:6.3f} | Prob={prob:.3f} | Pred={pred} | Real={real} {status}")

## 🎲 Exercício Prático 2: Análise de Componentes Principais (Preparação para Módulo 10)

Vamos ter um gostinho do que vem no Módulo 10! Use NumPy para fazer uma análise simples de dados.

**Sua missão:**
1. Gerar dados 2D correlacionados
2. Calcular matriz de covariância
3. Visualizar os dados

In [None]:
# EXERCÍCIO 2: Análise exploratória com NumPy

# 1. Gerar dados correlacionados
np.random.seed(42)
n_samples = 200

# TODO: Complete o código para gerar dados correlacionados
# Dica: Use uma transformação linear para criar correlação

# Dados base (não correlacionados)
data_base = np.random.randn(n_samples, 2)

# Matriz de transformação para criar correlação
transform_matrix = np.array([[2, 1.5],
                            [0.5, 1]])

# Aplicar transformação
data_transformed = data_base @ transform_matrix.T

print("Forma dos dados:", data_transformed.shape)
print("Primeiras 5 amostras:")
print(data_transformed[:5])
print()

# 2. Calcular estatísticas
# TODO: Calcule média, desvio padrão e matriz de covariância

media = np.mean(data_transformed, axis=0)
desvio = np.std(data_transformed, axis=0)
cov_matrix = np.cov(data_transformed.T)

print("Média:", media)
print("Desvio padrão:", desvio)
print("\nMatriz de Covariância:")
print(cov_matrix)
print(f"\nCorrelação entre X e Y: {cov_matrix[0,1] / (desvio[0] * desvio[1]):.3f}")

In [None]:
# 3. Visualizar os dados
fig, axes = plt.subplots(1, 3, figsize=(15, 4))

# Dados originais
axes[0].scatter(data_base[:, 0], data_base[:, 1], alpha=0.6, c='blue')
axes[0].set_title('Dados Originais (Não Correlacionados)')
axes[0].set_xlabel('X')
axes[0].set_ylabel('Y')
axes[0].grid(True, alpha=0.3)
axes[0].axis('equal')

# Dados transformados
axes[1].scatter(data_transformed[:, 0], data_transformed[:, 1], alpha=0.6, c='red')
axes[1].set_title('Dados Transformados (Correlacionados)')
axes[1].set_xlabel('X')
axes[1].set_ylabel('Y')
axes[1].grid(True, alpha=0.3)

# Matriz de covariância como heatmap
im = axes[2].imshow(cov_matrix, cmap='RdBu', center=0)
axes[2].set_title('Matriz de Covariância')
axes[2].set_xticks([0, 1])
axes[2].set_yticks([0, 1])
axes[2].set_xticklabels(['X', 'Y'])
axes[2].set_yticklabels(['X', 'Y'])

# Adicionando valores na matriz
for i in range(2):
    for j in range(2):
        axes[2].text(j, i, f'{cov_matrix[i,j]:.2f}', 
                    ha='center', va='center', fontsize=12, color='white')

plt.colorbar(im, ax=axes[2])
plt.tight_layout()
plt.show()

print("🎯 Ótimo trabalho! Você acabou de fazer uma análise exploratória completa!")
print("No Módulo 10, vamos aprofundar isso com PCA e autovetores! 🚀")

## 🔧 Funções Úteis do NumPy para IA

Antes de terminar, vamos ver algumas funções que você VAI usar muito em projetos de IA:

**Dica do Pedro:** Salve esta célula como referência! São as funções que mais uso no dia a dia! 📌

In [None]:
# Cheat Sheet: Funções essenciais do NumPy para IA

print("🎯 CHEAT SHEET NUMPY PARA IA")
print("="*40)

# 1. Criação de arrays
print("\n1. CRIAÇÃO:")
print("np.zeros((3,3))     - Matriz de zeros")
print("np.ones((3,3))      - Matriz de uns")
print("np.eye(3)           - Matriz identidade")
print("np.random.randn(3,3) - Números aleatórios (normal)")
print("np.arange(10)       - Sequência [0,1,2...9]")
print("np.linspace(0,1,5)  - 5 pontos entre 0 e 1")

# 2. Operações matemáticas
print("\n2. OPERAÇÕES:")
print("a @ b               - Multiplicação de matrizes")
print("np.dot(a, b)        - Produto escalar/matricial")
print("np.linalg.norm(a)   - Norma do vetor")
print("np.sum(a, axis=0)   - Soma por colunas")
print("np.mean(a, axis=1)  - Média por linhas")
print("np.max(a), np.min(a) - Máximo e mínimo")

# 3. Manipulação de forma
print("\n3. MANIPULAÇÃO:")
print("a.reshape(2, 3)     - Mudar formato")
print("a.T                 - Transposta")
print("a.flatten()         - Achatar array")
print("np.concatenate()    - Juntar arrays")
print("np.split()          - Dividir arrays")

# 4. Funções para IA
print("\n4. ESPECÍFICAS PARA IA:")
print("np.argmax(a)        - Índice do maior elemento")
print("np.where(condition) - Índices onde condição é True")
print("np.clip(a, min, max) - Limitar valores")
print("np.exp(a)           - Exponencial (softmax, sigmoid)")
print("np.log(a)           - Logaritmo (loss functions)")

# Exemplos práticos
print("\n\n🔥 EXEMPLOS PRÁTICOS:")
print("="*30)

# Softmax (muito usado em classificação!)
logits = np.array([2.0, 1.0, 0.1])
exp_logits = np.exp(logits)
softmax = exp_logits / np.sum(exp_logits)
print(f"Softmax: {logits} -> {softmax.round(3)}")

# One-hot encoding
classes = np.array([0, 1, 2, 1, 0])
n_classes = 3
one_hot = np.eye(n_classes)[classes]
print(f"\nOne-hot: {classes}")
print(one_hot)

# Normalização (muito importante!)
data = np.random.randn(5, 3)
normalized = (data - np.mean(data, axis=0)) / np.std(data, axis=0)
print(f"\nNormalização - antes média: {np.mean(data, axis=0).round(3)}")
print(f"Depois média: {np.mean(normalized, axis=0).round(3)}")

## 🎯 Resumo e Próximos Passos

Parabéns! 🎉 Você acabou de dominar o NumPy - a base de TUDO em IA com Python!

### O que você aprendeu:

✅ **Criação eficiente** de vetores e matrizes  
✅ **Operações matemáticas** otimizadas (produtos escalar e matricial)  
✅ **Broadcasting** - a mágica do NumPy  
✅ **Performance** - Por que NumPy é essencial  
✅ **Aplicações práticas** em IA (redes neurais, sistemas de recomendação)  

### Conexões com outros módulos:

```mermaid
graph TD
    A[Módulo 1-3: Teoria] --> B[Módulo 4: NumPy - ATUAL]
    B --> C[Módulo 5: Sistemas Lineares]
    B --> D[Módulo 6: Transformações]
    B --> E[Módulo 7: Inversa/Transposta]
    B --> F[Módulo 8: Determinante]
    B --> G[Módulo 9: SVD]
    B --> H[Módulo 10: PCA/Autovetores]
```

### Próximo módulo:
**Módulo 5: Sistemas de Equações Lineares** - Vamos resolver problemas reais usando as ferramentas que você acabou de aprender!

**Dica do Pedro Final:** Pratique! Crie seus próprios arrays, experimente com diferentes operações. NumPy é como andar de bicicleta - quanto mais você pratica, mais natural fica! 🚴‍♂️

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-04_img_04.png)

---

## 📚 Recursos Extras

**Para se aprofundar:**
- Documentação oficial do NumPy
- NumPy User Guide
- Curso "Álgebra Linear para IA" - Módulos seguintes

**Até o próximo módulo!** 🚀

*Pedro Nunes Guth - Expert em IA e Matemática*