# üéØ Opera√ß√µes com Matrizes: O Jogo das Camadas

## *M√≥dulo 3: Soma, Subtra√ß√£o e Multiplica√ß√£o - Por que a Ordem Importa nas Redes Neurais*

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-03_img_01.png)

---

**Opa, pessoal! üëã Pedro Guth aqui!**

Lembra quando falamos sobre vetores no m√≥dulo anterior? T√°, mas e quando a coisa fica mais complexa? Quando temos **m√∫ltiplas dimens√µes** trabalhando juntas?

√â a√≠ que entram as **opera√ß√µes com matrizes** - o verdadeiro cora√ß√£o de qualquer rede neural! 

Pensa assim: se um vetor √© como uma **fila de pessoas**, uma matriz √© como um **pr√©dio inteiro** com v√°rias fileiras. E quando esses "pr√©dios" se encontram... a√≠ que a m√°gica acontece! ‚ú®

In [None]:
# Bora configurar nosso ambiente!
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from matplotlib.patches import Rectangle
import warnings
warnings.filterwarnings('ignore')

# Configura√ß√£o dos gr√°ficos - deixa mais lindo!
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12

print("üöÄ Ambiente configurado! Bora pro jogo das matrizes!")

## üß† Por que Matrizes s√£o o Cora√ß√£o das Redes Neurais?

T√°, mas vamos come√ßar do b√°sico. Lembra dos vetores que vimos no **M√≥dulo 2**? 

Uma **matriz** nada mais √© que uma **cole√ß√£o organizada de vetores**! √â como se fosse um **arquivo Excel** onde cada linha ou coluna representa informa√ß√µes diferentes.

### üìä A Anatomia de uma Matriz

Uma matriz $A$ de dimens√µes $m \times n$ tem esta cara:

$$A = \begin{bmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{bmatrix}$$

Onde:
- $m$ = n√∫mero de **linhas** (quantas "fileiras" temos)
- $n$ = n√∫mero de **colunas** (quantas "posi√ß√µes" em cada fileira)
- $a_{ij}$ = elemento na posi√ß√£o linha $i$, coluna $j$

### üéØ Conex√£o com Redes Neurais

Em uma rede neural:
- **Cada linha** pode representar um **neur√¥nio**
- **Cada coluna** pode representar uma **conex√£o** com a camada anterior
- **Cada elemento** $a_{ij}$ √© o **peso** da conex√£o entre neur√¥nio $i$ e entrada $j$

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-03_img_02.png)

**üî• Dica do Pedro**: Sempre pense em matrizes como **transforma√ß√µes**. Elas pegam um conjunto de dados de entrada e **transformam** em algo novo!

In [None]:
# Vamos criar nossas primeiras matrizes!
print("üèóÔ∏è Construindo nossas matrizes exemplo")
print("="*50)

# Matriz A - Vamos imaginar que s√£o os pesos de 3 neur√¥nios conectados a 4 entradas
A = np.array([[1, 2, 3, 4],
              [5, 6, 7, 8],
              [9, 10, 11, 12]])

# Matriz B - Outra camada com as mesmas dimens√µes
B = np.array([[2, 1, 4, 3],
              [6, 5, 8, 7],
              [10, 9, 12, 11]])

print(f"Matriz A (3√ó4):")
print(A)
print(f"\nDimens√µes de A: {A.shape}")

print(f"\nMatriz B (3√ó4):")
print(B)
print(f"\nDimens√µes de B: {B.shape}")

print("\nüí° Pensa assim: cada linha √© um neur√¥nio, cada coluna uma conex√£o!")

## ‚ûï Soma de Matrizes: Quando os Neur√¥nios Se Juntam

A soma de matrizes √© **moleza**! √â como somar **posi√ß√£o por posi√ß√£o**, tipo quando voc√™ junta duas turmas de alunos nas mesmas carteiras.

### üìê A Matem√°tica por Tr√°s

Para duas matrizes $A$ e $B$ de **mesmas dimens√µes** $m \times n$:

$$C = A + B \quad \text{onde} \quad c_{ij} = a_{ij} + b_{ij}$$

**IMPORTANTE**: S√≥ podemos somar matrizes que t√™m **exatamente as mesmas dimens√µes**!

### üß† Na Pr√°tica das Redes Neurais

A soma aparece principalmente quando:
- **Adicionamos bias** aos neur√¥nios
- **Combinamos gradientes** durante o backpropagation
- **Fazemos ensemble** de diferentes redes

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-03_img_03.png)

**üî• Dica do Pedro**: A soma √© **comutativa** ($A + B = B + A$) e **associativa** ($A + (B + C) = (A + B) + C$). Matem√°tica linda, n√©?

In [None]:
# Bora somar nossas matrizes!
print("‚ûï SOMA DE MATRIZES - O Encontro dos Neur√¥nios")
print("="*50)

# Soma elemento por elemento
C_soma = A + B

print("Matriz A:")
print(A)
print("\nMatriz B:")
print(B)
print("\nA + B =")
print(C_soma)

# Vamos verificar posi√ß√£o por posi√ß√£o
print("\nüîç Verificando algumas posi√ß√µes:")
print(f"A[0,0] + B[0,0] = {A[0,0]} + {B[0,0]} = {C_soma[0,0]}")
print(f"A[1,2] + B[1,2] = {A[1,2]} + {B[1,2]} = {C_soma[1,2]}")
print(f"A[2,3] + B[2,3] = {A[2,3]} + {B[2,3]} = {C_soma[2,3]}")

# Testando propriedades
print("\nüßÆ Testando propriedades matem√°ticas:")
print(f"A + B = B + A? {np.array_equal(A + B, B + A)}")
print("Comutatividade confirmada! üéâ")

## ‚ûñ Subtra√ß√£o de Matrizes: A Diferen√ßa que Faz Diferen√ßa

A subtra√ß√£o funciona **igualzinho** √† soma, s√≥ que... subtraindo! üòÑ

### üìê F√≥rmula Matem√°tica

$$D = A - B \quad \text{onde} \quad d_{ij} = a_{ij} - b_{ij}$$

### üéØ Onde Usamos na IA

- **C√°lculo de gradientes**: diferen√ßa entre pesos atuais e anteriores
- **Fun√ß√£o de perda**: diferen√ßa entre predi√ß√£o e valor real
- **Regulariza√ß√£o**: penalizando pesos muito grandes

**üî• Dica do Pedro**: Ao contr√°rio da soma, a subtra√ß√£o **N√ÉO √© comutativa**! $A - B \neq B - A$ (na verdade, $A - B = -(B - A)$)

In [None]:
# Agora vamos subtrair!
print("‚ûñ SUBTRA√á√ÉO DE MATRIZES - Encontrando as Diferen√ßas")
print("="*50)

C_sub = A - B

print("A - B =")
print(C_sub)

print("\nB - A =")
print(B - A)

print("\nüîç Verificando que n√£o √© comutativa:")
print(f"A - B = B - A? {np.array_equal(A - B, B - A)}")
print(f"Mas A - B = -(B - A)? {np.array_equal(A - B, -(B - A))}")

# Exemplo pr√°tico: calculando "erro" entre duas predi√ß√µes
print("\nüéØ Exemplo pr√°tico - Diferen√ßa de predi√ß√µes:")
predicao_modelo1 = np.array([[0.8, 0.2], [0.6, 0.4]])
predicao_modelo2 = np.array([[0.7, 0.3], [0.5, 0.5]])

diferenca = predicao_modelo1 - predicao_modelo2
print("Diferen√ßa entre modelos:")
print(diferenca)
print(f"\nDiferen√ßa m√©dia absoluta: {np.abs(diferenca).mean():.3f}")

## üìä Visualizando as Opera√ß√µes

In [None]:
# Vamos visualizar nossas opera√ß√µes!
fig, axes = plt.subplots(2, 2, figsize=(15, 10))

# Matriz A
im1 = axes[0,0].imshow(A, cmap='Blues', aspect='auto')
axes[0,0].set_title('Matriz A\n(Pesos da Camada 1)', fontsize=14, fontweight='bold')
for i in range(A.shape[0]):
    for j in range(A.shape[1]):
        axes[0,0].text(j, i, str(A[i,j]), ha='center', va='center', fontweight='bold')

# Matriz B
im2 = axes[0,1].imshow(B, cmap='Reds', aspect='auto')
axes[0,1].set_title('Matriz B\n(Pesos da Camada 2)', fontsize=14, fontweight='bold')
for i in range(B.shape[0]):
    for j in range(B.shape[1]):
        axes[0,1].text(j, i, str(B[i,j]), ha='center', va='center', fontweight='bold')

# Soma A + B
im3 = axes[1,0].imshow(A + B, cmap='Greens', aspect='auto')
axes[1,0].set_title('A + B\n(Combina√ß√£o Aditiva)', fontsize=14, fontweight='bold')
for i in range(A.shape[0]):
    for j in range(A.shape[1]):
        axes[1,0].text(j, i, str((A + B)[i,j]), ha='center', va='center', fontweight='bold')

# Subtra√ß√£o A - B
im4 = axes[1,1].imshow(A - B, cmap='Purples', aspect='auto')
axes[1,1].set_title('A - B\n(Diferen√ßa)', fontsize=14, fontweight='bold')
for i in range(A.shape[0]):
    for j in range(A.shape[1]):
        axes[1,1].text(j, i, str((A - B)[i,j]), ha='center', va='center', fontweight='bold')

# Remove ticks para ficar mais limpo
for ax in axes.flat:
    ax.set_xticks([])
    ax.set_yticks([])

plt.tight_layout()
plt.suptitle('üé® Opera√ß√µes com Matrizes Visualizadas', fontsize=16, fontweight='bold', y=1.02)
plt.show()

print("üéØ Liiindo! Agora voc√™ v√™ como cada opera√ß√£o transforma os dados!")

## ‚úñÔ∏è Multiplica√ß√£o de Matrizes: Onde a M√°gica Acontece!

Agora chegamos na **opera√ß√£o mais importante** para redes neurais! A multiplica√ß√£o de matrizes √© onde **a transforma√ß√£o real acontece**.

### ü§Ø Por que √© Diferente?

Diferente da soma e subtra√ß√£o, a multiplica√ß√£o **N√ÉO √© elemento por elemento**. √â bem mais sofisticada!

### üìê A Regra de Ouro

Para multiplicar duas matrizes $A_{m \times n}$ e $B_{p \times q}$:

**CONDI√á√ÉO OBRIGAT√ìRIA**: $n = p$ (n√∫mero de colunas de A = n√∫mero de linhas de B)

**RESULTADO**: Matriz $C_{m \times q}$

### üßÆ A F√≥rmula Matem√°tica

$$c_{ij} = \sum_{k=1}^{n} a_{ik} \cdot b_{kj}$$

**Em portugu√™s**: Para calcular o elemento $c_{ij}$, pegamos a **linha i de A** e a **coluna j de B**, multiplicamos **elemento por elemento** e **somamos tudo**!

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-03_img_04.png)

**üî• Dica do Pedro**: Pensa assim - √© como se cada linha da primeira matriz fosse um "neur√¥nio" conversando com cada coluna da segunda matriz (que s√£o as "caracter√≠sticas")!

In [None]:
# Vamos ver a multiplica√ß√£o na pr√°tica!
print("‚úñÔ∏è MULTIPLICA√á√ÉO DE MATRIZES - A M√°gica das Transforma√ß√µes")
print("="*60)

# Criando matrizes compat√≠veis para multiplica√ß√£o
# A: 3√ó4, B precisa ser 4√óalgo para dar certo
X = np.array([[1, 2],
              [3, 4],
              [5, 6],
              [7, 8]])  # 4√ó2

print("Matriz A (3√ó4):")
print(A)
print(f"\nMatriz X (4√ó2):")
print(X)

# Verificando se podemos multiplicar
print(f"\nüîç Verifica√ß√£o de compatibilidade:")
print(f"A.shape = {A.shape} (3√ó4)")
print(f"X.shape = {X.shape} (4√ó2)")
print(f"Colunas de A ({A.shape[1]}) = Linhas de X ({X.shape[0]})? {A.shape[1] == X.shape[0]}")
print("‚úÖ Podemos multiplicar!")

# Fazendo a multiplica√ß√£o
C_mult = A @ X  # Operador @ √© para multiplica√ß√£o de matrizes
# Ou tamb√©m: C_mult = np.dot(A, X)

print(f"\nResultado A √ó X (ser√° {A.shape[0]}√ó{X.shape[1]}):")
print(C_mult)
print(f"Dimens√µes do resultado: {C_mult.shape}")

## üîç Entendendo Cada Passo da Multiplica√ß√£o

Vamos **abrir a caixa preta** e ver como cada elemento do resultado √© calculado!

In [None]:
# Vamos calcular passo a passo para entender melhor
print("üîç MULTIPLICA√á√ÉO PASSO A PASSO")
print("="*40)

print("Calculando elemento por elemento...\n")

# Vamos usar matrizes menores para ficar mais claro
A_pequena = np.array([[1, 2, 3],
                      [4, 5, 6]])

B_pequena = np.array([[7, 8],
                      [9, 10],
                      [11, 12]])

print("Matriz A (2√ó3):")
print(A_pequena)
print("\nMatriz B (3√ó2):")
print(B_pequena)

# Calculando cada posi√ß√£o manualmente
resultado = np.zeros((2, 2))

for i in range(2):  # Para cada linha de A
    for j in range(2):  # Para cada coluna de B
        # Pegamos linha i de A e coluna j de B
        linha_A = A_pequena[i, :]
        coluna_B = B_pequena[:, j]
        
        # Multiplica√ß√£o elemento por elemento e soma
        produto = np.sum(linha_A * coluna_B)
        resultado[i, j] = produto
        
        print(f"\nC[{i},{j}] = Linha {i} de A √ó Coluna {j} de B")
        print(f"C[{i},{j}] = {linha_A} √ó {coluna_B}")
        print(f"C[{i},{j}] = {linha_A[0]}√ó{coluna_B[0]} + {linha_A[1]}√ó{coluna_B[1]} + {linha_A[2]}√ó{coluna_B[2]}")
        print(f"C[{i},{j}] = {linha_A[0]*coluna_B[0]} + {linha_A[1]*coluna_B[1]} + {linha_A[2]*coluna_B[2]} = {produto}")

print(f"\nüéØ Resultado final:")
print(resultado)

# Verificando com NumPy
resultado_numpy = A_pequena @ B_pequena
print(f"\n‚úÖ Verifica√ß√£o com NumPy:")
print(resultado_numpy)
print(f"\nS√£o iguais? {np.allclose(resultado, resultado_numpy)}")

## ‚ö†Ô∏è Por que a ORDEM Importa? O Drama das Dimens√µes!

Aqui est√° o **pulo do gato** que muita gente n√£o entende no come√ßo!

### üö® A Multiplica√ß√£o N√ÉO √© Comutativa!

Diferente da soma, na multiplica√ß√£o: **$A \times B \neq B \times A$**

### üß† Por que isso √© CRUCIAL em Redes Neurais?

Imagine voc√™ tem:
- **Dados de entrada**: 100 amostras √ó 784 caracter√≠sticas (imagens 28√ó28)
- **Pesos da primeira camada**: 784 entradas √ó 128 neur√¥nios

A **√∫nica ordem que funciona** √©: `Dados @ Pesos`

**Resultado**: 100 amostras √ó 128 neur√¥nios ativados ‚úÖ

Se tentarmos `Pesos @ Dados`: **ERRO!** As dimens√µes n√£o batem! ‚ùå

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-03_img_05.png)

**üî• Dica do Pedro**: Sempre pense: "Estou transformando QUEM em O QU√ä?" A ordem das matrizes conta essa hist√≥ria!

In [None]:
# Demonstrando por que a ordem importa!
print("‚ö†Ô∏è A ORDEM IMPORTA - Demonstra√ß√£o Pr√°tica")
print("="*50)

# Matrizes de exemplo
P = np.array([[1, 2],
              [3, 4],
              [5, 6]])  # 3√ó2

Q = np.array([[7, 8, 9],
              [10, 11, 12]])  # 2√ó3

print("Matriz P (3√ó2):")
print(P)
print("\nMatriz Q (2√ó3):")
print(Q)

# P √ó Q √© poss√≠vel (3√ó2) √ó (2√ó3) = (3√ó3)
PQ = P @ Q
print(f"\n‚úÖ P √ó Q (poss√≠vel - 3√ó2 √ó 2√ó3 = 3√ó3):")
print(PQ)
print(f"Dimens√µes: {PQ.shape}")

# Q √ó P tamb√©m √© poss√≠vel (2√ó3) √ó (3√ó2) = (2√ó2)
QP = Q @ P
print(f"\n‚úÖ Q √ó P (tamb√©m poss√≠vel - 2√ó3 √ó 3√ó2 = 2√ó2):")
print(QP)
print(f"Dimens√µes: {QP.shape}")

# Mas os resultados s√£o COMPLETAMENTE diferentes!
print(f"\nü§Ø P√óQ = Q√óP? {np.array_equal(PQ, QP) if PQ.shape == QP.shape else 'Nem as dimens√µes s√£o iguais!'}")

# Exemplo que n√£o funciona
print("\n‚ùå Tentativa de multiplica√ß√£o incompat√≠vel:")
R = np.array([[1, 2, 3]])  # 1√ó3
S = np.array([[4], [5]])   # 2√ó1

print(f"R (1√ó3): {R}")
print(f"S (2√ó1): {S.flatten()}")

try:
    resultado_impossivel = R @ S
    print("Resultado:", resultado_impossivel)
except ValueError as e:
    print(f"üí• ERRO: {e}")
    print("As dimens√µes n√£o s√£o compat√≠veis para multiplica√ß√£o!")

## üß† Aplica√ß√£o Real: Simulando uma Camada Neural

Agora vamos ver como tudo isso se conecta em uma **rede neural de verdade**!

### üéØ O Cen√°rio

Vamos simular:
- **Entrada**: 5 amostras, cada uma com 4 caracter√≠sticas
- **Camada densa**: 4 entradas ‚Üí 3 neur√¥nios
- **Pesos**: matriz 4√ó3
- **Bias**: vetor com 3 elementos

### üìä A Transforma√ß√£o Completa

$$\text{Sa√≠da} = \text{Entrada} \times \text{Pesos} + \text{Bias}$$

$$Y_{5 \times 3} = X_{5 \times 4} \times W_{4 \times 3} + b_{1 \times 3}$$

In [None]:
# Simulando uma camada neural real!
print("üß† SIMULA√á√ÉO DE CAMADA NEURAL REAL")
print("="*40)

# Definindo nossos dados
np.random.seed(42)  # Para resultados reproduz√≠veis

# Dados de entrada (5 amostras, 4 caracter√≠sticas cada)
X = np.random.randn(5, 4)
print("üìä Dados de entrada X (5 amostras √ó 4 caracter√≠sticas):")
print(np.round(X, 2))
print(f"Dimens√µes: {X.shape}")

# Pesos da camada (4 entradas √ó 3 neur√¥nios)
W = np.random.randn(4, 3) * 0.5  # Multiplicamos por 0.5 para pesos menores
print(f"\n‚öñÔ∏è Matriz de pesos W (4 caracter√≠sticas √ó 3 neur√¥nios):")
print(np.round(W, 2))
print(f"Dimens√µes: {W.shape}")

# Bias (um para cada neur√¥nio)
b = np.random.randn(3) * 0.1
print(f"\nüéØ Vetor bias b (3 neur√¥nios):")
print(np.round(b, 2))
print(f"Dimens√µes: {b.shape}")

# Calculando a sa√≠da da camada
print("\nüîÑ Aplicando a transforma√ß√£o linear:")
print("Y = X @ W + b")

# Multiplica√ß√£o de matrizes
Z = X @ W
print(f"\nPrimeiro: X @ W (multiplica√ß√£o de matrizes)")
print(f"Dimens√µes: {X.shape} @ {W.shape} = {Z.shape}")
print("Resultado Z =")
print(np.round(Z, 2))

# Adi√ß√£o do bias (broadcasting)
Y = Z + b
print(f"\nDepois: Z + b (adi√ß√£o com broadcasting)")
print("Sa√≠da final Y =")
print(np.round(Y, 2))
print(f"Dimens√µes finais: {Y.shape}")

print("\nüéâ Liiindo! Acabamos de simular uma camada neural completa!")
print("\nüí° Cada linha de Y representa a ativa√ß√£o dos 3 neur√¥nios para uma amostra")

## üìà Fluxo de Dados em Rede Neural

```mermaid
graph LR
    A["Entrada X<br/>(5√ó4)"] --> B["Multiplica√ß√£o<br/>X @ W"]
    W["Pesos W<br/>(4√ó3)"] --> B
    B --> C["Resultado Z<br/>(5√ó3)"]
    C --> D["Adi√ß√£o Bias<br/>Z + b"]
    Bias["Bias b<br/>(3,)"] --> D
    D --> E["Sa√≠da Y<br/>(5√ó3)"]
    
    style A fill:#e1f5fe
    style W fill:#fff3e0
    style Bias fill:#f3e5f5
    style E fill:#e8f5e8
```

In [None]:
# Vamos visualizar o fluxo completo!
fig, axes = plt.subplots(2, 3, figsize=(18, 10))

# Dados de entrada X
im1 = axes[0,0].imshow(X, cmap='Blues', aspect='auto')
axes[0,0].set_title('Entrada X\n(5 amostras √ó 4 caracter√≠sticas)', fontweight='bold')
axes[0,0].set_xlabel('Caracter√≠sticas')
axes[0,0].set_ylabel('Amostras')

# Pesos W
im2 = axes[0,1].imshow(W, cmap='Oranges', aspect='auto')
axes[0,1].set_title('Pesos W\n(4 caracter√≠sticas √ó 3 neur√¥nios)', fontweight='bold')
axes[0,1].set_xlabel('Neur√¥nios')
axes[0,1].set_ylabel('Caracter√≠sticas')

# Resultado da multiplica√ß√£o Z
im3 = axes[0,2].imshow(Z, cmap='Greens', aspect='auto')
axes[0,2].set_title('X @ W = Z\n(5 amostras √ó 3 neur√¥nios)', fontweight='bold')
axes[0,2].set_xlabel('Neur√¥nios')
axes[0,2].set_ylabel('Amostras')

# Bias
axes[1,0].bar(range(len(b)), b, color=['purple', 'magenta', 'violet'])
axes[1,0].set_title('Bias b\n(3 neur√¥nios)', fontweight='bold')
axes[1,0].set_xlabel('Neur√¥nios')
axes[1,0].set_ylabel('Valor do Bias')

# Resultado final Y
im4 = axes[1,1].imshow(Y, cmap='viridis', aspect='auto')
axes[1,1].set_title('Sa√≠da Final Y = Z + b\n(5 amostras √ó 3 neur√¥nios)', fontweight='bold')
axes[1,1].set_xlabel('Neur√¥nios')
axes[1,1].set_ylabel('Amostras')

# Compara√ß√£o antes e depois
diferenca = Y - Z
im5 = axes[1,2].imshow(diferenca, cmap='RdBu', aspect='auto')
axes[1,2].set_title('Efeito do Bias\n(Y - Z)', fontweight='bold')
axes[1,2].set_xlabel('Neur√¥nios')
axes[1,2].set_ylabel('Amostras')

# Adicionando colorbars
plt.colorbar(im1, ax=axes[0,0])
plt.colorbar(im2, ax=axes[0,1])
plt.colorbar(im3, ax=axes[0,2])
plt.colorbar(im4, ax=axes[1,1])
plt.colorbar(im5, ax=axes[1,2])

plt.tight_layout()
plt.suptitle('üß† Anatomia Completa de uma Camada Neural', fontsize=16, fontweight='bold', y=1.02)
plt.show()

print("üî• Agora voc√™ v√™ EXATAMENTE como os dados fluem pela rede!")

## üì° Broadcasting: O Truque M√°gico do NumPy

Voc√™ reparou como conseguimos somar a matriz Z (5√ó3) com o vetor bias b (3,)? Isso √© **broadcasting**!

### üéØ Como Funciona o Broadcasting

O NumPy "**estica**" automaticamente o vetor menor para casar com as dimens√µes da matriz maior:

```
Z (5√ó3) + b (3,) 
‚Üì
Z (5√ó3) + b_expandido (5√ó3)  # b √© repetido 5 vezes
```

### üß† Por que √© Essencial em IA

- **Efici√™ncia**: N√£o precisamos criar matrizes gigantes desnecessariamente
- **Mem√≥ria**: Economiza RAM preciosa
- **Simplicidade**: C√≥digo mais limpo e leg√≠vel

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-03_img_06.png)

**üî• Dica do Pedro**: O broadcasting segue regras espec√≠ficas - as dimens√µes devem ser **compat√≠veis** ou uma delas deve ser **1**!

In [None]:
# Explorando o broadcasting em detalhes
print("üì° BROADCASTING - A M√°gica das Dimens√µes")
print("="*45)

# Exemplo 1: Matriz + Vetor
matriz = np.array([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])

vetor = np.array([10, 20, 30])

print("Exemplo 1: Matriz (3√ó3) + Vetor (3,)")
print(f"Matriz:\n{matriz}")
print(f"\nVetor: {vetor}")

resultado1 = matriz + vetor
print(f"\nResultado (broadcasting autom√°tico):\n{resultado1}")

# Mostrando o que acontece "por baixo dos panos"
vetor_expandido = np.tile(vetor, (3, 1))
print(f"\nO que o NumPy faz internamente (vetor expandido):\n{vetor_expandido}")
print(f"\nVerifica√ß√£o: {np.array_equal(resultado1, matriz + vetor_expandido)}")

print("\n" + "="*45)

# Exemplo 2: Diferentes formas de broadcasting
print("Exemplo 2: Diferentes tipos de broadcasting")

A = np.random.randint(1, 10, (2, 3))
b_linha = np.random.randint(1, 5, (1, 3))  # Vetor linha
b_coluna = np.random.randint(1, 5, (2, 1))  # Vetor coluna
escalar = 5

print(f"Matriz A (2√ó3):\n{A}")
print(f"\nVetor linha b_linha (1√ó3): {b_linha}")
print(f"Vetor coluna b_coluna (2√ó1):\n{b_coluna}")
print(f"Escalar: {escalar}")

print(f"\nA + b_linha (broadcasting em linhas):\n{A + b_linha}")
print(f"\nA + b_coluna (broadcasting em colunas):\n{A + b_coluna}")
print(f"\nA + escalar (broadcasting total):\n{A + escalar}")

print("\nüéØ Todos esses s√£o exemplos de broadcasting em a√ß√£o!")

## üí™ Exerc√≠cio 1: Construindo sua Primeira Rede

Agora √© sua vez! Vamos implementar uma **mini-rede neural** com 2 camadas:

### üéØ Especifica√ß√µes:
- **Entrada**: 10 amostras, 5 caracter√≠sticas cada
- **Camada 1**: 5 ‚Üí 8 neur√¥nios
- **Camada 2**: 8 ‚Üí 3 neur√¥nios (sa√≠da final)
- Use **fun√ß√£o ReLU** entre as camadas: $\text{ReLU}(x) = \max(0, x)$

### üìã Sua Miss√£o:
1. Crie as matrizes de pesos e vetores bias
2. Implemente o forward pass completo
3. Visualize os resultados

In [None]:
# üí™ EXERC√çCIO 1 - Sua vez de brilhar!
print("üí™ EXERC√çCIO 1: Construindo uma Mini-Rede Neural")
print("="*50)

# Definindo a seed para resultados consistentes
np.random.seed(123)

# TODO: Crie os dados de entrada (10 amostras, 5 caracter√≠sticas)
X_input = np.random.randn(10, 5)
print(f"üìä Dados de entrada: {X_input.shape}")

# TODO: Crie os pesos e bias da primeira camada (5 ‚Üí 8)
W1 = np.random.randn(5, 8) * 0.3  # Pesos pequenos s√£o melhores
b1 = np.random.randn(8) * 0.1
print(f"‚öñÔ∏è Camada 1 - W1: {W1.shape}, b1: {b1.shape}")

# TODO: Crie os pesos e bias da segunda camada (8 ‚Üí 3)
W2 = np.random.randn(8, 3) * 0.3
b2 = np.random.randn(3) * 0.1
print(f"‚öñÔ∏è Camada 2 - W2: {W2.shape}, b2: {b2.shape}")

# Implementando o forward pass
print("\nüîÑ Executando Forward Pass:")

# Primeira camada
Z1 = X_input @ W1 + b1
A1 = np.maximum(0, Z1)  # ReLU activation
print(f"Camada 1: {X_input.shape} ‚Üí {Z1.shape} ‚Üí {A1.shape} (ap√≥s ReLU)")

# Segunda camada
Z2 = A1 @ W2 + b2
A2 = Z2  # Sa√≠da linear (sem ativa√ß√£o)
print(f"Camada 2: {A1.shape} ‚Üí {Z2.shape} ‚Üí {A2.shape} (sa√≠da final)")

print(f"\nüéâ Parab√©ns! Voc√™ criou sua primeira rede neural!")
print(f"Entrada: {X_input.shape} ‚Üí Sa√≠da: {A2.shape}")
print(f"\nPrimeiras 3 predi√ß√µes:")
print(np.round(A2[:3], 3))

# Verificando quantos neur√¥nios foram ativados na camada oculta
neurons_ativos = np.sum(A1 > 0, axis=1)
print(f"\nüß† Neur√¥nios ativados por amostra (de 8 poss√≠veis):")
print(neurons_ativos)
print(f"M√©dia de ativa√ß√£o: {neurons_ativos.mean():.1f} neur√¥nios por amostra")

## üî• Exerc√≠cio 2: Explorando o Efeito da Ordem

Vamos investigar **experimentalmente** como a ordem das opera√ß√µes afeta os resultados!

In [None]:
# üî• EXERC√çCIO 2 - Investigando a Ordem das Opera√ß√µes
print("üî• EXERC√çCIO 2: O Mist√©rio da Ordem")
print("="*40)

# Cen√°rio: Duas transforma√ß√µes sequenciais
np.random.seed(456)

# Dados iniciais
dados = np.random.randn(4, 3)
transf_A = np.random.randn(3, 5)
transf_B = np.random.randn(5, 2)

print("üéØ Cen√°rio: Duas transforma√ß√µes em sequ√™ncia")
print(f"Dados: {dados.shape}")
print(f"Transforma√ß√£o A: {transf_A.shape}")
print(f"Transforma√ß√£o B: {transf_B.shape}")

# M√©todo 1: Aplicar transforma√ß√µes uma por vez
print("\nüìä M√©todo 1: Passo a passo")
resultado_passo1 = dados @ transf_A
resultado_final1 = resultado_passo1 @ transf_B
print(f"(Dados @ A) @ B = {dados.shape} ‚Üí {resultado_passo1.shape} ‚Üí {resultado_final1.shape}")

# M√©todo 2: Pr√©-computar a transforma√ß√£o combinada
print("\n‚ö° M√©todo 2: Transforma√ß√£o combinada")
transf_combinada = transf_A @ transf_B
resultado_final2 = dados @ transf_combinada
print(f"Dados @ (A @ B) = {dados.shape} ‚Üí {resultado_final2.shape}")
print(f"Transforma√ß√£o combinada: {transf_combinada.shape}")

# Verificando se s√£o iguais
print(f"\nüîç Os resultados s√£o iguais? {np.allclose(resultado_final1, resultado_final2)}")
print("\nüí° Isso demonstra a ASSOCIATIVIDADE da multiplica√ß√£o de matrizes!")
print("(A @ B) @ C = A @ (B @ C)")

# Medindo performance
import time

# Testando com dados maiores
dados_grandes = np.random.randn(1000, 100)
A_grande = np.random.randn(100, 50)
B_grande = np.random.randn(50, 10)

# M√©todo passo a passo
start_time = time.time()
for _ in range(100):
    temp = dados_grandes @ A_grande
    result1 = temp @ B_grande
time_metodo1 = time.time() - start_time

# M√©todo combinado
AB_combined = A_grande @ B_grande
start_time = time.time()
for _ in range(100):
    result2 = dados_grandes @ AB_combined
time_metodo2 = time.time() - start_time

print(f"\n‚è±Ô∏è Performance (100 repeti√ß√µes):")
print(f"M√©todo passo a passo: {time_metodo1:.4f}s")
print(f"M√©todo combinado: {time_metodo2:.4f}s")
print(f"Speedup: {time_metodo1/time_metodo2:.2f}x mais r√°pido!")

print("\nüöÄ Conclus√£o: A ordem pode afetar a EFICI√äNCIA, n√£o apenas o resultado!")

## üåç Conex√µes com o Mundo Real

Agora que dominamos as opera√ß√µes com matrizes, vamos ver onde elas aparecem **no mundo real da IA**:

### üñºÔ∏è Processamento de Imagens
- **Convolu√ß√£o**: Multiplica√ß√£o de matrizes para detectar padr√µes
- **Pooling**: Redu√ß√£o de dimensionalidade
- **Transforma√ß√µes geom√©tricas**: Rota√ß√£o, escala, transla√ß√£o

### üó£Ô∏è Processamento de Linguagem Natural
- **Embeddings**: Matriz palavra √ó caracter√≠sticas
- **Attention**: Multiplica√ß√£o para calcular relev√¢ncia
- **Transformers**: Camadas densas com multiplica√ß√£o matricial

### üéØ Sistemas de Recomenda√ß√£o
- **Matriz usu√°rio √ó item**: Collaborative filtering
- **Fatora√ß√£o matricial**: SVD para descobrir padr√µes latentes
- **Similaridade**: Produto escalar entre vetores

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-03_img_07.png)

In [None]:
# Exemplos do mundo real com nossas opera√ß√µes
print("üåç APLICA√á√ïES NO MUNDO REAL")
print("="*35)

# Simula√ß√£o 1: Sistema de Recomenda√ß√£o Simples
print("üé¨ Simula√ß√£o: Sistema de Recomenda√ß√£o de Filmes")

# Matriz usu√°rio x caracter√≠sticas dos filmes
# Caracter√≠sticas: [A√ß√£o, Com√©dia, Drama, Fic√ß√£o, Romance]
preferencias_usuarios = np.array([
    [5, 2, 3, 4, 1],  # Usu√°rio 1: ama a√ß√£o
    [1, 5, 4, 2, 5],  # Usu√°rio 2: ama com√©dia e romance
    [3, 3, 5, 3, 4],  # Usu√°rio 3: ama drama
    [4, 1, 2, 5, 2]   # Usu√°rio 4: ama a√ß√£o e fic√ß√£o
])

# Caracter√≠sticas dos filmes dispon√≠veis
filmes_caracteristicas = np.array([
    [4, 1, 2, 3, 1],  # Filme A: A√ß√£o/Fic√ß√£o
    [1, 5, 3, 1, 4],  # Filme B: Com√©dia/Romance
    [2, 2, 5, 2, 3],  # Filme C: Drama
    [5, 1, 1, 4, 1],  # Filme D: A√ß√£o/Fic√ß√£o pura
    [1, 4, 4, 1, 5]   # Filme E: Com√©dia/Romance/Drama
]).T  # Transposta para ficar (caracter√≠sticas √ó filmes)

# Calculando scores de recomenda√ß√£o
scores_recomendacao = preferencias_usuarios @ filmes_caracteristicas

print(f"Prefer√™ncias dos usu√°rios (4 usu√°rios √ó 5 caracter√≠sticas):")
print(preferencias_usuarios)
print(f"\nCaracter√≠sticas dos filmes (5 caracter√≠sticas √ó 5 filmes):")
print(filmes_caracteristicas)
print(f"\nScores de recomenda√ß√£o (4 usu√°rios √ó 5 filmes):")
print(scores_recomendacao)

# Encontrando melhores recomenda√ß√µes para cada usu√°rio
filmes_nomes = ['A√ß√£o A', 'Com√©dia B', 'Drama C', 'A√ß√£o D', 'Romance E']
print("\nüèÜ Melhores recomenda√ß√µes por usu√°rio:")
for i in range(4):
    melhor_filme_idx = np.argmax(scores_recomendacao[i])
    melhor_score = scores_recomendacao[i, melhor_filme_idx]
    print(f"Usu√°rio {i+1}: {filmes_nomes[melhor_filme_idx]} (score: {melhor_score})")

print("\n" + "="*50)

# Simula√ß√£o 2: Transforma√ß√£o de Embeddings
print("üî§ Simula√ß√£o: Transforma√ß√£o de Word Embeddings")

# Embeddings de palavras (5 palavras √ó 4 dimens√µes)
word_embeddings = np.random.randn(5, 4)
palavras = ['gato', 'cachorro', 'peixe', 'p√°ssaro', 'cobra']

# Matriz de transforma√ß√£o para novo espa√ßo sem√¢ntico
transformacao_semantica = np.random.randn(4, 3)

# Aplicando transforma√ß√£o
novos_embeddings = word_embeddings @ transformacao_semantica

print(f"Embeddings originais ({word_embeddings.shape}):")
for i, palavra in enumerate(palavras):
    print(f"{palavra:8}: {np.round(word_embeddings[i], 2)}")

print(f"\nNovos embeddings transformados ({novos_embeddings.shape}):")
for i, palavra in enumerate(palavras):
    print(f"{palavra:8}: {np.round(novos_embeddings[i], 2)}")

print("\nüéØ Isso √© exatamente como funciona uma camada densa em NLP!")

## ‚ö° Dicas de Performance e Boas Pr√°ticas

Antes de finalizarmos, aqui est√£o as **dicas de ouro** para trabalhar com matrizes de forma eficiente:

### üöÄ Otimiza√ß√µes de Performance

1. **Use NumPy**: Sempre prefira opera√ß√µes vetorizadas
2. **Evite loops**: Uma multiplica√ß√£o matricial √© milhares de vezes mais r√°pida que loops aninhados
3. **Ordem importa**: `A @ B @ C` pode ser calculado como `(A @ B) @ C` ou `A @ (B @ C)` - escolha a ordem mais eficiente
4. **Broadcasting**: Use quando poss√≠vel para economizar mem√≥ria

### üéØ Dicas de Debug

1. **Sempre verifique dimens√µes** antes de opera√ß√µes
2. **Use asserts** para validar shapes
3. **Visualize** matrizes pequenas para entender o que est√° acontecendo
4. **Teste com dados sint√©ticos** antes de usar dados reais

**üî• Dica Final do Pedro**: Quando em d√∫vida sobre dimens√µes, desenhe no papel! S√©rio, isso funciona! ‚úèÔ∏è

In [None]:
# Compara√ß√£o de performance: NumPy vs Loops puros
print("‚ö° COMPARA√á√ÉO DE PERFORMANCE")
print("="*35)

import time

# Criando matrizes de teste
size = 200
A_test = np.random.randn(size, size)
B_test = np.random.randn(size, size)

print(f"Testando multiplica√ß√£o de matrizes {size}√ó{size}")

# M√©todo 1: NumPy otimizado
start_time = time.time()
result_numpy = A_test @ B_test
time_numpy = time.time() - start_time

print(f"\nüöÄ NumPy (otimizado): {time_numpy:.4f} segundos")

# M√©todo 2: Loops puros (s√≥ para matrizes pequenas!)
if size <= 50:  # S√≥ testamos com matrizes pequenas
    A_small = A_test[:50, :50]
    B_small = B_test[:50, :50]
    
    start_time = time.time()
    result_loops = np.zeros((50, 50))
    for i in range(50):
        for j in range(50):
            for k in range(50):
                result_loops[i, j] += A_small[i, k] * B_small[k, j]
    time_loops = time.time() - start_time
    
    print(f"üêå Loops puros (50√ó50): {time_loops:.4f} segundos")
    print(f"üéØ NumPy √© {time_loops/time_numpy:.0f}x mais r√°pido!")
else:
    print("üêå Loops puros: Muito lento para testar com matrizes grandes!")

# Testando diferentes ordens de multiplica√ß√£o
print("\n" + "="*40)
print("üßÆ TESTANDO ORDEM DE MULTIPLICA√á√ÉO")

# Cen√°rio: A(100√ó500) @ B(500√ó50) @ C(50√ó10)
A_ordem = np.random.randn(100, 500)
B_ordem = np.random.randn(500, 50)
C_ordem = np.random.randn(50, 10)

# Ordem 1: (A @ B) @ C
start_time = time.time()
AB = A_ordem @ B_ordem  # 100√ó50
result_ordem1 = AB @ C_ordem  # 100√ó10
time_ordem1 = time.time() - start_time

# Ordem 2: A @ (B @ C)
start_time = time.time()
BC = B_ordem @ C_ordem  # 500√ó10
result_ordem2 = A_ordem @ BC  # 100√ó10
time_ordem2 = time.time() - start_time

print(f"Ordem 1 - (A @ B) @ C: {time_ordem1:.6f}s")
print(f"Ordem 2 - A @ (B @ C): {time_ordem2:.6f}s")
print(f"Resultados iguais? {np.allclose(result_ordem1, result_ordem2)}")

if time_ordem1 < time_ordem2:
    print(f"üèÜ Ordem 1 √© {time_ordem2/time_ordem1:.2f}x mais r√°pida!")
else:
    print(f"üèÜ Ordem 2 √© {time_ordem1/time_ordem2:.2f}x mais r√°pida!")

print("\nüí° A ordem das opera√ß√µes pode fazer MUITA diferen√ßa na performance!")

## üéØ Resum√£o: O que Aprendemos Hoje

Parab√©ns! üéâ Voc√™ acabou de dominar as **opera√ß√µes fundamentais com matrizes**! Vamos recapitular:

### ‚úÖ Conceitos Dominados

1. **Soma e Subtra√ß√£o**: Opera√ß√µes elemento por elemento
   - Requer matrizes de **mesmas dimens√µes**
   - Soma √© **comutativa**, subtra√ß√£o **n√£o √©**

2. **Multiplica√ß√£o de Matrizes**: A estrela do show!
   - **Regra de ouro**: Colunas de A = Linhas de B
   - **N√ÉO √© comutativa**: $A \times B \neq B \times A$
   - **√â associativa**: $(A \times B) \times C = A \times (B \times C)$

3. **Broadcasting**: A m√°gica do NumPy
   - Permite opera√ß√µes entre arrays de dimens√µes diferentes
   - Essencial para adicionar bias em redes neurais

### üß† Conex√£o com Redes Neurais

- **Cada camada** √© uma multiplica√ß√£o matricial seguida de soma (bias)
- **A ordem importa**: determina o fluxo de informa√ß√£o
- **Dimens√µes contam a hist√≥ria**: entrada ‚Üí transforma√ß√£o ‚Üí sa√≠da

### üöÄ Prepara√ß√£o para os Pr√≥ximos M√≥dulos

No **M√≥dulo 4**, vamos mergulhar fundo no **NumPy** e ver todas essas opera√ß√µes na pr√°tica com dados reais!

Nos m√≥dulos seguintes, usaremos essas bases para:
- **Resolver sistemas lineares** (M√≥dulo 5)
- **Entender transforma√ß√µes lineares** (M√≥dulo 6)
- **Trabalhar com inversas e transpostas** (M√≥dulo 7)

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/algebra-linear-para-ia-modulo-03_img_08.png)

### üî• √öltima Dica do Pedro

> **"Matrizes s√£o a linguagem universal da IA. Agora voc√™ fala fluentemente!"** 
>
> Continue praticando, visualizando e **sempre** verificando as dimens√µes. A matem√°tica √© linda quando voc√™ entende o que est√° acontecendo por tr√°s dos n√∫meros! ‚ú®

---

**Nos vemos no pr√≥ximo m√≥dulo! Bora dominar o NumPy! üêçüìä**