# 📊 Funções e Gráficos: Visualizando o Problema

## *Módulo 2 - Cálculo para IA*

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/cálculo-para-ia-modulo-02_img_01.png)

Fala galera! Sou o **Pedro Guth** e hoje vamos mergulhar no mundo das **funções e gráficos**! 🚀

Lembra do Módulo 1 quando falamos sobre a **montanha do erro**? Pois é, hoje vamos aprender a **visualizar** essa montanha de verdade! 

**Tá, mas por que isso é importante?**

Imagina que você está dirigindo no Google Maps sem ver o mapa - só ouvindo as instruções. Meio complicado, né? É exatamente isso que acontece quando tentamos entender IA sem visualizar as funções!

**Neste notebook você vai aprender:**
- O que são funções matemáticas de verdade
- Por que visualizar é TÃO importante
- Como criar e interpretar gráficos
- Funções de custo na prática
- E muito mais!

**Bora começar!** 🎯

In [None]:
# Setup inicial - Importando nossas ferramentas
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from mpl_toolkits.mplot3d import Axes3D
import warnings
warnings.filterwarnings('ignore')

# Configurando o estilo dos gráficos
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")

# Configurando para aparecer gráficos inline
%matplotlib inline

print("🎉 Bibliotecas carregadas! Vamos visualizar!")
print("📊 Numpy version:", np.__version__)
print("📈 Matplotlib pronto para os gráficos!")

## 🤔 O que são Funções Matemáticas?

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/cálculo-para-ia-modulo-02_img_02.png)

**Tá, mas o que é uma função afinal?**

Pensa numa **máquina de salgadinho**: você coloca uma moeda (entrada), ela processa, e sai um salgadinho (saída). A função é exatamente isso!

**Matematicamente:**
$$f(x) = y$$

Onde:
- $x$ é a **entrada** (input)
- $f$ é a **função** (processamento) 
- $y$ é a **saída** (output)

**Exemplos clássicos:**
- $f(x) = 2x + 1$ (função linear)
- $f(x) = x^2$ (função quadrática)
- $f(x) = e^x$ (função exponencial)

**Na IA, as funções representam:**
- **Modelos**: $f(x) = \text{predição}$
- **Custos**: $C(\theta) = \text{erro do modelo}$
- **Ativações**: $\sigma(x) = \text{neurônio ativado}$

**💡 Dica do Pedro:** Toda vez que você vê algo do tipo "entrada → processamento → saída", você está vendo uma função!

In [None]:
# Vamos criar nossas primeiras funções!

def funcao_linear(x):
    """Função linear: f(x) = 2x + 1"""
    return 2*x + 1

def funcao_quadratica(x):
    """Função quadrática: f(x) = x²"""
    return x**2

def funcao_exponencial(x):
    """Função exponencial: f(x) = e^x"""
    return np.exp(x)

# Testando nossas funções
print("🧮 Testando nossas funções:")
print(f"Linear f(3) = {funcao_linear(3)}")
print(f"Quadrática f(3) = {funcao_quadratica(3)}")
print(f"Exponencial f(1) = {funcao_exponencial(1):.2f}")

print("\n🎯 Liiindo! Funções criadas com sucesso!")

## 📈 Por que Visualizar é Fundamental?

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/cálculo-para-ia-modulo-02_img_03.png)

**Imagine tentar entender o Brasil só olhando coordenadas GPS vs usar o Google Maps...**

É exatamente essa a diferença entre trabalhar com funções só numericamente vs visualizá-las!

**🧠 O cérebro humano processa informações visuais:**
- **50.000x mais rápido** que texto
- Identifica **padrões** instantaneamente
- Detecta **anomalias** facilmente

**Na IA, visualizar funções nos ajuda a:**

1. **Entender o comportamento**: Como a função "se comporta"?
2. **Identificar mínimos/máximos**: Onde estão os pontos ótimos?
3. **Ver a inclinação**: Quão íngreme é a "montanha"?
4. **Detectar problemas**: Explosão de gradientes, overfitting...
5. **Otimizar modelos**: Escolher hiperparâmetros melhores

**💡 Dica do Pedro:** Se você não consegue desenhar sua função de custo, provavelmente não entendeu seu modelo!

In [None]:
# Vamos ver a diferença entre números e gráficos!

# Criando dados
x = np.linspace(-3, 3, 100)
y_linear = funcao_linear(x)
y_quad = funcao_quadratica(x)

# Primeiro: só números (difícil de entender)
print("📊 APENAS NÚMEROS (confuso):")
print("x  | Linear | Quadrática")
print("-" * 25)
for i in range(0, len(x), 20):
    print(f"{x[i]:4.1f} | {y_linear[i]:6.1f} | {y_quad[i]:8.1f}")

print("\n🤔 Conseguiu entender o padrão? Difícil né...")
print("\n👇 Agora vamos VISUALIZAR!")

In [None]:
# Agora com gráficos (muito mais fácil!)

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))

# Função Linear
ax1.plot(x, y_linear, 'b-', linewidth=3, label='f(x) = 2x + 1')
ax1.set_title('📈 Função Linear', fontsize=14, fontweight='bold')
ax1.set_xlabel('x')
ax1.set_ylabel('f(x)')
ax1.grid(True, alpha=0.3)
ax1.legend()

# Função Quadrática
ax2.plot(x, y_quad, 'r-', linewidth=3, label='f(x) = x²')
ax2.set_title('📉 Função Quadrática', fontsize=14, fontweight='bold')
ax2.set_xlabel('x')
ax2.set_ylabel('f(x)')
ax2.grid(True, alpha=0.3)
ax2.legend()

plt.tight_layout()
plt.show()

print("🎯 Agora sim! Dá pra ver claramente:")
print("📈 Linear: sempre cresce na mesma taxa")
print("📉 Quadrática: tem formato de U (parábola)")
print("\n💡 A visualização revela TUDO instantaneamente!")

## 🎯 Funções de Custo: O Coração da IA

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/cálculo-para-ia-modulo-02_img_04.png)

**Agora vamos ao que interessa: FUNÇÕES DE CUSTO!**

Lembra da **montanha do erro** do Módulo 1? Pois é, essa montanha é matematicamente uma **função de custo**!

**🤔 Tá, mas o que é uma função de custo?**

É uma função que **mede o quão errado** seu modelo está. Quanto maior o valor, pior o modelo!

**Matematicamente:**
$$C(\theta) = \frac{1}{2m} \sum_{i=1}^{m} (h_\theta(x^{(i)}) - y^{(i)})^2$$

Onde:
- $C(\theta)$ = função de custo
- $\theta$ = parâmetros do modelo
- $m$ = número de exemplos
- $h_\theta(x^{(i)})$ = predição do modelo
- $y^{(i)}$ = valor real

**Tipos mais comuns:**
1. **MSE (Mean Squared Error)**: Para regressão
2. **Cross-Entropy**: Para classificação
3. **MAE (Mean Absolute Error)**: Mais robusta

**💡 Dica do Pedro:** O objetivo da IA é encontrar o **fundo do vale** dessa montanha!

In [None]:
# Vamos criar dados sintéticos para nosso exemplo
np.random.seed(42)  # Para reprodutibilidade

# Gerando dados de exemplo: y = 2x + 1 + ruído
x_data = np.linspace(0, 10, 50)
y_real = 2 * x_data + 1  # Função real (sem ruído)
y_data = y_real + np.random.normal(0, 2, len(x_data))  # Com ruído

print("📊 Dataset criado!")
print(f"   📈 {len(x_data)} pontos de dados")
print(f"   🎯 Função real: y = 2x + 1")
print(f"   🔀 Ruído adicionado para simular dados reais")

# Visualizando nossos dados
plt.figure(figsize=(10, 6))
plt.scatter(x_data, y_data, alpha=0.6, s=50, label='Dados com ruído')
plt.plot(x_data, y_real, 'r--', linewidth=2, label='Função real: y = 2x + 1')
plt.xlabel('x')
plt.ylabel('y')
plt.title('📊 Nossos Dados de Treinamento', fontsize=14, fontweight='bold')
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()

print("\n🎯 Agora vamos criar um modelo para tentar 'adivinhar' a linha vermelha!")

In [None]:
# Definindo nosso modelo linear simples: h(x) = θ₀ + θ₁x

def modelo_linear(x, theta0, theta1):
    """Nosso modelo: h(x) = θ₀ + θ₁x"""
    return theta0 + theta1 * x

def funcao_custo_mse(theta0, theta1, x, y):
    """Função de custo MSE"""
    m = len(x)
    predicoes = modelo_linear(x, theta0, theta1)
    custo = (1/(2*m)) * np.sum((predicoes - y)**2)
    return custo

# Testando diferentes parâmetros
print("🧮 Testando diferentes parâmetros:")
print("\nθ₀  | θ₁  | Custo")
print("-" * 20)

parametros_teste = [
    (0, 0),    # Muito ruim
    (1, 1),    # Razoável
    (1, 2),    # Melhor
    (1, 2.1),  # Ainda melhor
    (0.8, 2.05) # Próximo do ótimo
]

for theta0, theta1 in parametros_teste:
    custo = funcao_custo_mse(theta0, theta1, x_data, y_data)
    print(f"{theta0:3.1f} | {theta1:3.1f} | {custo:6.2f}")

print("\n🎯 Repara como o custo vai diminuindo conforme nos aproximamos dos valores reais!")

In [None]:
# Vamos visualizar como diferentes modelos se ajustam aos dados

fig, axes = plt.subplots(2, 3, figsize=(18, 12))
axes = axes.flatten()

parametros = [
    (0, 0, "Modelo Terrível"),
    (1, 1, "Modelo Ruim"), 
    (1, 2, "Modelo Bom"),
    (1, 2.1, "Modelo Muito Bom"),
    (0.8, 2.05, "Modelo Excelente"),
    (1, 2, "Comparação Final")
]

for i, (theta0, theta1, titulo) in enumerate(parametros):
    ax = axes[i]
    
    # Dados
    ax.scatter(x_data, y_data, alpha=0.6, s=30, label='Dados')
    
    if i == 5:  # Última subplot - comparação
        ax.plot(x_data, y_real, 'g--', linewidth=3, label='Real: y = 2x + 1')
        ax.plot(x_data, modelo_linear(x_data, 1, 2), 'r-', linewidth=3, label='Modelo: y = 1 + 2x')
    else:
        # Modelo atual
        y_pred = modelo_linear(x_data, theta0, theta1)
        ax.plot(x_data, y_pred, 'r-', linewidth=2, label=f'y = {theta0} + {theta1}x')
        
        # Função real
        ax.plot(x_data, y_real, 'g--', alpha=0.7, label='Real')
    
    custo = funcao_custo_mse(theta0, theta1, x_data, y_data)
    ax.set_title(f'{titulo}\nCusto: {custo:.2f}', fontweight='bold')
    ax.legend()
    ax.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print("🎯 Viu como a visualização mostra CLARAMENTE qual modelo é melhor?")
print("📉 Quanto menor o custo, melhor o ajuste aos dados!")

## 🗺️ Mapeando a Paisagem do Custo

Agora vem a parte mais **LIIIINDA** do negócio: vamos mapear toda a paisagem da função de custo!

**🤔 O que isso significa?**

Significa que vamos testar **TODOS** os possíveis valores de $\theta_0$ e $\theta_1$ e ver como fica o custo!

**Matematicamente, vamos criar:**
$$C(\theta_0, \theta_1) = \text{superfície 3D}$$

**Por que isso é importante?**
- Visualizar onde está o **mínimo global**
- Entender a **topografia** do problema
- Ver se existem **mínimos locais**
- Planejar a **estratégia de otimização**

**💡 Dica do Pedro:** Isso é exatamente o que o Gradiente Descendente vai "navegar" nos próximos módulos!

In [None]:
# Criando a grade de parâmetros para mapear a paisagem
theta0_range = np.linspace(-2, 4, 50)
theta1_range = np.linspace(0, 4, 50)

# Criando a grade 2D
Theta0, Theta1 = np.meshgrid(theta0_range, theta1_range)

# Calculando o custo para cada combinação de parâmetros
Custos = np.zeros_like(Theta0)

print("🗺️ Mapeando a paisagem do custo...")
print(f"   📊 Testando {len(theta0_range)} × {len(theta1_range)} = {len(theta0_range) * len(theta1_range)} combinações")

for i in range(len(theta0_range)):
    for j in range(len(theta1_range)):
        Custos[j, i] = funcao_custo_mse(Theta0[j, i], Theta1[j, i], x_data, y_data)

print("✅ Paisagem mapeada!")
print(f"   📈 Custo mínimo: {np.min(Custos):.2f}")
print(f"   📉 Custo máximo: {np.max(Custos):.2f}")

# Encontrando o ponto de mínimo
min_idx = np.unravel_index(np.argmin(Custos), Custos.shape)
theta0_otimo = Theta0[min_idx]
theta1_otimo = Theta1[min_idx]
custo_minimo = Custos[min_idx]

print(f"\n🎯 PONTO ÓTIMO ENCONTRADO:")
print(f"   θ₀ ótimo: {theta0_otimo:.2f}")
print(f"   θ₁ ótimo: {theta1_otimo:.2f}")
print(f"   Custo mínimo: {custo_minimo:.2f}")

In [None]:
# Visualizando a paisagem em 3D - A MONTANHA DO ERRO!

fig = plt.figure(figsize=(15, 5))

# Subplot 1: Superfície 3D
ax1 = fig.add_subplot(131, projection='3d')
surface = ax1.plot_surface(Theta0, Theta1, Custos, 
                          cmap='viridis', alpha=0.8,
                          linewidth=0, antialiased=True)

# Marcando o ponto ótimo
ax1.scatter([theta0_otimo], [theta1_otimo], [custo_minimo], 
           color='red', s=100, label='Mínimo Global')

ax1.set_xlabel('θ₀')
ax1.set_ylabel('θ₁')
ax1.set_zlabel('Custo')
ax1.set_title('🏔️ A Montanha do Erro!', fontweight='bold')

# Subplot 2: Curvas de nível
ax2 = fig.add_subplot(132)
contour = ax2.contour(Theta0, Theta1, Custos, levels=20, cmap='viridis')
ax2.clabel(contour, inline=True, fontsize=8)
ax2.scatter(theta0_otimo, theta1_otimo, color='red', s=100, marker='x', 
           linewidth=3, label='Mínimo Global')
ax2.set_xlabel('θ₀')
ax2.set_ylabel('θ₁')
ax2.set_title('🗺️ Mapa Topográfico', fontweight='bold')
ax2.legend()
ax2.grid(True, alpha=0.3)

# Subplot 3: Heatmap
ax3 = fig.add_subplot(133)
heatmap = ax3.imshow(Custos, extent=[theta0_range[0], theta0_range[-1], 
                                   theta1_range[0], theta1_range[-1]], 
                    origin='lower', cmap='viridis', aspect='auto')
ax3.scatter(theta0_otimo, theta1_otimo, color='red', s=100, marker='x', 
           linewidth=3, label='Mínimo Global')
ax3.set_xlabel('θ₀')
ax3.set_ylabel('θ₁')
ax3.set_title('🔥 Mapa de Calor', fontweight='bold')
ax3.legend()
plt.colorbar(heatmap, ax=ax3, label='Custo')

plt.tight_layout()
plt.show()

print("🎯 LIIINDO! Agora você pode VER a paisagem completa!")
print("📍 O ponto vermelho é onde queremos chegar!")
print("🏔️ A montanha azul-escura representa custos altos (ruim)")
print("🌿 A região amarela representa custos baixos (bom)")

## 🎨 Tipos de Funções de Custo

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/cálculo-para-ia-modulo-02_img_05.png)

**Bora conhecer os principais tipos de funções de custo!**

Cada problema tem sua função de custo ideal. É como escolher a ferramenta certa para cada trabalho!

### 1. **MSE (Mean Squared Error)**
$$MSE = \frac{1}{m} \sum_{i=1}^{m} (y_i - \hat{y}_i)^2$$

**Quando usar:** Regressão linear, quando queremos penalizar erros grandes

### 2. **MAE (Mean Absolute Error)**
$$MAE = \frac{1}{m} \sum_{i=1}^{m} |y_i - \hat{y}_i|$$

**Quando usar:** Quando temos outliers, mais robusta

### 3. **Cross-Entropy**
$$CE = -\frac{1}{m} \sum_{i=1}^{m} y_i \log(\hat{y}_i)$$

**Quando usar:** Classificação, especialmente com probabilidades

**💡 Dica do Pedro:** MSE penaliza erros grandes MUITO mais que erros pequenos (por causa do quadrado)!

In [None]:
# Comparando diferentes funções de custo

def mse_custo(y_real, y_pred):
    """Mean Squared Error"""
    return np.mean((y_real - y_pred)**2)

def mae_custo(y_real, y_pred):
    """Mean Absolute Error"""
    return np.mean(np.abs(y_real - y_pred))

def huber_custo(y_real, y_pred, delta=1.0):
    """Huber Loss - Combina MSE e MAE"""
    erro = y_real - y_pred
    condicao = np.abs(erro) <= delta
    quadratico = 0.5 * erro**2
    linear = delta * np.abs(erro) - 0.5 * delta**2
    return np.mean(np.where(condicao, quadratico, linear))

# Criando dados com outliers para demonstrar as diferenças
y_real_exemplo = np.array([1, 2, 3, 4, 5])
y_pred_normal = np.array([1.1, 2.2, 2.9, 3.8, 5.1])  # Predições normais
y_pred_outlier = np.array([1.1, 2.2, 2.9, 3.8, 10])  # Uma predição muito errada

print("📊 COMPARANDO FUNÇÕES DE CUSTO:\n")

print("Cenário 1: Predições normais")
print(f"Real:     {y_real_exemplo}")
print(f"Predito:  {y_pred_normal}")
print(f"MSE:  {mse_custo(y_real_exemplo, y_pred_normal):.3f}")
print(f"MAE:  {mae_custo(y_real_exemplo, y_pred_normal):.3f}")
print(f"Huber: {huber_custo(y_real_exemplo, y_pred_normal):.3f}")

print("\nCenário 2: COM OUTLIER (último valor muito errado)")
print(f"Real:     {y_real_exemplo}")
print(f"Predito:  {y_pred_outlier}")
print(f"MSE:  {mse_custo(y_real_exemplo, y_pred_outlier):.3f}  ← EXPLODIU!")
print(f"MAE:  {mae_custo(y_real_exemplo, y_pred_outlier):.3f}  ← Mais robusta")
print(f"Huber: {huber_custo(y_real_exemplo, y_pred_outlier):.3f}  ← Meio termo")

print("\n🎯 Viu a diferença? MSE penaliza MUITO mais os outliers!")

In [None]:
# Visualizando como cada função de custo se comporta

# Criando erros de -5 a 5
erros = np.linspace(-5, 5, 100)

# Calculando as perdas para cada erro
mse_perdas = erros**2
mae_perdas = np.abs(erros)
huber_perdas = np.where(np.abs(erros) <= 1, 
                       0.5 * erros**2,
                       np.abs(erros) - 0.5)

# Plotando
plt.figure(figsize=(12, 8))

plt.plot(erros, mse_perdas, 'r-', linewidth=3, label='MSE (Quadrática)', alpha=0.8)
plt.plot(erros, mae_perdas, 'b-', linewidth=3, label='MAE (Linear)', alpha=0.8)
plt.plot(erros, huber_perdas, 'g-', linewidth=3, label='Huber (Híbrida)', alpha=0.8)

plt.xlabel('Erro (y_real - y_pred)', fontsize=12)
plt.ylabel('Perda', fontsize=12)
plt.title('📊 Comparação das Funções de Custo', fontsize=16, fontweight='bold')
plt.legend(fontsize=12)
plt.grid(True, alpha=0.3)

# Destacando regiões importantes
plt.axvline(x=0, color='black', linestyle='--', alpha=0.5)
plt.axhline(y=0, color='black', linestyle='--', alpha=0.5)

# Adicionando anotações
plt.annotate('MSE penaliza\nerros grandes!', 
            xy=(3, 9), xytext=(1.5, 15),
            arrowprops=dict(arrowstyle='->', color='red'),
            fontsize=10, ha='center')

plt.annotate('MAE é linear\n(mais robusta)', 
            xy=(4, 4), xytext=(2.5, 8),
            arrowprops=dict(arrowstyle='->', color='blue'),
            fontsize=10, ha='center')

plt.show()

print("🎯 Agora fica claro porque cada função é útil em situações diferentes!")
print("📈 MSE: Boa para erros 'normais', ruim com outliers")
print("📉 MAE: Robusta a outliers, mas pode ser lenta para converger")
print("🎨 Huber: O melhor dos dois mundos!")

## 🔍 Anatomia de uma Função: Propriedades Importantes

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/cálculo-para-ia-modulo-02_img_06.png)

**Agora vamos destrinchar uma função como um detetive!** 🕵️‍♂️

Quando olhamos para uma função, especialmente de custo, precisamos identificar suas **características importantes**:

### 🎯 **Propriedades Essenciais:**

1. **Domínio**: Onde a função "vive"
2. **Mínimos/Máximos**: Pontos críticos
3. **Convexidade**: A função é uma "tigela" ou "montanha"?
4. **Continuidade**: Tem "saltos" ou é lisa?
5. **Derivabilidade**: Podemos calcular a inclinação?

**Por que isso importa na IA?**
- **Convexidade** → Garantia de encontrar o mínimo global
- **Continuidade** → Gradiente Descendente funciona
- **Derivabilidade** → Conseguimos calcular gradientes

**💡 Dica do Pedro:** Funções convexas são o "santo graal" da otimização - sempre têm um único mínimo global!

In [None]:
# Vamos analisar diferentes tipos de funções

def funcao_convexa(x):
    """Função convexa - formato de U"""
    return x**2 + 2*x + 1

def funcao_concava(x):
    """Função côncava - formato de ∩"""
    return -(x**2) + 4*x + 1

def funcao_nao_convexa(x):
    """Função não-convexa - tem vários mínimos locais"""
    return x**4 - 4*x**3 + 4*x**2 + 1

def funcao_com_ruido(x):
    """Função com muitas oscilações"""
    return x**2 + 2*np.sin(5*x)

# Criando dados
x = np.linspace(-3, 5, 1000)

# Calculando as funções
y_convexa = funcao_convexa(x)
y_concava = funcao_concava(x)
y_nao_convexa = funcao_nao_convexa(x)
y_ruido = funcao_com_ruido(x)

print("🔍 ANALISANDO DIFERENTES TIPOS DE FUNÇÕES:")
print("\n1. 📈 Convexa: Uma única 'tigela' - IDEAL para IA")
print("2. 📉 Côncava: Uma única 'montanha' - Para maximização")
print("3. 🎢 Não-convexa: Várias 'tigelas' - CUIDADO com mínimos locais!")
print("4. 🌊 Com ruído: Oscilações - Difícil de otimizar")

In [None]:
# Visualizando as diferentes propriedades

fig, axes = plt.subplots(2, 2, figsize=(15, 12))

# Função Convexa
axes[0,0].plot(x, y_convexa, 'b-', linewidth=3)
axes[0,0].set_title('📈 Função CONVEXA\n(Ideal para otimização)', fontweight='bold', color='blue')
axes[0,0].grid(True, alpha=0.3)
axes[0,0].set_ylabel('f(x)')

# Marcando o mínimo
min_idx = np.argmin(y_convexa)
axes[0,0].plot(x[min_idx], y_convexa[min_idx], 'ro', markersize=10, label='Mínimo Global')
axes[0,0].legend()

# Função Côncava
axes[0,1].plot(x, y_concava, 'g-', linewidth=3)
axes[0,1].set_title('📉 Função CÔNCAVA\n(Para problemas de maximização)', fontweight='bold', color='green')
axes[0,1].grid(True, alpha=0.3)

# Marcando o máximo
max_idx = np.argmax(y_concava)
axes[0,1].plot(x[max_idx], y_concava[max_idx], 'ro', markersize=10, label='Máximo Global')
axes[0,1].legend()

# Função Não-Convexa
axes[1,0].plot(x, y_nao_convexa, 'r-', linewidth=3)
axes[1,0].set_title('🎢 Função NÃO-CONVEXA\n(CUIDADO: Múltiplos mínimos!)', fontweight='bold', color='red')
axes[1,0].grid(True, alpha=0.3)
axes[1,0].set_xlabel('x')
axes[1,0].set_ylabel('f(x)')

# Marcando mínimos locais
from scipy.signal import find_peaks
picos_neg, _ = find_peaks(-y_nao_convexa, height=-10)
if len(picos_neg) > 0:
    axes[1,0].plot(x[picos_neg], y_nao_convexa[picos_neg], 'ro', markersize=8, label='Mínimos Locais')
    axes[1,0].legend()

# Função com Ruído
axes[1,1].plot(x, y_ruido, 'purple', linewidth=2)
axes[1,1].set_title('🌊 Função com OSCILAÇÕES\n(Difícil otimização)', fontweight='bold', color='purple')
axes[1,1].grid(True, alpha=0.3)
axes[1,1].set_xlabel('x')

plt.tight_layout()
plt.show()

print("\n🎯 LIÇÕES IMPORTANTES:")
print("✅ Funções CONVEXAS: Sempre encontramos o mínimo global!")
print("⚠️  Funções NÃO-CONVEXAS: Podemos ficar presos em mínimos locais!")
print("🌊 Funções com RUÍDO: Precisamos de técnicas especiais!")
print("\n💡 Por isso escolher a arquitetura certa é TÃO importante!")

## 🚀 Aplicação Prática: Função de Custo Real

**Bora fazer um exemplo REAL de Machine Learning!**

Vamos simular um problema de **predição de preços de casas** e ver como nossa função de custo se comporta.

**Cenário:**
- 🏠 **Problema**: Prever preço de casas baseado no tamanho
- 📊 **Dados**: Tamanho da casa (m²) vs Preço (R$)
- 🎯 **Objetivo**: Encontrar a melhor linha que ajusta os dados
- 📈 **Modelo**: $\text{Preço} = \theta_0 + \theta_1 \times \text{Tamanho}$

**Este é um exemplo típico que você vai encontrar na vida real!**

In [None]:
# Criando dataset realista de preços de casas
np.random.seed(42)

# Dados de casas (tamanho em m², preço base em R$)
n_casas = 100
tamanho_casa = np.random.normal(120, 40, n_casas)  # Tamanho médio 120m²
tamanho_casa = np.clip(tamanho_casa, 50, 300)      # Entre 50 e 300m²

# Preço real: R$ 2000/m² + ruído + fatores extras
preco_base = 2000  # R$ por m²
preco_casa = (preco_base * tamanho_casa + 
              np.random.normal(0, 50000, n_casas) +  # Ruído
              tamanho_casa * np.random.normal(500, 200, n_casas))  # Fatores extras

# Garantindo preços positivos e realistas
preco_casa = np.clip(preco_casa, 100000, 1000000)

print("🏠 DATASET DE CASAS CRIADO!")
print(f"   📊 {n_casas} casas no dataset")
print(f"   📏 Tamanho médio: {np.mean(tamanho_casa):.1f}m²")
print(f"   💰 Preço médio: R$ {np.mean(preco_casa):,.0f}")
print(f"   💸 Preço por m²: R$ {np.mean(preco_casa/tamanho_casa):,.0f}")

# Visualizando nossos dados
plt.figure(figsize=(12, 8))
plt.scatter(tamanho_casa, preco_casa, alpha=0.6, s=50, c='blue', edgecolors='black')
plt.xlabel('Tamanho da Casa (m²)', fontsize=12)
plt.ylabel('Preço da Casa (R$)', fontsize=12)
plt.title('🏠 Dataset: Tamanho vs Preço das Casas', fontsize=16, fontweight='bold')
plt.grid(True, alpha=0.3)

# Formatando eixo Y para mostrar valores em reais
plt.gca().yaxis.set_major_formatter(plt.FuncFormatter(lambda x, p: f'R$ {x/1000:.0f}K'))

plt.show()

print("\n🎯 Agora vamos treinar um modelo para prever o preço baseado no tamanho!")

In [None]:
# Implementando nosso modelo de regressão linear

class ModeloLinearSimples:
    def __init__(self):
        self.theta0 = 0  # Intercepto
        self.theta1 = 0  # Coeficiente angular
        self.historico_custo = []
    
    def prever(self, x):
        """Faz predições usando o modelo atual"""
        return self.theta0 + self.theta1 * x
    
    def calcular_custo(self, x, y):
        """Calcula o custo MSE"""
        m = len(x)
        predicoes = self.prever(x)
        custo = (1/(2*m)) * np.sum((predicoes - y)**2)
        return custo
    
    def treinar_analitico(self, x, y):
        """Resolve analiticamente (fórmula fechada)"""
        # Fórmulas da regressão linear
        x_mean = np.mean(x)
        y_mean = np.mean(y)
        
        numerador = np.sum((x - x_mean) * (y - y_mean))
        denominador = np.sum((x - x_mean)**2)
        
        self.theta1 = numerador / denominador
        self.theta0 = y_mean - self.theta1 * x_mean
        
        return self.theta0, self.theta1

# Criando e treinando o modelo
modelo = ModeloLinearSimples()

print("🤖 TREINANDO O MODELO...")
print(f"   📊 Dados de entrada: {len(tamanho_casa)} casas")

# Calculando custo inicial (parâmetros zerados)
custo_inicial = modelo.calcular_custo(tamanho_casa, preco_casa)
print(f"   💸 Custo inicial (θ₀=0, θ₁=0): {custo_inicial:,.0f}")

# Treinando (solução ótima analítica)
theta0_otimo, theta1_otimo = modelo.treinar_analitico(tamanho_casa, preco_casa)
custo_final = modelo.calcular_custo(tamanho_casa, preco_casa)

print(f"\n✅ MODELO TREINADO!")
print(f"   🎯 θ₀ (intercepto): R$ {theta0_otimo:,.0f}")
print(f"   📈 θ₁ (preço/m²): R$ {theta1_otimo:,.0f} por m²")
print(f"   💰 Custo final: {custo_final:,.0f}")
print(f"   📉 Redução do custo: {((custo_inicial-custo_final)/custo_inicial)*100:.1f}%")

print(f"\n🏠 INTERPRETAÇÃO DO MODELO:")
print(f"   💡 Preço base (casa de 0m²): R$ {theta0_otimo:,.0f}")
print(f"   💡 Cada m² adicional custa: R$ {theta1_otimo:,.0f}")
print(f"   💡 Fórmula: Preço = {theta0_otimo:,.0f} + {theta1_otimo:,.0f} × Tamanho")

In [None]:
# Visualizando o resultado final

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(18, 8))

# Subplot 1: Dados + Modelo ajustado
ax1.scatter(tamanho_casa, preco_casa, alpha=0.6, s=50, c='lightblue', 
           edgecolors='black', label='Dados Reais')

# Linha do modelo
x_linha = np.linspace(tamanho_casa.min(), tamanho_casa.max(), 100)
y_linha = modelo.prever(x_linha)
ax1.plot(x_linha, y_linha, 'r-', linewidth=3, 
        label=f'Modelo: y = {theta0_otimo:,.0f} + {theta1_otimo:,.0f}x')

ax1.set_xlabel('Tamanho da Casa (m²)', fontsize=12)
ax1.set_ylabel('Preço da Casa (R$)', fontsize=12)
ax1.set_title('🏠 Modelo Treinado vs Dados Reais', fontsize=14, fontweight='bold')
ax1.legend()
ax1.grid(True, alpha=0.3)
ax1.yaxis.set_major_formatter(plt.FuncFormatter(lambda x, p: f'R$ {x/1000:.0f}K'))

# Subplot 2: Resíduos (erros)
predicoes = modelo.prever(tamanho_casa)
residuos = preco_casa - predicoes

ax2.scatter(predicoes, residuos, alpha=0.6, s=50, c='orange', edgecolors='black')
ax2.axhline(y=0, color='red', linestyle='--', linewidth=2, label='Erro = 0')
ax2.set_xlabel('Predições (R$)', fontsize=12)
ax2.set_ylabel('Resíduos (R$)', fontsize=12)
ax2.set_title('📊 Análise dos Resíduos', fontsize=14, fontweight='bold')
ax2.legend()
ax2.grid(True, alpha=0.3)
ax2.xaxis.set_major_formatter(plt.FuncFormatter(lambda x, p: f'R$ {x/1000:.0f}K'))
ax2.yaxis.set_major_formatter(plt.FuncFormatter(lambda x, p: f'R$ {x/1000:.0f}K'))

plt.tight_layout()
plt.show()

# Calculando métricas de performance
from sklearn.metrics import r2_score, mean_absolute_error

r2 = r2_score(preco_casa, predicoes)
mae = mean_absolute_error(preco_casa, predicoes)
rmse = np.sqrt(np.mean(residuos**2))

print("📊 MÉTRICAS DE PERFORMANCE:")
print(f"   🎯 R² Score: {r2:.3f} ({r2*100:.1f}% da variância explicada)")
print(f"   📏 MAE: R$ {mae:,.0f} (erro médio absoluto)")
print(f"   📐 RMSE: R$ {rmse:,.0f} (erro quadrático médio)")

print(f"\n🏠 TESTE PRÁTICO:")
tamanhos_teste = [80, 120, 200]
for tamanho in tamanhos_teste:
    preco_previsto = modelo.prever(tamanho)
    print(f"   Casa de {tamanho}m²: R$ {preco_previsto:,.0f}")

## 🎯 Exercício Prático 1: Explorando Funções



**Agora é sua vez de colocar a mão na massa!** 🚀

**Desafio:** Crie e analise diferentes funções de custo para entender seu comportamento.

**Tarefas:**
1. Implemente uma função cúbica: $f(x) = ax^3 + bx^2 + cx + d$
2. Teste diferentes valores para os parâmetros $a$, $b$, $c$, $d$
3. Visualize como cada parâmetro afeta o formato da função
4. Identifique onde estão os mínimos e máximos

**💡 Dica do Pedro:** Use `np.gradient()` para calcular aproximadamente a derivada e encontrar pontos críticos!

In [None]:
# EXERCÍCIO 1: Complete o código abaixo

def funcao_cubica(x, a, b, c, d):
    """Função cúbica: f(x) = ax³ + bx² + cx + d"""
    # TODO: Implemente a função cúbica
    return # Sua implementação aqui

def encontrar_pontos_criticos(x, y):
    """Encontra pontos onde a derivada ≈ 0"""
    # TODO: Use np.gradient para calcular a derivada
    derivada = # Sua implementação aqui
    
    # TODO: Encontre onde a derivada muda de sinal
    # Dica: use np.diff(np.sign(derivada)) para detectar mudanças de sinal
    
    return pontos_criticos

# Teste seus parâmetros aqui
x = np.linspace(-3, 3, 1000)

# TODO: Teste diferentes valores de parâmetros
a, b, c, d = 1, -3, 2, 1  # Modifique estes valores!

y = funcao_cubica(x, a, b, c, d)
pontos_criticos = encontrar_pontos_criticos(x, y)

# Visualização
plt.figure(figsize=(12, 8))
plt.plot(x, y, 'b-', linewidth=3, label=f'f(x) = {a}x³ + {b}x² + {c}x + {d}')

# TODO: Marque os pontos críticos no gráfico
# plt.scatter(...)

plt.xlabel('x')
plt.ylabel('f(x)')
plt.title('🎯 Sua Função Cúbica', fontsize=16, fontweight='bold')
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()

print("🎯 ANÁLISE DA SUA FUNÇÃO:")
print(f"   📊 Parâmetros: a={a}, b={b}, c={c}, d={d}")
print(f"   🎯 Pontos críticos encontrados: {len(pontos_criticos)}")
print("\n💡 Experimente diferentes valores e veja como a função muda!")

## 🎯 Exercício Prático 2: Criando sua Própria Função de Custo

**Desafio Avançado:** Implemente e compare diferentes funções de custo!

**Cenário:** Você tem um dataset com alguns outliers e precisa escolher a melhor função de custo.

**Tarefas:**
1. Implemente MSE, MAE e Huber Loss
2. Teste com dados que têm outliers
3. Compare visualmente qual função é mais robusta
4. Analise qual seria melhor para seu problema

In [None]:
# EXERCÍCIO 2: Implemente as funções de custo

# Dados com outliers para teste
y_true = np.array([1, 2, 3, 4, 5, 6, 7, 8])
y_pred_normal = np.array([1.1, 2.1, 2.9, 4.1, 4.9, 6.1, 7.1, 7.9])  # Predições normais
y_pred_outlier = np.array([1.1, 2.1, 2.9, 15, 4.9, 6.1, 7.1, 7.9])  # Com outlier

def mse_loss(y_true, y_pred):
    """TODO: Implemente Mean Squared Error"""
    return # Sua implementação

def mae_loss(y_true, y_pred):
    """TODO: Implemente Mean Absolute Error"""
    return # Sua implementação

def huber_loss(y_true, y_pred, delta=1.0):
    """TODO: Implemente Huber Loss"""
    # Dica: Use np.where para implementar a condição
    return # Sua implementação

# TODO: Teste suas implementações
print("📊 COMPARANDO FUNÇÕES DE CUSTO:\n")

print("Cenário 1: Predições normais")
print(f"MSE:   {mse_loss(y_true, y_pred_normal):.3f}")
print(f"MAE:   {mae_loss(y_true, y_pred_normal):.3f}")
print(f"Huber: {huber_loss(y_true, y_pred_normal):.3f}")

print("\nCenário 2: Com outlier")
print(f"MSE:   {mse_loss(y_true, y_pred_outlier):.3f}")
print(f"MAE:   {mae_loss(y_true, y_pred_outlier):.3f}")
print(f"Huber: {huber_loss(y_true, y_pred_outlier):.3f}")

# TODO: Crie uma visualização comparando as três funções
# Dica: Use subplots para mostrar cada cenário

print("\n🤔 PERGUNTA PARA REFLEXÃO:")
print("Qual função de custo você usaria se seus dados tivessem muitos outliers? Por quê?")

## 🔄 Conectando com os Próximos Módulos

```mermaid
graph TD
    A["📊 Módulo 2: Funções e Gráficos"] --> B["🎯 Módulo 3: Limites"]
    B --> C["📈 Módulo 4: Derivadas"]
    C --> D["⛓️ Módulo 6: Regra da Cadeia"]
    D --> E["🏔️ Módulo 11: Gradiente Descendente"]
    
    A --> F["Visualizar a montanha"]
    B --> G["Continuidade da função"]
    C --> H["Inclinação em cada ponto"]
    D --> I["Backpropagation"]
    E --> J["Otimização final"]
```

**🎯 Recapitulando nossa jornada:**

**✅ No Módulo 1:** Entendemos que IA é otimização e visualizamos a "montanha do erro"

**✅ No Módulo 2 (atual):** Aprendemos a:
- Criar e visualizar funções matemáticas
- Entender funções de custo (MSE, MAE, Huber)
- Mapear a paisagem completa do erro
- Identificar propriedades importantes (convexidade, mínimos)

**🚀 Próximos módulos:**
- **Módulo 3**: Como definir quando uma função é "suave" (limites)
- **Módulo 4**: Como medir a "inclinação" da montanha (derivadas)
- **Módulo 6**: Como calcular gradientes em redes neurais (regra da cadeia)
- **Módulo 11**: Como "descer" a montanha eficientemente (gradiente descendente)

**💡 Dica do Pedro:** Tudo que vimos aqui vai ser fundamental para entender como os algoritmos de IA realmente funcionam!

## 🎉 Resumo: O que Aprendemos

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/cálculo-para-ia-modulo-02_img_08.png)

**Parabéns! Você concluiu o Módulo 2! 🎊**

### 🧠 **Conceitos Fundamentais Dominados:**

1. **🔧 Funções Matemáticas**
   - O que são e como funcionam
   - Entrada → Processamento → Saída
   - Tipos: linear, quadrática, exponencial

2. **👁️ Importância da Visualização**
   - Cérebro processa visual 50.000x mais rápido
   - Identifica padrões instantaneamente
   - Detecta problemas facilmente

3. **💰 Funções de Custo**
   - MSE: Para regressão, penaliza erros grandes
   - MAE: Robusta a outliers
   - Huber: Melhor dos dois mundos

4. **🗺️ Mapeamento da Paisagem**
   - Visualização 3D da função de custo
   - Identificação de mínimos globais
   - Curvas de nível e mapas de calor

5. **🔍 Propriedades das Funções**
   - Convexidade (santo graal!)
   - Continuidade e derivabilidade
   - Mínimos locais vs globais

### 🎯 **Skills Práticas Desenvolvidas:**
- ✅ Implementar funções de custo do zero
- ✅ Criar visualizações informativas
- ✅ Analisar propriedades matemáticas
- ✅ Comparar diferentes abordagens
- ✅ Resolver problemas reais (previsão de preços)

### 🚀 **Preparação para os Próximos Módulos:**
- 🎯 **Limites**: Definir continuidade e suavidade
- 📈 **Derivadas**: Medir inclinação e taxa de variação
- ⛓️ **Regra da Cadeia**: Base do backpropagation
- 🏔️ **Gradiente Descendente**: Otimização prática

**💡 Frase do Pedro:** *"Agora você não apenas sabe que existe uma montanha do erro - você sabe como mapeá-la, visualizá-la e entender sua geografia! Isso é fundamental para tudo que vem pela frente!"*

**🎊 Continue firme na jornada! O próximo módulo sobre Limites vai ser LINDO!**