Sum√°rio: 

1. Physics-Informed Neural Networks (PINNs) com PyTorch

1. **Introdu√ß√£o √†s PINNs**
    - O que s√£o PINNs?
    - Por que combinar f√≠sica com redes neurais?
    - Aplica√ß√µes em finan√ßas e outras √°reas.

2. **Fundamentos Matem√°ticos das PINNs**
    - Formula√ß√£o de equa√ß√µes diferenciais parciais (PDEs) em PINNs.
    - Fun√ß√£o de perda combinando dados e f√≠sica.
    - Exemplo simples: Equa√ß√£o do Calor ou Black-Scholes.

3. **Implementa√ß√£o B√°sica com PyTorch**
    - Arquitetura da rede neural.
    - Defini√ß√£o da fun√ß√£o de perda (dados + PDE).
    - Treinamento e desafios num√©ricos.

4. **Aplica√ß√£o em Finan√ßas: Modelo Black-Scholes**
    - Revis√£o da equa√ß√£o Black-Scholes.
    - Adapta√ß√£o para uma PINN.
    - Compara√ß√£o com solu√ß√µes anal√≠ticas/n√∫mericas tradicionais.

5. **T√≥picos Avan√ßados e Otimiza√ß√µes**
    - Tratamento de condi√ß√µes iniciais/de contorno.
    - Balanceamento de termos na fun√ß√£o de perda.
    - Acelera√ß√£o com GPUs e t√©cnicas de treinamento.

6. **Estudo de Caso Pr√°tico**
    - Implementa√ß√£o completa de uma PINN para op√ß√µes europeias.
    - Visualiza√ß√£o de resultados.

7. **Limita√ß√µes e Extens√µes**
    - Quando PINNs falham?
    - Alternativas h√≠bridas (ex: PINNs + SDEs).

## 1. Physics-Informed Neural Networks (PINNs) com PyTorch


### 1.1 **Introdu√ß√£o √†s PINNs**

1.1 **Introdu√ß√£o √†s PINNs**
- O que s√£o PINNs?
- Por que combinar f√≠sica com redes neurais?
- Aplica√ß√µes em finan√ßas e outras √°reas.

O que s√£o PINNs?
PINNs s√£o redes neurais treinadas para resolver equa√ß√µes diferenciais (PDEs/ODEs) incorporando diretamente as leis f√≠sicas (ou financeiras) na fun√ß√£o de perda. Em vez de depender apenas de dados, elas usam a estrutura conhecida da equa√ß√£o subjacente (ex: Black-Scholes) como regulariza√ß√£o.

Por que combinar f√≠sica com redes neurais?
- Dados escassos: Em problemas financeiros ou f√≠sicos, dados reais podem ser limitados ou ruidosos. A f√≠sica atua como um "guia" para generaliza√ß√£o.
- Interpretabilidade: A solu√ß√£o respeita leis conhecidas, mesmo em regi√µes sem dados.
- Flexibilidade: PINNs lidam com problemas n√£o-lineares e geometrias complexas sem malhas num√©ricas.

Aplica√ß√µes em finan√ßas:
- Precifica√ß√£o de op√ß√µes (Black-Scholes).
- Calibra√ß√£o de modelos estoc√°sticos.
- Simula√ß√£o de cen√°rios de mercado com restri√ß√µes te√≥ricas.


### 2. **Fundamentos Matem√°ticos das PINNs**


**Fundamentos Matem√°ticos das PINNs**
    - Formula√ß√£o de equa√ß√µes diferenciais parciais (PDEs) em PINNs.
    - Fun√ß√£o de perda combinando dados e f√≠sica.
    - Exemplo simples: Equa√ß√£o do Calor ou Black-Scholes.

As PINNs resolvem problemas baseados em equa√ß√µes diferenciais (PDEs/ODEs) combinando duas fontes de informa√ß√£o:  
1. **Dados observados** (ex: pre√ßos de op√ß√µes no mercado).  
2. **Leis f√≠sicas/financeiras** (ex: equa√ß√£o Black-Scholes).  


#### **2.1 Formula√ß√£o Geral de uma PINN**  
Considere uma PDE gen√©rica:  
$$
\mathcal{F}[u(t, x)] = 0, \quad t \in [0, T], x \in \Omega  
$$  
com:  
- **Condi√ß√£o inicial (IC):** \( u(0, x) = u_0(x) \).  
- **Condi√ß√µes de contorno (BC):** \( u(t, x) = g(t, x) \) em \( \partial\Omega \).  

**Exemplo (Equa√ß√£o Black-Scholes):**  
$$
\frac{\partial V}{\partial t} + rS\frac{\partial V}{\partial S} + \frac{1}{2}\sigma^2 S^2 \frac{\partial^2 V}{\partial S^2} - rV = 0  
$$  
Onde \( V(t, S) \) √© o pre√ßo da op√ß√£o, \( S \) √© o ativo subjacente, \( r \) √© a taxa livre de risco, e \( \sigma \) √© a volatilidade.  

A ordem l√≥gica do c√≥gido se da pela seguinte forma:

C√≥digo Completo da PINN para Black-Scholes
1. Importa√ß√µes e Configura√ß√µes Iniciais
2. Defini√ß√£o da Arquitetura da PINN
3. Fun√ß√µes de Amostragem de Dados
4. Fun√ß√µes de Perda
5. Loop de Treinamento


Ordem L√≥gica de Execu√ß√£o
- Configura√ß√£o: Define par√¢metros do modelo e hiperpar√¢metros da rede.
- 
- Arquitetura: Cria a PINN com camadas lineares e ativa√ß√£o Tanh.
- 
- Amostragem: Gera pontos para o dom√≠nio, condi√ß√£o inicial e contorno.
- 
- Perdas: Calcula os termos da PDE, condi√ß√£o inicial e contorno.
- 
- Treinamento: Minimiza a perda total via backpropagation.


# A Equa√ß√£o de Black-Scholes

A equa√ß√£o de Black-Scholes √© uma PDE (Equa√ß√£o Diferencial Parcial) que descreve a evolu√ß√£o do pre√ßo de uma op√ß√£o europeia sob certas premissas, como:
- Mercado eficiente;
- Sem pagamento de dividendos;
- Volatilidade constante.

Para uma **op√ß√£o de compra (call)**, sua f√≥rmula anal√≠tica √©:

$$
C(S_t, t) = S_t N(d_1) - K e^{-r(T-t)} N(d_2)
$$

Onde:
- \( C(S_t, t) \) √© o pre√ßo da op√ß√£o no tempo \( t \), dado o pre√ßo do ativo \( S_t \).
- \( N(\cdot) \) √© a fun√ß√£o cumulativa da distribui√ß√£o normal padr√£o.
- \( d_1 \) e \( d_2 \) s√£o termos que dependem de \( S_t \), \( K \), \( r \), \( \sigma \) e \( T - t \).

### Forma Diferencial (PDE) da Equa√ß√£o de Black-Scholes

A forma diferencial da equa√ß√£o, que √© a base para a PINN, √©:

$$
\frac{\partial V}{\partial t} + r S \frac{\partial V}{\partial S} + \frac{1}{2} \sigma^2 S^2 \frac{\partial^2 V}{\partial S^2} - rV = 0
$$

Essa equa√ß√£o √© a base para diversas abordagens num√©ricas e de aprendizado de m√°quina, como redes neurais f√≠sicas (*Physics-Informed Neural Networks* - PINNs), que buscam resolver a PDE de forma eficiente.

In [None]:
#C√≥digo para Treinamento de uma Rede Neural Profunda (PINN) para o Modelo Black-Scholes
#1. Importa√ß√µes e Configura√ß√µes Iniciais
import torch
import torch.nn as nn
import numpy as np

# Par√¢metros do modelo Black-Scholes
r = 0.05      # Taxa livre de risco
sigma = 0.2   # Volatilidade
K = 100.0     # Pre√ßo de exerc√≠cio (strike)
T = 1.0       # Tempo at√© a expira√ß√£o (em anos)
S_min = 0     # Pre√ßo m√≠nimo do ativo
S_max = 200   # Pre√ßo m√°ximo do ativo

# Hiperpar√¢metros da PINN
layers = [2, 50, 50, 1]  # Arquitetura da rede: [input_dim, hidden_dim, ..., output_dim]
lambda_pde = 1.0         # Peso da perda da PDE
lambda_ic = 1.0          # Peso da condi√ß√£o inicial
lambda_bc = 1.0          # Peso das condi√ß√µes de contorno
batch_size = 100         # N√∫mero de pontos por batch
epochs = 5000            # N√∫mero de √©pocas

#2. Defini√ß√£o da Arquitetura da PINN
class PINN(nn.Module):
    def __init__(self, layers):
        super().__init__()
        self.linear_layers = nn.ModuleList(
            [nn.Linear(layers[i], layers[i+1]) for i in range(len(layers)-1)]
        )
        self.activation = nn.Tanh()  # Ativa√ß√£o suave para gradientes est√°veis

    def forward(self, t, S):
        inputs = torch.cat([t, S], dim=1)  # Concatena tempo (t) e pre√ßo (S)
        for layer in self.linear_layers[:-1]:
            inputs = self.activation(layer(inputs))
        output = self.linear_layers[-1](inputs)  # Sem ativa√ß√£o na √∫ltima camada
        return output
    
#3. Fun√ß√µes de Amostragem de Dados
def sample_domain(batch_size):
    """Gera pontos aleat√≥rios no dom√≠nio [0,T] x [S_min, S_max]."""
    t = torch.rand(batch_size, 1) * T
    S = torch.rand(batch_size, 1) * (S_max - S_min) + S_min
    return t, S

def sample_ic(batch_size):
    """Gera pontos para a condi√ß√£o inicial (payoff em t=T)."""
    S_ic = torch.rand(batch_size, 1) * (S_max - S_min) + S_min
    return S_ic

def sample_bc_times(batch_size):
    """Gera tempos para as condi√ß√µes de contorno."""
    return torch.rand(batch_size, 1) * T

#4. Fun√ß√µes de Perda
def loss_pde(t, S, V_hat):
    """Calcula o residual da PDE Black-Scholes."""
    t.requires_grad_(True)
    S.requires_grad_(True)
    
    # Derivadas parciais via autograd
    dV_dt = torch.autograd.grad(V_hat.sum(), t, create_graph=True)[0]
    dV_dS = torch.autograd.grad(V_hat.sum(), S, create_graph=True)[0]
    d2V_dS2 = torch.autograd.grad(dV_dS.sum(), S, create_graph=True)[0]
    
    # Residual da PDE
    residual = dV_dt + r * S * dV_dS + 0.5 * (sigma ** 2) * (S ** 2) * d2V_dS2 - r * V_hat
    return (residual ** 2).mean()

def loss_ic(S_ic):
    """Perda da condi√ß√£o inicial (payoff final)."""
    t_ic = torch.ones_like(S_ic) * T  # Tempo final (t=T)
    V_true_ic = torch.max(S_ic - K, torch.zeros_like(S_ic))  # Payoff: max(S-K, 0)
    V_pred_ic = pinn(t_ic, S_ic)
    return ((V_pred_ic - V_true_ic) ** 2).mean()

def loss_bc(t_bc):
    """Perda das condi√ß√µes de contorno."""
    # BC1: V(t, S=0) = 0
    S_bc_low = torch.zeros_like(t_bc)
    V_bc_low = pinn(t_bc, S_bc_low)
    loss_bc1 = (V_bc_low ** 2).mean()
    
    # BC2: V(t, S -> ‚àû) ‚âà S - K*e^{-r(T-t)}
    S_bc_high = torch.ones_like(t_bc) * S_max
    V_bc_high = pinn(t_bc, S_bc_high)
    V_true_bc_high = S_bc_high - K * torch.exp(-r * (T - t_bc))
    loss_bc2 = ((V_bc_high - V_true_bc_high) ** 2).mean()
    
    return loss_bc1 + loss_bc2

#5. Loop de Treinamento
# Inicializa a rede e o otimizador
pinn = PINN(layers)
optimizer = torch.optim.Adam(pinn.parameters(), lr=0.001)

for epoch in range(epochs):
    optimizer.zero_grad()
    
    # Amostra pontos do dom√≠nio e calcula as perdas
    t_pde, S_pde = sample_domain(batch_size)
    V_hat = pinn(t_pde, S_pde)
    
    l_pde = loss_pde(t_pde, S_pde, V_hat)
    l_ic = loss_ic(sample_ic(batch_size))
    l_bc = loss_bc(sample_bc_times(batch_size))
    
    # Perda total ponderada
    loss = lambda_pde * l_pde + lambda_ic * l_ic + lambda_bc * l_bc
    
    # Backpropagation
    loss.backward()
    optimizer.step()
    
    if epoch % 1000 == 0:
        print(f"Epoch {epoch}, Loss: {loss.item():.4f}, PDE Loss: {l_pde.item():.4f}")


In [14]:
%pip install matplotlib

Collecting matplotlib
  Downloading matplotlib-3.10.1-cp313-cp313-win_amd64.whl.metadata (11 kB)
Collecting contourpy>=1.0.1 (from matplotlib)
  Downloading contourpy-1.3.1-cp313-cp313-win_amd64.whl.metadata (5.4 kB)
Collecting cycler>=0.10 (from matplotlib)
  Downloading cycler-0.12.1-py3-none-any.whl.metadata (3.8 kB)
Collecting fonttools>=4.22.0 (from matplotlib)
  Downloading fonttools-4.57.0-cp313-cp313-win_amd64.whl.metadata (104 kB)
Collecting kiwisolver>=1.3.1 (from matplotlib)
  Downloading kiwisolver-1.4.8-cp313-cp313-win_amd64.whl.metadata (6.3 kB)
Collecting pillow>=8 (from matplotlib)
  Downloading pillow-11.2.1-cp313-cp313-win_amd64.whl.metadata (9.1 kB)
Collecting pyparsing>=2.3.1 (from matplotlib)
  Downloading pyparsing-3.2.3-py3-none-any.whl.metadata (5.0 kB)
Downloading matplotlib-3.10.1-cp313-cp313-win_amd64.whl (8.1 MB)
   ---------------------------------------- 0.0/8.1 MB ? eta -:--:--
   ---------- ----------------------------- 2.1/8.1 MB 11.7 MB/s eta 0:00:01
 

In [None]:
import torch
import torch.nn as nn
import numpy as np
import matplotlib.pyplot as plt


In [None]:
#C√≥digo para Treinamento de uma Rede Neural Profunda (PINN) para o Modelo Black-Scholes

# ======================
# 1. Configura√ß√£o
# ======================
r = 0.05       # Taxa livre de risco
sigma = 0.2    # Volatilidade
K = 100.0      # Pre√ßo de exerc√≠cio
T = 1.0        # Tempo at√© a maturidade (anos)
S_min = 0      # Pre√ßo m√≠nimo do ativo
S_max = 200    # Pre√ßo m√°ximo do ativo

# Hiperpar√¢metros da PINN
layers = [2, 50, 50, 1]  # Estrutura da rede [entrada, ocultas..., sa√≠da]
lambda_pde = 1.0         # Peso da perda da PDE
lambda_ic = 1.0          # Peso da perda da condi√ß√£o inicial
lambda_bc = 1.0          # Peso da perda da condi√ß√£o de contorno
batch_size = 100         # Pontos por lote
epochs = 5000            # N√∫mero de √©pocas de treino
learning_rate = 0.001    # Taxa de aprendizado do otimizador

# ======================
# 2. Arquitetura da PINN
# ======================
class BlackScholesPINN(nn.Module):
    def __init__(self, layers):
        super().__init__()
        self.linear_layers = nn.ModuleList(
            [nn.Linear(layers[i], layers[i+1]) for i in range(len(layers)-1)]
        )
        self.activation = nn.Tanh()  # Fun√ß√£o de ativa√ß√£o suave para estabilidade

    def forward(self, t, S):
        t_norm = t.view(-1, 1) / T
        S_norm = S.view(-1, 1) / K
        inputs = torch.cat([t_norm, S_norm], dim=1)

        for layer in self.linear_layers[:-1]:
            inputs = self.activation(layer(inputs))
        return self.linear_layers[-1](inputs)

# ======================
# 3. Amostragem de Dados
# ======================
def sample_domain(batch_size):
    t = torch.rand(batch_size, 1) * T
    S = torch.rand(batch_size, 1) * (S_max - S_min) + S_min
    t.requires_grad = True
    S.requires_grad = True
    return t, S

def sample_ic(batch_size):
    S_ic = torch.rand(batch_size, 1) * (S_max - S_min) + S_min
    return S_ic

def sample_bc(batch_size):
    t_bc = torch.rand(batch_size, 1) * T
    return t_bc

# ======================
# 4. Fun√ß√µes de Perda
# ======================
def compute_derivatives(t, S, V_hat):
    dV_dt = torch.autograd.grad(V_hat.sum(), t, create_graph=True)[0]
    dV_dS = torch.autograd.grad(V_hat.sum(), S, create_graph=True)[0]
    d2V_dS2 = torch.autograd.grad(dV_dS.sum(), S, create_graph=True)[0]
    return dV_dt, dV_dS, d2V_dS2

def pde_loss(t, S, V_hat):
    dV_dt, dV_dS, d2V_dS2 = compute_derivatives(t, S, V_hat)
    residual = dV_dt + r*S*dV_dS + 0.5*(sigma**2)*(S**2)*d2V_dS2 - r*V_hat
    return (residual**2).mean()

def ic_loss(pinn, S_ic):
    t_ic = torch.ones_like(S_ic) * T
    V_true = torch.max(S_ic - K, torch.zeros_like(S_ic))
    V_pred = pinn(t_ic, S_ic)
    return ((V_pred - V_true)**2).mean()

def bc_loss(pinn, t_bc):
    S_bc1 = torch.zeros_like(t_bc)
    V_bc1 = pinn(t_bc, S_bc1)
    loss1 = (V_bc1**2).mean()

    S_bc2 = torch.ones_like(t_bc) * S_max
    V_true_bc2 = S_bc2 - K * torch.exp(-r * (T - t_bc))
    V_bc2 = pinn(t_bc, S_bc2)
    loss2 = ((V_bc2 - V_true_bc2)**2).mean()

    return loss1 + loss2

# ======================
# 5. Loop de Treinamento
# ======================
pinn = BlackScholesPINN(layers)
optimizer = torch.optim.Adam(pinn.parameters(), lr=learning_rate)

loss_history = []

for epoch in range(epochs):
    optimizer.zero_grad()

    t_pde, S_pde = sample_domain(batch_size)
    V_hat = pinn(t_pde, S_pde)

    l_pde = pde_loss(t_pde, S_pde, V_hat)
    l_ic = ic_loss(pinn, sample_ic(batch_size))
    l_bc = bc_loss(pinn, sample_bc(batch_size))

    loss = lambda_pde*l_pde + lambda_ic*l_ic + lambda_bc*l_bc
    loss_history.append(loss.item())

    loss.backward()
    optimizer.step()

    if epoch % 1000 == 0:
        print(f"√âpoca {epoch:5d} | Perda Total: {loss.item():.4e} | "
              f"Perda PDE: {l_pde.item():.4e} | Perda IC: {l_ic.item():.4e} | "
              f"Perda BC: {l_bc.item():.4e}")

√âpoca     0 | Perda Total: 1.2887e+04 | Perda PDE: 1.0179e-02 | Perda IC: 2.3319e+03 | Perda BC: 1.0555e+04
√âpoca  1000 | Perda Total: 3.0909e+03 | Perda PDE: 9.0591e+00 | Perda IC: 2.8809e+02 | Perda BC: 2.7937e+03
√âpoca  2000 | Perda Total: 5.7378e+02 | Perda PDE: 1.9597e+01 | Perda IC: 2.8109e+01 | Perda BC: 5.2608e+02
√âpoca  3000 | Perda Total: 9.5734e+01 | Perda PDE: 8.6751e+00 | Perda IC: 8.4406e+00 | Perda BC: 7.8618e+01
√âpoca  4000 | Perda Total: 1.6335e+01 | Perda PDE: 9.0750e-01 | Perda IC: 1.0315e+00 | Perda BC: 1.4396e+01


In [None]:
#(Com func. de aviso) C√≥digo para Treinamento de uma Rede Neural Profunda (PINN) para o Modelo Black-Scholes

def log_step(step):
    print(f"‚úÖ Etapa conclu√≠da: {step}")

try:
    # ======================
    # 1. Configura√ß√£o
    # ======================

    # a) Par√¢metros do Modelo Black-Scholes
    r = 0.05       # Taxa livre de risco
    sigma = 0.2    # Volatilidade
    K = 100.0      # Pre√ßo de exerc√≠cio
    T = 1.0        # Tempo at√© a maturidade (anos)
    S_min = 0      # Pre√ßo m√≠nimo do ativo
    S_max = 200    # Pre√ßo m√°ximo do ativo

    # b)Hiperpar√¢metros da PINN
    layers = [2, 50, 50, 1]
    lambda_pde = 1.0
    lambda_ic = 1.0
    lambda_bc = 1.0
    batch_size = 100
    epochs = 5000
    learning_rate = 0.001

    log_step("Configura√ß√£o inicial")

    # ======================
    # 2. Arquitetura da PINN
    # ======================
    class BlackScholesPINN(nn.Module):
        def __init__(self, layers):
            super().__init__()
            self.linear_layers = nn.ModuleList(
                [nn.Linear(layers[i], layers[i+1]) for i in range(len(layers)-1)]
            )
            self.activation = nn.Tanh()

        def forward(self, t, S):
            t_norm = t.view(-1, 1) / T
            S_norm = S.view(-1, 1) / K
            inputs = torch.cat([t_norm, S_norm], dim=1)
            
            for layer in self.linear_layers[:-1]:
                inputs = self.activation(layer(inputs))
            return self.linear_layers[-1](inputs)

    log_step("Defini√ß√£o da arquitetura da rede")

    # ======================
    # 3. Amostragem de Dados
    # ======================
    def sample_domain(batch_size):
        t = torch.rand(batch_size, 1) * T
        S = torch.rand(batch_size, 1) * (S_max - S_min) + S_min
        t.requires_grad = True
        S.requires_grad = True
        return t, S

    def sample_ic(batch_size):
        S_ic = torch.rand(batch_size, 1) * (S_max - S_min) + S_min
        return S_ic

    def sample_bc(batch_size):
        t_bc = torch.rand(batch_size, 1) * T
        return t_bc

    log_step("Amostragem de dados")

    # ======================
    # 4. Fun√ß√µes de Perda
    # ======================
    def compute_derivatives(t, S, V_hat):
        dV_dt = torch.autograd.grad(V_hat.sum(), t, create_graph=True)[0]
        dV_dS = torch.autograd.grad(V_hat.sum(), S, create_graph=True)[0]
        d2V_dS2 = torch.autograd.grad(dV_dS.sum(), S, create_graph=True)[0]
        return dV_dt, dV_dS, d2V_dS2

    def pde_loss(t, S, V_hat):
        dV_dt, dV_dS, d2V_dS2 = compute_derivatives(t, S, V_hat)
        residual = dV_dt + r*S*dV_dS + 0.5*(sigma**2)*(S**2)*d2V_dS2 - r*V_hat
        return (residual**2).mean()

    def ic_loss(pinn, S_ic):
        t_ic = torch.ones_like(S_ic) * T
        V_true = torch.max(S_ic - K, torch.zeros_like(S_ic))
        V_pred = pinn(t_ic, S_ic)
        return ((V_pred - V_true)**2).mean()

    def bc_loss(pinn, t_bc):
        S_bc1 = torch.zeros_like(t_bc)
        V_bc1 = pinn(t_bc, S_bc1)
        loss1 = (V_bc1**2).mean()

        S_bc2 = torch.ones_like(t_bc) * S_max
        V_true_bc2 = S_bc2 - K * torch.exp(-r * (T - t_bc))
        V_bc2 = pinn(t_bc, S_bc2)
        loss2 = ((V_bc2 - V_true_bc2)**2).mean()

        return loss1 + loss2

    log_step("Defini√ß√£o das fun√ß√µes de perda")

    # ======================
    # 5. Loop de Treinamento
    # ======================
    pinn = BlackScholesPINN(layers)
    optimizer = torch.optim.Adam(pinn.parameters(), lr=learning_rate)

    loss_history = []

    log_step("Inicializa√ß√£o da rede e otimizador")

    for epoch in range(epochs):
        try:
            optimizer.zero_grad()

            t_pde, S_pde = sample_domain(batch_size)
            V_hat = pinn(t_pde, S_pde)

            l_pde = pde_loss(t_pde, S_pde, V_hat)
            l_ic = ic_loss(pinn, sample_ic(batch_size))
            l_bc = bc_loss(pinn, sample_bc(batch_size))

            loss = lambda_pde*l_pde + lambda_ic*l_ic + lambda_bc*l_bc
            loss_history.append(loss.item())

            loss.backward()
            optimizer.step()

            if epoch % 1000 == 0:
                print(f"√âpoca {epoch:5d} | Perda Total: {loss.item():.4e} | "
                      f"Perda PDE: {l_pde.item():.4e} | Perda IC: {l_ic.item():.4e} | "
                      f"Perda BC: {l_bc.item():.4e}")
            
        except Exception as e:
            print(f"‚ùå Erro na √©poca {epoch}: {e}")
            break  # Encerra o loop caso ocorra um erro

    log_step("Treinamento conclu√≠do")

except Exception as e:
    print(f"‚ùå Ocorreu um erro durante a execu√ß√£o: {e}")

‚úÖ Etapa conclu√≠da: Configura√ß√£o inicial
‚úÖ Etapa conclu√≠da: Defini√ß√£o da arquitetura da rede
‚úÖ Etapa conclu√≠da: Amostragem de dados
‚úÖ Etapa conclu√≠da: Defini√ß√£o das fun√ß√µes de perda
‚úÖ Etapa conclu√≠da: Inicializa√ß√£o da rede e otimizador
√âpoca     0 | Perda Total: 1.2130e+04 | Perda PDE: 3.0908e-02 | Perda IC: 1.5536e+03 | Perda BC: 1.0576e+04
√âpoca  1000 | Perda Total: 3.0298e+03 | Perda PDE: 6.2679e+00 | Perda IC: 2.3360e+02 | Perda BC: 2.7899e+03
√âpoca  2000 | Perda Total: 5.8488e+02 | Perda PDE: 1.7007e+01 | Perda IC: 3.0456e+01 | Perda BC: 5.3742e+02
√âpoca  3000 | Perda Total: 1.0111e+02 | Perda PDE: 2.4611e+01 | Perda IC: 1.3841e+01 | Perda BC: 6.2657e+01
√âpoca  4000 | Perda Total: 1.4024e+01 | Perda PDE: 2.4893e+00 | Perda IC: 2.6192e+00 | Perda BC: 8.9155e+00
‚úÖ Etapa conclu√≠da: Treinamento conclu√≠do


### . Detalhes do C√≥digo

#### 1. Configura√ß√µes Iniciais

1.a. Par√¢metros do Modelo Black-Scholes:

````
r = 0.05       # Taxa livre de risco
sigma = 0.2    # Volatilidade
K = 100.0      # Pre√ßo de exerc√≠cio (strike)
T = 1.0        # Tempo at√© a maturidade (em anos)
S_min = 0      # Pre√ßo m√≠nimo do ativo
S_max = 200    # Pre√ßo m√°ximo do ativo
````
**V√°riaveis representadas no c√≥digo:**

- **r = Taxa Livre de Risco:**
    Representa a taxa livre de risco, ou Taxa de retorno sem risco, (r na PDE). Usada para descontar o valor futuro da op√ß√£o( usada para descontar fluxos futuros ). Use a taxa anualizada de t√≠tulos p√∫blicos de prazo semelhante ao vencimento da op√ß√£o, por exemplo, se a op√ß√£o vence em 1 ano, pegue a taxa SELIC ou treasury bond de 1 ano. As melhores faixas s√£o o r variando entre 1% a 15% a.a., dependendo do pa√≠s e cen√°rio econ√¥mico. Para Ajuste, pode ser atualizada periodicamente para refletir a taxa de mercado mais recente.Pode ser fixada ou modelada estocasticamente em casos mais avan√ßados.
    Modelagem Estoc√°stica da Taxa Livre de Risco

     Como seria uma modelagem estoc√°stica da taxa definida?
     A **taxa livre de risco** \( r \) normalmente √© considerada constante para simplificar modelos de precifica√ß√£o. No entanto, em mercados mais complexos ou de longo prazo, essa taxa pode ser modelada como um **processo    estoc√°stico**.
    Modelo de Vasicek:
        Um modelo amplamente utilizado para taxas de juros √© o **Modelo de Vasicek**, que segue a equa√ß√£o diferencial   estoc√°stica:

    $$
    d r_t = a (b - r_t) dt + \sigma_r dW_t
    $$

    Onde:
    - \( a \) ‚Üí **Velocidade de revers√£o √† m√©dia**: determina o qu√£o r√°pido \( r_t \) converge para a taxa de longo     prazo.
    - \( b \) ‚Üí **Taxa de longo prazo (m√©dia)**: n√≠vel m√©dio ao qual a taxa tende a se estabilizar.
    - \( sigma_r \) ‚Üí **Volatilidade da taxa**: grau de incerteza na varia√ß√£o da taxa de juros.
    - \( dW_t \) ‚Üí **Movimento Browniano**: captura as varia√ß√µes aleat√≥rias ao longo do tempo.

    Impacto da Modelagem Estoc√°stica
    Ao inv√©s de considerar \( r \) como constante, simulamos **trajet√≥rias poss√≠veis** para a taxa de juros ao longo    do tempo. Isso permite:
    - Capturar cen√°rios onde a taxa **sobe** ou **abaixa** dinamicamente.
    - Melhorar a modelagem de **op√ß√µes de longo prazo** e **t√≠tulos de renda fixa**, tornando as simula√ß√µes mais    realistas.

---
- sigma = Volatilidade do Ativo Subjacente:
    Volatilidade do ativo subjacente (œÉ na PDE). Controla a difus√£o do pre√ßo, ou seja, mede o desvio padr√£o das varia√ß√µes do ativo. Uma boa pr√°tica √© usar a volatilidade hist√≥rica ou a volatilidade impl√≠cita (se dispon√≠vel no mercado de op√ß√µes). Faixa comum √© para A√ß√µes est√°veis: 10% a 30% a.a. e A√ß√µes vol√°teis ou criptomoedas: 50% a 150% a.a. Para um ajuste, podemos calcular com s√©ries hist√≥ricas de pre√ßos:
````
volatilidade = np.std(retornos) * np.sqrt(252)
````
Ou use a volatilidade impl√≠cita das op√ß√µes negociadas no mercado (melhor pr√°tica para precifica√ß√£o realista).

Como seria usar a volatilidade impl√≠cita das op√ß√µes negociadas no mercado?
A volatilidade impl√≠cita √© aquela que, se colocada no modelo (por exemplo, no Black-Scholes), faz com que o pre√ßo te√≥rico da op√ß√£o bata com o pre√ßo negociado no mercado. Para obter, devemos coletar os pre√ßos de op√ß√µes no mercado para diferentes strikes e vencimentos. Al√©m disso devemos usar um m√©todo de busca num√©rica (ex: Newton-Raphson) para encontrar a œÉ que iguala o pre√ßo do modelo ao pre√ßo de mercado.
Exemplo de conceito (simplificado):

````
def erro_volatilidade(sigma):
    preco_modelo = black_scholes(S, K, T, r, sigma)
    return preco_modelo - preco_mercado

# encontrar a sigma que zera o erro
sigma_implicita = optimize.brentq(erro_volatilidade, 0.01, 2)
````
Esse tipo de opera√ß√£o tem como impacto refletir as expectativas de mercado sobre a volatilidade futura e uma forma mais precisa para precificar op√ß√µes reais do que a volatilidade hist√≥rica.

---

- K = Pre√ßo de Exerc√≠cio (Strike)
    Pre√ßo de exerc√≠cio (strike) da op√ß√£o que representa o valor de compra/venda acordado na op√ß√£o. Aparece na condi√ß√£o inicial (payoff final). Depende do produto financeiro. Pode ser ATM (At-the-money), ITM (In-the-money) ou OTM (Out-the-money).
    - O que √© a condi√ß√£o inicial (payoff final):
        Na equa√ß√£o de derivadas parciais (PDE) da precifica√ß√£o de op√ß√µes, a condi√ß√£o inicial √© o valor da op√ß√£o no momento do vencimento (t = T), ou seja, o payoff.
        - Fun√ß√£o de Payoff para Op√ß√µes
            Op√ß√£o de Compra (*Call*) - A fun√ß√£o de payoff para uma op√ß√£o de compra (*call*) √© definida como:
            $$
            V(S, T) = \max(S_T - K, 0)
            $$
            Onde:
                - \( S_T \) ‚Üí Pre√ßo do ativo no tempo de vencimento \( T \).
                - \( K \) ‚Üí Pre√ßo de exerc√≠cio da op√ß√£o.
                - A fun√ß√£o **m√°ximo** garante que o payoff seja **zero** caso \( S_T < K \), pois o titular da op√ß√£o n√£o a exerceria.
            
            Op√ß√£o de Venda (*Put*) - A fun√ß√£o de payoff para uma op√ß√£o de venda (*put*) √© definida como:

            $$
            V(S, T) = \max(K - S_T, 0)
            $$

            Onde:
                - \( S_T \) ‚Üí Pre√ßo do ativo no tempo de vencimento \( T \).
                - \( K \) ‚Üí Pre√ßo de exerc√≠cio da op√ß√£o.
                - A fun√ß√£o **m√°ximo** garante que o payoff seja **zero** caso \( S_T > K \), pois o titular da op√ß√£o n√£o a          exerceria.

    Este modelo representa a base para a precifica√ß√£o de op√ß√µes e pode ser utilizado em diversos m√©todos,incluindo simula√ß√µes estoc√°sticas e equa√ß√µes diferenciais parciais.

- O que √© ATM, ITM e OTM?
    - ATM (At-the-money):
     - Quando o pre√ßo do ativo ‚âà strike.
    - ITM (In-the-money):
        - Para call: pre√ßo do ativo > strike
        - Para put: pre√ßo do ativo < strike
    - OTM (Out-the-money):
        - Para call: pre√ßo do ativo < strike
        - Para put: pre√ßo do ativo > strike

    Em simula√ß√µes, use m√∫ltiplos valores de K para construir a curva de valor da op√ß√£o. Para isso, voc√™ pode precificar a op√ß√£o para uma s√©rie de valores de strike e montar uma curva V(K) com o seguinte exemplo:
    ````
    Ks = np.linspace(80, 120, 20)
    valores_opcao = [black_scholes(S, K, T, r, sigma) for K in Ks]

    plt.plot(Ks, valores_opcao)
    plt.xlabel("Pre√ßo de Exerc√≠cio (K)")
    plt.ylabel("Valor da Op√ß√£o")
    plt.title("Curva Valor da Op√ß√£o x Strike")
    plt.show()
    ````
    As vantagens de se utilizar isso √© que permite uma analise de op√ß√µes sob diferentes niv√©is de strike usando para contruir superf√≠cies de volatilidade e estudar smiles ou skews
    A faixa comum se da nas casas pr√≥ximas ao pre√ßo atual do ativo, ou a ¬±10%, ¬±20%, etc., para cen√°rios de stress. Defina de acordo com o contrato ou com a faixa que deseja testar.

---

- T = Tempo at√© o Vencimento
    Tempo total at√© a expira√ß√£o da op√ß√£o. Define o dom√≠nio temporal t‚àà[0,T]. √â conveniente que se expresse em anos (ex: 6 meses = 0.5). Prefira ajustes din√¢micos se for atualizar o valor da op√ß√£o ao longo do tempo. Comum operar na faixa de 1 dia (‚âà 0.00396 anos) at√© 5 anos (5.0). O ajuste √© feito pelo contrato da op√ß√£o e em modelos din√¢micos, diminua t continuamente conforme o tempo passa, uma vez que modelos com atualiza√ß√£o din√¢mica s√£o mais realistas para op√ß√µes com vencimento curto e o valor da op√ß√£o decai com o tempo (efeito theta)

    Ex: hoje T = 1 ano

    Amanh√£ T = 1 - (1/252)

    Em simula√ß√£o cont√≠nua:

    ùë° ‚Üí ùëá ‚àí passo¬†de¬†tempo¬†acumulado

---

- S_min e S_max = ‚Äî Limites do Dom√≠nio Espacial
    Intervalo de pre√ßos considerado na simula√ß√£o. Importante para as condi√ß√µes de contorno. S_min: geralmente 0 e S_max: no m√≠nimo 2x o pre√ßo atual, mas prefira 3x ou 4x para evitar problemas de contorno. Exemplo:
    - Se pre√ßo atual = 100:
        - S_min = 0
        - S_max = 200 a 400

---


1.b. Hiperpar√¢metros da PINN

#### 2. Defini√ß√£o da Arquitetura da PINN

#### 3. Fun√ß√µes de Amostragem de Dados

#### 4. Fun√ß√µes de Perda

#### 5. Loop de Treinamento

#### Pr√≥ximos Passos

- Visualiza√ß√£o: Plotar a solu√ß√£o da PINN vs. solu√ß√£o anal√≠tica de Black-Scholes.
- Extens√µes: Adicionar dados de mercado reais (loss_data) para calibra√ß√£o.

In [None]:
# Exemplo de visualiza√ß√£o (ap√≥s o treinamento)
import matplotlib.pyplot as plt

S_test = torch.linspace(S_min, S_max, 100).reshape(-1, 1)
t_test = torch.zeros_like(S_test)  # t=0 (hoje)
V_pred = pinn(t_test, S_test).detach().numpy()

plt.plot(S_test, V_pred, label="PINN Solution")
plt.xlabel("Pre√ßo do Ativo (S)"); plt.ylabel("Pre√ßo da Op√ß√£o (V)")
plt.legend(); plt.show()

In [None]:
# ======================
# 6. Visualization
# ======================
# Plot training loss
plt.figure(figsize=(10, 5))
plt.semilogy(loss_history)
plt.xlabel("Epoch")
plt.ylabel("Loss (log scale)")
plt.title("Training Convergence")
plt.grid(True)
plt.show()

# Plot option price surface
with torch.no_grad():
    
    # Pre√ßo da op√ß√£o (V) em fun√ß√£o do pre√ßo do ativo (S) e do tempo (t)
    S_test = torch.linspace(S_min, S_max, 100).reshape(-1, 1)
    t_test = torch.zeros_like(S_test)  # t=0 (hoje)
    V_pred = pinn(t_test, S_test).detach().numpy()
    
    plt.plot(S_test, V_pred, label="PINN Solution")
    plt.xlabel("Pre√ßo do Ativo (S)"); plt.ylabel("Pre√ßo da Op√ß√£o (V)")
    plt.legend(); plt.show()    

    #Training Convergence
    S_test = torch.linspace(S_min, S_max, 100).reshape(-1, 1)
    t_test = torch.linspace(0, T, 50).reshape(-1, 1)
    

    
    # Create grid for 3D plot
    S_grid, t_grid = torch.meshgrid(S_test.squeeze(), t_test.squeeze())
    V_grid = pinn(t_grid.reshape(-1, 1), S_grid.reshape(-1, 1))
    V_grid = V_grid.reshape(S_grid.shape).numpy()
    
    fig = plt.figure(figsize=(12, 6))
    ax = fig.add_subplot(111, projection='3d')
    ax.plot_surface(S_grid.numpy(), t_grid.numpy(), V_grid, cmap='viridis')
    ax.set_xlabel('Asset Price (S)')
    ax.set_ylabel('Time to Maturity (t)')
    ax.set_zlabel('Option Price (V)')
    ax.set_title('PINN Solution to Black-Scholes')
    plt.show()
