# Temas avanzados sobre las PINNs

**Autor:** David Ortiz ‚Äî 2025

Accede al trabajo fundacional de las PINNs [aqu√≠](https://www.sciencedirect.com/science/article/pii/S0021999118307125).

Este tutorial se apoya en la literatura reciente sobre *spectral bias* en redes neuronales y su impacto en el entrenamiento de PINNs.

### Introducci√≥n
Las Redes Neuronales Informadas por la F√≠sica (PINNs) heredan de las redes neuronales profundas un fen√≥meno conocido como **sesgo espectral**, mediante el cual las componentes de baja frecuencia de la soluci√≥n se aprenden m√°s r√°pidamente que las de alta frecuencia. Este comportamiento puede afectar de manera significativa la convergencia y precisi√≥n de las PINNs, especialmente en problemas con soluciones multiescalares o gradientes pronunciados. En esta actividad se analiza y caracteriza el sesgo espectral en PINNs, utilizando un problema controlado con soluci√≥n conocida para estudiar su efecto en el entrenamiento.

### Objetivos de aprendizaje
- Comprender el concepto de sesgo espectral en redes neuronales y su manifestaci√≥n en PINNs  
- Analizar el impacto del sesgo espectral en la convergencia de soluciones f√≠sicas  
- Evaluar estrategias simples para mitigar el sesgo espectral en PINNs  

### Resumen de la Actividad
Estudiar el sesgo espectral en PINNs a partir de un problema unidimensional con soluci√≥n anal√≠tica conocida, siguiendo el mismo esquema general de implementaci√≥n:

<img src="../figures/pinns_new_scheme.png" width="800" height="400">

- (1) formular el problema f√≠sico y su soluci√≥n exacta;  
- (2) definir el dominio de entrenamiento;  
- (3) implementar una ANN como aproximador de la soluci√≥n;  
- (4) analizar el contenido espectral de la soluci√≥n y de la red;  
- (5) entrenar la PINN y estudiar la evoluci√≥n espectral del error;  
- (6) comparar resultados bajo distintas configuraciones de entrenamiento.

Finalmente, discutir c√≥mo el sesgo espectral influye en la capacidad de las PINNs para capturar din√°micas de alta frecuencia.


## Descripci√≥n Matem√°tica del Problema

### **Contexto**

El sistema de Lorenz es un conjunto de tres ecuaciones diferenciales ordinarias acopladas que describe un sistema ca√≥tico. Fue introducido por Edward Lorenz en 1963 como un modelo simplificado de convecci√≥n atmosf√©rica y se ha convertido en uno de los ejemplos m√°s ic√≥nicos de comportamiento ca√≥tico en sistemas din√°micos.

### **Modelo Matem√°tico**

El sistema de Lorenz est√° definido por las siguientes ecuaciones:

$$
\begin{align}
\frac{dx}{dt} &= \sigma(y - x) \\
\frac{dy}{dt} &= x(\rho - z) - y \\
\frac{dz}{dt} &= xy - \beta z
\end{align}
$$

donde:
- $x(t)$, $y(t)$, $z(t)$ son las variables de estado del sistema
- $\sigma$ (sigma) es el n√∫mero de Prandtl, que representa la relaci√≥n entre viscosidad y conductividad t√©rmica
- $\rho$ (rho) es el n√∫mero de Rayleigh, relacionado con la diferencia de temperatura
- $\beta$ (beta) es un par√°metro geom√©trico relacionado con las dimensiones f√≠sicas del sistema

### **Par√°metros y Condiciones Iniciales**

Para este ejercicio, utiliza los **par√°metros cl√°sicos de Lorenz** que producen comportamiento ca√≥tico:

$$
\sigma = 10.0, \quad \rho = 28.0, \quad \beta = \frac{8}{3}
$$

**Condiciones iniciales:**

$$
x(0) = 1.0, \quad y(0) = 1.0, \quad z(0) = 1.0
$$

**Dominio temporal:** $t \in [0, 20]$

### **Objetivo**

Implementar una **Physics-Informed Neural Network (PINN)** siguiendo las 6 etapas del flujo de trabajo para:

1. Aproximar las soluciones $x(t)$, $y(t)$, $z(t)$ del sistema de Lorenz
2. Comparar los resultados con la soluci√≥n num√©rica obtenida mediante el m√©todo de Runge-Kutta
3. Visualizar el famoso **atractor de Lorenz** en el espacio de fases $(x, y, z)$
4. Analizar la capacidad de la PINN para capturar la din√°mica ca√≥tica del sistema

> **üí° REMARK:**  
> Para este ejercicio debes utilizar un enfoque data-driven. Es decir, en la 
> funci√≥n de costo debes incluir los datos simulados. Si tienes dudas de como 
> se hace, puedes ver la soluci√≥n del ejercicio en la carpeta "solutions"



### Configuraci√≥n Inicial

Comenzamos importando m√≥dulos y definiendo algunas funciones de utilidad

In [None]:
%matplotlib inline

In [3]:
# NumPy para operaciones num√©ricas
import numpy as np
# PyTorch para construir y entrenar redes neuronales
import torch
import torch.nn as nn
import torch.optim as optim
# Matplotlib para graficar
import matplotlib.pyplot as plt
import matplotlib as mlp
# Time para medir tiempo de entrenamiento
import time
# Warnings para ignorar mensajes de advertencia
import warnings
warnings.filterwarnings("ignore")

In [None]:
device = (
    "cuda"
    if torch.cuda.is_available()
    else "mps"
    if torch.backends.mps.is_available()
    else "cpu"
)
print(f"Using {device} device")

# Actualizaci√≥n de los par√°metros de Matplotlib
gray = '#5c5c5c' #'#5c5c5c' '000'
mlp.rcParams.update(
    {
        "image.cmap" : 'viridis', # plasma, inferno, magma, cividis
        "text.color" : gray,
        "xtick.color" :gray,
        "ytick.color" :gray,
        "axes.labelcolor" : gray,
        "axes.edgecolor" :gray,
        "axes.spines.right" : False,
        "axes.spines.top" : False,
        "axes.formatter.use_mathtext": True,
        "axes.unicode_minus": False,

        'font.size' : 15,
        'interactive': False,
        "font.family": 'sans-serif',
        "legend.loc" : 'best',
        'text.usetex': False,
        'mathtext.fontset': 'stix',
    }
)


# Util function to calculate the relative l2 error
def relative_l2_error(u_num, u_ref):
    # Calculate the L2 norm of the difference
    l2_diff = torch.norm(u_num - u_ref, p=2)

    # Calculate the L2 norm of the reference
    l2_ref = torch.norm(u_ref, p=2)

    # Calculate L2 relative error
    relative_l2 = l2_diff / l2_ref
    return relative_l2

# Util function to plot the solutions
def plot_comparison(time, theta_true, theta_pred, loss):

    # Convert tensors to numpy arrays for plotting
    t_np = time.detach().cpu().data.numpy()
    theta_true_np = theta_true.detach().cpu().data.numpy()
    theta_pred_np = theta_pred.detach().cpu().data.numpy()


    # Create a figure with 2 subplots
    _, axs = plt.subplots(1, 2, figsize=(12, 6))

    # Plot the true and predicted values
    axs[0].plot(t_np, theta_true_np, label = r'$\theta(t)$ (numerical solution)')
    axs[0].plot(t_np, theta_pred_np, label = r'$\theta_{pred}(t)$ (predicted solution) ')
    axs[0].set_title('Angular displacement Numerical Vs. Predicted')
    axs[0].set_xlabel(r'Time $(s)$')
    axs[0].set_ylabel('Amplitude')
    axs[0].set_ylim(-1,1.3)
    axs[0].legend(loc='best', frameon=False)


    # Plot the difference between the predicted and true values
    difference = np.abs(theta_true_np.reshape(-1,1) - theta_pred_np.reshape(-1,1))
    axs[1].plot(t_np, difference)
    axs[1].set_title('Absolute Difference')
    axs[1].set_xlabel(r'Time $(s)$')
    axs[1].set_ylabel(r'$|\theta(t) - \theta_{pred}(t)|$')
    # Display the plot
    plt.legend(loc='best', frameon=False)
    plt.tight_layout()
    plt.show()

    # Plot the loss values recorded during training
    # Create a figure with 1 subplots
    _, axs = plt.subplots(1, 1, figsize=(6, 3))
    axs.plot(loss)
    axs.set_xlabel('Iteration')
    axs.set_ylabel('Loss')
    axs.set_yscale('log')
    axs.set_xscale('log')
    axs.set_title('Training Progress')
    axs.grid(True)

    # Display the plot
    plt.tight_layout()
    plt.show()

In [None]:
from scipy.integrate import solve_ivp

#===============================================================================
# ARQUITECTURA MODIFICADA: NO TOCAR
#===============================================================================

class Sin(nn.Module):
    def forward(self, x):
        return torch.sin(x)

class NeuralNetwork(nn.Module):

    def __init__(self, hlayers, fourier_dim=None, sigma=1.0):
        """
        Args:
            hlayers (list): lista con el n√∫mero de neuronas en cada capa.
            fourier_dim (int): dimensi√≥n de las Fourier features (opcional).
            sigma (float): escala de las frecuencias aleatorias.
        """
        super(NeuralNetwork, self).__init__()

        self.fourier_dim = fourier_dim
        self.sigma = sigma

        if self.fourier_dim is not None:
            # Inicializamos matriz B ~ N(0, sigma^2)
            input_dim = hlayers[0]
            B = torch.randn((fourier_dim, input_dim)) * sigma
            self.register_buffer("B", B)  # se guarda como parte del modelo pero no se entrena
            # actualizamos la entrada de la red: ahora 2*fourier_dim
            hlayers = [2 * fourier_dim] + hlayers[1:]

        layers = []
        for i in range(len(hlayers[:-2])):
            layers.append(nn.Linear(hlayers[i], hlayers[i+1]))
            layers.append(Sin())
        layers.append(nn.Linear(hlayers[-2], hlayers[-1]))

        self.layers = nn.Sequential(*layers)
        self.init_params()

    def fourier_features(self, x):
        """Mapeo de Fourier features"""
        # x shape: [batch, input_dim]
        x_proj = 2 * torch.pi * x @ self.B.T  # [batch, fourier_dim]
        return torch.cat([torch.sin(x_proj), torch.cos(x_proj)], dim=-1)

    def init_params(self):
        """Xavier Glorot parameter initialization of the Neural Network"""
        def init_normal(m):
            if isinstance(m, nn.Linear):
                nn.init.xavier_normal_(m.weight)
        self.apply(init_normal)

    def forward(self, x):
        if self.fourier_dim is not None:
            x = self.fourier_features(x)
        return self.layers(x)
    
#===============================================================================
# SOLUCI√ìN NUM√âRICA. NO TOCAR
#===============================================================================

def numerical_sol_lorenz(t_eval, sigma = 10, rho = 28, beta = 8.0/3.0,
                         x0 = 1, y0 = 1, z0 = 1):
        
    def lorenz_system(t, state, sigma, rho, beta):
        x, y, z = state
        dx_dt = sigma * (y - x)
        dy_dt = x * (rho - z) - y
        dz_dt = x * y - beta * z
        return [dx_dt, dy_dt, dz_dt]

    # Resolver con m√©todo num√©rico
    t_span = (0, T)
    t_eval_np = t_eval.detach().cpu().numpy().ravel()
    initial_state = [x0, y0, z0]

    sol = solve_ivp(
        lorenz_system, 
        t_span, 
        initial_state,
        args=(sigma, rho, beta),
        t_eval=t_eval_np,
        method='RK45'
    )

    x_true = torch.tensor(sol.y[0],device=device, dtype=torch.float32).view(-1, 1)
    y_true = torch.tensor(sol.y[1],device=device, dtype=torch.float32).view(-1, 1)
    z_true = torch.tensor(sol.y[2],device=device, dtype=torch.float32).view(-1, 1)
    
    return x_true, y_true, z_true

In [None]:
#===============================================================================
# ETAPA 1: DEFINICI√ìN DE LOS PAR√ÅMETROS (MODELO F√çSICO)
#===============================================================================

sigma = 10.0
rho = 28.0
beta = 8.0/3.0

x0 = 1.0
y0 = 1.0
z0 = 1.0

# Dominio temporal
T = 20.0        # tiempo total de simulaci√≥n
N_train = 101   # puntos de colocaci√≥n para entrenamiento
N_eval = 2000   # puntos para evaluaci√≥n

#===============================================================================
# ETAPA 2: DEFINICI√ìN DEL DOMINIO 
#===============================================================================
t_train, t_eval = crear_dominio_temporal(T, N_train, N_eval)

x_train, y_train, z_train = numerical_sol_lorenz(t_train)

#===============================================================================
# ETAPA 3: CREACI√ìN DE LA RED NEURONAL SURROGANTE 
#===============================================================================

# Crear la red
torch.manual_seed(123)
hidden_layers = [1, 50, 50, 50, 3]
lorenz_pinn = NeuralNetwork(hidden_layers).to(device)
nparams = sum(p.numel() for p in lorenz_pinn.parameters() if p.requires_grad)
print(f'Number of trainable parameters: {nparams}')

#==========================================================================
# ETAPA 4 Y 5: DEFINICI√ìN DE LA FUNCI√ìN DE COSTO BASADA EN AUTOGRAD
#==========================================================================
MSE = nn.MSELoss()

def LorenzPINNLoss(PINN, t_phys, sigma, rho, beta, 
                   x0=1.0, y0=1.0, z0=1.0,
                   lambda_pde=10.0, lambda_ic=10.0):
    
    t0 = torch.tensor(0., device=device, requires_grad=True).view(-1, 1)
    
    # Predicciones de la red
    u = PINN(t_phys)  # (N, 3)
    x, y, z = u[:, 0:1], u[:, 1:2], u[:, 2:3]
    
    # Calcular derivadas temporales
    dx_dt = grad(x, t_phys)
    dy_dt = grad(y, t_phys)
    dz_dt = grad(z, t_phys)
    
    # Residuos de las ecuaciones de Lorenz
    f1 = dx_dt - sigma * (y - x)
    f2 = dy_dt - (x * (rho - z) - y)
    f3 = dz_dt - (x * y - beta * z)
    
    # P√©rdida PDE (residuo de las ecuaciones)
    loss_pde = MSE(f1, torch.zeros_like(f1)) + \
               MSE(f2, torch.zeros_like(f2)) + \
               MSE(f3, torch.zeros_like(f3))
    
    # Condiciones iniciales
    u0 = PINN(t0)
    x0_pred, y0_pred, z0_pred = u0[:, 0:1], u0[:, 1:2], u0[:, 2:3]
    
    loss_ic = MSE(x0_pred, torch.ones_like(x0_pred) * x0) + \
              MSE(y0_pred, torch.ones_like(y0_pred) * y0) + \
              MSE(z0_pred, torch.ones_like(z0_pred) * z0)
              
    loss_data = MSE(x, x_train) + \
                MSE(y, y_train) + \
                MSE(z, z_train)
    
    # P√©rdida total
    return lambda_pde * loss_pde + lambda_ic * loss_ic + 100*loss_data




#==========================================================================
# ETAPA 6: DEFINICI√ìN DEl OPTIMIZADOR
#==========================================================================
lr = 0.01
optimizer = pinn_optimizer(lorenz_pinn, lr)

#==========================================================================
# CICLO DE ENTRENAMIENTO
#==========================================================================
training_iter = 30000
loss_values = []

start_time = time.time()

for i in range(training_iter):
    optimizer.zero_grad()
    
    loss = LorenzPINNLoss(lorenz_pinn, t_train, sigma, rho, beta)
    
    loss_values.append(loss.item())
    
    if i % 1000 == 0:
        print(f"Iteration {i}: Loss {loss.item():.10f}")
    
    loss.backward()
    optimizer.step()

elapsed_time = time.time() - start_time
print(f"Training time: {elapsed_time:.2f} seconds")


#==========================================================================
# Validaci√≥n
#==========================================================================

# Primero, obt√©n la soluci√≥n num√©rica completa para graficar
x_true, y_true, z_true = numerical_sol_lorenz(t_eval, sigma, rho, beta, x0, y0, z0)

# Convertir a numpy para graficar
x_true_np = x_true.detach().cpu().numpy().ravel()
y_true_np = y_true.detach().cpu().numpy().ravel()
z_true_np = z_true.detach().cpu().numpy().ravel()

# Predicciones de la PINN
lorenz_pinn.eval()
with torch.no_grad():
    u_pred = lorenz_pinn(t_eval).cpu().numpy()
    x_pred = u_pred[:, 0]
    y_pred = u_pred[:, 1]
    z_pred = u_pred[:, 2]

t_plot = t_eval.detach().cpu().numpy().ravel()

# Gr√°fico 1: Series temporales
fig, axes = plt.subplots(3, 1, figsize=(12, 10))

axes[0].plot(t_plot, x_true_np, 'g-', label='Soluci√≥n num√©rica', linewidth=2)
axes[0].plot(t_plot, x_pred, 'r--', label='PINN', linewidth=1.5)
axes[0].set_ylabel('x(t)', fontsize=12)
axes[0].legend()
axes[0].grid(True, alpha=0.3)

axes[1].plot(t_plot, y_true_np, 'g-', label='Soluci√≥n num√©rica', linewidth=2)
axes[1].plot(t_plot, y_pred, 'r--', label='PINN', linewidth=1.5)
axes[1].set_ylabel('y(t)', fontsize=12)
axes[1].legend()
axes[1].grid(True, alpha=0.3)

axes[2].plot(t_plot, z_true_np, 'g-', label='Soluci√≥n num√©rica', linewidth=2)
axes[2].plot(t_plot, z_pred, 'r--', label='PINN', linewidth=1.5)
axes[2].set_xlabel('Tiempo (s)', fontsize=12)
axes[2].set_ylabel('z(t)', fontsize=12)
axes[2].legend()
axes[2].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Gr√°fico 2: Atractor de Lorenz (3D)
from mpl_toolkits.mplot3d import Axes3D

fig = plt.figure(figsize=(14, 6))

# Soluci√≥n num√©rica
ax1 = fig.add_subplot(121, projection='3d')
ax1.plot(x_true_np, y_true_np, z_true_np, 'g-', linewidth=0.5, alpha=0.7)
ax1.set_xlabel('x')
ax1.set_ylabel('y')
ax1.set_zlabel('z')
ax1.set_title('Atractor de Lorenz - Soluci√≥n Num√©rica')
ax1.view_init(elev=20, azim=45)  # Ajustar vista

# PINN
ax2 = fig.add_subplot(122, projection='3d')
ax2.plot(x_pred, y_pred, z_pred, 'r-', linewidth=0.5, alpha=0.7)
ax2.set_xlabel('x')
ax2.set_ylabel('y')
ax2.set_zlabel('z')
ax2.set_title('Atractor de Lorenz - PINN')
ax2.view_init(elev=20, azim=45)  # Ajustar vista

plt.tight_layout()
plt.show()

# Gr√°fico 3: P√©rdida durante el entrenamiento
plt.figure(figsize=(10, 5))
plt.plot(loss_values)
plt.xlabel('Iteraci√≥n')
plt.ylabel('P√©rdida')
plt.yscale('log')
plt.title('Convergencia del Entrenamiento')
plt.grid(True, alpha=0.3)
plt.show()

# Gr√°fico 4: Errores relativos

# Convertir predicciones a tensores de PyTorch si no lo son
x_pred_torch = torch.tensor(x_pred, device=device, dtype=torch.float32).view(-1, 1)
y_pred_torch = torch.tensor(y_pred, device=device, dtype=torch.float32).view(-1, 1)
z_pred_torch = torch.tensor(z_pred, device=device, dtype=torch.float32).view(-1, 1)

# Calcular errores (ahora ambos son tensores de PyTorch)
error_x = torch.norm(x_pred_torch - x_true) / torch.norm(x_true)
error_y = torch.norm(y_pred_torch - y_true) / torch.norm(y_true)
error_z = torch.norm(z_pred_torch - z_true) / torch.norm(z_true)

print(f"\n{'='*50}")
print("M√âTRICAS DE ERROR")
print(f"{'='*50}")
print(f"Error L2 relativo en x: {error_x.item():.6f}")
print(f"Error L2 relativo en y: {error_y.item():.6f}")
print(f"Error L2 relativo en z: {error_z.item():.6f}")
print(f"Error L2 promedio: {((error_x + error_y + error_z)/3).item():.6f}")
print(f"{'='*50}")