Vamos tentar aprender a função
$$
u = \sin(x),\quad  x \in (0, 2\pi)
$$

usando rede neural feed-forward.

##### Gerar um dataset

O traning set:
$$
S = {(x_i,u_i), i= 1, \cdots, n}\\
x_i \approx U(0, 2\pi), \quad u_i \approx N(sin(x_i), \sigma(x_i))
$$

Com $U(a,b)$ sendo uma distribuição aleatória uniforme e $N(\mu,\sigma)$ é uma distribuição normal.

In [2]:
!pip install torch
!pip install numpy
!pip install matplotlib

Collecting numpy
  Downloading numpy-2.4.2-cp314-cp314-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl.metadata (6.6 kB)
Downloading numpy-2.4.2-cp314-cp314-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl (16.6 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m16.6/16.6 MB[0m [31m6.7 MB/s[0m  [33m0:00:02[0mm0:00:01[0m00:01[0m
[?25hInstalling collected packages: numpy
Successfully installed numpy-2.4.2
Collecting matplotlib
  Downloading matplotlib-3.10.8-cp314-cp314-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl.metadata (52 kB)
Collecting contourpy>=1.0.1 (from matplotlib)
  Downloading contourpy-1.3.3-cp314-cp314-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl.metadata (5.5 kB)
Collecting cycler>=0.10 (from matplotlib)
  Downloading cycler-0.12.1-py3-none-any.whl.metadata (3.8 kB)
Collecting fonttools>=4.22.0 (from matplotlib)
  Downloading fonttools-4.61.1-cp314-cp314-manylinux1_x86_64.manylinux2014_x86_64.manylinux_2_17_x86_64.manylinux_2_5_x86_64.whl.metad

In [3]:
# Bibliotecas

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
import matplotlib.pyplot as plt

Matplotlib is building the font cache; this may take a moment.


##### Gerar um dataset

O traning set:
$$
S = {(x_i,u_i), i= 1, \cdots, n}\\
x_i \approx U(0, 2\pi), \quad u_i \approx N(sin(x_i), \sigma(x_i))
$$

Com $U(a,b)$ sendo uma distribuição aleatória uniforme e $N(\mu,\sigma)$ é uma distribuição normal.

In [4]:
# Gerar os dados sintéticos
def generate_data(num_points, noise_std=0.1):
    # Gerar valores x uniformemente distribuídos entre 0 e 2π
    x_values = np.sort(np.random.uniform(0, 2 * np.pi, num_points))
    y_values = np.sin(x_values) + np.random.normal(0, noise_std, num_points)
    return x_values, y_values

num_points = 1000

x_train, y_train = generate_data(num_points, noise_std=0.1)

##### Definição do modelo

Usamos uma **rede neural feedforward** (**MLP**) para aproximar a função

$$
u = \sin(x)
$$

Dada uma entrada $x \in D \subset \mathbb{R}^n$, uma rede neural feedforward a transforma em uma saída $u_{\theta}(x) \in \mathbb{R}^m$ por meio de camadas de unidades (neurônios). Essas camadas são compostas por:

- transformações afim-lineares entre neurônios de camadas sucessivas, e  
- funções de ativação escalares não lineares dentro de cada neurônio.

Isso resulta na seguinte representação:

$$
u_{\theta}(x) = C_K \circ A \circ C_{K-1} \circ \ldots \circ A \circ C_2 \circ A \circ C_1(x).
$$

Aqui, $\circ$ denota a **composição de funções** e $A$ é uma **função de ativação escalar (não linear)**.

Para qualquer $1 \leq k \leq K$, definimos

$$
C_k z_k = W_k z_k + b_k, \quad \text{onde } W_k \in \mathbb{R}^{d_{k+1} \times d_k},\; z_k \in \mathbb{R}^{d_k},\; b_k \in \mathbb{R}^{d_{k+1}}.
$$

Também denotamos

$$
\theta = \{W_k, b_k\}, \qquad \theta_W = \{W_k\} \quad \forall\, 1 \leq k \leq K,
$$

como o conjunto completo de **parâmetros ajustáveis (pesos)** da rede.
