# Physics-Informed Neural Networks (PINNs)

Теоретическая основа: универсальная теорема аппроксимации - теорема Хорника-Цирельсона-Уайта: \
Однослойная нейроная сеть с достаточно большим числом нейронов и нелинейной гладкой функцией \
(например, sigmoid или tanh) может приблизить любую непрерывную функцию на компактном множестве \
с любой заданной точностью. 

$$
sup_{x \in K}| f(x) - N(x) | < \epsilon
$$

# Уравнение теплопроводности

$$ \frac{\partial u(x,t)}{\partial t}=\frac{\partial}{\partial x}(k(x)*\frac{\partial u(x,t)}{\partial x})+f(x,t)) $$
$$ x \in (0,L), \, t \in (0,T] $$ \
$ u(x,t) $ - температура  \
$ k(x) $ - коэф.теплопроводности \
$ f(x,t) $ - источники \\ стоки
### Начальные условия:
$$ u(x,0)=g_{IC}(x) $$
$$ x \in [0,L], \, t = 0 $$
### Граничные условия (например, первого рода):
$$ u(0,t)=g_{LB}(t), u(L,t)=g_{RB}(t) $$
$$ x \in \{0,L\}, \, t \in (0,T] $$

# Аппроксимация дифференциального уравнения нейроной сетью
$ N_u(x,t) $ - нейросеть аппроксимирует u(x,t),тогда аппроксимированное ур-ие теплопроводности примет вид:
$$
\frac{\partial N_u(x,t)}{\partial t}=\frac{\partial}{\partial x}(k(x) \frac{\partial N_u(x,t)}{\partial x})+f(x,t))
$$

или раскроем производную произведения и перенесем все в левую сторону
$$
\frac{\partial N_u(x,t)}{\partial t} - \frac{\partial k(x)}{\partial x} \frac{\partial N_u(x,t)}{\partial x} - k(x) \frac{\partial^2 N_u(x,t)}{\partial x^2} -f(x,t)) = 0
$$

Производная нейросети $ N_u(x,t) $, состоящая, например, из входа -> два внутренних слоя -> выход - 
это гладкая функция как композиция слоев нейросети \
$$ N_u(x,t) = f_3(f_2(f_1(x,t,\theta), \theta), \theta), $$ \
$ f_1, f_2, f_3 $ - слои нейросети (линейные преобразования + функции активации) \
$ \theta_i $ - обучаемые параметры (веса и смещения) \
производная $  N_u(x,t) $ вычисляется по цепному правилу:
$$
\frac{\partial N_u}{\partial x} = \frac{\partial f_3}{\partial f_2} * \frac{\partial f_2}{\partial f_1} * \frac{\partial f_1}{\partial x}
$$
где каждый член это якобиан (матрица частных производных)

# Функция потерь (loss function)
### 1. Partial Differential Equation loss: ошибка аппроксимации дифф.ур-ия нейронной сетью
$$
L_{PDE} = \frac{1}{M} \sum_{j=1}^M || \frac{\partial N_u(x,t)}{\partial t} - \frac{\partial k(x)}{\partial x} \frac{\partial N_u(x,t)}{\partial x} - k(x) \frac{\partial^2 N_u(x,t)}{\partial x^2} -f(x,t) ||^2
$$
$$ x \in (0,L), t \in (0,T] $$
### 2. Initial condition loss: ошибка нейронной сети по начальным условиям
$$ L_{IC} = \frac{1}{K} \sum_{j=1}^K || N_u(x,0) - g_{IC}(x) ||^2 $$
$$ x \in [0;L], t = 0 $$
### 3. Boundary condition loss: ошибка нейронной сети по граничным условиям
$$ L_{BC} = \frac{1}{P} (\sum_{j=1}^P || N_u(0,t) - g_{LB}(t) ||^2 + \sum_{j=1}^P || N_u(L,t) - g_{RB}(t) ||^2) $$
$$ x \in \{0,L\}, t \in (0,T] $$
### 4. Data loss: ошибка предсказанных и экспериментальных данных
$$ L_{data} = \frac{1}{N} \sum_{j=1}^N || N_u(x,t) - u_{data}(x,t) ||^2 $$
$$ x \in (0,L), t \in (0,T] $$
### Итоговый лосс:
$$ L = \lambda_{PDE} L_{PDE} + \lambda_{IC} L_{IC} + \lambda_{BC} L_{BC} + \lambda_{data} L_{data} $$
пояснение по выбору M,K,P,N пусть 
K - число пропорциональное кол-ву шагов дискретизации по времени, 
P - число пропорциональное кол-ву шагов дискретизации по пространству (в данном случае одномерному)
тогда 
M - будет числом пропорциональным K*P кол-ву шагов дискретизации внутренней области определения
N - кол-во возможных экспериментальных данных, которые попадают во внутреннюю область \
Таким образом:
1. Решаем ПРЯМУЮ ЗАДАЧУ - на выходе получаем PINN физической модели (аппроксимацию дифференциального уравнения в частных производных с учетом нач. и гр. условий)
$$ L_{phys} = \lambda_{PDE} L_{PDE} + \lambda_{IC} L_{IC} + \lambda_{BC} L_{BC} $$
3. Решаем ОБРАТНУЮ ЗАДАЧУ - дополнительно к аппроксимации физической модели $ N_u(x,t) $ добавляем в уравнение аппроксимацию, например, коэффициента теплопроводности $ N_k(x) $ и решаем задачу оптимизации двух PINN сетей  

Пояснение по виду лоссов: $ loss = \frac{1}{N} \sum_{j=1}^N ||x||^2  $, где ||*|| - Евклидова норма. \
Если x - вектор независимых параметров, т.е. $ x \in \{x_1, x_2, ..., x_n\} $
то $ ||x|| = \sqrt {x_1^2 + x_2^2 + ... x_n^2} $ (длина n-мерного вектора)  или $ ||x||^2 = \sum_{i=1}^n x_i^2 $, тогда:
$ loss =  \frac{1}{N} \sum_{j=1}^N (\sum_{i=1}^n x_i^2) $, где первая сумма (справа) - длина n-мерного вектора в квадрате,
а вторая сумма (слева) - среднее значение N длин в квадрате n-мерных векторов \
Если x - это скаляр, тогда: $ loss = \frac{1}{N} \sum_{j=1}^N (x^2) $

# ПРИМЕР
## 1. ПРЯМАЯ ЗАДАЧА
### Пусть исходные данные следующие:
$$ x \in [0,1], \, t \in [0,1] $$
$$ u(0,t) = u(L,t)=0 $$
$$ u(x,0) = sin(\pi * x) $$
$$ k(x) = k_a \, cos(2 \pi x) + k_b $$ 
$$ \frac{\partial k(x)}{\partial x} = - k_a 2 \pi \, sin(2 \pi x) $$
$$ f(x,t) = 0 $$
Значения $ k_a $ и $ k_b $ такие, что $ k(x) $ положителен на всем интервале x тогда:
### Partial Differential Equation loss:
$$
L_{PDE} = \frac{1}{M} \sum_{j=1}^M || \frac{\partial N_u(x,t)}{\partial t} + k_a 2 \pi \, sin(2 \pi x)*\frac{\partial N_u(x,t)}{\partial x} - (k_a \, cos(2 \pi x) + k_b) *\frac{\partial^2 N_u(x,t)}{\partial x^2} ||^2
$$ 
$$ x \in (0;L), t \in (0;T] $$
### Initial condition loss:
$$ L_{IC} = \frac{1}{K} \sum_{j=1}^K || N_u(x,0) - sin(\pi * x) ||^2 $$
$$ x \in [0;L], t = 0 $$
### Boundary condition loss:
$$ L_{BC} = \frac{1}{P} (\sum_{j=1}^P || N_u(0,t) ||^2 + \sum_{j=1}^P || N_u(L,t) ||^2) $$
$$ x=\{0,L\}, t \in (0;T] $$

# 1.1 Создаем PDE нейроную сеть
### 2 (вход) -> 5 (1-ый внутр.слой) -> 5 (2-ой внутр.слой) -> 1 (выход)

In [68]:
# Создаем нейросеть 2->5->5->1
import torch
import torch.nn as nn

class Nu( nn.Module ):
    def __init__(self):
        super().__init__()
        self.fc = nn.Sequential(
            nn.Linear(2,5),
            nn.Sigmoid(),
            nn.Linear(5,5),
            nn.Sigmoid(),
            nn.Linear(5,1)
        )

    def forward(self, x, t):
        return self.fc( torch.cat([x, t], dim=1) ) # self.layers()

In [69]:
u_net = Nu()
u_net

Nu(
  (fc): Sequential(
    (0): Linear(in_features=2, out_features=5, bias=True)
    (1): Sigmoid()
    (2): Linear(in_features=5, out_features=5, bias=True)
    (3): Sigmoid()
    (4): Linear(in_features=5, out_features=1, bias=True)
  )
)

# 1.2 Проверка работы нейросети (вручную проходим от входа на выход по всем слоям)
### 1.2.1 2 нейрона (вход) -> 5 нейронов (1-ый внутр.слой)
$$
h_i = Sigmoid(\sum_{j=1}^2 w_{ij}x_j + b_i), i = 1,2,3,4,5
$$

или в матричном кратком виде: $ h = Sigmoid(W*x+b) $, или в матричном полном виде:
$$
\begin{vmatrix}
h_1 \\
h_2 \\
h_3 \\
h_4 \\
h_5
\end{vmatrix} \quad = \quad
Sigmoid
\begin{pmatrix}
\begin{vmatrix}
w_{11} & w_{12} \\
w_{21} & w_{22} \\
w_{31} & w_{32} \\
w_{41} & w_{42} \\
w_{51} & w_{52}
\end{vmatrix} *
\begin{vmatrix}
x_1 \\
x_2
\end{vmatrix} \quad + \quad
\begin{vmatrix}
b_1 \\
b_2 \\
b_3 \\
b_4 \\
b_5
\end{vmatrix}
\end{pmatrix}
$$

In [70]:
xt = torch.tensor([0.1, 0.2]).view(-1,1)
xt

tensor([[0.1000],
        [0.2000]])

In [71]:
# 2-> 5
print(u_net.fc[0].weight)
print(u_net.fc[0].bias)

Parameter containing:
tensor([[ 0.2971, -0.1073],
        [ 0.4041, -0.2996],
        [ 0.2805,  0.5935],
        [ 0.4604,  0.0734],
        [ 0.3943, -0.4974]], requires_grad=True)
Parameter containing:
tensor([ 0.3398,  0.2451, -0.2366, -0.5725, -0.1150], requires_grad=True)


In [72]:
# h = Sigmoid( W(1)x+b(1) )
h = torch.sigmoid( u_net.fc[0].weight @ xt + u_net.fc[0].bias.view(-1,1) )
h

tensor([[0.5862],
        [0.5562],
        [0.4776],
        [0.3748],
        [0.4564]], grad_fn=<SigmoidBackward0>)

### 1.2.2 5 нейронов (1-ый внутр.слой) -> 5 нейронов (2-ый внутр.слой)
$$
g_i = Sigmoid(\sum_{j=1}^5 w_{ij}h_j + b_i), i = 1,2,3,4,5
$$

или в матричном кратком виде: $ g = Sigmoid(W*h+b) $, или в матричном полном виде:
$$
\begin{vmatrix}
g_1 \\
g_2 \\
g_3 \\
g_4 \\
g_5
\end{vmatrix} \quad = \quad
Sigmoid
\begin{pmatrix}
\begin{vmatrix}
w_{11} & w_{12} & w_{13} & w_{14} & w_{15} \\
w_{21} & w_{22} & w_{23} & w_{24} & w_{25} \\
w_{31} & w_{32} & w_{33} & w_{34} & w_{35} \\
w_{41} & w_{42} & w_{43} & w_{44} & w_{45} \\
w_{51} & w_{52} & w_{53} & w_{54} & w_{55} 
\end{vmatrix} *
\begin{vmatrix}
h_1 \\
h_2 \\
h_3 \\
h_4 \\
h_5
\end{vmatrix} \quad + \quad
\begin{vmatrix}
b_1 \\
b_2 \\
b_3 \\
b_4 \\
b_5
\end{vmatrix}
\end{pmatrix}
$$

In [73]:
# 5-> 5
print(u_net.fc[2].weight)
print(u_net.fc[2].bias)

Parameter containing:
tensor([[-0.3868, -0.0568, -0.0261,  0.2307,  0.1421],
        [ 0.1288, -0.1486, -0.4219, -0.2583, -0.4213],
        [-0.4125,  0.2083,  0.1472, -0.2239, -0.2070],
        [ 0.1134,  0.2205, -0.1971, -0.3777, -0.1586],
        [ 0.1446,  0.4001, -0.1700, -0.3297, -0.2827]], requires_grad=True)
Parameter containing:
tensor([-0.3862, -0.3407, -0.1419, -0.3057,  0.2879], requires_grad=True)


In [74]:
# g = Sigmoid( W(2)h+b(2) )
g = torch.sigmoid( u_net.fc[2].weight @ h + u_net.fc[2].bias.view(-1,1) )
g

tensor([[0.3762],
        [0.3019],
        [0.4071],
        [0.3954],
        [0.5650]], grad_fn=<SigmoidBackward0>)

### 1.2.3 5 нейронов (2-ый внутр.слой) -> 1 нейрон (выход)
$$
y_i = \sum_{j=1}^5 w_{ij}g_j + b_i, i = 1
$$

или в матричном кратком виде: $ y = W*g+b $, или в матричном полном виде:
$$
\begin{vmatrix}
y_1
\end{vmatrix} \quad = \quad
\begin{vmatrix}
w_{11} & w_{12} & w_{13} & w_{14} & w_{15} \\
\end{vmatrix} *
\begin{vmatrix}
g_1 \\
g_2 \\
g_3 \\
g_4 \\
g_5
\end{vmatrix} \quad + \quad
\begin{vmatrix}
b_1
\end{vmatrix}
$$

Обратите внимание, что функции активации нет, но могла бы быть. 

In [75]:
# 5 -> 1
print(u_net.fc[4].weight)
print(u_net.fc[4].bias)

Parameter containing:
tensor([[ 0.3285, -0.2794, -0.0612, -0.3419, -0.0533]], requires_grad=True)
Parameter containing:
tensor([-0.4354], requires_grad=True)


In [76]:
# y = W(3)g+b(3)
y = u_net.fc[4].weight @ g + u_net.fc[4].bias.view(-1,1)
y

tensor([[-0.5864]], grad_fn=<AddBackward0>)

# 1.3 Проверка ручных вычислений с автоматическим (передачей параметров в нейроную сеть)

In [77]:
# придется входные данные представить немного в ином виде, т.к. в модели нейронки Nu параметры передаются
# в пакетном batch режиме
x_batch = xt[0].view(-1,1)
t_batch = xt[1].view(-1,1)
print(torch.cat([x_batch,t_batch], dim=1))
# предсказания, на данном этапе нейронка инициализируется каким-то начальными значениями, 
# соответсвенно предсказание носит некий случайный характер в начале
u_pred = u_net(x_batch,t_batch)
u_pred

tensor([[0.1000, 0.2000]])


tensor([[-0.5864]], grad_fn=<AddmmBackward0>)

In [78]:
if y == u_pred:
    print("OK")
else:
    print("FAILED")

OK


# 1.4 Задаем области определения

Пусть вся область будет 10х10, из них:
1. внутрення область - 8х9 = 72
2. начальные условия - 10х1 = 10
3. граничные условия - 9х1х2 = 18

### $ x \in (0,1) \, , t \in (0,1] $

In [79]:
temp = torch.linspace(0,1,10)[1:9]
temp

tensor([0.1111, 0.2222, 0.3333, 0.4444, 0.5556, 0.6667, 0.7778, 0.8889])

In [80]:
temp = torch.linspace(0,1,10)[1:9]
x_batch_pde = torch.empty(0)

for x in temp:
    x_batch_pde = torch.cat( [x_batch_pde, x * torch.ones(9) ])
x_batch_pde = x_batch_pde.view(-1,1)
x_batch_pde.requires_grad = True
x_batch_pde.size()

torch.Size([72, 1])

In [81]:
t_batch_pde = torch.empty(0)

for i in temp:
    t_batch_pde = torch.cat( [ t_batch_pde, torch.linspace(0,1,10)[1:10] ] )
t_batch_pde = t_batch_pde.view(-1,1)
t_batch_pde.requires_grad = True
t_batch_pde.size()

torch.Size([72, 1])

In [82]:
torch.cat( [ x_batch_pde, t_batch_pde], dim=1 ).size()

torch.Size([72, 2])

### $ x \in [0,1] \, , t=0 $

In [83]:
x_batch_ic = torch.linspace(0,1,10).view(-1,1)
t_batch_ic = torch.zeros(10).view(-1,1)

x_batch_ic.requires_grad = True
t_batch_ic.requires_grad = True

torch.cat([x_batch_ic, t_batch_ic], dim=1).size()

torch.Size([10, 2])

### $ x \in \{0,1\} \, , t \in (0,1] $

In [84]:
x_batch_bc = torch.cat( [torch.zeros(9).view(-1,1), torch.ones(9).view(-1,1)])
t_batch_bc = torch.cat( [torch.linspace(0,1,10)[1:10].view(-1,1), torch.linspace(0,1,10)[1:10].view(-1,1)] )

x_batch_bc.requires_grad = True
t_batch_bc.requires_grad = True

torch.cat([x_batch_bc, t_batch_bc], dim=1).size()

torch.Size([18, 2])

### Полная область определения

In [85]:
x_batch = torch.cat([x_batch_pde, x_batch_ic, x_batch_bc])
t_batch = torch.cat([t_batch_pde, t_batch_ic, t_batch_bc])

torch.cat([x_batch, t_batch], dim=1).size()

torch.Size([100, 2])

In [94]:
u_net = Nu()

In [95]:
optimizer = torch.optim.Adam( u_net.parameters(), lr=1e-2 )

# 1.5 Обучение

In [96]:
# параметры для расчета loss_pde
#ka, kb = 0.02, 0.1
ka, kb = 0.00, 0.3
# весовые коэффициенты для общего loss
alpha_pde, alpha_ic, alpha_bc = 1.,1.,1.
# обучение
MAX = 10000
for epoch in range(MAX):
    # ---------------------------------- ПРЕДИКТИВНЫЕ ДАННЫЕ ПО ВСЕЙ ОБЛАСТИ ОПРЕДЕЛЕНИЯ ----------------
    u_pred = u_net(x_batch,t_batch)
    # ---------------------------------- LOSS PDE ----------------
    u_pred_pde = u_pred[0:72]
    # du/dx, du/dt
    [du_dx, du_dt] = torch.autograd.grad(u_pred_pde, inputs=[x_batch_pde, t_batch_pde], grad_outputs=torch.ones_like(x_batch_pde), create_graph=True, retain_graph=True)
    # d2u/dx2
    [d2u_dx2, du_dxdt] = torch.autograd.grad(du_dx, inputs=[x_batch_pde, t_batch_pde], grad_outputs=torch.ones_like(x_batch_pde), create_graph=True, retain_graph=True)
    # loss pde
    loss_pde = torch.mean((du_dt[0] + ka*2*torch.pi*torch.sin(2*torch.pi*x_batch_pde)*du_dx[0] - (ka*torch.cos(2*torch.pi*x_batch_pde) +kb)*d2u_dx2[0])**2)
    # ---------------------------------- LOSS IC -----------------
    u_pred_ic = u_pred[72:82]
    loss_ic = torch.mean( (u_pred_ic - torch.sin(torch.pi*x_batch_ic))**2 )
    # ---------------------------------- LOSS BC -----------------
    u_pred_bc = u_pred[82:100]
    loss_bc = torch.mean( (u_pred_bc)**2 )
    # ---------------------------------- LOSS COMMON -------------
    loss = alpha_pde * loss_pde + alpha_ic * loss_ic + alpha_bc * loss_bc
    # стираем предыдущий граф градиента
    optimizer.zero_grad()
    # обратное распространение ошибки
    loss.backward()
    # записываем новые коэфициента
    optimizer.step()
    if epoch % 20 == 0:
        print(f'Epoch [{epoch}/{MAX}], Loss: {loss.item():.5f}, loss pde: {loss_pde.item():.5f}, loss ic: {loss_ic.item():.5f}, loss bc: {loss_bc.item():.5f}')
    if loss < 0.0001:
        print('stop optimization')
        break

Epoch [0/10000], Loss: 0.39573, loss pde: 0.00000, loss ic: 0.13110, loss bc: 0.26463
Epoch [20/10000], Loss: 0.28867, loss pde: 0.00002, loss ic: 0.19629, loss bc: 0.09236
Epoch [40/10000], Loss: 0.28647, loss pde: 0.00012, loss ic: 0.21789, loss bc: 0.06845
Epoch [60/10000], Loss: 0.28295, loss pde: 0.00047, loss ic: 0.20954, loss bc: 0.07295
Epoch [80/10000], Loss: 0.27792, loss pde: 0.00180, loss ic: 0.20385, loss bc: 0.07227
Epoch [100/10000], Loss: 0.27176, loss pde: 0.00637, loss ic: 0.19765, loss bc: 0.06774
Epoch [120/10000], Loss: 0.26865, loss pde: 0.01439, loss ic: 0.19052, loss bc: 0.06374
Epoch [140/10000], Loss: 0.26711, loss pde: 0.01646, loss ic: 0.18817, loss bc: 0.06247
Epoch [160/10000], Loss: 0.26427, loss pde: 0.01520, loss ic: 0.18741, loss bc: 0.06166
Epoch [180/10000], Loss: 0.25834, loss pde: 0.01507, loss ic: 0.18372, loss bc: 0.05955
Epoch [200/10000], Loss: 0.24667, loss pde: 0.01423, loss ic: 0.17589, loss bc: 0.05654
Epoch [220/10000], Loss: 0.22623, loss

# 1.7 Проверка

In [97]:
u_res = u_net(x_batch,t_batch)

In [98]:
# Initial condition
u_res[72:82]

tensor([[0.0091],
        [0.3231],
        [0.6337],
        [0.8671],
        [0.9877],
        [0.9904],
        [0.8743],
        [0.6426],
        [0.3283],
        [0.0062]], grad_fn=<SliceBackward0>)

In [99]:
# Boundary condition
u_res[82:100]

tensor([[ 0.0079],
        [ 0.0066],
        [ 0.0053],
        [ 0.0038],
        [ 0.0022],
        [ 0.0003],
        [-0.0019],
        [-0.0043],
        [-0.0072],
        [ 0.0036],
        [ 0.0016],
        [ 0.0001],
        [-0.0008],
        [-0.0013],
        [-0.0012],
        [-0.0007],
        [ 0.0002],
        [ 0.0015]], grad_fn=<SliceBackward0>)

In [100]:
# PDE
u_res[0:72].view(8,9)

tensor([[0.3211, 0.3185, 0.3153, 0.3115, 0.3069, 0.3016, 0.2956, 0.2887, 0.2810],
        [0.6323, 0.6296, 0.6258, 0.6207, 0.6144, 0.6068, 0.5978, 0.5876, 0.5760],
        [0.8672, 0.8657, 0.8626, 0.8578, 0.8515, 0.8434, 0.8338, 0.8224, 0.8093],
        [0.9891, 0.9886, 0.9864, 0.9823, 0.9764, 0.9686, 0.9590, 0.9475, 0.9342],
        [0.9918, 0.9914, 0.9891, 0.9848, 0.9787, 0.9706, 0.9606, 0.9487, 0.9349],
        [0.8744, 0.8727, 0.8692, 0.8639, 0.8569, 0.8481, 0.8375, 0.8252, 0.8111],
        [0.6405, 0.6370, 0.6323, 0.6264, 0.6192, 0.6109, 0.6014, 0.5907, 0.5790],
        [0.3248, 0.3210, 0.3169, 0.3125, 0.3078, 0.3028, 0.2976, 0.2922, 0.2865]],
       grad_fn=<ViewBackward0>)