In [1]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt

%matplotlib inline

In [2]:
# параметры распределений
mu0, cov0 = [-2.0, 3.0], [[1.0, 0.2], [0.3, 1.0]]
mu1, cov1 = [3.0, 2.0], [[1.0, 0.0], [0.0, 1.0]]

In [3]:
def sample(d0, d1, n=32):
    x0 = d0.sample((n,))
    x1 = d1.sample((n,))
    y0 = torch.zeros((n, 1))
    y1 = torch.ones((n, 1))
    return torch.cat([x0, x1], 0), torch.cat([y0, y1], 0)

In [4]:
d0 = torch.distributions.MultivariateNormal(torch.tensor(mu0), torch.tensor(cov0))
d1 = torch.distributions.MultivariateNormal(torch.tensor(mu1), torch.tensor(cov1))

In [5]:
layer = nn.Linear(2, 1)
print([p.data[0] for p in layer.parameters()])
opt = optim.SGD(lr=1e-1, params=list(layer.parameters()))

[tensor([-0.3942, -0.4434]), tensor(-0.2098)]


In [6]:
log_freq = 500
for i in range(10000):
    opt.zero_grad()
    if i%log_freq == 0:
        with torch.no_grad():
            x, y = sample(d0, d1, 100000)
            out = F.sigmoid(layer(x))
            loss = F.binary_cross_entropy(out, y)
        print('Ошибка после %d итераций: %f' %(i/log_freq, loss))
    x, y = sample(d0, d1, 1024)
    out = F.sigmoid(layer(x))
    loss = F.binary_cross_entropy(out, y)
    loss.backward()
    opt.step()


Ошибка после 0 итераций: 1.414114
Ошибка после 1 итераций: 0.021184
Ошибка после 2 итераций: 0.017006
Ошибка после 3 итераций: 0.015263
Ошибка после 4 итераций: 0.014452
Ошибка после 5 итераций: 0.013912
Ошибка после 6 итераций: 0.013226
Ошибка после 7 итераций: 0.013168
Ошибка после 8 итераций: 0.012972
Ошибка после 9 итераций: 0.013104
Ошибка после 10 итераций: 0.012703
Ошибка после 11 итераций: 0.012170
Ошибка после 12 итераций: 0.012660
Ошибка после 13 итераций: 0.012176
Ошибка после 14 итераций: 0.012399
Ошибка после 15 итераций: 0.012093
Ошибка после 16 итераций: 0.011903
Ошибка после 17 итераций: 0.011690
Ошибка после 18 итераций: 0.012069
Ошибка после 19 итераций: 0.011848


In [None]:
#x_scale = np.linspace(-10, 10, 5000)
#d0_pdf = stats.norm.pdf(x_scale, mu0, sigma0) 
#d1_pdf = stats.norm.pdf(x_scale, mu1, sigma1)
#x_tensor = torch.tensor(x_scale.reshape(-1, 1), dtype=torch.float)
#with torch.no_grad():
#    dist = F.sigmoid(layer(x_tensor)).numpy()

In [None]:
#plt.plot(x_scale, d0_pdf*2, label='d0') # умножение на 2 для красоты графиков, на распределения не влияет
#plt.plot(x_scale, d1_pdf*2, label='d1')
#plt.plot(x_scale, dist.flatten(), label='pred')
#plt.legend();

In [None]:
#opt = optim.SGD(lr=1e-7, params=list(layer.parameters()))