Создать Dataset для загрузки данных (sklearn.datasets.fetch_california_housing)
Обернуть его в Dataloader
Написать архитектуру сети, которая предсказывает стоимость недвижимости. Сеть должна включать BatchNorm слои и Dropout (или НЕ включать, но нужно обосновать)
Сравните сходимость Adam, RMSProp и SGD, сделайте вывод по качеству работы модели train-test разделение нужно сделать с помощью sklearn random_state=13, test_size = 0.25

In [1]:
import math
import torch

import numpy as np

from PIL import Image
from torchvision import transforms, datasets

import torch.nn.functional as F
import torch.nn as nn

from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from tqdm import tqdm

In [2]:
data_x, data_y = fetch_california_housing(return_X_y=True, as_frame=True)

In [3]:
data_x_train, data_x_test, data_y_train, data_y_test = train_test_split(data_x, data_y,
                                                                  test_size=0.25,
                                                                  random_state=13)

In [4]:
train_dataset = torch.utils.data.TensorDataset(torch.from_numpy(data_x_train.astype(np.float32).to_numpy()),
                                               torch.from_numpy(data_y_train.astype(np.float32).to_numpy()))
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=256)

test_dataset = torch.utils.data.TensorDataset(torch.from_numpy(data_x_test.astype(np.float32).to_numpy()),
                                               torch.from_numpy(data_y_test.astype(np.float32).to_numpy()))
test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=256)

In [5]:
print(data_x_train)

       MedInc  HouseAge   AveRooms  AveBedrms  Population  AveOccup  Latitude  \
5707   3.5174      36.0   4.547945   1.094368      1357.0  2.065449     34.21   
3754   2.9728      36.0   4.299465   0.997326      1217.0  3.254011     34.18   
11866  1.6944      11.0  21.372093   4.627907        69.0  1.604651     40.19   
19325  3.7143      49.0   6.201087   1.298913       505.0  2.744565     38.53   
1962   2.9219      17.0   6.113960   1.128205       862.0  2.455840     38.73   
...       ...       ...        ...        ...         ...       ...       ...   
153    4.7708      52.0   6.727700   1.075117       612.0  2.873239     37.81   
866    5.2879      12.0   5.410596   1.006623      3436.0  3.250710     37.57   
74     2.4830      20.0   6.278195   1.210526       290.0  2.180451     37.81   
14512  6.0891       5.0   5.469595   0.918919      1063.0  3.591216     32.91   
338    2.2467      46.0   5.940678   1.104520      1339.0  3.782486     37.74   

       Longitude  
5707    

In [10]:
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(8, 128)
        self.fc2 = nn.Linear(128, 32)
        self.fc3 = nn.Linear(32, 1)
        self.relu1 = nn.ReLU()
        self.relu2 = nn.ReLU()
        self.drop1 = nn.Dropout(0.3)
        self.drop2 = nn.Dropout(0.3)
        self.batch1 = nn.BatchNorm1d(128)
        self.batch2 = nn.BatchNorm1d(32)

    def forward(self, x):
        x = self.fc1(x)
        x = self.batch1(x)
        x = self.relu1(x)
        x = self.drop1(x)
        x = self.fc2(x)
        x = self.batch2(x)
        x = self.drop2(x)
        x = self.relu2(x)
        x = self.fc3(x)
        return x

net = Net()

In [7]:
optimizer_func = [torch.optim.RMSprop(net.parameters(), lr=0.001, eps=1e-07), torch.optim.SGD(net.parameters(), lr=0.01), torch.optim.Adam(net.parameters())]
criterion = nn.MSELoss()

In [8]:
len(optimizer_func)

3

In [11]:
result = dict()
optimizer_list = ['RMSprop', 'SGD', 'Adam']
for i in range(3):
    func = optimizer_list[i]
    optimizer = optimizer_func[i]
    for epoch in tqdm(range(100)):  
        running_loss = 0.0
        epoch_loss = 0.0
        for i, data in enumerate(train_loader, 0):
            inputs, labels = data[0], data[1]
            
            # обнуляем градиент
            optimizer.zero_grad()

            outputs = net(inputs)
            loss = criterion(outputs, labels)
            loss.backward()
            optimizer.step()

            epoch_loss += outputs.shape[0] * loss.item()

            # выводим статистику о процессе обучения
            running_loss += loss.item()
            if i % 300 == 0:    
                print('[%d, %5d] loss: %.3f' %
                    (epoch + 1, i + 1, running_loss / 2000))
                running_loss = 0.0
    print(epoch, epoch_loss / len(train_dataset))
    result[func] = epoch + 1, epoch_loss / len(train_dataset)

print('Training is finished!')
# print(epoch, epoch_loss / len(train_dataset))

  return F.mse_loss(input, target, reduction=self.reduction)


[1,     1] loss: 0.003


  return F.mse_loss(input, target, reduction=self.reduction)
  2%|█▋                                                                                | 2/100 [00:00<00:19,  5.11it/s]

[2,     1] loss: 0.003
[3,     1] loss: 0.003


  3%|██▍                                                                               | 3/100 [00:00<00:17,  5.54it/s]

[4,     1] loss: 0.003


  5%|████                                                                              | 5/100 [00:00<00:18,  5.01it/s]

[5,     1] loss: 0.003
[6,     1] loss: 0.003


  7%|█████▋                                                                            | 7/100 [00:01<00:17,  5.31it/s]

[7,     1] loss: 0.003
[8,     1] loss: 0.003


  9%|███████▍                                                                          | 9/100 [00:01<00:16,  5.41it/s]

[9,     1] loss: 0.003
[10,     1] loss: 0.003


 11%|████████▉                                                                        | 11/100 [00:02<00:16,  5.42it/s]

[11,     1] loss: 0.003
[12,     1] loss: 0.003


 13%|██████████▌                                                                      | 13/100 [00:02<00:16,  5.42it/s]

[13,     1] loss: 0.003
[14,     1] loss: 0.003


 15%|████████████▏                                                                    | 15/100 [00:02<00:15,  5.52it/s]

[15,     1] loss: 0.003


 16%|████████████▉                                                                    | 16/100 [00:03<00:15,  5.34it/s]

[16,     1] loss: 0.003


 17%|█████████████▊                                                                   | 17/100 [00:03<00:15,  5.40it/s]

[17,     1] loss: 0.003
[18,     1] loss: 0.003


 19%|███████████████▍                                                                 | 19/100 [00:03<00:14,  5.55it/s]

[19,     1] loss: 0.003
[20,     1] loss: 0.003


 21%|█████████████████                                                                | 21/100 [00:03<00:14,  5.64it/s]

[21,     1] loss: 0.003
[22,     1] loss: 0.003


 22%|█████████████████▊                                                               | 22/100 [00:04<00:13,  5.67it/s]

[23,     1] loss: 0.003


 23%|██████████████████▋                                                              | 23/100 [00:04<00:14,  5.41it/s]

[24,     1] loss: 0.003


 25%|████████████████████▎                                                            | 25/100 [00:04<00:16,  4.57it/s]

[25,     1] loss: 0.003


 26%|█████████████████████                                                            | 26/100 [00:04<00:15,  4.91it/s]

[26,     1] loss: 0.003
[27,     1] loss: 0.003


 28%|██████████████████████▋                                                          | 28/100 [00:05<00:13,  5.22it/s]

[28,     1] loss: 0.003


 29%|███████████████████████▍                                                         | 29/100 [00:05<00:13,  5.34it/s]

[29,     1] loss: 0.003
[30,     1] loss: 0.003


 31%|█████████████████████████                                                        | 31/100 [00:05<00:12,  5.51it/s]

[31,     1] loss: 0.003
[32,     1] loss: 0.003


 33%|██████████████████████████▋                                                      | 33/100 [00:06<00:12,  5.42it/s]

[33,     1] loss: 0.003


 34%|███████████████████████████▌                                                     | 34/100 [00:06<00:12,  5.46it/s]

[34,     1] loss: 0.003
[35,     1] loss: 0.003


 36%|█████████████████████████████▏                                                   | 36/100 [00:06<00:11,  5.59it/s]

[36,     1] loss: 0.003
[37,     1] loss: 0.003


 38%|██████████████████████████████▊                                                  | 38/100 [00:07<00:10,  5.66it/s]

[38,     1] loss: 0.003
[39,     1] loss: 0.003


 40%|████████████████████████████████▍                                                | 40/100 [00:07<00:10,  5.68it/s]

[40,     1] loss: 0.003
[41,     1] loss: 0.003


 42%|██████████████████████████████████                                               | 42/100 [00:07<00:10,  5.75it/s]

[42,     1] loss: 0.003
[43,     1] loss: 0.003


 44%|███████████████████████████████████▋                                             | 44/100 [00:08<00:09,  5.64it/s]

[44,     1] loss: 0.003
[45,     1] loss: 0.003


 46%|█████████████████████████████████████▎                                           | 46/100 [00:08<00:10,  5.32it/s]

[46,     1] loss: 0.003
[47,     1] loss: 0.003


 48%|██████████████████████████████████████▉                                          | 48/100 [00:08<00:09,  5.58it/s]

[48,     1] loss: 0.003
[49,     1] loss: 0.003


 50%|████████████████████████████████████████▌                                        | 50/100 [00:09<00:08,  5.63it/s]

[50,     1] loss: 0.003
[51,     1] loss: 0.003


 52%|██████████████████████████████████████████                                       | 52/100 [00:09<00:08,  5.61it/s]

[52,     1] loss: 0.003
[53,     1] loss: 0.003


 54%|███████████████████████████████████████████▋                                     | 54/100 [00:09<00:08,  5.62it/s]

[54,     1] loss: 0.002


 55%|████████████████████████████████████████████▌                                    | 55/100 [00:10<00:08,  5.58it/s]

[55,     1] loss: 0.003
[56,     1] loss: 0.003


 57%|██████████████████████████████████████████████▏                                  | 57/100 [00:10<00:07,  5.50it/s]

[57,     1] loss: 0.003


 58%|██████████████████████████████████████████████▉                                  | 58/100 [00:10<00:07,  5.56it/s]

[58,     1] loss: 0.003
[59,     1] loss: 0.003


 60%|████████████████████████████████████████████████▌                                | 60/100 [00:11<00:07,  5.54it/s]

[60,     1] loss: 0.003
[61,     1] loss: 0.003


 62%|██████████████████████████████████████████████████▏                              | 62/100 [00:11<00:06,  5.75it/s]

[62,     1] loss: 0.003
[63,     1] loss: 0.003


 64%|███████████████████████████████████████████████████▊                             | 64/100 [00:11<00:06,  5.80it/s]

[64,     1] loss: 0.003
[65,     1] loss: 0.003


 66%|█████████████████████████████████████████████████████▍                           | 66/100 [00:12<00:06,  5.48it/s]

[66,     1] loss: 0.003
[67,     1] loss: 0.003


 68%|███████████████████████████████████████████████████████                          | 68/100 [00:12<00:05,  5.62it/s]

[68,     1] loss: 0.003
[69,     1] loss: 0.003


 70%|████████████████████████████████████████████████████████▋                        | 70/100 [00:12<00:05,  5.79it/s]

[70,     1] loss: 0.003
[71,     1] loss: 0.003


 72%|██████████████████████████████████████████████████████████▎                      | 72/100 [00:13<00:04,  5.80it/s]

[72,     1] loss: 0.003
[73,     1] loss: 0.003


 74%|███████████████████████████████████████████████████████████▉                     | 74/100 [00:13<00:04,  5.71it/s]

[74,     1] loss: 0.003
[75,     1] loss: 0.003


 76%|█████████████████████████████████████████████████████████████▌                   | 76/100 [00:13<00:04,  5.71it/s]

[76,     1] loss: 0.003
[77,     1] loss: 0.003


 78%|███████████████████████████████████████████████████████████████▏                 | 78/100 [00:14<00:03,  5.82it/s]

[78,     1] loss: 0.003
[79,     1] loss: 0.003


 80%|████████████████████████████████████████████████████████████████▊                | 80/100 [00:14<00:03,  5.85it/s]

[80,     1] loss: 0.003
[81,     1] loss: 0.003


 82%|██████████████████████████████████████████████████████████████████▍              | 82/100 [00:14<00:03,  5.63it/s]

[82,     1] loss: 0.003
[83,     1] loss: 0.003


 84%|████████████████████████████████████████████████████████████████████             | 84/100 [00:15<00:02,  5.72it/s]

[84,     1] loss: 0.003
[85,     1] loss: 0.003


 86%|█████████████████████████████████████████████████████████████████████▋           | 86/100 [00:15<00:02,  5.37it/s]

[86,     1] loss: 0.003
[87,     1] loss: 0.003


 88%|███████████████████████████████████████████████████████████████████████▎         | 88/100 [00:16<00:02,  5.47it/s]

[88,     1] loss: 0.003
[89,     1] loss: 0.003


 90%|████████████████████████████████████████████████████████████████████████▉        | 90/100 [00:16<00:01,  5.78it/s]

[90,     1] loss: 0.003
[91,     1] loss: 0.003


 92%|██████████████████████████████████████████████████████████████████████████▌      | 92/100 [00:16<00:01,  5.81it/s]

[92,     1] loss: 0.003
[93,     1] loss: 0.003


 94%|████████████████████████████████████████████████████████████████████████████▏    | 94/100 [00:17<00:01,  5.81it/s]

[94,     1] loss: 0.003
[95,     1] loss: 0.003


 96%|█████████████████████████████████████████████████████████████████████████████▊   | 96/100 [00:17<00:00,  5.73it/s]

[96,     1] loss: 0.003
[97,     1] loss: 0.003


 98%|███████████████████████████████████████████████████████████████████████████████▍ | 98/100 [00:17<00:00,  5.80it/s]

[98,     1] loss: 0.003
[99,     1] loss: 0.003


100%|████████████████████████████████████████████████████████████████████████████████| 100/100 [00:18<00:00,  5.52it/s]


[100,     1] loss: 0.003
99 5.089457634129881


  0%|                                                                                          | 0/100 [00:00<?, ?it/s]

[1,     1] loss: 0.003


  1%|▊                                                                                 | 1/100 [00:00<00:17,  5.79it/s]

[2,     1] loss: 0.003


  2%|█▋                                                                                | 2/100 [00:00<00:17,  5.70it/s]

[3,     1] loss: 0.003


  4%|███▎                                                                              | 4/100 [00:00<00:17,  5.50it/s]

[4,     1] loss: 0.003
[5,     1] loss: 0.003


  6%|████▉                                                                             | 6/100 [00:01<00:17,  5.39it/s]

[6,     1] loss: 0.003
[7,     1] loss: 0.003


  8%|██████▌                                                                           | 8/100 [00:01<00:16,  5.63it/s]

[8,     1] loss: 0.002
[9,     1] loss: 0.003


 10%|████████                                                                         | 10/100 [00:01<00:15,  5.77it/s]

[10,     1] loss: 0.003
[11,     1] loss: 0.003


 12%|█████████▋                                                                       | 12/100 [00:02<00:15,  5.74it/s]

[12,     1] loss: 0.003
[13,     1] loss: 0.003


 14%|███████████▎                                                                     | 14/100 [00:02<00:14,  5.75it/s]

[14,     1] loss: 0.003
[15,     1] loss: 0.003


 16%|████████████▉                                                                    | 16/100 [00:02<00:14,  5.74it/s]

[16,     1] loss: 0.003
[17,     1] loss: 0.003


 18%|██████████████▌                                                                  | 18/100 [00:03<00:14,  5.80it/s]

[18,     1] loss: 0.003
[19,     1] loss: 0.003


 20%|████████████████▏                                                                | 20/100 [00:03<00:14,  5.58it/s]

[20,     1] loss: 0.003


 21%|█████████████████                                                                | 21/100 [00:03<00:14,  5.62it/s]

[21,     1] loss: 0.003
[22,     1] loss: 0.003


 23%|██████████████████▋                                                              | 23/100 [00:04<00:13,  5.75it/s]

[23,     1] loss: 0.003
[24,     1] loss: 0.003


 24%|███████████████████▍                                                             | 24/100 [00:04<00:13,  5.63it/s]

[25,     1] loss: 0.003


 26%|█████████████████████                                                            | 26/100 [00:04<00:13,  5.43it/s]

[26,     1] loss: 0.003
[27,     1] loss: 0.003


 28%|██████████████████████▋                                                          | 28/100 [00:04<00:12,  5.60it/s]

[28,     1] loss: 0.003
[29,     1] loss: 0.003


 30%|████████████████████████▎                                                        | 30/100 [00:05<00:12,  5.75it/s]

[30,     1] loss: 0.003
[31,     1] loss: 0.003


 32%|█████████████████████████▉                                                       | 32/100 [00:05<00:11,  5.81it/s]

[32,     1] loss: 0.003
[33,     1] loss: 0.003


 34%|███████████████████████████▌                                                     | 34/100 [00:06<00:11,  5.82it/s]

[34,     1] loss: 0.003
[35,     1] loss: 0.003


 36%|█████████████████████████████▏                                                   | 36/100 [00:06<00:11,  5.62it/s]

[36,     1] loss: 0.003
[37,     1] loss: 0.003


 38%|██████████████████████████████▊                                                  | 38/100 [00:06<00:10,  5.85it/s]

[38,     1] loss: 0.003
[39,     1] loss: 0.003


 40%|████████████████████████████████▍                                                | 40/100 [00:07<00:10,  5.79it/s]

[40,     1] loss: 0.003
[41,     1] loss: 0.003


 42%|██████████████████████████████████                                               | 42/100 [00:07<00:10,  5.69it/s]

[42,     1] loss: 0.003
[43,     1] loss: 0.003


 44%|███████████████████████████████████▋                                             | 44/100 [00:07<00:09,  5.67it/s]

[44,     1] loss: 0.003
[45,     1] loss: 0.003


 45%|████████████████████████████████████▍                                            | 45/100 [00:07<00:09,  5.71it/s]

[46,     1] loss: 0.003


 47%|██████████████████████████████████████                                           | 47/100 [00:08<00:10,  5.25it/s]

[47,     1] loss: 0.003
[48,     1] loss: 0.003


 49%|███████████████████████████████████████▋                                         | 49/100 [00:08<00:09,  5.37it/s]

[49,     1] loss: 0.003


 50%|████████████████████████████████████████▌                                        | 50/100 [00:08<00:09,  5.53it/s]

[50,     1] loss: 0.003
[51,     1] loss: 0.003


 52%|██████████████████████████████████████████                                       | 52/100 [00:09<00:08,  5.47it/s]

[52,     1] loss: 0.003


 53%|██████████████████████████████████████████▉                                      | 53/100 [00:09<00:08,  5.62it/s]

[53,     1] loss: 0.003
[54,     1] loss: 0.003


 55%|████████████████████████████████████████████▌                                    | 55/100 [00:09<00:07,  5.67it/s]

[55,     1] loss: 0.003
[56,     1] loss: 0.003


 57%|██████████████████████████████████████████████▏                                  | 57/100 [00:10<00:07,  5.66it/s]

[57,     1] loss: 0.003
[58,     1] loss: 0.003


 59%|███████████████████████████████████████████████▊                                 | 59/100 [00:10<00:07,  5.82it/s]

[59,     1] loss: 0.003
[60,     1] loss: 0.003


 61%|█████████████████████████████████████████████████▍                               | 61/100 [00:10<00:06,  5.85it/s]

[61,     1] loss: 0.003
[62,     1] loss: 0.003


 63%|███████████████████████████████████████████████████                              | 63/100 [00:11<00:06,  5.85it/s]

[63,     1] loss: 0.003
[64,     1] loss: 0.003


 65%|████████████████████████████████████████████████████▋                            | 65/100 [00:11<00:06,  5.57it/s]

[65,     1] loss: 0.003
[66,     1] loss: 0.003


 67%|██████████████████████████████████████████████████████▎                          | 67/100 [00:11<00:06,  5.37it/s]

[67,     1] loss: 0.003
[68,     1] loss: 0.003


 69%|███████████████████████████████████████████████████████▉                         | 69/100 [00:12<00:05,  5.57it/s]

[69,     1] loss: 0.003
[70,     1] loss: 0.003


 71%|█████████████████████████████████████████████████████████▌                       | 71/100 [00:12<00:05,  5.65it/s]

[71,     1] loss: 0.003
[72,     1] loss: 0.003


 73%|███████████████████████████████████████████████████████████▏                     | 73/100 [00:12<00:04,  5.73it/s]

[73,     1] loss: 0.003
[74,     1] loss: 0.003


 75%|████████████████████████████████████████████████████████████▊                    | 75/100 [00:13<00:04,  5.79it/s]

[75,     1] loss: 0.003
[76,     1] loss: 0.003


 77%|██████████████████████████████████████████████████████████████▎                  | 77/100 [00:13<00:03,  5.85it/s]

[77,     1] loss: 0.003
[78,     1] loss: 0.003


 79%|███████████████████████████████████████████████████████████████▉                 | 79/100 [00:13<00:03,  5.79it/s]

[79,     1] loss: 0.003
[80,     1] loss: 0.003


 81%|█████████████████████████████████████████████████████████████████▌               | 81/100 [00:14<00:03,  5.76it/s]

[81,     1] loss: 0.003
[82,     1] loss: 0.003


 83%|███████████████████████████████████████████████████████████████████▏             | 83/100 [00:14<00:02,  5.70it/s]

[83,     1] loss: 0.003
[84,     1] loss: 0.003


 85%|████████████████████████████████████████████████████████████████████▊            | 85/100 [00:15<00:02,  5.80it/s]

[85,     1] loss: 0.003
[86,     1] loss: 0.003


 87%|██████████████████████████████████████████████████████████████████████▍          | 87/100 [00:15<00:02,  5.28it/s]

[87,     1] loss: 0.003
[88,     1] loss: 0.003


 89%|████████████████████████████████████████████████████████████████████████         | 89/100 [00:15<00:02,  5.47it/s]

[89,     1] loss: 0.002
[90,     1] loss: 0.003


 91%|█████████████████████████████████████████████████████████████████████████▋       | 91/100 [00:16<00:01,  5.60it/s]

[91,     1] loss: 0.003
[92,     1] loss: 0.003


 93%|███████████████████████████████████████████████████████████████████████████▎     | 93/100 [00:16<00:01,  5.48it/s]

[93,     1] loss: 0.003


 94%|████████████████████████████████████████████████████████████████████████████▏    | 94/100 [00:16<00:01,  5.54it/s]

[94,     1] loss: 0.003
[95,     1] loss: 0.003


 96%|█████████████████████████████████████████████████████████████████████████████▊   | 96/100 [00:17<00:00,  5.56it/s]

[96,     1] loss: 0.003


 97%|██████████████████████████████████████████████████████████████████████████████▌  | 97/100 [00:17<00:00,  5.55it/s]

[97,     1] loss: 0.003
[98,     1] loss: 0.003


 99%|████████████████████████████████████████████████████████████████████████████████▏| 99/100 [00:17<00:00,  5.58it/s]

[99,     1] loss: 0.003
[100,     1] loss: 0.003


100%|████████████████████████████████████████████████████████████████████████████████| 100/100 [00:17<00:00,  5.63it/s]


99 5.10006648021767


  1%|▊                                                                                 | 1/100 [00:00<00:17,  5.62it/s]

[1,     1] loss: 0.003
[2,     1] loss: 0.003


  3%|██▍                                                                               | 3/100 [00:00<00:17,  5.68it/s]

[3,     1] loss: 0.003
[4,     1] loss: 0.003


  4%|███▎                                                                              | 4/100 [00:00<00:16,  5.65it/s]

[5,     1] loss: 0.003


  5%|████                                                                              | 5/100 [00:00<00:17,  5.40it/s]

[6,     1] loss: 0.003


  7%|█████▋                                                                            | 7/100 [00:01<00:18,  4.98it/s]

[7,     1] loss: 0.003


  8%|██████▌                                                                           | 8/100 [00:01<00:18,  4.96it/s]

[8,     1] loss: 0.003


  9%|███████▍                                                                          | 9/100 [00:01<00:17,  5.16it/s]

[9,     1] loss: 0.003
[10,     1] loss: 0.003


 11%|████████▉                                                                        | 11/100 [00:02<00:16,  5.30it/s]

[11,     1] loss: 0.003


 12%|█████████▋                                                                       | 12/100 [00:02<00:16,  5.27it/s]

[12,     1] loss: 0.003


 13%|██████████▌                                                                      | 13/100 [00:02<00:16,  5.33it/s]

[13,     1] loss: 0.003


 14%|███████████▎                                                                     | 14/100 [00:02<00:15,  5.45it/s]

[14,     1] loss: 0.003
[15,     1] loss: 0.003


 16%|████████████▉                                                                    | 16/100 [00:02<00:15,  5.51it/s]

[16,     1] loss: 0.003


 17%|█████████████▊                                                                   | 17/100 [00:03<00:15,  5.48it/s]

[17,     1] loss: 0.003
[18,     1] loss: 0.003


 19%|███████████████▍                                                                 | 19/100 [00:03<00:14,  5.53it/s]

[19,     1] loss: 0.003
[20,     1] loss: 0.003


 21%|█████████████████                                                                | 21/100 [00:03<00:14,  5.40it/s]

[21,     1] loss: 0.003


 22%|█████████████████▊                                                               | 22/100 [00:04<00:14,  5.31it/s]

[22,     1] loss: 0.003
[23,     1] loss: 0.003


 24%|███████████████████▍                                                             | 24/100 [00:04<00:14,  5.33it/s]

[24,     1] loss: 0.003


 25%|████████████████████▎                                                            | 25/100 [00:04<00:13,  5.43it/s]

[25,     1] loss: 0.003
[26,     1] loss: 0.003


 27%|█████████████████████▊                                                           | 27/100 [00:05<00:14,  4.98it/s]

[27,     1] loss: 0.003


 28%|██████████████████████▋                                                          | 28/100 [00:05<00:13,  5.17it/s]

[28,     1] loss: 0.003
[29,     1] loss: 0.003


 30%|████████████████████████▎                                                        | 30/100 [00:05<00:13,  5.35it/s]

[30,     1] loss: 0.003
[31,     1] loss: 0.003


 32%|█████████████████████████▉                                                       | 32/100 [00:06<00:12,  5.37it/s]

[32,     1] loss: 0.003
[33,     1] loss: 0.003


 34%|███████████████████████████▌                                                     | 34/100 [00:06<00:11,  5.52it/s]

[34,     1] loss: 0.003
[35,     1] loss: 0.003


 36%|█████████████████████████████▏                                                   | 36/100 [00:06<00:11,  5.50it/s]

[36,     1] loss: 0.003
[37,     1] loss: 0.003


 38%|██████████████████████████████▊                                                  | 38/100 [00:07<00:11,  5.51it/s]

[38,     1] loss: 0.003


 39%|███████████████████████████████▌                                                 | 39/100 [00:07<00:11,  5.39it/s]

[39,     1] loss: 0.003


 40%|████████████████████████████████▍                                                | 40/100 [00:07<00:11,  5.40it/s]

[40,     1] loss: 0.003


 41%|█████████████████████████████████▏                                               | 41/100 [00:07<00:10,  5.42it/s]

[41,     1] loss: 0.003
[42,     1] loss: 0.003


 43%|██████████████████████████████████▊                                              | 43/100 [00:08<00:10,  5.31it/s]

[43,     1] loss: 0.003


 44%|███████████████████████████████████▋                                             | 44/100 [00:08<00:10,  5.36it/s]

[44,     1] loss: 0.003


 45%|████████████████████████████████████▍                                            | 45/100 [00:08<00:10,  5.42it/s]

[45,     1] loss: 0.003
[46,     1] loss: 0.003


 46%|█████████████████████████████████████▎                                           | 46/100 [00:08<00:09,  5.48it/s]

[47,     1] loss: 0.003


 48%|██████████████████████████████████████▉                                          | 48/100 [00:09<00:10,  5.05it/s]

[48,     1] loss: 0.003


 49%|███████████████████████████████████████▋                                         | 49/100 [00:09<00:09,  5.16it/s]

[49,     1] loss: 0.003


 50%|████████████████████████████████████████▌                                        | 50/100 [00:09<00:09,  5.25it/s]

[50,     1] loss: 0.003
[51,     1] loss: 0.003


 52%|██████████████████████████████████████████                                       | 52/100 [00:09<00:08,  5.34it/s]

[52,     1] loss: 0.003
[53,     1] loss: 0.003


 54%|███████████████████████████████████████████▋                                     | 54/100 [00:10<00:08,  5.58it/s]

[54,     1] loss: 0.003
[55,     1] loss: 0.003


 56%|█████████████████████████████████████████████▎                                   | 56/100 [00:10<00:07,  5.56it/s]

[56,     1] loss: 0.003
[57,     1] loss: 0.003


 58%|██████████████████████████████████████████████▉                                  | 58/100 [00:10<00:07,  5.50it/s]

[58,     1] loss: 0.003


 59%|███████████████████████████████████████████████▊                                 | 59/100 [00:10<00:07,  5.54it/s]

[59,     1] loss: 0.003


 60%|████████████████████████████████████████████████▌                                | 60/100 [00:11<00:07,  5.36it/s]

[60,     1] loss: 0.003


 61%|█████████████████████████████████████████████████▍                               | 61/100 [00:11<00:07,  5.42it/s]

[61,     1] loss: 0.003
[62,     1] loss: 0.003


 63%|███████████████████████████████████████████████████                              | 63/100 [00:11<00:06,  5.44it/s]

[63,     1] loss: 0.003
[64,     1] loss: 0.003


 65%|████████████████████████████████████████████████████▋                            | 65/100 [00:12<00:06,  5.46it/s]

[65,     1] loss: 0.003


 66%|█████████████████████████████████████████████████████▍                           | 66/100 [00:12<00:06,  5.43it/s]

[66,     1] loss: 0.003
[67,     1] loss: 0.003


 68%|███████████████████████████████████████████████████████                          | 68/100 [00:12<00:06,  5.22it/s]

[68,     1] loss: 0.003
[69,     1] loss: 0.003


 70%|████████████████████████████████████████████████████████▋                        | 70/100 [00:13<00:05,  5.43it/s]

[70,     1] loss: 0.003
[71,     1] loss: 0.003


 72%|██████████████████████████████████████████████████████████▎                      | 72/100 [00:13<00:05,  5.56it/s]

[72,     1] loss: 0.003
[73,     1] loss: 0.003


 74%|███████████████████████████████████████████████████████████▉                     | 74/100 [00:13<00:04,  5.55it/s]

[74,     1] loss: 0.003
[75,     1] loss: 0.003


 76%|█████████████████████████████████████████████████████████████▌                   | 76/100 [00:14<00:04,  5.59it/s]

[76,     1] loss: 0.003
[77,     1] loss: 0.003


 78%|███████████████████████████████████████████████████████████████▏                 | 78/100 [00:14<00:03,  5.57it/s]

[78,     1] loss: 0.002


 79%|███████████████████████████████████████████████████████████████▉                 | 79/100 [00:14<00:03,  5.34it/s]

[79,     1] loss: 0.003


 80%|████████████████████████████████████████████████████████████████▊                | 80/100 [00:14<00:03,  5.45it/s]

[80,     1] loss: 0.003
[81,     1] loss: 0.003


 82%|██████████████████████████████████████████████████████████████████▍              | 82/100 [00:15<00:03,  5.56it/s]

[82,     1] loss: 0.003
[83,     1] loss: 0.003


 84%|████████████████████████████████████████████████████████████████████             | 84/100 [00:15<00:02,  5.64it/s]

[84,     1] loss: 0.003
[85,     1] loss: 0.003


 86%|█████████████████████████████████████████████████████████████████████▋           | 86/100 [00:15<00:02,  5.56it/s]

[86,     1] loss: 0.003
[87,     1] loss: 0.003


 88%|███████████████████████████████████████████████████████████████████████▎         | 88/100 [00:16<00:02,  5.13it/s]

[88,     1] loss: 0.003


 89%|████████████████████████████████████████████████████████████████████████         | 89/100 [00:16<00:02,  5.28it/s]

[89,     1] loss: 0.003
[90,     1] loss: 0.003


 91%|█████████████████████████████████████████████████████████████████████████▋       | 91/100 [00:16<00:01,  5.54it/s]

[91,     1] loss: 0.003
[92,     1] loss: 0.003


 93%|███████████████████████████████████████████████████████████████████████████▎     | 93/100 [00:17<00:01,  5.66it/s]

[93,     1] loss: 0.003
[94,     1] loss: 0.003


 95%|████████████████████████████████████████████████████████████████████████████▉    | 95/100 [00:17<00:00,  5.68it/s]

[95,     1] loss: 0.003
[96,     1] loss: 0.003


 97%|██████████████████████████████████████████████████████████████████████████████▌  | 97/100 [00:17<00:00,  5.50it/s]

[97,     1] loss: 0.003


 98%|███████████████████████████████████████████████████████████████████████████████▍ | 98/100 [00:18<00:00,  5.56it/s]

[98,     1] loss: 0.003
[99,     1] loss: 0.003


 99%|████████████████████████████████████████████████████████████████████████████████▏| 99/100 [00:18<00:00,  5.56it/s]

[100,     1] loss: 0.003


100%|████████████████████████████████████████████████████████████████████████████████| 100/100 [00:18<00:00,  5.40it/s]

99 5.115353797202887
Training is finished!





In [None]:
print(result)

{'RMSprop': (100, 1.3281817846520003), 'SGD': (100, 1.3255716610324475), 'Adam': (100, 1.3250196221570945)}
