# PyTorchでニューラルネットワーク基礎 #02 【回帰分析・非線形化】

* Qiitaの記事と連動しています
* データファイル: vending_machine.csv
* vending_macnine.csvを使った回帰分析のサンプルファイル

In [1]:
import numpy as np
import torch
import torch.nn as nn
import torch.nn.functional as F

In [2]:
# numpy で CSV ファ イ ル を 読 み 込 む
# np.loadtxt( ファ イ ル 名 ， 句 切 り 記 号 ， 利 用 列 ) を 利 用
# torch テ ン ソ ル に 変 換 torch.Tensor()
filename = "./vending_machine.csv"
x = np.loadtxt(filename, delimiter=",", skiprows=1, usecols=(0,1,2,3))
t = np.loadtxt(filename, delimiter=",", skiprows=1, usecols=(4))
x = torch.FloatTensor(x)
t = torch.FloatTensor(t).view(-1,1)

### データの形状の確認
* x: (バッチサイズ, 4)
* t: (バッチサイズ, 1)

In [3]:
x.shape, t.shape

(torch.Size([54, 4]), torch.Size([54, 1]))

In [4]:
# ネットワークの定義
class DNN(nn.Module):
    def __init__(self):
        super().__init__()
        self.fc1 = nn.Linear(4,10)    # ４個から特徴量10個
        self.fc2 = nn.Linear(10,1)    #  10個の特徴量から1個（売上）
    # forward部分が実際の流れ。この例だと、全結合層一つだけ
    def forward(self, x):
        h = self.fc1(x)
        h = F.relu(h)
        y = self.fc2(h)
        return y

# モデルの作成
model = DNN()


In [5]:
criterion = nn.MSELoss()                                 # 損失関数を記述
#optimizer = torch.optim.SGD(model.parameters(), lr=0.001) # Adam，AdamWとかたくさんある
optimizer = torch.optim.Adam(model.parameters(), lr=0.05)

In [6]:
LOOP = 5000                               # LOOP : 学習回数
for epoch in range(LOOP):
    optimizer.zero_grad()                # 勾配初期化pytorchの約束事項
    y = model(x)                         # ネットワークモデルによる予測
    loss = criterion(y, t)               # 誤差計算pytorchの約束事項
    print(epoch,"\tloss:", loss.item())  # lossの値 (loss.item()) を表示
    loss.backward()                      # backward(微分する部分)
    optimizer.step()                     # パラメータ更新pytorchの約束事項

0 	loss: 169160.796875
1 	loss: 166430.015625
2 	loss: 163931.359375
3 	loss: 161326.265625
4 	loss: 158364.140625
5 	loss: 155106.328125
6 	loss: 151487.40625
7 	loss: 147443.515625
8 	loss: 142876.984375
9 	loss: 137732.234375
10 	loss: 132037.359375
11 	loss: 125805.546875
12 	loss: 119068.546875
13 	loss: 111865.7890625
14 	loss: 104245.1484375
15 	loss: 96265.3359375
16 	loss: 87996.7109375
17 	loss: 79521.7578125
18 	loss: 70935.5390625
19 	loss: 62345.77734375
20 	loss: 53872.47265625
21 	loss: 45646.90234375
22 	loss: 37809.80859375
23 	loss: 30508.283203125
24 	loss: 23891.166015625
25 	loss: 18102.375
26 	loss: 13271.7080078125
27 	loss: 9502.9052734375
28 	loss: 6859.0029296875
29 	loss: 5346.20703125
30 	loss: 4898.904296875
31 	loss: 5370.45849609375
32 	loss: 6535.751953125
33 	loss: 8110.47265625
34 	loss: 9787.4140625
35 	loss: 11282.4384765625
36 	loss: 12377.0791015625
37 	loss: 12945.1611328125
38 	loss: 12957.6826171875
39 	loss: 12468.6923828125
40 	loss: 11589.879

### 予測してみた

* 損失：397くらい（もうすこし小さくなる）
* 10月、25度、人口比率0.9、平日０ ===> 556.38 (モデルごとに値が異なる)
* 線形の場合 ===> 556.53



In [8]:
x_test = [10, 25, 0.9, 0]
x_test = torch.FloatTensor(x_test)
model(x_test)

tensor([556.3793], grad_fn=<ViewBackward0>)