In [0]:
import torch
import torch.nn as nn

#### 入力（x）と正解データ（y）

In [0]:
x = torch.randn(10, 3) #10次元×３次元のランダムの行列 bach* 入力次元
y = torch.randn(10, 2) # bach* 出力力次元

#### モデル：$ M(x) = W x + b $

In [3]:
M = nn.Linear(3,2) 
print('W: ',M.weight)  #requires_grad=True 勾配を計算するか？
print('b: ',M.bias)

W:  Parameter containing:
tensor([[ 0.3525,  0.3671,  0.4170],
        [-0.3942, -0.0782, -0.1043]], requires_grad=True)
b:  Parameter containing:
tensor([ 0.2383, -0.3851], requires_grad=True)


#### ロス関数（criterion）と最適化手法（optimizer）

In [0]:
criterion = nn.MSELoss()
optimizer = torch.optim.SGD(M.parameters(), lr=0.01) # 学習対象はM lr 学習率

#### ロスの計算
pytorchでは勾配を計算するたびに足されるので注意

.zero_grad()で0に戻せる

In [12]:
optimizer.zero_grad() # 重要 まずは勾配を０に初期化
pred = M(x)
loss = criterion(pred,y)
print(loss)

tensor(1.1637, grad_fn=<MseLossBackward>)


#### 誤差逆伝播

最適化手法によりモデルの重みが更新される

In [13]:
loss.backward() # 自動微分！
print ('dL/dW: ', M.weight.grad) 
print ('dL/db: ', M.bias.grad)
optimizer.step() # 重みの更新

dL/dW:  tensor([[ 0.7000,  0.3443,  1.3664],
        [-0.2530,  0.3422, -0.4125]])
dL/db:  tensor([ 0.2897, -0.1315])


#### ロスが下がる

In [14]:
pred = M(x)
loss = criterion(pred,y)
print(loss)

tensor(1.1347, grad_fn=<MseLossBackward>)


#### 自動微分で自由にロスの定義

In [17]:
# criterion = lambda x, y: torch.pow(x-y, 2).mean() # criterion.MSELossと同じ
criterion = lambda x, y: torch.abs(x-y).mean()
pred = M(x)
loss = criterion(pred,y) # 誤差関数の定義。 ２乗誤差
print(loss)
loss.backward()
print ('dL/dW: ', M.weight.grad) 
print ('dL/db: ', M.bias.grad)

tensor(0.8328, grad_fn=<MeanBackward0>)
dL/dW:  tensor([[ 2.0400,  0.9374,  3.5277],
        [-0.7006,  1.1693, -0.8848]])
dL/db:  tensor([ 0.5702, -0.0601])
