In [0]:
import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
import torch.autograd as autograd
import torch.nn.functional as F

# PyTorchの基本モジュール

In [0]:
a = torch.ones((2, 3))
a

In [0]:
a = torch.zeros((2, 3))
a

In [0]:
a = torch.full((2, 3), fill_value=99)
a

In [0]:
a = torch.eye(3)
a

In [0]:
torch.manual_seed(1234)

torch.randn(10)

In [0]:
torch.rand(10)

In [0]:
a = torch.ones((2, 3), dtype=torch.float)
a.dtype

In [0]:
a = torch.ones((2, 3), dtype=torch.int)
a.dtype

In [0]:
a = torch.ones((2, 3), dtype=torch.long)
a.dtype

In [0]:
a.shape

In [0]:
a = torch.arange(6)
a

In [0]:
b = a.reshape(2, 3)
b

In [0]:
b = a.view(1, 2, 3, 1)
b

In [0]:
x = torch.randn(10, 3, 2)
x.shape

In [0]:
x.view(30, 2).shape

In [0]:
x.view(3, -1).shape

In [0]:
b = a.unsqueeze(dim=1)
b

In [0]:
c = b.squeeze()

In [0]:
c = b[:, None]
c

In [0]:
a = torch.arange(6).reshape(1, 2, 3)
a.shape

In [0]:
b = a.transpose(0, 2)
b.shape

In [0]:
b = a.permute(0, 2, 1)
b.shape

In [0]:
# numpy、list、scalarへの変換
# 変換前
a = torch.arange(6).reshape(1, 2, 3)
a.shape

In [0]:
# numpy.ndarrayへの変換
a.numpy()

In [0]:
# listへの変換
a.tolist()

In [0]:
# scalarへの変換
a.sum().item()

**Q１. Tensor型の2行3列の行列を作成して下さい。1行目の値は、[0,1,2]、2行目の値は[3,4,5] とする。**

**Q２. Tensor型のデータをNumpy型に変換して下さい。**

**Q３. Tensor型のデータをlist型に変換して下さい。**

**Q４. Tensor型のデータをscalar型に変換して下さい。**

# 演算

In [0]:
a = torch.rand((2, 3))
b = torch.rand((2, 3))
print(a)
print(b)

In [0]:
a + b

In [0]:
a - b

In [0]:
a * b

In [0]:
a / b

In [0]:
# log
torch.log(a)

In [0]:
# exp
torch.exp(a)

In [0]:
# ルート
torch.sqrt(a)

### 集約演算

In [0]:
a = torch.arange(10, dtype=torch.float32).reshape(2, 5)
print(a)

In [0]:
# 合計(dim0)
torch.sum(a, dim=0)  # a.sum(0)でも可

In [0]:
# 平均(dim1)
torch.mean(a, dim=1)

In [0]:
# 分散(全体)
torch.var(a)    # dimを指定しない場合は全体に対して適用

In [0]:
# 標準偏差(dim -1, 最後の次元)
torch.std(a, dim=-1)   # dim=-1とすると最後の次元に対して適用

In [0]:
# 最大値、argmax(dim0)
torch.max(a, dim=0)  # torch.maxは, maxとargmaxの両方を返す(torch.minも同様)

In [0]:
# 最大値
torch.max(a)  # dimを指定しない場合はmax(or min)のみ返す

### 行列・テンソル積

In [0]:
a = torch.ones(4)
b = torch.ones(4)

c = torch.dot(a, b)
print(a)
print(c)

In [0]:
a = torch.ones((2, 3))
b = torch.ones((3, 4))

c = torch.matmul(a, b)
print(a)
print(b)
print(c)

### 行列のノルム

In [0]:
a = torch.arange(3, dtype=torch.float)
print(a)
print(torch.norm(a, p=2))

**Ｑ１．次の行列A,Bの内積A・Ｂを Tensorを用いて計算してください。**

**Ｑ２．次のy , tに関する二乗和誤差をTensor型を用いて求めて下さい。**

y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]

t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0 ]

# CPU／GPUの切替

In [0]:
a = torch.ones(1)
a

In [0]:
b = a.cuda()
b

In [0]:
b = a.to('cuda')
b

In [0]:
c = b.cpu()
c

In [0]:
c = b.to('cpu')
c

In [0]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(device)
print(torch.ones(1, device=device))

**Q１. 以下のTensor型で宣言された変数aについて、GPUデバイスで操作できるように、定義した変数bを作成してください。**

　a = torch.ones((3, 3))

**Q２. GPUデバイスで操作できるように定義した変数bにについて、CPUデバイスで操作できるように定義した変数cを作成してください。**

**Q３. 新規に定義する変数dについて、GPUデバイスでもCPUデバイスでも操作できるようにtorch.cuda.is_available()を用いて定義して下さい。**

# Autograd

In [0]:
# 順伝播の計算
x = torch.randn(4, 4)
y = torch.randn(4, 1)

w = torch.randn(4, 1, requires_grad=True)
b = torch.randn(1, requires_grad=True)

y_pred = torch.matmul(x, w) + b

In [0]:
# 目的関数の定義
loss = (y_pred - y).pow(2).sum()

In [0]:
# ユーザが作成したTensorはgrad_fn=None
print(x.grad_fn)
print(y.grad_fn)
print(w.grad_fn)
print(b.grad_fn)
print()

In [0]:
# Functionによって計算されたTensorはgrad_fnを有する
print(y_pred.grad_fn)

In [0]:
# まだ勾配は計算されていない
print(x.grad)
print(y.grad)
print(w.grad)
print(b.grad)

In [0]:
# 逆伝播
loss.backward()

In [0]:
# requires_grad=Trueを指定した変数は勾配が計算されている
print(x.grad)
print(y.grad)
print(w.grad)
print(b.grad)

In [0]:
# .detach()を使うことにより、Tensorの勾配計算を行わないようにすることも可能
x = torch.randn(4, 4)
y = torch.randn(4, 1)

w = torch.randn(4, 1, requires_grad=True)
b = torch.randn(1, requires_grad=True)
b = b.detach()  # bの勾配計算を停止

y_pred = torch.matmul(x, w) + b

loss = (y_pred - y).pow(2).sum()

loss.backward()

print(w.grad)  # 勾配を有する
print(b.grad)  # 勾配を有さない

In [0]:
# with torch.no_grad():でくくることで、その下で定義したTensorの勾配計算をまとめて停止させることが可能
with torch.no_grad():
    y_eval = torch.matmul(x, w) + b  # y_predと同様の計算を行う

print('requires_grad of y_pred:', y_pred.requires_grad)  # requires_grad=True
print('requires_grad of y_eval:', y_eval.requires_grad)  # requires_grad=False

# PyTorchのネットワーク構築

In [0]:
# 線形層
nn.Linear(input_dim, output_dim)

In [0]:
# 畳み込み層
nn.Conv1d(input_dim, output_dim, kernel_size)

In [0]:
# LSTM
nn.LSTM(input_dim, hidden_dim, num_layers)

## 活性化関数

In [0]:
import torch.nn.functional as F
torch.manual_seed(34)
x = torch.randn((2, 3))

In [0]:
# sigmoid
print(torch.sigmoid(x)) 

In [0]:
# relu()
print(F.relu(x))

In [0]:
# tanh()
print(torch.tanh(x))

In [0]:
# Leakey_relu()
print(F.leaky_relu(x, 0.2))

In [0]:
# softplus()
print(F.softplus(x))

In [0]:
# softmax()
print(F.softmax(x, dim=-1))

## 誤差関数

In [0]:
# L1誤差
nn.L1Loss()

In [0]:
# 平均二乗誤差
nn.MSELoss()

In [0]:
# 交差エントロピー誤差
nn.CrossEntropyLoss()

## モジュール化

In [0]:
class MLP(nn.Module):  # nn.Moduleを継承する
    def __init__(self, in_dim, hid_dim, out_dim):  # __init__をoverride
        super(MLP, self).__init__()
        self.linear1 = nn.Linear(in_dim, hid_dim)
        self.linear2 = nn.Linear(hid_dim, out_dim)
    
    def forward(self, x):  # forwardをoverride
        x = F.relu(self.linear1(x))
        x = torch.sigmoid(self.linear2(x))
        return x

In [0]:
mlp = MLP(2, 3, 1)
print(mlp)
print()

x = torch.Tensor([[0, 0], [0, 1], [1, 0], [1, 1]])
y = mlp(x) # forward(x)が呼ばれる
print("# feedforward：")
print(y)
print()

print("# mlp.parameters()でモデルのパラメータ取得：")
print(mlp.parameters())

## 最適化

In [0]:
# optimizerの定義
optimizer = optim.SGD([W1, W2], lr=0.1)
 
# 勾配のリセット
optimizer.zero_grad()
 
# パラメータの更新
optimizer.step()

# 学習

In [0]:
# XORをMLPで行う
x = torch.Tensor([[0, 0], [0, 1], [1, 0], [1, 1]])
t = torch.Tensor([0, 1, 1, 0])

# モデルの定義
mlp = MLP(2, 3, 1)

# 誤差関数の定義
criterion = nn.BCELoss()  # Binary Cross Entropy Loss

# 最適化の定義
optimizer = optim.SGD(mlp.parameters(), lr=0.1)  # Moduleのパラメータは.parameters()で取得できる

# モデルを訓練モードにする（Dropout等に関係）
mlp.train()

In [0]:
for i in range(1000):
    # 順伝播
    y_pred = mlp(x)

    # 誤差の計算
    loss = criterion(y_pred, t.unsqueeze(1))
    
    # 逆伝播
    optimizer.zero_grad()
    loss.backward()
    
    # パラメータの更新
    optimizer.step()

    if i % 100 == 0:
        print(i, loss.item())

## モデルの保存・読み込み・再学習

In [0]:
print(list(mlp.parameters()))
print()

# state_dictの取得
state_dict = mlp.state_dict()
print(state_dict)

# モデルの保存
torch.save(state_dict, './model.pth')

In [0]:
# モデルの定義
mlp2 = MLP(2, 3, 1)
print(list(mlp2.parameters()))  # ランダムな初期値
print()

# 学習済みパラメータの読み込み
state_dict = torch.load('./model.pth')
mlp2.load_state_dict(state_dict)
print(list(mlp2.parameters()))  # 学習済みパラメータ

# PyTorchを用いたMLPの実装

In [0]:
#  torchvision & DataLoader
from torchvision import transforms, datasets
 
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Lambda(lambda x: x.view(in_dim))
])
 
dataloader = torch.utils.data.DataLoader(
    datasets.MNIST('~/data/mnist', train=True, download=True, transform=transform),
    batch_size=batch_size,
    shuffle=True
)

これまでのコードを参考・活用し、MNISTを実装するコードを作成して下さい。

In [0]:
from torchvision import datasets, transforms, models
from sklearn.metrics import f1_score

In [0]:
# 参考
in_dim  = 784
hid_dim = 200
out_dim = 10
lr = 0.001
batch_size = 32
n_epochs = 10

In [0]:
# 参考
for epoch in range(n_epochs):
    losses_train = []
    losses_valid = []
    preds_train = []
    preds_valid = []
    trues_train = []
    trues_valid = []
    
    mlp.train()
    for x, t in dataloader_train:
        true = t.tolist()
        trues_train.extend(true)

        # 勾配の初期化
        
        
        # テンソルをGPUに移動
        
        
        
        # 順伝播
        
        
        # 誤差の計算
        
        
        # 誤差の逆伝播
        
        
        # パラメータの更新
        
        
        # モデルの出力を予測値のスカラーに変換
        pred = y.argmax(1).tolist()
        preds_train.extend(pred)
        
        losses_train.append(loss.tolist())
    
    mlp.eval()
    for x, t in dataloader_valid:
        true = t.tolist()
        trues_valid.extend(true)

        # テンソルをGPUに移動
        
        
        
        # 順伝播
        

        # 誤差の計算
        
        
        # モデルの出力を予測値のスカラーに変換
        pred = y.argmax(1).tolist()
        preds_valid.extend(pred)
        
        losses_valid.append(loss.tolist())
        
    print('EPOCH: {}, Train [Loss: {:.3f}, F1: {:.3f}], Valid [Loss: {:.3f}, F1: {:.3f}]'.format(
        epoch,
        np.mean(losses_train),
        f1_score(trues_train, preds_train, average='macro'),
        np.mean(losses_valid),
        f1_score(trues_valid, preds_valid, average='macro')
    ))