<h1>Table of Contents<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#インストールについて" data-toc-modified-id="インストールについて-1"><span class="toc-item-num">1&nbsp;&nbsp;</span>インストールについて</a></span></li><li><span><a href="#What-is-PyTorch" data-toc-modified-id="What-is-PyTorch-2"><span class="toc-item-num">2&nbsp;&nbsp;</span>What is PyTorch</a></span><ul class="toc-item"><li><span><a href="#演算" data-toc-modified-id="演算-2.1"><span class="toc-item-num">2.1&nbsp;&nbsp;</span>演算</a></span></li></ul></li><li><span><a href="#AUTOGRAD:-AUTOMATIC-DIFFERENTIATION" data-toc-modified-id="AUTOGRAD:-AUTOMATIC-DIFFERENTIATION-3"><span class="toc-item-num">3&nbsp;&nbsp;</span>AUTOGRAD: AUTOMATIC DIFFERENTIATION</a></span></li><li><span><a href="#ニューラルネットワーク" data-toc-modified-id="ニューラルネットワーク-4"><span class="toc-item-num">4&nbsp;&nbsp;</span>ニューラルネットワーク</a></span></li></ul></div>

In [3]:
import os
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import re
plt.rcParams['figure.figsize'] = (8, 6)
plt.rcParams['figure.figsize'] = (8, 6)
plt.rcParams['font.size'] = 14

In [2]:
import cv2

## インストールについて

公式を参考にそのままやったらかなり躓いたのでメモしておく。

公式ではPyTorchやCUDAのバージョンを選択してインストール用のコマンドを生成してくれるが、
これでやってしまうとうまくインストールできなかった。  
(`import torch`すると、`DLL load failed`となってしまった)

おそらくだけど、これを行った時点ではPyTorchの最新バージョンは1.3.0だが、
まだWindowsに対応していないのでは?
対策として一つ前のバージョンである1.2.0を入れることにした。

また、前のバージョンである1.2.0を、これも公式のとおりにインストールしたら
CUDA9に対応したPyTorchが入ってしまった。
(以下のコマンド)

```
pip install torch==1.2.0 torchvision==0.4.0 -f https://download.pytorch.org/whl/torch_stable.html
```

以下のページを参考にしながら、次のように行うことで、
CUDA10を使用したPyTorch Ver1.2をインストールすることができた。

```
pip3 install https://download.pytorch.org/whl/cu100/torch-1.2.0-cp36-cp36m-win_amd64.whl

pip3 install https://download.pytorch.org/whl/cu100/torchvision-0.4.0-cp36-cp36m-win_amd64.whl
```

これをPipfileのscriptに書いておいたので、あとからでもインストールできると思う。

---

**参考**

- [1](https://discuss.pytorch.org/t/getting-cuda-version-9-0-17-but-nvcc-shows-the-cuda-version-to-be-10-0-130/48300)
- [2](https://drumato.hatenablog.com/entry/2019/01/13/104206)

---

In [9]:
import torch

x = torch.rand(5, 3)
print(x)

tensor([[0.6743, 0.4999, 0.2041],
        [0.1182, 0.4369, 0.9295],
        [0.9445, 0.6874, 0.0416],
        [0.2082, 0.6115, 0.8720],
        [0.7573, 0.5505, 0.6653]])


In [10]:
if torch.cuda.is_available():
    print(f"CUDA version using in PyTorch is {torch.version.cuda}")

CUDA version using in PyTorch is 10.0


## What is PyTorch

変数やテンソルの生成、扱い方など。。

In [17]:
x = torch.empty(5, 3)
x = torch.zeros(5, 3)
x = torch.rand(5, 3)
x = torch.randn(5, 3)
x = torch.ones(5, 3)

- `empty`
- `zeros`
- `ones`
- `rand`
- `randn`

### 演算

例えば足し算は`+`演算子でもできるし、`tensor`がもっている`add`メソッドでもできる。

`tensor`自身に足した結果を格納したい場合には、`postfix`に`_`をつけたメソッドを呼び出せばよい。
足し算の場合には、`add_`メソッドとなる。
足し算以外の他の演算メソッドでもこの法則は同様。

また、`postfir`に`_like`とあるものは、入力にtensorをとり、
その形状と同じtensorを返す。

In [24]:
x = torch.rand(5, 3)
y = torch.rand(5, 3)

print(f"x + y = \n{x + y}")

print(f"x = \n{x.add_(y)}")

x + y = 
tensor([[1.4379, 1.0812, 1.1456],
        [0.3082, 0.8464, 0.5303],
        [1.7579, 0.9883, 0.6281],
        [1.4171, 0.8570, 0.7017],
        [0.1624, 0.2367, 1.3165]])
x = 
tensor([[1.4379, 1.0812, 1.1456],
        [0.3082, 0.8464, 0.5303],
        [1.7579, 0.9883, 0.6281],
        [1.4171, 0.8570, 0.7017],
        [0.1624, 0.2367, 1.3165]])


In [34]:
print(torch.rand_like(x))

tensor([[0.6319, 0.4041, 0.3563],
        [0.4245, 0.3924, 0.8710],
        [0.0683, 0.2766, 0.8291],
        [0.9181, 0.5231, 0.2561],
        [0.7665, 0.9804, 0.7721]])


In [29]:
# numpy-likeにスライスすることも可能
print(f"The 1st row of x:\n{x[0,:]}")

The 1st row of x:
tensor([1.4379, 1.0812, 1.1456])


チュートリアルでは紹介しきれない演算子が多くある。
(例えば、transposeやslicing、代数演算など)

それらの詳細は以下にすべてまとまっているので、適宜参考にすること。

[docs](https://pytorch.org/docs/stable/torch.html)

In [33]:
# tensorをndarrayに変換可能

a = torch.ones(5)
b = a.numpy()
print(f"numpy-converted obj: {b}")

a.add_(1)

print(f"the converted obj reference the same obejct.")
print(f"numpy-converted obj: {b}")

numpy-converted obj: [1. 1. 1. 1. 1.]
the converted obj reference the same obejct.
numpy-converted obj: [2. 2. 2. 2. 2.]


## AUTOGRAD: AUTOMATIC DIFFERENTIATION

参考ページ:[ここ](https://pytorch.org/tutorials/beginner/blitz/autograd_tutorial.html#sphx-glr-beginner-blitz-autograd-tutorial-py)

In [82]:
x = torch.ones(2, 2, requires_grad=True)
y = x + 2
print(y)

tensor([[3., 3.],
        [3., 3.]], grad_fn=<AddBackward0>)


In [83]:
z = y * y * 3
# out = z.mean()

# print(z, out)

上記のように`requires_grad`属性を`True`にしたいtensorに対して演算を行うと、
その演算に対する微分情報が得られる。

In [69]:
out.backward()
print(x.grad)

tensor([[4.5000, 4.5000],
        [4.5000, 4.5000]])


以上の結果は、`out`を`x`で偏微分したもの、つまりはヤコビアン。
(`out`は`x`の関数。)

計算過程を詳説すると、以下のとおり。

---
`out`を$\boldsymbol{o}$ と表記すると、$\boldsymbol{o} = \frac{1}{4} \sum 3(\boldsymbol{x} +2)^2$となる。

これを$\boldsymbol{x}$ で微分したものが上記となる。

$\frac{\boldsymbol{o}}{x_i} = \frac{3}{2}(x_i + 2)$である。$x_i = 1$のとき、これは4.5となる。

よって、上記のような計算結果となる。

---

In [98]:
x = torch.ones(2, 2, requires_grad=True)
y = 2 * x ** 4 + 5

y.backward(torch.ones(2, 2))
print(x.grad)

tensor([[8., 8.],
        [8., 8.]])


ベクトル$\boldsymbol{y}$に対して、ベクトル$\boldsymbol{x}$の各要素で偏微分したものはヤコビ行列(ヤコビアン)と呼ばれる。

一般に、`torch.autograd`はヤコビアンと行列の積を求める計算エンジンである。

つまり、任意のベクトル$\boldsymbol{v}$が与えられた場合、$\boldsymbol{v}^\mathrm{T} \cdot \boldsymbol{J}$が計算される。

仮に$\boldsymbol{v}$がスカラー量$l = f(\boldsymbol{y})$の勾配であった場合、つまり、
$\boldsymbol{v} = \{ \frac{\partial{l}}{\partial{y_1}},...,  \frac{\partial{l}}{\partial{y_n}}\}^\mathrm{T}$
である場合、**連鎖律(chain rule)** によって、
ベクトル-ヤコビアンの積は、スカラー量$l$を$\boldsymbol{x}$で微分したものとなる。

$$
\boldsymbol{J}^\mathrm{T} \cdot \boldsymbol{v} = \{ \frac{\partial{l}}{\partial{x_1}},...,  \frac{\partial{l}}{\partial{x_m}}\}^\mathrm{T}
$$

## ニューラルネットワーク

Pytorchでは`torch.nn`パッケージを用いてニューラルネットワークを構築していく。

ニューラルネットワークのトレーニングの主な流れは以下のとおり。

- ネットワークを構築する
- 入力データを入れる
- 損失を計算する
- backprop計算
- ネットワーク内の重みを更新

In [101]:
nn.Conv2d?

In [105]:
import torch.nn as nn
import torch.nn.functional as F

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        
        # 1層目
        # 1チャンネルの画像データを入力
        # 出力には6チェンネルのデータとなる
        # カーネルサイズは3x3
        # 注: 畳み込み層では出力画像のサイズを指定しない。
        # (サイズはカーネルサイズやPoolong層、パディングによって自動的に決まる)
        self.conv1 = nn.Conv2d(1, 6, 3)
        
        # 2層目
        # 6チャンネルのデータを入力
        # 出力には16チェンネルのデータとなる
        # カーネルサイズは3x3
        self.conv2 = nn.Conv2d(6, 16, 3)
        
        # 3層目以降は全結合層(アフィン層とも)
        # 入力は16チャンネルの6x6の２2次元データで、
        # 120行の出力を出す
        self.fc1 = nn.Linear(16 * 6 * 6, 120)
        # 以降は同様
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)
        
    def forward(self, x):
        # Max pooling8(2x2)をかます
        x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2))
        # Pooling範囲が正方であるならば数字単独でもOK
        x = F.max_pool2d(F.relu(self.conv2(x)), 2)
        # フラット化する
        x = x.view(-1, self.num_flat_features(x))
        # あとは残りのAffine層に突っ込む
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x
    

    def num_flat_features(self, x):
        # all dimensions except the batch dimension
        size = x.size()[1:]
        num_features = 1
        for s in size:
            num_features *= s
        return num_features

In [103]:
net = Net()
print(net)

Net(
  (conv1): Conv2d(1, 6, kernel_size=(3, 3), stride=(1, 1))
  (conv2): Conv2d(6, 16, kernel_size=(3, 3), stride=(1, 1))
  (fc1): Linear(in_features=576, out_features=120, bias=True)
  (fc2): Linear(in_features=120, out_features=84, bias=True)
  (fc3): Linear(in_features=84, out_features=10, bias=True)
)


`forward()`を定義したが、`backward`は定義していない。

これについては、`forward`の処理から自動的に決まるので、
あとは`autograd`がやってくれる。

ユーザーは好きに`forward()`内の演算を定義するだけでよい。

`parameters()`で重みを取得できる。

以下では試しに1層目の重みのサイズをprintしている。

1チャンネルの画像データに対して、(3x3)のカーネルを適用して、
6チャンネルのデータを出力する重みとなっていることがわかる。

In [113]:
params = list(net.parameters())
print(len(params))
print(params[0].size())

10
torch.Size([6, 1, 3, 3])


In [114]:
# 適当な値で値を出力してみる。
data_input = torch.randn(1, 1, 32, 32)
data_out = net(data_input)
print(data_out)

tensor([[ 0.0278,  0.1053,  0.1006, -0.1327, -0.0275,  0.1336,  0.0397, -0.0255,
          0.0373, -0.2106]], grad_fn=<AddmmBackward>)
