In [1]:
import torch

## AutoGrad体験

In [2]:
x = torch.ones(2, 2, requires_grad=True)
print(x)

tensor([[1., 1.],
        [1., 1.]], requires_grad=True)


`requires_grad=True` で計算過程を記録できる

In [3]:
y = x + 2
print(y)

print(y.grad_fn)

tensor([[3., 3.],
        [3., 3.]], grad_fn=<AddBackward0>)
<AddBackward0 object at 0x1072b0b80>


In [4]:
z = y * y * 3
out = z.mean()

print(z)
print(out)

tensor([[27., 27.],
        [27., 27.]], grad_fn=<MulBackward0>)
tensor(27., grad_fn=<MeanBackward0>)


足し算はAdd、掛け算はMul、平均はMeanになっているのがわかる

In [5]:
a = torch.randn(2, 2)
a = ((a * 3) / (a - 1))
print(a.requires_grad)

False


この時点では`requires_grad`は設定してないが...

In [6]:
a.requires_grad_()

print(a.requires_grad)

True


`.requires_grad_()`によって変更できた

In [7]:
b = (a * a).sum()
print(b.grad_fn)

<SumBackward0 object at 0x120c320a0>


In [8]:
f = torch.ones(2, 2)
g = torch.ones(2, 2, requires_grad=True)
h = f + g

print("f:",f.requires_grad)
print("g:",g.requires_grad)
print("h:",h.requires_grad)

f: False
g: True
h: True


既に`True`にしてある変数が含まれた計算なら、新たな変数も`requires_grad=True`

## 逆伝搬

In [9]:
print(out)

tensor(27., grad_fn=<MeanBackward0>)


In [10]:
out.backward()

print(x)

tensor([[1., 1.],
        [1., 1.]], requires_grad=True)


In [11]:
print(x.grad)

tensor([[4.5000, 4.5000],
        [4.5000, 4.5000]])


- `out.backward()`は`out.backward(torch.tesnor(1.))`と同じ
   - テンソルoutには一つのスカラーが格納されているため（.mean()で平均出したからか）
- `.backward()`で微分対象を設定
- `.grad`で何で微分するか決めている

$$ 
    z_i = 3\times y_i \times y_i \quad,\quad y_i = x_i + 2 \\
    \begin{align}
    \boldsymbol{out} &=  \frac{1}{4} \sum_{i} z_i \\
    &= \frac{1}{4} \sum_{i} 3\times (x_i + 2)^2
    \end{align} \\
    \frac{\partial \boldsymbol{out}}{\partial x_i} = \frac{3}{2}(x_i + 2)
$$

## torch.autograd
- ベクトルーヤコビアンの積を計算することが役割
    - ベクトルーヤコビアンの積によりスカラーを出力しないモデルに外部勾配を組み込みやすくなる
      
        
          
- ベクトルーヤコビアンの積の例
    - `y.data.norm()`がユークリッドノルム（要素の二乗和の平方根）を返す

In [12]:
x = torch.randn(3, requires_grad=True)
y = x * 2
while y.data.norm() < 1000:
    y = y *2
print(y)

tensor([  -22.9231,  -136.9092, -1220.6875], grad_fn=<MulBackward0>)


In [13]:
v = torch.tensor([0.1, 1.0, 0.0001], dtype=torch.float)
y.backward(v)
print(x.grad)

tensor([5.1200e+01, 5.1200e+02, 5.1200e-02])


スカラーでないものを`.backward()`するときに引数を渡すと微分できる的な話？（引数は微分対象と同じ型っぽい）


In [14]:
print(x.requires_grad)
print((x ** 2).requires_grad)

with torch.no_grad():
    print((x ** 2).requires_grad)

True
True
False


autogradを止めるためには`with torch.no_grad():`でテンソルをくくる

In [15]:
print(x.requires_grad)

y = x.detach()
print(y.requires_grad)

print(x.eq(y).all())

True
False
tensor(True)


- `.detach()`で同じテンソルを作ることができるが、`require_grad`は`False`
- `x.eq(y)`は各テンソルの要素が同じであるかをbool型で返す
    - `.all()`を加えたことで全ての要素が同じであるかをbool型で返す

In [16]:
x = torch.ones(3)
y = torch.tensor([1,2,1])

print(x.eq(y))

tensor([ True, False,  True])
