In [1]:
import math
import torch

# PyTorch のモジュール
PyTorchライブラリは，NumPyと同様の計算機能を提供する以外に，開発者が深層学習モデルの設計やトレーニング，テストを迅速に行えるようなモジュール群を提供しています．その中でも特に便利なモジュールをご紹介します．

## torch.nn
ニューラルネットワークアーキテクチャを構築する際，ネットワークが構築される基本的な側面は，層の数や各層のニューロンの数，それらのうちどれが学習可能かなどです．PyTorch の ```nn``` モジュールは，これらのハイレベルな要素を定義することで，すべての詳細を手動で指定するのではなく，ニューラルネットワークアーキテクチャを素早くインスタンス化することができます．

In [2]:
# 256次元の入力から4次元の出力を得る1層のニューラルネットワーク
#   => 256x4 次元の行列を乱数で埋めて初期化する
weights = torch.randn(256, 4) / math.sqrt(256)

# 誤差逆伝播によって学習できるように設定しておく
weights.requires_grad_()

# 同様にバイアスも定義し学習可能に設定する
bias = torch.zeros(4, requires_grad=True)

In [3]:
# 上記のコードは次のコードと同値
weights_2 = torch.nn.Linear(256, 4)

```torch.nn``` モジュールの中には，```torch.nn.functional``` というサブモジュールがあります．このサブモジュールは，```torch.nn``` モジュール内のすべての関数で構成されています．一方，他のサブモジュールはすべてクラスです．これらの関数は，損失関数，活性化関数，プーリング関数，畳み込み関数，線形関数など，ニューラルネットワークを関数的に作成するのに使用できるニューラル関数です．

In [6]:
import torch.nn.functional as F

# X は入力，y は GT データ，model はニューラルネットワークのモデル
loss_func = F.cross_entropy
loss = loss_func(model(X), y)

NameError: name 'model' is not defined

## torch.optim
ニューラルネットワークを学習する際には，エラーをバックプロパゲートしてネットワークの重みやパラメータを調整しますが，このプロセスを最適化と呼んでいます．```optim``` モジュールには，ディープラーニングモデルの学習中に様々なタイプの最適化スケジュールを実行することに関連するすべてのツールと機能が含まれています．```torch.optim``` モジュールを使ってトレーニングセッション中にオプティマイザーを定義することができます．

In [7]:
opt = optim.SGD(model.parameters(), lr=lr)

NameError: name 'optim' is not defined

In [8]:
# 手動で最適化手順を記述する場合
with torch.no_grad():
    for param in model.parameters():
        param -= param.grad * lr
        model.zero_grad()
        
# 上記はよりシンプルに書ける
opt.step()
opt.zero_grad()

NameError: name 'model' is not defined

## torch.utils.data
```utils.data``` モジュールの下で，torch は独自の ```dataset``` と ```DatasetLoader``` クラスを提供していますが，これらのクラスは抽象的で柔軟な実装のため，非常に便利です．基本的にこれらのクラスは，テンソルの反復処理やその他の操作を行うための直感的で便利な方法を提供します．これらを用いることで．テンソル計算の最適化による高いパフォーマンスと，フェイルセーフなデータ入出力を実現することができます．

In [9]:
from torch.utils.data import (TensorDataset, DataLoader)

train_dataset = TensorDataset(x_train, y_train)
train_dataloader = DataLoader(train_dataset, batch_size=bs)

NameError: name 'x_train' is not defined

In [10]:
# 手動でバッチの反復処理を行う
for i in range((n-1)//bs + 1):
    x_batch = x_train[start_i:end_i]
    y_batch = y_train[start_i:end_i]
    pred = model(x_batch)
    
# もっとシンプルに書ける
for x_batch,y_batch in train_dataloader:
    pred = model(x_batch)

NameError: name 'n' is not defined