<a href="https://colab.research.google.com/github/yugonsan/pytorch_practice/blob/main/%E7%AC%AC4%E7%AB%A0.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

- 予測関数
- 前の章では、予測関数はパラメタWとBを持つ関数でした
- 次に正解テンソルYと出力関数Ypの値を使って誤差の大きさを評価する損失関数を定義した
- 1次関数：nn.Linear
- レイヤー関数：tensorを入力とし、tensorを出力する関数群。線形関数や活性化関数（ReLU）
- パラメター：レイヤー関数の内部で持っている入力テンソル以外のデータ、学習とはレイヤー関数のパラメーター値を調整することを意味します。
- 機械学習モデル：入力テンソルに対して望ましい出力テンソルを出力する合成関数
- 学習：レイヤー関数内部のパラメータ値を望ましい出力テンソルが得られるように調整すること。

In [2]:
# 必要ライブラリの導入

!pip install japanize_matplotlib | tail -n 1
!pip install torchviz | tail -n 1

Successfully installed japanize_matplotlib-1.1.3
Successfully installed torchviz-0.0.2


In [3]:
# 必要ライブラリのインポート

%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
import japanize_matplotlib

In [4]:
# PyTorch関連ライブラリ
import torch
import torch.nn as nn
from torchviz import make_dot

In [5]:
# デフォルトフォントサイズ変更
plt.rcParams['font.size'] = 14

# デフォルトグラフサイズ変更
plt.rcParams['figure.figsize'] = (6,6)

# デフォルトで方眼表示ON
plt.rcParams['axes.grid'] = True

# numpyの浮動小数点の表示精度
np.set_printoptions(suppress=True, precision=4)

In [8]:
# レイヤー関数内部構造
# 最初の線形関数
# 入力784,出力128
l1 = nn.Linear(784, 128)
# 2番目の線形関数
# 入力128, 出力10
l2 = nn.Linear(128, 10)
# 活性化関数
relu = nn.ReLU(inplace=True)
# ここでいう128が隠れ層に当たります

In [13]:
# 入力テンソルから出力テンソルを計算
# ダミー入力データを作成
inputs = torch.randn(100, 784)
print(inputs.data)
# 中間テンソル1の計算
m1 = l1(inputs)
# 中間テンソル2の計算
m2 = relu(m1)
# 出力テンソルの計算
outputs = l2(m2)
print(outputs.data)
# 入力テンソルのshapeの確認
print('入力テンソル', inputs.shape)
print('出力テンソル', outputs.shape)

tensor([[-1.3114,  0.9464, -0.5677,  ..., -0.7650,  0.0165, -0.2071],
        [-0.0187, -0.6506,  0.0329,  ..., -0.4312, -0.9684, -0.0151],
        [-0.0877,  0.6705, -0.9164,  ...,  0.8796, -1.0630,  0.1052],
        ...,
        [ 0.3689, -0.1534,  0.2495,  ..., -1.1420,  0.2895, -0.3629],
        [-0.5797,  0.1831, -1.9654,  ...,  0.3336, -0.0275,  1.0629],
        [ 0.8009, -0.2154, -1.3981,  ..., -0.1092, -0.0116, -0.3918]])
tensor([[ 1.0888e-01,  1.5182e-01, -2.7055e-01, -1.9404e-01, -4.6530e-02,
          4.3273e-03, -6.3327e-02,  2.2146e-01, -5.2545e-01,  3.8298e-01],
        [-3.5235e-01, -5.1703e-02,  2.0609e-01,  1.8316e-01,  1.7650e-01,
          1.0154e-01, -1.2055e-01, -5.2479e-02, -1.2500e-01,  3.1560e-01],
        [ 2.6540e-01, -4.2220e-02,  1.8161e-01, -6.9403e-02,  1.0079e-01,
         -1.5514e-01, -8.1443e-02, -2.0259e-01, -1.9213e-01,  1.9340e-01],
        [ 1.0644e-01, -8.3291e-02, -3.7266e-02,  3.4755e-01,  1.4811e-01,
         -3.7483e-01, -4.5515e-02,  5.0160e-0

最初に100行784列最後に100行10列テンソル

In [14]:
net2 = nn.Sequential(
    l1,
    relu,
    l2
)

outputs2 = net2(inputs)

# 入力テンソルと出力テンソルのshape確認
print('入力テンソル', inputs.shape)
print('出力テンソル', outputs2.shape)

入力テンソル torch.Size([100, 784])
出力テンソル torch.Size([100, 10])


nn.Sequentialなどの利用によって、m1,m2という形で見えていた中間テンソルがコードから一切なくなっている

- 活性化関数の目的
- 線形関数の間に活性化関数を追加したら正しい形のDLになります。
- 非線形関数と呼ばれる活性化関数を線形関数の間にいれることにより初めて、深い深層のディープラーニングが意味を持つ
- ReLU関数（ランプ関数）を利用している。
- 活性化関数の役割その2：線形関数の出力値を整形するパターン
- 2値分類ではシグモイド関数、多値分類ではsoftmax関数を利用し、モデルの出力値を0から1の確率値にする
