# 深層学習ノートブック-3 pytorchによる多項ロジスティック回帰
参考：  
* [行列積](https://w3e.kanazawa-it.ac.jp/math/category/gyouretu/senkeidaisu/henkan-tex.cgi?target=/math/category/gyouretu/senkeidaisu/gyouretu-no-seki.html)

pytorchのAutograd, Tensorを用いて多項ロジスティック回帰による分類をスクラッチで実装する。  
ここで実装する一連の流れは深層学習における学習プロセスの基礎であり、非常に重要。  

ここではMNIST（手書き数字(0~9)）データセットを用いた10クラス分類のタスクを多項ロジスティック回帰で解くことを考える。  
MNISTデータセットにある各pixel値(8x8=64)を特徴量として扱う。  

データ数をm、特徴量の行列を$\bm{X}$、$\bm{X}$に対応する重み行列を$W^T$※とすると、  
softmax関数への入力$\bm{z}$は下記のように表せる。  
※行列積の形で表わすために転置をとっている。


$\bm{z} = \bm{XW}^T+\bm{b} $  
$=\left(
\begin{matrix} 
x_{1,1} & x_{1,2} & ... & x_{1,64}\\ 
x_{2,1} & x_{2,2} & ... & x_{2, 64}\\
. & . & ... & .\\
x_{m,1} & x_{m,2} & ... & x_{m, 64}
\end{matrix} 
\right)$
$\left(
\begin{matrix} 
w_{1,1} & w_{1,2} & ... & w_{1,10}\\ 
w_{2,1} & w_{2,2} & ... & x_{2,10}\\
. & . & ... & .\\
w_{64,1} & x_{64,2} & ... & x_{64, 10}
\end{matrix} 
\right)$
$+\left(
\begin{matrix} 
b_{1} & b_{2} & ... & b_{10}\\ 
b_{1} & b_{2} & ... & b_{10}\\
. & . & ... & .\\
b_{1} & b_{2} & ... & b_{10}
\end{matrix}
\right)$  

$=\left(
\begin{matrix} 
\sum_{k=1}^{64} x_{1, k}w_{k, 1}+b_1 & \sum_{k=1}^{64} x_{1, k}w_{k, 2}+b_2 & ... & \sum_{k=1}^{64} x_{1, k}w_{k, 10}+b_{10}\\ 
\sum_{k=1}^{64} x_{2, k}w_{k, 1}+b_1 & \sum_{k=1}^{64} x_{2, k}w_{k, 2}+b_2 & ... & \sum_{k=1}^{64} x_{2, k}w_{k, 10}+b_{10}\\ 
. & . & ... & .\\
\sum_{k=1}^{64} x_{m, k}w_{k, 1}+b_1 & \sum_{k=1}^{64} x_{m, k}w_{k, 2}+b_2 & ... & \sum_{k=1}^{64} x_{m, k}w_{k, 10}+b_{10}\\ 
\end{matrix} 
\right)$

$=\left(
\begin{matrix} 
z_{1,1} & z_{1,2} & ... & z_{1,10}\\ 
z_{2,1} & z_{2,2} & ... & z_{2,10}\\
. & . & ... & .\\
z_{m,1} & z_{m,2} & ... & z_{m, 10}
\end{matrix} 
\right)$

$\bm{X}$のshapeはデータ数m × 特徴量数64  
$\bm{W}^T$は重みづけの対象数（すなわち特徴量数64）× 最終的な出力列数（10クラス分類なので10）、  
$\bm{b}$は1 × 最終的な出力列数となるが、上記ではbroadcastされた状態で書いている。  
最終的に$\bm{z}$は各データ数 × クラス数というshapeで表わされ、クラスごとに線形回帰の結果が対応する。  