<a href="https://colab.research.google.com/github/sonoko-jpg/section_1/blob/main/section_7/math_matrix.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 行列積と転置
機械学習において有用な、行列積と転置について学びます。  
これらを用いることで、機械学習のコードを短く効率的に記述することが可能になります。  

## ● 行列
行列は数値が格子状に並んだもので、数式上は以下のように表されます。  

$$
   A  = \left(
    \begin{array}{cccc}
      0 & 1 & 2 & 3\\
      1 & 2 & 3 & 4 \\
      2 & 3 & 4 & 5 \\
    \end{array}
      \right) \\
$$

このような行列ですが、コード上はNumPyの配列を使って以下のように表すことができます。

In [None]:
import numpy as np

a = np.array([[0, 1, 2, 3],  # 行列
              [1, 2, 3, 4],
              [2, 3, 4, 5]])
print(a)

## ● 行列積
以下の行列$A$、$B$を考えます。

$$
   A  = \left(
    \begin{array}{ccc}
      0 & 1 & 2 \\
      1 & 2 & 3 \\
    \end{array}
  \right) \\
   B  = \left(
    \begin{array}{cc}
      2 & 1 \\
      2 & 1 \\
      2 & 1 \\
    \end{array}
  \right) \\
$$

これらの行列の**行列積**は、以下の通りに計算します。  
前の行列の「行」と、後ろの行列の「列」の各要素の積の総和が、新しい行列の要素になります。

$$
AB = \left(
    \begin{array}{ccc}
      0 & 1 & 2 \\
      1 & 2 & 3 \\
    \end{array}
  \right)
  \left(
    \begin{array}{cc}
      2 & 1 \\
      2 & 1 \\
      2 & 1 \\
    \end{array}
  \right) \\
= \left(
    \begin{array}{ccc}
      0\times 2+1\times 2+2\times 2 & 0\times 1+1\times 1+2\times 1 \\
      1\times 2+2\times 2+3\times 2 & 1\times 1+2\times 1+3\times 1 \\
    \end{array}
  \right) \\
= \left(
    \begin{array}{ccc}
      6 & 3 \\
      12 & 6 \\
    \end{array}
  \right)
$$

数値同士の積と異なり、行列積においては前の行列と後ろの行列の交換は特定の条件を除きできません。  
そして、行列積を計算するためには、前の行列の列数と、後ろの行列の行数が一致していなければいけません。  
例えば、前の行列の列数が3であれば、後ろの行列の行数は3である必要があります。   
  
以下のコードでは、上記の行列積をNumPyの`dot`関数を使って計算しています。

In [None]:
import numpy as np

a = np.array([[0, 1, 2],
              [1, 2, 3]])
b = np.array([[2, 1],
              [2, 1],
              [2, 1]])

c = np.dot(a, b)  # 行列積
print(c)

ニューラルネットワークはしばしば非常に多くのパラメータを扱いますが、これらは行列に格納することができます。  
そして、行列積を使えば入力と重みの積の総和を一行で記述することができます。   



In [None]:
import numpy as np

# 入力:3 ニューロン:2
x = np.array([[0, 0.5, 1.0]])  # 入力
w = np.array([[-1, 1],  # 重み
              [1, -1],
              [-1, 1]])

print(np.dot(x, w))  # 入力と重みの積の総和

## ● 転置
行列に対する重要な操作の1つに、**転置**があります。  
行列を転置することにより、行と列が入れ替わります。  
以下は転置の例ですが、例えば行列$A$の転置行列は$A^{\mathrm{T}}$と表します。  

$$  \begin{aligned} \\
   A & = \left(
    \begin{array}{ccc}
      1 & 2 & 3 \\
      4 & 5 & 6 \\
    \end{array}
  \right) \\
   A^{\mathrm{T}} & = \left(
    \begin{array}{cc}
      1 & 4 \\
      2 & 5 \\
      3 & 6 \\
    \end{array}
  \right) \\
\end{aligned} $$

NumPyにおいて、転置した行列は配列の後に`.T`をつけることで得ることができます。  

In [None]:
import numpy as np

a = np.array([[1, 2, 3],
              [4, 5, 6]])
print(a.T)  # 転置

行列積では、前の行列の列数と、後ろの行列の行数が一致する必要があります。  
しかしながら、一致しなくても転置により行列積が可能になる場合があります。  

In [None]:
import numpy as np

a = np.array([[0, 1, 2],
              [1, 2, 3]])  # 2x3の行列
b = np.array([[0, 1, 2],
              [1, 2, 3]])  # 2x3の行列 このままでは行列積ができない

# print(np.dot(a, b))  # 転置しないで行列積をとるとエラー
print(np.dot(a, b.T))  # 転置により行列積が可能に