# 行列の計算

## 行列とは

行列の定義は以下の通りです。

#### 定義: 行列

$$
\begin{pmatrix} 
1 & 2 \\ 
3 & 4 \\ 
\end{pmatrix}
$$

や

$$
\begin{pmatrix} 
a & b & c \\ 
d & e & f \\ 
\end{pmatrix}
$$

のように、数を縦と横に並べたものをいう。ただし、

$$
\begin{pmatrix} 
a & b & c \\ 
d & e & \\ 
\end{pmatrix}
$$


のように、数が欠けているものは行列とは言わない。

（これも特別な行列に限り表記上は欠けている場合がありますが、そのときはおおよそ0を意味します。）






行列というのは、数の並びです。行列の横の並びを **行** といい、縦の並びを **列**　といいます。


これが非常に覚えづらいです（どれくらい覚えづらいかというと、東大のオープンセミナーで講師の方が「どっちが行でしたっけ？」と確認していたレベルです。）（どうかとは思いましたが……）


恩師からは、このように習いました。別に出典はありそうですが。

![](images/02/01.png)

$$
A = \begin{pmatrix} 
1 & 2 \\ 
3 & 4 \\ 
\end{pmatrix}
$$

の2は「1行目」で「2列目」の要素なので、「2行1列目の要素」と呼びます。これらの表現の仕方は用途に応じて変わることから紹介していくとキリがないため、都度紹介します。


## ベクトル

**ベクトル**は前の節で「行列が特別な場合」という表現をしました。ベクトルは「1行もしくは1列の行列」のことをいいます。つまりこういうことです。

$$
\begin{pmatrix}
1 & 2 & 3 & 4
\end{pmatrix}
$$

$$
\begin{pmatrix}
1\\
2\\
3\\
\end{pmatrix}
$$

横に並ぶ1行のベクトルを**行ベクトル**、縦に並ぶ1列のベクトルを**列ベクトル**といいます。
現段階では、これだけの解釈で十分です。

## 行列のたし算

行列のたし算は「同じ場所の要素同士を足す」という操作をします。ですので、**2つの行列の行数と列数は同じ**　でないと計算できません。

In [5]:
# 計算できる例
A = [ 1 2 3; 4 5 6; 7 8 9]
B = [ 9 8 7; 6 5 4; 3 2 1]
A+B

3×3 Matrix{Int64}:
 10  10  10
 10  10  10
 10  10  10

In [6]:
# 計算できない例
A = [ 1 2 3; 4 5 6; 7 8 9]
B = [ 9 8 7; 6 5 4]
A+B

LoadError: DimensionMismatch("dimensions must match: a has dims (Base.OneTo(3), Base.OneTo(3)), b has dims (Base.OneTo(2), Base.OneTo(3)), mismatch at 1")

$$
\begin{pmatrix}
1 & 2 & 3\\
4 & 5 & 6\\
7 & 8 & 9\\
\end{pmatrix}
+ 
\begin{pmatrix}
9 & 8 & 7\\
6 & 5 & 4\\
3 & 2 & 1\\
\end{pmatrix}
=
\begin{pmatrix}
10 & 10 & 10\\
10 & 10 & 10\\
10 & 10 & 10\\
\end{pmatrix}
$$

$$
\begin{pmatrix}
1 & 2 & 3\\
4 & 5 & 6\\
7 & 8 & 9\\
\end{pmatrix}
+ 
\begin{pmatrix}
9 & 8 & 7\\
6 & 5 & 4\\
\end{pmatrix}
=
\times \quad（計算できない）
$$

ベクトルは「行列の特別な場合」ですので、行ベクトルの場合は同じ列数、列ベクトルの場合は同じ行数でないと計算できません。

ちなみに引き算については「スカラー倍によるたし算」で片が付きます。
線形のところでもでたスカラー倍ですが、スカラー倍の場合は次に紹介する行列のかけ算とは異なり、単純にすべての要素にスカラー倍をかけるだけです。

$$
\alpha 
\begin{pmatrix}
a & b & c\\
d & e & f\\
g & h & i
\end{pmatrix}
=
\begin{pmatrix}
\alpha a & \alpha b & \alpha  c\\
\alpha d & \alpha e & \alpha  f\\
\alpha g & \alpha h & \alpha i
\end{pmatrix}
$$

$\alpha=-1$とすれば行列が-1倍になるので、これをたし算すれば引き算できます。

## 行列と列ベクトルのかけ算

「ベクトルは行列のかけ算」なので行列同士のかけ算を紹介してもよいのですが、一般的な参考書と少しアプローチを変えてみます。

前の節で線形変換を紹介しました。あるベクトルに行列をかけることにより、回転や大きさを変えるなどの変形ができました。


これをまず、Juliaで計算してみましょう。

In [37]:
# とある行列
A = [2 4; 1 3]

# とあるベクトル
x = [5; 4]

A * x

2-element Vector{Int64}:
 26
 17

$\begin{pmatrix} 26\\17\end{pmatrix}$ となりました。「どのように計算しているのか」よりもまず、計算できる条件について紹介します。
計算できる条件には「行列の大きさ」が関わります。

「行列の大きさ」というのは、機械学習やディープラーニングを実装する上でもかなり重要です。1つのデータというのは複数の値で表現されます。これらを処理するときには行列のかけ算が必要となるのですが、そのときに演算できる行列かどうかは実装者が知っている必要があります。実際の計算自体は機械学習のライブラリがやってくれるのでかけ算の計算方法を知らなくても求められるのです。逆に言えば、これさえわかればロジックを知らなくても実装できることがたくさんあるのです。「内側が同じときに計算可能で、外側の大きさの行列ができる」。これは覚えておいてください。


行列とベクトルのかけ算ができる条件は2パターンあります。

$A$を行列で$x$を列ベクトルとします。

まずは先ほどのJuluaでの例のように「行列をベクトルの左からかける場合」、つまり$Ax$の場合です。この場合の条件は「$A$の列数と$x$の行数が同じとき」です。

もう一つは先ほどのJuluaでの例のように「行列をベクトルの右からかける場合」、つまり$xA$の場合です。この場合の条件は「$A$の行数と$x$の列数が同じとき」です。
後者は$x$が列ベクトルでしたので、列数は常に1です（列ベクトルは列数が1の行列でした）。ですので必然と$A$の行数は1に限られます。すなわち「$A$は行ベクトルのとき」
に限られます（行ベクトルは行数が1の行列でした）。

この段階で図にまとめてみましょう。

<img src="./images/02/02.png" style="width: 500px">

感覚としては、「行数列数」という順番でいうことが多いので「行数列数×行数列数」の内側同士である「行数（列数×行数）列数」が同じときには計算が可能、と覚えると少しは覚えやすかもしれません。

この条件を満たしているとき、行列とベクトルのかけ算ができます。このときにできる行列は、「行数が左側の行列（ベクトル）の行数、列数が右側のベクトル（行列）の列数」の行列です。

<img src="./images/02/03.png" style="width: 500px">

これが行列のかけ算の一つ目のややこしいところですね。先ほどの説明でいえば、「行数列数×行数列数」の外側同士である(「行数)列数×行数(列数)」ができあがる行列の大きさ、と覚えられます。まとめると、「内側が同じときに計算可能で、外側の大きさの行列ができる」、といったところでしょうか。

さて実際の計算ですが（上のように言うと、あまりやる意味がないように感じるかもしれませんね）、とにかく次のように考えてください。

> 「左は行を、右は列を考える」

これが非常に重要な考え方です。先ほどのJuliaで計算を例に見てみましょう。


<img src="./images/02/04.png" style="width: 500px">


左は行ごとに、右は列ごとに分割します。とはいえ、右側は列ベクトルを考えているので分割していないようにみえますね。
次がやっと、行列のかけ算で一番ややこしいところです。

<img src="./images/02/05.png" style="width: 500px">

言葉で説明しても図で説明しても慣れるまではひっかかってしまうでしょう。次のように考えます。


### 行列のかけ算の方法

1. できあがるベクトルの行数、列数を考える。（ここでは「(2行)2列×2行(1列)」　2行1列のベクトル）
2. 2行1列の括弧を書く
3. 2行1列には「1行1列目の要素」と「2行1列目の要素」があるんだな、と思う
4. 深呼吸する
5. 「1行1列目の要素」に注目する
6. 左側の「1行目」と右側の「1列目」に注目する
7. 左側の1行目の要素を左から、右側の1列目の要素を上から順番に取り出してお互いに掛け合わせ、順番に足していく
8. 7.で計算した結果を2.で作った括弧の「1行1列目の要素」に書く
9. コーヒーを一口のみ、目を閉じて自然の風景を30秒間想像する
10. 次に「2行1列目の要素」に注目する
11. 左側の「2行目」と右側の「1列目」に注目する
12. 左側の2行目の要素を左から、右側の1列目の要素を上から順番に取り出してお互いに掛け合わせ、順番に足していく
13. 7.で計算した結果を2.で作った括弧の「2行1列目の要素」に書く
14. 完了したので2時間眠る

この手順です。数学者は日々、このようにして行列を計算しています（嘘です）。
計算の手順に従って、Juliaで実装してみましょう。

In [96]:
# 1., 2.,3.
result = Array{Int}(undef, 2, 1)

#4.

A = [[2 4], [1 3]]
x = [5; 4]


for (i,a)=enumerate(A)
    # 5.,6.,10.
    temp = 0
    for (a0,x0)=zip(a, x)
        # 6.,7.,11.,12.
        temp += a0*x0
    end
    # 8.
    result[i,1] = temp
    # 9.,13.
end
    
# 14.
result


2×1 Matrix{Int64}:
 26
 17

数式でも確認してみましょう、

$$
\begin{aligned}
\begin{pmatrix}
2 & 4\\
1 & 3\\
\end{pmatrix}
\begin{pmatrix}
5\\
4\\
\end{pmatrix}
&=
\begin{pmatrix}
2 \times 5 + 4 \times 4\\
1 \times 5 + 3 \times 4\\
\end{pmatrix}\\
&=
\begin{pmatrix}
26\\
17\\
\end{pmatrix}
\end{aligned}
$$

通常の解説であれば、まず行列同士のかけ算から紹介するのですが、先ほどの通り、最初から別の視点で行列と行列のかけ算を紹介したいがために、あえて行列とベクトルのかけ算を追いかけています。まずは今回紹介したパターンを覚えていただければ、次で紹介する行列同士のかけ算も割りと？わかりやすく計算できるようになるはずです。


#### 練習問題

手計算、もしくはJuliaで答えを確認してみてください。

$$
\begin{pmatrix}
1 & 2 & 3\\
4 & 5 & 6\\
\end{pmatrix}
\begin{pmatrix}
1\\
0\\
1
\end{pmatrix}
=
\begin{pmatrix}
4\\
0\\
6
\end{pmatrix}
$$

$$
\begin{pmatrix}
1 & 0 & 0 & 0\\
0 & 1 & 0 & 0\\
0 & 0 & 1 & 0\\
0 & 0 & 0 & 1
\end{pmatrix}
\begin{pmatrix}
100\\
200\\
300\\
400\\
\end{pmatrix}
=
\begin{pmatrix}
100\\
200\\
300\\
400\\
\end{pmatrix}
$$



In [98]:
# 1.,2.,3.
result = Array{Int}(undef, 2, 1)

#4.

A = [[1 2 3], [4 5 6]]
x = [1; 0; 1]


for (i,a)=enumerate(A)
    # 5.,6.,10.
    temp = 0
    for (a0,x0)=zip(a, x)
        # 6.,7.,11.,12.
        temp += a0*x0
    end
    # 8.
    result[i,1] = temp
    # 9.,13.
end
    
# 14.
result

2×1 Matrix{Int64}:
  4
 10

In [39]:
# 1., 2.,3.
result = Array{Int}(undef, 4, 1)

#4.

A = [[1 0 0 0], [0 1 0 0], [0 0 1 0],[0 0 0 1]]
x = [100; 200; 300; 400]


for (i,a)=enumerate(A)
    # 5.,6.,10.
    temp = 0
    for (a0,x0)=zip(a, x)
        # 6.,7.,11.,12.
        temp += a0*x0
    end
    # 8.
    result[i,1] = temp
    # 9.,13.
end
    
# 14.
result

4×1 Matrix{Int64}:
 100
 200
 300
 400

## 行列のかけ算

さて、やっとのことで行列のかけ算に移ります。しかし、おおかたの準備は実はできているのです。

まず、2つの行列を$A,B$とします。ベクトルで説明した通り、$AB$を計算できるか確認するには、$A$と$B$のそれぞれの行数、列数の情報が必要です。
また、これも同様に内側が同じときに計算可能で、外側の大きさの行列ができる」で確認できます。

$A$がm行l列で、$B$がl行n列のかけ算のときは「m行l列×l行n列」のように考えます。このとき「内側同士」が同じ場合にかけ算の計算が可能です。
またでき上がる行列の大きさは外側同士なので「m行n列」です。

ここで一般的な参考書では正当に一つ一つの数をみて計算するのですが、次のようにみてみます。正直、それほどわかりやすいというものではありません。
ただ、このような見方は線形代数を見ていく上で非常に重要な見方です。


ここでは一度、$A$を2行3列、$B$を3行5列の行列としましょう。$A$と$B$のかけ算$AB$を考えてみます。$A$の列数は3で$B$の行数も$3$なので、計算可能です。
このとき、右側の行列である$B$に注目してみます。$B$は次のような形をしているでしょう。

$$
B
=
\begin{pmatrix}
b_{11} & b_{12} & b_{13} & b_{14} & b_{15}\\
b_{21} & b_{22} & b_{23} & b_{24} & b_{25}\\
b_{31} & b_{32} & b_{33} & b_{34} & b_{35}\\
\end{pmatrix}
$$

$b_{ij}$ はi行j列目の要素を表しています。これを少し見方を変えてみましょう。

行列とベクトルのかけ算のときに、「左は行、右は列に注目する」として、右側の行列を列で分割しました。
$B$のj列目を$b_j$とすると、$b_j = \begin{pmatrix}b_{1j}\\ b_{2j}\\ b_{3j} \end{pmatrix}\quad{j=1,2,3,4,5}$のように表現できます。
するとこの各$b_j$は3行1列の行列なので、明らかに列ベクトルです。また、この表現を使って$B$を表現し直すと

$$
B
=
\begin{pmatrix}
b_1 & b_2 & b_3 & b_4 & b_5
\end{pmatrix}
$$

とできます。このようにみると、かけ算$AB$は

$$
AB = (Ab_1 Ab_2 Ab_3 Ab_4 Ab_5)
$$

のように計算できるのです。このようにすれば「行列と行列の計算」を「行列とベクトルの計算」として考えられます。

これは実のところ、やっていることは一般的な行列のかけ算とやっていることは変わりません。
ですので、結果的には行列$C$が$AB=C$であるとし、$C$のi行j列目の要素を$c_{ij}$とするとき

$$c_{ij} = \sum_{k=1}^(3) a_{ik} b_{kj}$$

と計算できる、ということです（行列とベクトルの計算でのJuliaでの実装時のアルゴリズムや計算確認の方法を数式で表現したものです）。
「要素」としてみるか「列」としてみるかの違いしかありません。

それぞれに優劣があるものではありません。ただ見方を変えることで計算しやすくなったり本質を付きやすくなったりします。
理解しやすいほうで構いませんので、線形代数や機械学習等でかけ算が出て来たときにどちらが考えやすいか、体感すると良いかもしれません。

行列のかけ算をJuliaで確認します。


In [95]:
A = [
1 0 1;
0 1 0
]

B = [
1 2 3 4 5;
6 7 8 9 10;
11 12 13 14 15;
]

# [2x3] x [3x5] なので [2 x 5]
result = Array{Int}(undef, size(A, 1), size(B, 2))

for i=1:size(A, 1)
    a = A[i,:]
    for j=1:size(B, 2)
        temp = 0
        b = B[:, j]
        for (a0, b0)=zip(a, b)
            temp += a0 * b0
        end
        
        result[i, j] = temp
    end 
end
    
result




2×5 Matrix{Int64}:
 12  14  16  18  20
  6   7   8   9  10

もっと踏み込もうと思ったのですが、分量的に十分な量ですので、最後に軽く「左から行列をかける場合」についてもご紹介します。

先ほどは$AB$の$B$を列で分割して各列ごとに$A$を掛ける、という見方をご紹介しました。
しかし、実はこの逆もいえます。

$A$は「行で分割」するので、$A$のi列目の行を$a_i$としたとき、

$$ a_i = (a_{i1}, a_{i2}, a_{i3})$$

と表現できます。すると同様に、

$$A = 
\begin{pmatrix}
a_{1}\\
a_{2}\\
a_{3}
\end{pmatrix}
$$

のように表現できます。各$a_i$は1行3列の行ベクトルです。$B$は3行5列の行列なので、各$a_i$とかけ算ができます。ですので、

$$AB =
\begin{pmatrix}
a_{1} B\\
a_{2} B\\
a_{3} B
\end{pmatrix}
$$

のようにも計算できます。

もっと複雑なこともいえるようになるのですが、それはまたあとでご紹介します。



