# 行列

行列はベクトルを集めたもの

$$
A =
\begin{pmatrix}
    a_{11} & a_{12}\\
    a_{21} & a_{22}
\end{pmatrix}
$$


$$
% 太字のalias
\newcommand{\b}[1]{\boldsymbol{#1}}
$$

In [121]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib as mpl
import japanize_matplotlib

## 行列積

$$
A =
\begin{pmatrix}
    a_{11} & a_{12}\\
    a_{21} & a_{22}
\end{pmatrix}, \
B =
\begin{pmatrix}
    b_{11} & b_{12}\\
    b_{21} & b_{22}
\end{pmatrix}
$$

とすると、行列積（matrix multiplication）は

$$
A B = 
\begin{pmatrix}
    a_{11} & a_{12}\\
    a_{21} & a_{22}
\end{pmatrix}
\begin{pmatrix}
    b_{11} & b_{12}\\
    b_{21} & b_{22}
\end{pmatrix}
=
\begin{pmatrix}
    a_{11} b_{11} + a_{12} b_{21} & a_{11} b_{12} + a_{12} b_{22} \\
    a_{21} b_{11} + a_{22} b_{21} & a_{21} b_{12} + a_{22} b_{22}
\end{pmatrix}
$$

### ベクトルの直積との関係

2つのベクトル$\boldsymbol{a}, \boldsymbol{b}$のテンソル積

$$
\boldsymbol{a} \circ \boldsymbol{b}
= \boldsymbol{a} \otimes \boldsymbol{b}
= \boldsymbol{a} \boldsymbol{b}^T
= \begin{pmatrix}
a_1 \\ a_2 \\ \vdots \\ a_n
\end{pmatrix}
\begin{pmatrix}
b_1 & b_2 & \cdots & b_n
\end{pmatrix}
= \begin{pmatrix}
    a_1 b_1 & a_1 b_2 & \cdots & a_1 b_n\\
    a_2 b_1 & a_2 b_2 & \cdots & a_2 b_n\\
    \vdots  & \vdots  & \ddots & \vdots \\
    a_n b_1 & a_n b_2 & \cdots & a_n b_n
\end{pmatrix}
$$

を**直積**（direct product）あるいは**外積**（outer product）という。

:::{card} 行列積と直積の関係

行列$A, B$の$i$番目の列ベクトルを$\boldsymbol{a}_i, \boldsymbol{b}_i$とし、行ベクトルを$\boldsymbol{a}_i^T, \boldsymbol{b}_i^T$とする。このとき、

$$
A^T B = \sum^n_{i=1} \boldsymbol{a}_i \boldsymbol{b}_i^T
$$

が成り立つ。この形式は計量経済学（回帰分析）の漸近正規性の証明などで多用される。
:::

（例）$A, B \in \mathbb{R}^{2\times 2}$のとき、

$$
\begin{align}
A^T B &= 
\begin{pmatrix}
    a_{11} & a_{21}\\
    a_{12} & a_{22}
\end{pmatrix}
\begin{pmatrix}
    b_{11} & b_{12}\\
    b_{21} & b_{22}
\end{pmatrix}
\\
&= 
\begin{pmatrix}
   a_{11} b_{11} + a_{21} b_{21} & a_{11} b_{12} + a_{21} b_{22}\\
   a_{12} b_{11} + a_{22} b_{21} & a_{12} b_{12} + a_{22} b_{22}\\
\end{pmatrix}
\end{align}
$$

であり、

$$
a_1
= \begin{pmatrix}
    a_{11} \\
    a_{12} 
\end{pmatrix}
, \hspace{1em}
b_1^T = 
\begin{pmatrix}
    b_{11} & b_{12}\\
\end{pmatrix}
$$

から

$$
\begin{align}
\sum^2_{i=1} \boldsymbol{a}_i \boldsymbol{b}_i^T
&= \begin{pmatrix}
    a_{11} \\
    a_{12}
\end{pmatrix}
\begin{pmatrix}
    b_{11} & b_{12}
\end{pmatrix}
+ \begin{pmatrix}
    a_{21} \\
    a_{22}
\end{pmatrix}
\begin{pmatrix}
    b_{21} & b_{22}
\end{pmatrix}
\\
&= \begin{pmatrix}
    a_{11} b_{11} & a_{11} b_{12}\\
    a_{12} b_{11} & a_{12} b_{12}
\end{pmatrix}
+ \begin{pmatrix}
    a_{21} b_{21} & a_{21} b_{22}\\
    a_{22} b_{21} & a_{22} b_{22}
\end{pmatrix}
\end{align}
$$

であるため。

:::{card} 行列積との関係

行列の一部をベクトルで表して（＝ブロック行列）、通常の行列積の定義をベクトルの積の形で表すこともできる

$n$次元正方行列$A, B$の$i$番目の列ベクトルを$\boldsymbol{a}_i, \boldsymbol{b}_i$とし、行ベクトルを$\boldsymbol{a}_i^T, \boldsymbol{b}_i^T$とする。このとき、

$$
\begin{align}
BA &= 
\begin{pmatrix}
    \boldsymbol{b}_{1}^T \\
    \boldsymbol{b}_{2}^T \\
    \vdots \\
    \boldsymbol{b}_{n}^T
\end{pmatrix}
\begin{pmatrix}
    \boldsymbol{a}_1, \boldsymbol{a}_2, \cdots, \boldsymbol{a}_n
\end{pmatrix}
=
\begin{pmatrix}
    \boldsymbol{b}_{1}^T \boldsymbol{a}_1 & \boldsymbol{b}_{1}^T \boldsymbol{a}_2 & \cdots & \boldsymbol{b}_{1}^T \boldsymbol{a}_n\\
    \boldsymbol{b}_{2}^T \boldsymbol{a}_1 & \boldsymbol{b}_{2}^T \boldsymbol{a}_2 & \cdots & \boldsymbol{b}_{2}^T \boldsymbol{a}_n\\
    \vdots & \vdots & & \vdots\\
    \boldsymbol{b}_{n}^T \boldsymbol{a}_1 & \boldsymbol{b}_{n}^T \boldsymbol{a}_2 & \cdots & \boldsymbol{b}_{n}^T \boldsymbol{a}_n\\
\end{pmatrix}
\end{align}
$$
:::

## 行列と写像

> 行列は写像である
>
> （平岡和幸, & 堀玄. (2004). プログラミングのための線形代数. 株式会社 オーム社.）

例：ベクトル$x$に行列$A$を掛けて$y$とする

$$
y = A x
$$

$x$を$y$に写す写像（≒関数）が行列$A$


## 基底

## 座標変換

## 直交行列と回転行列

## 行列式

正方行列$A$に対して、その**行列式**（determinant）を$|A|$や$\det(A)$と表す。行列式はスカラーである。

2次の正方行列に対して、行列式は次のように求めることができる。

$$
A = 
\begin{pmatrix}
a & b\\
a' & b'
\end{pmatrix}
= (\b{a}, \b{b})
\\
\Rightarrow
|A|
= |\b{a}, \b{b}|
= ab' - a'b
$$


In [1]:
import numpy as np

A = np.array([
    [1, 2],
    [3, 4],
])

det = 1 * 4 - 2 * 3
det

-2

In [2]:
np.linalg.det(A)

-2.0000000000000004

きちんとした定義は次のようになる

:::{admonition} （定義）行列式

次の4つの条件を満たす$A$の列ベクトルの関数$\det(\b{a}_1, \b{a}_2, \cdots, \b{a}_d)$を$A$の行列式と呼ぶ。

(1) 各列ベクトルについて線形である

(2) 2つの列ベクトルが同じならゼロになる

(2') 2つの列ベクトルを入れ替えると符号が変わる

(3) $\det(I) = \det(\b{e}_1, \cdots, \b{e}_d) = 1$ （$\b{e}_1, \cdots, \b{e}_d$は基本ベクトル）


### 行列式の幾何的な解釈＝体積拡大率

2つのベクトルが四角形を表すとみなす。この四角形を変形させる行列$A$があったとき、変換後の四角形の面積はもとの面積の$\text{det}(A)$倍である、と解釈できる（行列式の値が正の値のとき。負の場合は軸が反転して裏返しになる。$\text{det}(A)=0$ならぺちゃんこに潰れている状態）

例えば$I \in \mathbb{R}^{2\times 2}$が構成する四角形に$A$を乗じて$AI=A$とするときの拡大率ともいえるし、$A$の面積とも言える

In [3]:
e0 = [1, 0]
e1 = [0, 1]

I = np.array([e0, e1])
O = np.array([0, 0])

fig, ax = plt.subplots(figsize=[4, 4])
ax.grid(True, alpha=.5)
ax.arrow(*O, *e0, width=0.01, color="black", length_includes_head=True)
ax.arrow(*O, *e1, width=0.01, color="black", length_includes_head=True)
ax.fill_between(x=[0, 1], y1=0, y2=1, alpha=.5)

ax.set(xlim=[-0.5, 1.5], ylim=[-0.5, 1.5], xticks=[0, 1], yticks=[0, 1])
fig.show()

NameError: name 'plt' is not defined

適当な行列$A$で変換するとこうなる

In [None]:
A = np.array([
    [1, 1],
    [0, 1]
])
e0_ = A @ e0
e1_ = A @ e1
y_ = e0_ + e1_

fig, ax = plt.subplots()
ax.grid(True, alpha=.5)
ax.arrow(0, 0, *e0_, width=0.01, color="black", length_includes_head=True)
ax.arrow(0, 0, *e1_, width=0.01, color="black", length_includes_head=True)

d = np.array([e0_, y_])
ax.plot(d[:, 0], d[:, 1], color="black", linestyle="--")
d = np.array([e1_, y_])
ax.plot(d[:, 0], d[:, 1], color="black", linestyle="--")

x = np.linspace(0, y_[0], 11)
ax.fill_between(x=x, y1=[max(e - 1, 0) for e in x], y2=[min(e, 1) for e in x], alpha=.5)
ax.set(xlim=[-0.25, 2.25], ylim=[-0.25, 1.25], xticks=[0, 1, 2], yticks=[0, 1])
fig.show()

平行四辺形の面積は底辺×高さ。今回は底辺も高さも1なので、面積は変わっていない。

この行列$A$の行列式は1になる

In [None]:
np.linalg.det(A)

参考：[Chapter 6 行列式 | 線形代数のエッセンス - YouTube](https://www.youtube.com/watch?v=K8axNorb1CU)

#### （例）次のような行列の場合は…？

$$
A = 
\begin{pmatrix}
1 & 2\\
1 & 3
\end{pmatrix}
, \hspace{2em}
B = 
\begin{pmatrix}
1 & 102\\
1 & 103
\end{pmatrix}
\\
\text{det}(A) = 3 - 2 = 1
, \hspace{2em}
\text{det}(B) = 103 - 102 = 1
$$


In [None]:
A = np.array([
    [1, 2],
    [1, 3]
])
B = np.array([
    [1, 102],
    [1, 103]
])
fig, axes = plt.subplots(ncols=2, figsize=[8, 4])

for X, ax in zip([A, B], axes):
    x0_ = X[0]
    x1_ = X[1]
    y_ = x0_ + x1_
    ax.grid(True, alpha=.5)
    ax.arrow(0, 0, *x0_, width=0.01, color="black", length_includes_head=True)
    ax.arrow(0, 0, *x1_, width=0.01, color="black", length_includes_head=True)

    d = np.array([x0_, y_])
    ax.plot(d[:, 0], d[:, 1], color="black", linestyle="--")
    d = np.array([x1_, y_])
    ax.plot(d[:, 0], d[:, 1], color="black", linestyle="--")

    x = np.linspace(0, y_[0], 11)
    ax.set(title=f"det = {np.linalg.det(X)}")
fig.show()

### 多重線形性

行列$A=(a_1, \cdots, a_n)$について

$$
\def\b#1{\boldsymbol{#1}}
\DeclareMathOperator{\det}{\text{det}}
\begin{align}
\det(c \b{a}_1, \b{a}_2, \cdots, \b{a}_n) &= c \det(\b{a}_1, \b{a}_2, \cdots, \b{a}_n)\\
\det(\b{a}_1 + \b{a}_1', \b{a}_2, \cdots, \b{a}_n) &= \det(\b{a}_1, \b{a}_2, \cdots, \b{a}_n) + \det(\b{a}_1', \b{a}_2, \cdots, \b{a}_n)\\
\det(c\b{A}) = c^n \det(\b{A})
\end{align}
$$

のように任意の列への線形和が全体への線形和と等しいような法則性があること

In [None]:
A = np.array([
    [1, 2],
    [1, 3]
])
print(f"det(A) = {np.linalg.det(A)}")

c = 5
print(f"det(cA) = {np.linalg.det(c * A):.1f}")
print(f"det(cA) - c^n det(A) = {np.linalg.det(c * A) - c**A.shape[0] * np.linalg.det(A):.1f}")

In [None]:
A[:, 0] *= c
A

In [None]:
np.linalg.det(A)

## 逆行列

正方行列$A$に対し、

$$
AA^{-1} = A^{-1} A = I
$$

が成立する正方行列$A^{-1}$が存在するとき、$A^{-1}$を$A$の**逆行列**という。（$I$は$A$と同じサイズの単位行列）

逆行列が存在する行列のことを**正則行列（regular matrix）**や**可逆行列（invertible matrix）**という。

正則でない行列は**特異行列（singular matrix）**という

### 逆行列の効率的な計算

#### 行列分解で計算する方法

- https://speakerdeck.com/nagiss/hiyurisuteitukukontesutodeji-jie-xue-xi-siyou?slide=26

#### 共役勾配法

**共役勾配（conjugate gradient: CG）法**は逆行列の計算を二次最適化に落とし込む方法としても使われる


## 行列の計算規則

$$
A(B+C) = AB + AC
$$

In [None]:
import numpy as np
A = np.array([
    [1, 0],
    [0, 0]
])
B = np.array([
    [2, 0],
    [0, 3]
])
C = np.array([
    [0, -1],
    [-1, 0]
])

In [None]:
A @ (B + C)

In [None]:
A @ B + A @ C

### べき乗

$$
\begin{align}
AA &= A^2\\
AAA &= A^3
\end{align}
$$

$$
\begin{align}
A^{n+m} &= A^n + A^m\\
(A^n)^m &= A^{nm}
\end{align}
$$


:::{adomonition} 例

$$
A =
\begin{pmatrix}
1 & 0\\
0 & 0
\end{pmatrix}
\hspace{1em}
A^2 = 
\begin{pmatrix}
1 & 0\\
0 & 0
\end{pmatrix}
\begin{pmatrix}
1 & 0\\
0 & 0
\end{pmatrix}
= 
\begin{pmatrix}
1 & 0\\
0 & 0
\end{pmatrix}
$$


$$
B =
\begin{pmatrix}
2 & 0\\
0 & 3
\end{pmatrix}
\hspace{1em}
B^2 = 
\begin{pmatrix}
2 & 0\\
0 & 3
\end{pmatrix}
\begin{pmatrix}
2 & 0\\
0 & 3
\end{pmatrix}
= 
\begin{pmatrix}
4 & 0\\
0 & 9
\end{pmatrix}
$$
:::

#### 普通の数取は異なる計算規則

$$
\begin{align}
(A + B)^2 &= A^2 + AB + BA + B^2\\
(A + B) (A - B) &= A^2 - AB + BA - B^2\\
(AB)^2 &= ABAB
\end{align}
$$


:::{adomonition} 例

$$
A =
\begin{pmatrix}
1 & 0\\
0 & 0
\end{pmatrix}
\hspace{1em}
B =
\begin{pmatrix}
2 & 0\\
0 & 3
\end{pmatrix}
$$

$$
\begin{align}
AB &=
\begin{pmatrix}
1 & 0\\
0 & 0
\end{pmatrix}
\begin{pmatrix}
2 & 0\\
0 & 3
\end{pmatrix}
=
\begin{pmatrix}
2 & 0\\
0 & 0
\end{pmatrix}
\\
(AB)^2 &= 
\begin{pmatrix}
4 & 0\\
0 & 0
\end{pmatrix}
\end{align}
$$
:::

### 逆行列

$$
(A^{-1})^{-1} = A
$$


$$
(AB)^{-1} = B^{-1} A^{-1}
$$

$$
(A^k)^{-1} = (A^{-1})^k
$$

### 左右を入れ替えなければどこにカッコをつけてもおなじ

例えばベクトル$\boldsymbol{x} = (x_1, x_2, \dots, x_n)$について、$\boldsymbol{x} \boldsymbol{x}^T \boldsymbol{x}$は$(\boldsymbol{x} \boldsymbol{x}^T) \boldsymbol{x}$と捉えるより$\boldsymbol{x} (\boldsymbol{x}^T \boldsymbol{x})$としたほうが楽

$$
(\boldsymbol{x} \boldsymbol{x}^T) \boldsymbol{x}
= 
\begin{pmatrix}
x_1^2 & x_1 x_2 & \cdots & x_1 x_n\\
x_2 x_1 & x_2^2 & \cdots & x_2 x_n\\
\vdots & \vdots & & \vdots\\
x_n x_1 & x_n x_2 & \cdots & x_n^2
\end{pmatrix}
\begin{pmatrix}
x_1\\
x_2\\
\vdots\\
x_n
\end{pmatrix}
= 
\begin{pmatrix}
x_1^2 \cdot x_1 + x_1 x_2 \cdot x_2 + \cdots + x_1 x_n \cdot x_n\\
x_2 x_1 \cdot x_1 + x_2^2 \cdot x_2 + \cdots + x_2 x_n \cdot x_n\\
\vdots\\
x_n x_1 \cdot x_1 + x_n x_2 \cdot x_2 + \cdots + x_n^2 \cdot x_n
\end{pmatrix}
=
\begin{pmatrix}
x_1\\
x_2\\
\vdots\\
x_n
\end{pmatrix}
\sum^n_{i=1} x_i^2
$$

$$
\boldsymbol{x} (\boldsymbol{x}^T \boldsymbol{x})
= 
\begin{pmatrix}
x_1\\
x_2\\
\vdots\\
x_n
\end{pmatrix}
\sum^n_{i=1} x_i^2
$$