# 行列と行列式

参考
* [線形代数汎論](https://amzn.asia/d/cQQdYH2)

意外と行列の定義とか用語、性質についての理解が浅いので、今回は教科書を参考に一気にやっていきましょう。


## 行列

*  代数系$K$上の$m\times n$型の行列$A=[a_{ij}] \quad (i=1, \cdots, m; j=1,\cdots, n)$の定義：
$$
A=     \begin{bmatrix}
         a_{11} & \cdots && a_{1n}\\
         \vdots & \ddots && \vdots\\ 
         a_{m1} & \cdots && a_{mn} 
     \end{bmatrix}
    ,\quad a_{ij} \in K
$$
* 下三角部分：$\{a_{ij}\mid i\geq j\}$
* 上三角部分：$\{a_{ij}\mid i\leq j\}$
* 上Hessenberg行列：$i > j+1$のとき$a_{ij}=0$
* 下Hessenberg行列：$j > i+1$のとき$a_{ij}=0$
$$
A=   \begin{bmatrix}
         a_{11} & a_{12} && \cdots &&& a_{1n}\\
         a_{21} & a_{22} && \cdots &&& a_{2n}\\ 
         0 & a_{32} && \cdots &&& a_{3n}\\ 
         \vdots & \vdots && \ddots &&& \vdots\\ 
         0 & 0 && \cdots &&& a_{mn} 
     \end{bmatrix}
    ,\quad a_{ij} \in K
$$
* 縦ベクトル：$m\times 1$型の行列
* 横ベクトル：$1\times n$型の行列

## 行列算

* 行列積：$P = [p_{ij}]=AB$なる$l \times n$型の行列
    * $p_{ij}=\sum^m_{k=1} a_{ik} b_{kj} \quad (i=1, \cdots, l; j=1, \cdots, n)$
    * ここで$A$は$l\times m$型、$B$は$m \times n$型の行列

## Hermite行列とか

* 共役：$K=\mathbb{C}$（複素数体）のとき、ca$m\times n$型の行列$A$の共役 $C=[c_{ij}]=\overline{A}$
    * $c_{ij}=\overline{a}_{ij}$で定められる$m\times n$型行列のこと。ここで$\overline{a}_{ij}$は$a$の共役複素数。 
* AのHermite共役$A^\dag$：$(\overline{A})^\top=\overline{A^\top}$
* $A$が正方行列のときの呼び方
    * $A^\top=-A$は反対称行列、交代行列、もしくは歪対称行列
    * $A^\dag=A$はHermite行列
    * $A^\dag=-A$は歪Hermite行列
* 任意の正方行列に対して$A=\frac{1}{2}(A+A^\top)+\frac{1}{2}(A-A^\top)$と対称行列と反対称行列に分割可能


## 置換行列と基本行列

$n$個のもの($1, 2, \cdots, n$)を番号順に並べた並び方を基準にして、その並び方を$\pi_1, \pi_2, \cdots, \pi_n$に並び替えたとする。
$\pi_i$は$1, 2, \cdots, n$のどれかに等しく、$i\neq j$ならば$\pi_i\neq \pi_j$である。このような並び替えを置換という。

これは集合$V=\{1, \cdots, n\}$のそれ自身への全単射であるともみなせる。置換$\pi$は

$$
\begin{pmatrix}
&1 \quad 2 \quad \cdots \quad n\\
&\pi_1 \quad \pi_2 \quad \cdots \quad \pi_n 
\end{pmatrix}
$$
のように表記されることもある。とくに$i_0$と$j_0$を入れ替える単純な置換は互換と呼ばれる。$(i_0, j_0)$と略記する。

置換は複数回の互換の積の形で表せるが、その表現は一意ではない。例えば

$$
\begin{pmatrix}
&1, 2, 3\\
&3, 1, 2
\end{pmatrix}
= (1, 2)\circ (2, 3) = (1, 3) \circ (1, 2)
$$

のように、置換は複数の互換で表せる。しかし、その互換の総数の偶奇は一意である。総数が偶数のときは偶置換、奇数なら奇置換という。
下の図（岩田先生のスライドより引用）のように置換の交差数を数えると偶置換であるか奇置換であるかは簡単にわかる。

![determinant](figs/matrix_determinant.png)



* 正方行列$P$の要素がどれも$0$か$1$に等しく、どの行、列にもちょうど$1$個だけ$1$があるとき、$P$は置換行列と呼ばれる。
    * $m$次の置換行列の行$i$における$1$が列$j_i$にあるとき、$m\times n$の行列$A$に対して、$PA$の行集合の順序は$A$の行集合の順序に次の置換を施すのと同じ
    * $m$次の置換行列の行$i$における$1$が列$j_i$にあるとき、$n\times m$の行列$B$に対して、$BP$の行集合の順序は$B$の列集合の順序に次の置換を施すのと同じ
* 特に、ある$i_0$, $j_0$ ($i_0 \neq j_0$)について、$p_{ii}=1$ ($i\neq i_0, j_0$), $p_{i_0j_0}=p_{j_0i_0}-1$, $p_{i_0i_0}=p_{j_0j_0}=0$である置換行列は互換行列と呼ばれる。
    * $PA$で行$i_0$と$j_0$を入れ替える。
$$
\begin{pmatrix}
&j_1 \quad j_2 \quad \cdots \quad j_m\\
&1 \quad 2 \quad \cdots \quad m
\end{pmatrix}
$$
* 基本行列：置換行列と次の２つの行列は合わせて基本行列と呼ぶ
    * 行列$T$：$T(i_0;t)A$は$A$の行$i_0$を$t$倍する
    * 行列$W$：$W(i_0,j_0;t)A$は$A$の行$j_0$を$t$倍して行$i_0$に加える

In [16]:
import numpy as np

A = np.array([[1, 2, 3], [11, 12, 13], [21, 22, 23], [31, 32, 33]])  # 4 x 3
P = np.array([[0, 1, 0], [1, 0, 0], [0, 0, 1]])

print("置換行列")
print(P)

print(f"行列A")
print(A)
print(f"行列AP")
print(A @ P)

print(f"行列A.T")
print(A.T)
print(f"行列PA.T")
print(P @ A.T)

置換行列
[[0 1 0]
 [1 0 0]
 [0 0 1]]
行列A
[[ 1  2  3]
 [11 12 13]
 [21 22 23]
 [31 32 33]]
行列AP
[[ 2  1  3]
 [12 11 13]
 [22 21 23]
 [32 31 33]]
行列A.T
[[ 1 11 21 31]
 [ 2 12 22 32]
 [ 3 13 23 33]]
行列PA.T
[[ 2 12 22 32]
 [ 1 11 21 31]
 [ 3 13 23 33]]


## 部分行列と行列の分割

* $m\times n$型の行列$A=[a_{ij}]$の$r$本の行と$s$本の列を自然な順に配列してできる$r\times s$の行列を$A$の部分行列と言う
* ブロック行列：行列を部分行列に分割するやつ

In [26]:
import numpy as np

A = np.array([[1, 2, 3, 4], [11, 12, 13, 14], [21, 22, 23, 24], [31, 32, 33, 44]])  # 4 x 4
print("行列 A")
print(A)

sub_A = A[[1, 2]][:, [2, 3]]
print("部分行列")
print(sub_A)

行列 A
[[ 1  2  3  4]
 [11 12 13 14]
 [21 22 23 24]
 [31 32 33 44]]
部分行列
[[13 14]
 [23 24]]


## クロネッカー積（直積）

$m_1\times n_1$の行列$A=[a_{ij}]$と$m_2\times n_2$の行列$B=[b_{ij}]$に対して、クロネッカー積$A\otimes B$は
$$
A\otimes B=   \begin{bmatrix}
         a_{11}B & a_{12}B && \cdots &&& a_{1n_1} B\\
         a_{21}B & a_{22}B && \cdots &&& a_{2n_1} B\\
         \vdots & \vdots && \ddots &&& \vdots\\ 
         a_{m_11}B & a_{m_12}B && \cdots &&& a_{m_1n_1}B 
     \end{bmatrix}
$$

で定義される$(m_1m_2)\times (n_1n_2)$の行列。

---

**クロネッカー積と方程式**

* $Ax = y$を考えると、$y_i = \sum_{j=1}^{n_1}a_{ij}x_j$であるから、$A=[a_{ij}]$は方程式の係数とみなせる。
* $Bu = v$を考えると、$v_i = \sum_{j=1}^{n_2}a_{ij}u_j$であるから、$B=[b_{ij}]$は方程式の係数とみなせる。

ここで、$y$と$v$の変数の積による新しい$m_1 \cdot m_2$個の変数（テンソル積とも呼ばれる）

$w_1=y_1v_1$, $w_2=y_1 v_2$, ..., $w_{m_2}=y_1 v_{m_2}$, ..., $w_{(m_1 - 1)m_2 + 1} = y_{m_1} v_1$, ..., $w_{m_1 m_2}=y_{m_1}v_{m_2}$

を考えよう。また、同様にして$x$と$u$のテンソル積

$z_1=x_1u_1$, $z_2=x_1 u_2$, ..., $z_{m_2}=x_1 u_{m_2}$, ..., $z_{(m_1 - 1)m_2 + 1} = x_{m_1} u_1$, ..., $z_{m_1 m_2}=x_{m_1}u_{m_2}$

も考える。このとき、

$$w_i = \sum_{j=1}^{n_1\cdot n_2} (A \otimes B)_{ij}z_{j}$$

が成り立つ。

In [16]:
import numpy as np

A = np.array([[1, 2, 3, 4], [11, 12, 13, 14], [21, 22, 23, 24]])  # 3 x 4
print("行列 A")
print(A)

B = np.array([[0.1, 0.2], [0.12, 0.22]])  # 2 x 2

AB = np.kron(A, B)
print(AB)
print(AB.shape)

x = np.array([1, 2, 3, 4])
u = np.array([11, 22])
z = np.tensordot(x, u, axes=0).flatten()
print(z.shape)

y = A @ x
v = B @ u
w = np.tensordot(y, v, axes=0).flatten()
print(w.shape)

np.testing.assert_allclose(w, AB @ z, atol=1e-6)  # クロネッカー積とテンソル積の等号の確認

行列 A
[[ 1  2  3  4]
 [11 12 13 14]
 [21 22 23 24]]
[[0.1  0.2  0.2  0.4  0.3  0.6  0.4  0.8 ]
 [0.12 0.22 0.24 0.44 0.36 0.66 0.48 0.88]
 [1.1  2.2  1.2  2.4  1.3  2.6  1.4  2.8 ]
 [1.32 2.42 1.44 2.64 1.56 2.86 1.68 3.08]
 [2.1  4.2  2.2  4.4  2.3  4.6  2.4  4.8 ]
 [2.52 4.62 2.64 4.84 2.76 5.06 2.88 5.28]]
(6, 8)
(8,)
(6,)


## 交代化演算子

$i_k, j_k \in \{1, 2, \cdots, n\}$とする。
$\varepsilon_{j_1, \cdots, j_r}^{i_1, \cdots, i_r}$を、

1. $\{i_1, \cdots, i_r\}\neq \{j_1, \cdots, j_r\}$ or $\{i_1, \cdots, i_r\}$の中に同じものがある or $\{j_1, \cdots, j_r\}$の中に同じものがあるとき、
$$\varepsilon_{j_1, \cdots, j_r}^{i_1, \cdots, i_r}=0$$
とする
2. １以外であり、かつ
    $$
    \begin{pmatrix}
    &i_1, \cdots, i_r\\
    &j_1, \cdots, j_r
    \end{pmatrix}
    $$
    が偶置換なら
    $$\varepsilon_{j_1, \cdots, j_r}^{i_1, \cdots, i_r}=1$$
    奇置換なら
    $$\varepsilon_{j_1, \cdots, j_r}^{i_1, \cdots, i_r}=-1$$
とする。

このとき、$i_1, \cdots, i_r$の順に添え字が並んでいる式$F_{i_1, \cdots, i_r}$に対して、$F_{i_1, \cdots, i_r}$をこの添字に対して交代化するというのは、

$$
F_{[i_1, \cdots, i_r]}:= \frac{1}{r!}\sum_{j_1=1}^n \cdots \sum_{j_r=1}^n \varepsilon_{i_1, \cdots, i_r}^{j_1, \cdots, j_r} F_{j_1\cdots j_r}
$$

を作ることを言う。つまり、$F_{[i_1, \cdots, i_r]}$は、$i_1, \cdots, i_r$が全て異なるとき（それ以外では$F_{[i_1, \cdots, i_r]}=0$）、$(i_1, \cdots, i_r)$の置換$(j_1, \cdots, j_r)$を添字に持つ式$F_{j_1, \cdots, j_r}$を、置換が偶置換なら正の符号、奇置換なら負の符号をつけて加え合わせたものを、置換の総数$r!$で割ったものである。

例えば、$F_[122]= 0$であり、また、

$$F_[123]=\frac{1}{6}(F_{123}+F_{231}+F_{312}-F_{213}-F_{132}-F_{321})$$

である。

また、$G_{i_1,\cdots, i_r}=F_{[i_1,\cdots, i_r]}$なら、$G_{i_1,\cdots, i_r}$は添字${i_1,\cdots, i_r}$について交代的であるという。つまり、$G$は添字の任意の２個を入れ替えると符号が変わる。　

## 行列式

行列$A=[a_{ij}]$の$(i, j)$要素を$a_i^j$と書こう。
$a_{j_1}^{i_1}\cdots a_{j_r}^{i_r}$は$(i_k, j_k)$要素の積である。
このとき、交代化演算子は
$a_{j_1}^{[i_1}\cdots a_{j_r}^{i_r]}=a_{[j_1}^{i_1}\cdots a_{j_r]}^{i_r}=a_{[j_1}^{[i_1}\cdots a_{j_r]}^{i_r]}$を満たす。

これを使って、行列式は次で定義される

$$
\det A = \sum \varepsilon_{j_1, \cdots, j_n}^{1, \cdots, n} a_{1 j_1}a_{2 j_2} \cdots a_{n j_n}
= n! a_{1}^{[1}\cdots a_{n}^{n]}
= n! a_{[1}^{1}\cdots a_{n]}^{n}
= n! a_{[1}^{[1}\cdots a_{n]}^{n]}
$$

図と照らし合わせるとわかりやすい。
1. 各行から、列の被りがないように一つづつインデックスを取ってきて、その積を考えると出てくる。
2. 各行から選択するのは固定であり、列について交代化演算子を考えている
2. 各列から選択するのは固定であり、行について交代化演算子を考えている

![determinant](figs/matrix_determinant.png)


### 行列式の性質

1. 任意の$j(=1, \cdots, n)$と$\lambda (\in K)$について、
$$\det[a_{\cdot, 1}, a_{\cdot, 2}, \cdots, \lambda a_{\cdot, j}, \cdots, a_{\cdot, n}] = 
\lambda\det[a_{\cdot, 1}, a_{\cdot, 2}, \cdots, a_{\cdot, j}, \cdots, a_{\cdot, n}]
$$
2. 任意の$j$のとある$n$次元縦ベクトル$b$について
$$\det[a_{\cdot, 1}, a_{\cdot, 2}, \cdots, a_{\cdot, j} + b, \cdots, a_{\cdot, n}] = 
\det[a_{\cdot, 1}, a_{\cdot, 2}, \cdots, a_{\cdot, j}, \cdots, a_{\cdot, n}]
+ \det[a_{\cdot, 1}, a_{\cdot, 2}, \cdots, b, \cdots, a_{\cdot, n}]
$$
3. 列の交換で符号が反転
4. 単位行列の行列式は１
5. 一般の三角行列の行列式は対角成分の積（各列から一つづつ選択する処理を想像するとすぐわかるはず）

## 小行列式

行列$A$の正方部分行列$A^{i_1\cdots i_r}_{j_1 \cdots j_r}$の行列式を$A$の$r$次の小行列式と呼ぶ。$|A|^{i_1,\cdots, i_r}_{j_1,\cdots, j_r}$と書く。
特に$A^{i_1\cdots i_r}_{i_1 \cdots i_r}$の形のものを主小行列式、$A^{1\cdots r}_{1 \cdots r}$の形のものを首座小行列式と呼ぶ。

![principle_minor](figs/principle_minor.png)
![leading_principle_minor](figs/leading_principle_minor.png)

## トレース

省略

## 余因子・余因子行列

$n$次正方行列$A$の$(i, j)$要素$a_{ij}$の余因子は

$$\Delta^{i_1\cdots i_r}_{j_1 \cdots j_r}=(-1)^{i+j}|A|^{1, \cdots, i-1, i+1, \cdots, n}_{1, \cdots, j-1, j+1, \cdots, n}$$

で定義される。
これは$\det A$を$a_{i j}$の１次式と見たときの$a_{i j}$の係数とみなせる。

![cofactor](figs/cofactor.png)

$\hat{a}_{ij}=\Delta_{j i}$なる$\widehat{A}[\hat{a}_{ij}]$を余因子行列と呼び、$\operatorname{adj} A$と書く。$i j$の順番に注意。