# ベクトル空間とは

## そもそも空間とは？

**空間**とは、日常でも使われる言葉です。日常で使われる「空間」の定義を調べてみたところ、「物体が存在しないで空いているところ」という定義が書かれていました。
個人的にはあまり適切な定義とは思えませんでした。

数学では、漠然といえば「ある集合に**適切な**構造を導入したもの」と考えます。
例えば、47都道府県の県庁所在地全体は単なる「集合」です。これに任意の2つの県庁所在地を「線分で結んだ長さ」を「距離」として導入すると、
この「県庁所在地全体」と「距離」で一つの空間ができ上がります。

数学でも集合を$X$、距離を$d$とするときには、空間はそれらの組み合わせとして$(X, d)$として表現します。
今回の場合は構造が「距離」の空間ですので、**距離空間**と呼びます。

数学には様々な$\circ\circ$空間という名前の空間がでてきますが、すべての空間は「集合と構造」の組み合わせでできています。



## ベクトル（線形）空間

**ベクトル空間**とは「ベクトルを要素とする空間」で、**線形空間**と呼ばれます。実際はもっと厳密ですが、さきほどの「空間」の説明とは違うことがわかります。
ベクトル空間は「集合と構造」の組み合わせでできていません。

ベクトル空間は次のような**公理**を満たす空間として定義されます（紹介だけですので、ガチで入るまでは覚えなくてもよいです）。


$V$をベクトルを要素とする集合、$V$の任意の要素$x,y,z$とゼロベクトル$0$,$x$の逆ベクトルを$-x$,スカラー倍を$k, l, 1$に対して

1. 和の結合法則: $(x + y) + z = x + (y + z)$
2. 和の交換法則: $x + y = y + x$
3. 零ベクトルとの和: $x + 0 = x$
4. 逆ベクトルとの和: $x + (−x) = 0$
5. スカラー倍の結合法則: $(kl)x = k(lx)$
6. スカラー 1 によるスカラー倍: $1x = x$
7. ベクトルの和に関する分配法則: $k(x + y) = kx + ky$
8. スカラー倍に関する分配法則: $(k + l)x = kx + lx$

を満たすとき、$V$をベクトル空間という。

（数学をやっていく上でここを明確に区別する場面というのは多くないのですが、ベクトル空間のような「要素がとある条件を満たす」ような空間を**抽象空間**と呼びます。）

**n次元ベクトル空間**という表現が出て来たときは、列ベクトルで行数がn個、つまり$\begin{pmatrix}x_1\\x_2\\\vdots\\x_n\end{pmatrix}$のような形をしています。



## ベクトル空間と行列

ディープラーニングで各ノードごとにデータが入力され、それらに行列を掛けて計算します。次のような場合を考えましょう。


<img src="images/04/01.png" style="width:700px">


入力データ$\textbf{x}$がn次元ベクトルであるとします（実際はバイアスで1つ追加するために(n+1)を考えることもあります）。
このとき、第一階層では$W_1$をかけるのですが、第一階層のノード数が$m$なので$W_1$は「m行n列」のベクトルになります。

[線形代数とディープラーニング](./03_線形代数とディープラーニング)でもお話しましたが、線形変換は次元の変換もできます。
$\textbf{x}$に$X_1$を掛けた結果を$\textbf{y}_1$とすると、

$$\textbf{y}_1 = W_1 \textbf{x}$$

となりますが、このとき$textbf{y}_1$はm次元ベクトルです。これらを繰り返して考えると、$W_2$は「l行m列」の行列で$W_3$は「1行l列」の行列であり、
最終的な目標データを$\textbf{y}$とすれば、

$$
\begin{aligned}
\textbf{y}  &= W_3 W_2 W_1 \textbf{x}
\end{aligned}
$$

です。これまでには「次元の変換」と説明してきましたが、「行列は写像の一つ」をこの節の最初にご紹介しています。写像とは「集合の要素と集合の要素を紐付ける」、少し言い方を
変えると「ある集合の要素をある集合の要素に写す」ともいえます。

※「写す」は「移す」と表記する場合もあります。下の英語がmappingのため、個人的には「写す」の方がしっくりきているのでそちらを採用しています。

これを踏襲すると、

- $W_1$はn次元ベクトル空間からm次元ベクトル空間へ写す写像
- $W_2$はm次元ベクトル空間からl次元ベクトル空間へ写す写像
- $W_3$はl次元ベクトル空間から1次元ベクトル空間へ写す写像

という見方もできます。実はこれだけではありません。

- $W_2W_1$はn次元ベクトル空間からl次元ベクトル空間へ写す写像
- $W_3W_2$はm次元ベクトル空間から1次元ベクトル空間へ写す写像
- $W_3W_2W_1$はn次元ベクトル空間から1次元ベクトル空間へ写す写像

という見方もできます。実はこれが微分積分の章もご紹介した「合成関数」です。

$z = g(y), y = f(x)$という二つの関数$f,g$に対して、

$$g \circ f (x) = g(f(x))$$

というものです。

- $W_2W_1$はn次元ベクトル空間からl次元ベクトル空間へ写す写像

は、$W_2$が$g$、$W_1$が$f$という見方をするわけです。

関数での合成関数が行列では単純なかけ算として考えられるのです。


## ベクトル空間と基底

**基底**は前節でも紹介した通り「骨組みの基準」です。

<img src="images/03/01.png" style="height: 500px;">

n次元ベクトル空間の場合は、基底がn個の要素の組み合わせでできています。逆に「基底がn個の要素の組み合わせでできているとき、そのベクトル空間はn次元である」とも言えます。

しかし、基底は「骨組みの基準」というのは厳密さがありません。基底は次の2つの性質を持つときに基底とするということを定義しています。（厳密な数学的な言い方は後ほど紹介します。）

1. 基底の組み合わせ$(e_1, e_2, \dots, e_n)$のうちから$e_i$を一つとりだしたとき、$e_i$以外の組み合わせをスカラー倍したり足しても$e_i$を表現できない。
2. ベクトル空間内の任意のベクトルを、スカラー倍した基底のたし算だけで表現できる

まず、1について解説します。3次元で考えてみましょう。


<img src="images/04/02.png" style="height: 700px;">


$\textbf{e_2}$と$\textbf{e_3}$それぞれを伸ばしたり縮めたりして足して$\textbf{e_1}$を表現しようとします。しかし、$\textbf{e_2}$で$\textbf{e_3}$で表現できるのはオレンジの面だけで、いくらやっても$\textbf{e_1}$を表現できません。
これを$\textbf{e_2},\textbf{e_3}$を選んで他の2つで表現しようとしても同じことがおきます。

このようにベクトルのいくつかの組み合わせを用意して1つを他の組み合わせで表現できないとき、その組みあわせは**一次独立**もしくは**線形独立**であるといいます。
逆に線形独立でない、すなわち一つでも他の組み合わせで表現できるときは**一次従属**もしくは**線形従属**であるといいます。
基底の場合の1. の条件を一次独立のことを言っています。


次に2.について紹介します。2.はベクトル空間内のどんなベクトルでも基底だけで表現できるという性質です。

<img src="images/04/03.png" style="height: 700px;">


基底の3つのベクトルで表現しています。数学的な表現をすると、オレンジの点を$\textbf{x}$とするとき、スカラー$\alpha_1, \alpha_2, \alpha_3$に対して

$$ \textbf{x} = \alpha_1 \textbf{x}_1 + \alpha_2 \textbf{x}_2 + \alpha_3 \textbf{x}_3$$

のように表せます。このように（基底でなくても）あるベクトルをとあるベクトルのスカラー倍と和で表すことを**一次結合**もしくは**線形結合**といいます。

ベクトル空間内のすべてのベクトルをあるベクトルの一次結合で表せるとき、そのベクトルの組み合わせは（そのベクトル空間を）**張る**といいます。

2.の性質は張ることを言っています。

つまり、基底は次のように定義できます。

#### 定義: 基底
ベクトル空間$V$に対してベクトル空間の要素の組み合わせ$[\textbf{e}_1,\textbf{e}_2, \dots, \textbf{e}_n ]$が次の性質を満たすとき、この組み合わせを基底という。

1. $\textbf{e}_1,\textbf{e}_2, \dots, \textbf{e}_n$は一次独立である。
2. $\textbf{e}_1,\textbf{e}_2, \dots, \textbf{e}_n$は$V$を張る。


ちなみに一次独立も明確に定義すると、つぎのようになります。

#### 定義: 一次独立、一次従属
ベクトル$\textbf{x}_1,\textbf{x}_2, \dots, \textbf{x}_2$が次の性質を満たすとき、一次独立であるという。

$$\alpha_1 \textbf{x}_1 + \alpha_2 \textbf{x}_2 + \dots + \alpha_n \textbf{x}_n = 0 \Rightarrow \alpha_1 = \alpha_2 = \dots \alpha_n = 0$$

一次独立でないとき、一次従属という。


数式にすると少しややこしく見えますが、例えばi番目の項を移項して両辺を$\alpha_i$で割ると

$$\frac{\alpha_1}{\alpha_i} \textbf{x}_1 + \frac{\alpha_2}{\alpha_i} \textbf{x}_2 + \dots +  \frac{\alpha_{i-1}}{\alpha_i} \textbf{x}_{i-1} + \frac{\alpha_i+1}{\alpha_{i}} \textbf{x}_{i+1} + \dots + \frac{\alpha_n}{\alpha_i} \textbf{x}_n =  \textbf{x}_{i}$$


とすれば、「一つのベクトルを他のベクトルの組み合わせで表現する」という形になります。

これが成り立つのは、すべての$\alpha_i=0$のとき、つまり両辺が0になるときのみであるということを言っています。すなわち「すべてのスカラー倍を0倍にしない限りは、1つのベクトルを他のベクトルの組み合わせで表現できない」ということです。

数学的にするとややこしいのですが、これを言語だけで表現するときっと非常に難解な文章になります。
