## 線形代数を学ぶモチベーション
統計学や機械学習を学ぶに当たって、線形代数を学ぶことによるメリットは以下の2点になります。
1. 表記を簡単にできる
    線形代数を用いることで、計算過程や計算結果を行列どうしの計算として、見やすく分かりやすく提示することができます。
2. 高次元に対応できる
    機械学習などでは特徴量の数が１００を超えるような高次元のデータを扱います。変数の次元が高くなった場合でも、行列を用いれば簡潔に表現することができます。

現在では、Pythonのnumpyライブラリなどを使って、高次元の行列計算のプログラムを簡単に書くことができます。実際にデータを分析するにあたり、統計や機械学習のアルゴリズムを行列計算のプログラムに落とし込むためには、線形代数の知識は必須のものとなります。

## ベクトル空間と部分空間
### ベクトル空間とは
線形代数学はベクトル空間と呼ばれる特別な集合の上に描かれます。
ベクトル空間の定義は以下になります。
#### ベクトル空間の定義
 任意の元$x,y \in L$ 任意の実数$a,b$について実数倍$ax,by$と、それらの和$ax+by$が定義されており、必ず $ax+by \in L$ が成り立つような集合$L$を、ベクトル空間(vector space)という。また、$L$ の元をベクトル(vector)という。

#### 直積集合
$k$個の実数集合$R$の直積を$R^k$とします。これは、$k$個の実数を組にした$(x_1,\ldots,x_k)$を元とする集合が$R^k$です。任意の実数$a$について、$(x_1,\ldots,x_k)$の$a$倍を
$$
(x_1,\ldots,x_k) = (ax_1,\ldots,ax_k)
$$
によって定義します。また、$(x_1,\ldots,x_k)$と$(y_1,\ldots,y_k)$の和を
$$
(x_1,\ldots,x_k)+(y_1,\ldots,y_k) = (x_1+y_1,\ldots,x_k+y_k)
$$
とします。このとき、
$$
a(x_1,\ldots,x_k)+b(y_1,\ldots,y_k) = (ax_1+by_1,\ldots,ax_k+by_k) \in R^k
$$
が必ず成立するので、$R^k$もまたベクトル空間になります。

#### 列ベクトルと行ベクトル
$k$個の実数を縦に並べて表したものを、

$$
\begin{eqnarray}
x=\left[
\begin{array}{c}
x_1 \\
\vdots \\
x_k \\
\end{array}
\right]
\end{eqnarray}
$$
列ベクトル(column vector)表記という。これに対して、

$$
\begin{eqnarray}
x=\left[
\begin{array}{ccc}
x_1&\ldots &x_k
\end{array}
\right]
\end{eqnarray}
$$
のように横１列に並べた表記法は行ベクトル(row vector)表記という。

#### ベクトルの演算
$R^k$に属するベクトルと実数の間では、以下のような計算が可能であるとします。正確には、いかに定める演算の元で、$R^k$はベクトル空間になります。

- ベクトルの和・差
    ベクトル$x,y$の和$x+y$と差$x-y$を、
$$
\left[\begin{array}{c}
x_1 \\
\vdots \\
x_k \\
\end{array}\right]
+
\left[\begin{array}{c}
y_1 \\
\vdots \\
y_k \\
\end{array}\right]
=
\left[\begin{array}{c}
x_1+y_1 \\
\vdots \\
x_k+y_k \\
\end{array}\right]
,
\left[\begin{array}{c}
x_1 \\
\vdots \\
x_k \\
\end{array}\right]
-
\left[\begin{array}{c}
y_1 \\
\vdots \\
y_k \\
\end{array}\right]
=
\left[\begin{array}{c}
x_1-y_1 \\
\vdots \\
x_k-y_k \\
\end{array}\right]
$$
によって定義する。
- ベクトルの実数倍
    ベクトル$x$と実数$c$について、$x$の$c$倍$cx$を
$$
c\left[\begin{array}{c}
x_1 \\
\vdots \\
x_k \\
\end{array}\right]
=
\left[\begin{array}{c}
cx_1 \\
\vdots \\
cx_k \\
\end{array}\right]
$$
によって定義する。

以下に、Pythonのnumpyを使ったベクトル演算のサンプルを示します。

In [1]:
import numpy as np

In [5]:
# numpyでのベクトル演算のサンプル
x = np.array([[1], [2]])
y = np.array([[3], [4]])
# ベクトルの和
print(x + y)

[[4]
 [6]]


In [6]:
# ベクトルの定数倍
c = 3
print(c * x)

[[3]
 [6]]


#### スパン
ベクトル空間$L$から選ばれたいくつかのベクトル$x_1,\ldots,x_n$を用いて作られる部分集合をスパンと言います。
定義は以下の通りです。

定義

ベクトル$x_1,\ldots,x_n(\in L)$の線形結合$a_1x_1+\cdots+a_nx_n$の集合、
$$
\{ a_1x_1+\cdots+a_nx_n | a_1,\ldots,a_n \in R \}
$$
を$x_1,\ldots,x_n$のスパン（span）、または$x_1,\ldots,x_n$が張る空間といい、
$$
Span\{ x_1,\ldots,x_n \}
$$
と書く。

#### 部分空間
部分空間の定義は以下のようになります。

定義

ベクトル空間$L$の部分集合$M$がベクトル空間の性質をもつとき、すなわち任意の$x,y \in M$と任意の実数$a,b$について、
$ax+by \in M$が成り立つとき、$M$は$L$の部分空間（subspace）であるという。

## 基底と次元
### 線形従属と線形独立
#### 線形従属
ベクトル$x_1,\ldots,x_n$のあいだに、
$$
x_n = a_1x_1+\cdots+a_{n-1}x_{n-1}
$$
の関係がある場合、$x_n$は、その他の$x_1,\ldots,x_{n-1}$の組み合わせとして表現されます。
このとき、$x_1,\ldots,x_{n}$は線形従属（linearly dependent）と言います。より一般的な定義は以下の通りです。

定義

$x_1,\ldots,x_n \in L$が線形従属（linearly dependent）であるとは、全てが０でない係数$a_1,\ldots,a_n$を用いて、
$$
a_1x_1+\cdots+a_nx_n=0
$$
とできることをいう。

#### 線形独立
また、線形独立の定義は以下のようになります。

定義

$x_1,\ldots,x_n \in L$が線形独立（linearly independent）であるとは、$a_1=\cdots=a_n=0$であるとき、またその時にのみ
$a_1x_1+\cdots+a_nx_n=0$が成り立つことをいう。

### 次元と基底

定義

$L$をベクトル空間とする。線形独立な$x_1,\ldots,x_n \in L$を用いて
$$
L = Span(x_1,\ldots,x_n)
$$
と書けるとき、「$L$の次元（dimension）は$n$である」、あるいは「$L$は$n$次元ベクトル空間である」と言い、$dimL=n$と書く。
またこのとき、ベクトル$x_1,\ldots,x_n$を$L$の基底（base）という。