# 予備知識

## 線形代数<a name="linear_algebra"></a>

### 行列と各要素の表記<a name="matrix_expression"></a>

機械学習ではよく行列を扱う。行列というのは、縦 $n$ 行・横 $m$ 列のデータが入ったスプレッドシートをイメージすると良い。

|$x^{(1)}_1$|$x^{(1)}_2$|$x^{(1)}_3$|$x^{(1)}_4$|
|:-:|:-:|:-:|:-:|
|$x^{(2)}_1$|$x^{(2)}_2$|$x^{(2)}_3$|$x^{(2)}_4$|
|$x^{(3)}_1$|$x^{(3)}_2$|$x^{(3)}_3$|$x^{(3)}_4$|

機械学習の文脈では上のように、行番号を括弧内、列番号を添字で表すことが多い。この場合、行は各サンプル、列はそのサンプルの各特徴(具体的なデータ)を表す。

具体例：

||国語|数学|英語|
|:-:|--:|--:|--:|
|Aさん|5|3|4|
|Bさん|4|3|4|
|Cさん|4|4|4|

行または列が1しかないものをベクトルと呼び、行が1のものを行ベクトル、列が1のものを列ベクトルと呼ぶ。

行ベクトル $=\ \left(x_1,\ x_2,\ \ldots\ x_n\right)$

列ベクトル $=\ \left(
    \begin{array}{c}
        x_1 \\
        x_2 \\
        \vdots \\
        x_n
    \end{array}
\right)$

通常、スカラ(単なる数値)やベクトルは$x$のように小文字のアルファベット、行列は$X$のように大文字のアルファベットで表す。

$X\ =\ \left(
    \begin{array}{rrr}
        x^{(1)}_1 & x^{(1)}_2 & x^{(1)}_3 \\
        x^{(2)}_1 & x^{(2)}_2 & x^{(2)}_3
    \end{array}
\right)$

### 転置<a name="transpose"></a>

行ベクトルと列ベクトルを入れ替えたり、行列を対角に沿って反転させることを転置(transpose)と呼び、$X^{\mathrm{T}}$のように記述する。

$X\ =\ \left(
    \begin{array}{rrr}
        1 & 2 & 3 \\
        4 & 5 & 6
    \end{array}
\right),\ X^{\mathrm{T}}\ =\ \left(
    \begin{array}{rrr}
        1 & 4 \\
        2 & 5 \\
        3 & 6
    \end{array}
\right)$

### 内積<a name="inner_product"></a>

ベクトルや行列を掛ける場合、一定のルールがある。(内積と呼ばれる)

まず、ベクトル同士を掛ける場合は、次元(要素数)が同じでなければならない。そして掛ける順番にも意味があり、行ベクトル×列ベクトルの順番でなければならない。計算結果は、それぞれのベクトルの同じ順番の要素同士を掛けたものの和になる。

$w\ =\ \left(
    \begin{array}{c}
        w_1 \\
        w_2 \\
        \vdots \\
        w_n
    \end{array}
\right),\ x\ =\ \left(
    \begin{array}{c}
        x_1 \\
        x_2 \\
        \vdots \\
        x_n
    \end{array}
\right)$

$w^{\mathrm{T}}x\ =\ w_1x_1\ +\ w_2x_2\ +\ \ldots\ w_nx_n$

具体例：$[\ 1\ 2\ 3\ ]\ \times\ \left[\ 
    \begin{array}{r}
        4 \\
        5 \\
        6
    \end{array}
\right]\ =\ 1\times4\ +\ 2\times5\ +\ 3\times6\ =\ 32$

行列同士を掛ける場合は少し複雑だが、行列をベクトルの集合として捉えると以下のような手順が覚えやすい。

$A\ =\ \left(
    \begin{array}{cccc}
        a_{11} & a_{12} & \ldots & a_{1j} \\
        a_{21} & a_{22} & \ldots & a_{2j} \\
        \vdots & \vdots & \ddots & \vdots \\
        a_{i1} & a_{i2} & \ldots & a_{ij}
    \end{array}
\right),\ B\ =\ \left(
    \begin{array}{cccc}
        b_{11} & b_{12} & \ldots & b_{1k} \\
        b_{21} & b_{22} & \ldots & b_{2k} \\
        \vdots & \vdots & \ddots & \vdots \\
        b_{j1} & b_{j2} & \ldots & b_{jk}
    \end{array}
\right)$

これを

$\begin{cases}
    a_1\ =\ (\ a_{11},\ a_{12},\ \ldots\ a_{1j}\ ) \\
    a_2\ =\ (\ a_{21},\ a_{22},\ \ldots\ a_{2j}\ ) \\
    \vdots \\
    a_i\ =\ (\ a_{i1},\ a_{i2},\ \ldots\ a_{ij}\ )
\end{cases}$

$b_1\ =\ \left(
    \begin{array}{c}
        b_{11} \\
        b_{21} \\
        \vdots \\
        b_{j1}
    \end{array}
\right),\ b_2\ =\ \left(
    \begin{array}{c}
        b_{12} \\
        b_{22} \\
        \vdots \\
        b_{j2}
    \end{array}
\right),\ \ldots,\ b_j\ =\ \left(
    \begin{array}{c}
        b_{1k} \\
        b_{2k} \\
        \vdots \\
        b_{jk}
    \end{array}
\right)$

$A\ =\ \left(
    \begin{array}{c}
        a_1 \\
        a_2 \\
        \vdots \\
        a_i
    \end{array}
\right),\ B\ =\ (\ b_1,\ b_2,\ \ldots\ b_k\ )$

とすると、それぞれの要素を縦横方向にコピーして形を揃え、同じ位置にあるもの同士を掛けるようにすれば行列の内積になる。$i$行$j$列×$j$行$k$列のように行列の内積は左側の列の次元と右側の行の次元が揃ってなければならない。慣れないうちは、結果として得られるはずの行列のshapeから逆算して内側の数字が揃うように意識しておけば良い。

$AB\ =\ \left(
    \begin{array}{cccc}
        a_1b_1 & a_1b_2 & \ldots & a_1b_k \\
        a_2b_1 & a_2b_2 & \ldots & a_2b_k \\
        \vdots & \vdots & \ddots & \vdots \\
        a_ib_1 & a_ib_2 & \ldots & a_ib_k
    \end{array}
\right)$

具体例：

$\begin{eqnarray}
    \left(
        \begin{array}{rr}
            1 & 2 \\
            3 & 4 \\
            5 & 6
        \end{array}
    \right)\ \times\ \left(
        \begin{array}{rrrr}
            7 & 8 & 9 & 10 \\
            11 & 12 & 13 & 14
        \end{array}
    \right) & = & \left(
        \begin{array}{c}
            (\ 1\ 2\ ) \\
            (\ 3\ 4\ ) \\
            (\ 5\ 6\ )
        \end{array}
    \right)\ \times\ \left(
        \begin{array}{cccc}
            \left(
                \begin{array}{r}
                    7 \\
                    11
                \end{array}
            \right) & \left(
                \begin{array}{r}
                    8 \\
                    12
                \end{array}
            \right) & \left(
                \begin{array}{r}
                    9 \\
                    13
                \end{array}
            \right) & \left(
                \begin{array}{r}
                    10 \\
                    14
                \end{array}
            \right)
        \end{array}
    \right) \\
    & = & \left(
        \begin{array}{cccc}
            (\ 1\ 2\ )\ \times\ \left(
                \begin{array}{r}
                    7 \\
                    11
                \end{array}
            \right) & (\ 1\ 2\ )\ \times\ \left(
                \begin{array}{r}
                    8 \\
                    12
                \end{array}
            \right) & (\ 1\ 2\ )\ \times\ \left(
                \begin{array}{r}
                    9 \\
                    13
                \end{array}
            \right) & (\ 1\ 2\ )\ \times\ \left(
                \begin{array}{r}
                    10 \\
                    14
                \end{array}
            \right) \\
            (\ 3\ 4\ )\ \times\ \left(
                \begin{array}{r}
                    7 \\
                    11
                \end{array}
            \right) & (\ 3\ 4\ )\ \times\ \left(
                \begin{array}{r}
                    8 \\
                    12
                \end{array}
            \right) & (\ 3\ 4\ )\ \times\ \left(
                \begin{array}{r}
                    9 \\
                    13
                \end{array}
            \right) & (\ 3\ 4\ )\ \times\ \left(
                \begin{array}{r}
                    10 \\
                    14
                \end{array}
            \right) \\
            (\ 5\ 6\ )\ \times\ \left(
                \begin{array}{r}
                    7 \\
                    11
                \end{array}
            \right) & (\ 5\ 6\ )\ \times\ \left(
                \begin{array}{r}
                    8 \\
                    12
                \end{array}
            \right) & (\ 5\ 6\ )\ \times\ \left(
                \begin{array}{r}
                    9 \\
                    13
                \end{array}
            \right) & (\ 5\ 6\ )\ \times\ \left(
                \begin{array}{r}
                    10 \\
                    14
                \end{array}
            \right) \\
        \end{array}
    \right) \\
    & = & \left(
        \begin{array}{rrrr}
            29 & 32 & 35 & 38 \\
            65 & 72 & 79 & 86 \\
            101 & 112 & 123 & 134
        \end{array}
    \right)
\end{eqnarray}$

## Numpy<a name="numpy"></a>

### Numpyとは<a name="numpy_description"></a>

行列の演算を扱いやすくするライブラリ。
行列の計算を並列・高速化する。

### インポート<a name="numpy_import"></a>

慣例としてnpという名前をつける。

In [None]:
import numpy as np

### 配列の基本操作<a name="numpy_basic"></a>

np.arrayに引数として配列を渡して作成する。各要素の値の型は一致しなければならない。

In [None]:
a = np.array([1, 2, 3, 4])
b = np.array([
    [5, 6, 7],
    [8, 9, 10]
])

shapeで配列の次元を確認できる。

In [None]:
a.shape

In [None]:
b.shape

Tで転置された行列を取得できる。

In [None]:
b.T

reshapeで配列のshapeを変更できる。

In [None]:
b = b.reshape((3, 2))
b

reshapeの際、インデックスに-1を使用できる。

In [None]:
b = b.reshape((-1, 3))
b

行ベクトルから列ベクトル(列1の行列)への変換。

In [None]:
a.reshape((-1, 1))

配列の中の値は以下のようにして取り出す。

In [None]:
b[0, 2]

取り出す範囲も指定できる。

In [None]:
b[0:2, 1:3]

In [None]:
b[:, 1]

### 連続する値の作成<a name="numpy_serial_number"></a>

arangeで指定した間隔(デフォルトでは1)の配列、linspaceで指定した個数に分割された配列が得られる。

In [None]:
A = np.arange(6).reshape((-1, 2))
A

In [None]:
B = np.linspace(6, 9.5, 8).reshape((2, -1))
B

### 内積<a name="numpy_dot"></a>

In [None]:
A.dot(B)

### ブロードキャスト<a name="numpy_broadcast"></a>

In [None]:
# ベクトルとスカラ
np.arange(5) + 2 # [0, 1, 2, 3, 4] + 2

In [None]:
# 行列とベクトル
c = np.arange(6).reshape((2, 3))
c

In [None]:
d = np.arange(3) + 4
d

In [None]:
c + d

In [None]:
# 行ベクトルと列ベクトル
e = np.arange(5)
e

In [None]:
f = np.linspace(10, 12, 3).reshape((-1, 1))
f

In [None]:
e + f

### 値の検索と置換<a name="numpy_search"></a>

インデックスに条件文を指定すると、あてはまる値を取得できる。

In [None]:
g = np.linspace(1, 10, 5)
g > 5

In [None]:
g[g > 5]

条件に一致する要素に別の値を代入。

In [None]:
g[g < 5] = 0
g

条件に一致するものとしないものに同時に値を代入。

In [None]:
np.where(g < 5, 0, 1)

## matplotlib<a name="matplotlib"></a>

### matplotlibとは<a name="matplotlib_description"></a>

グラフ描画のためのライブラリ。

### インポート<a name="matplotlib_import"></a>

通常はpyplotをpltという名前でインポートする。

In [None]:
import matplotlib.pyplot as plt

### 折れ線グラフ<a name="matplotlib_plot"></a>

In [None]:
x = np.arange(0, 5, 0.5)
y = np.sin(x)
plt.plot(x, y)
plt.show()

### 散布図<a name="matplotlib_scatter"></a>

In [None]:
x = np.linspace(-1, 1, 20)
y = np.sqrt(1 - x ** 2)
plt.scatter(x ,y)
plt.scatter(x, -y, marker='x')
plt.show()

### ヒストグラム<a name="matplotlib_hist"></a>

In [None]:
np.random.seed(0)
x = np.random.normal(size=1000)
plt.hist(x)
plt.show()

### グラフのカスタマイズ<a name="matplotlib_customize"></a>

軸のラベル指定

In [None]:
x = np.arange(0, 5, 0.1)
y = np.sin(x)
plt.xlabel('Label of x axis')
plt.ylabel('Label of y axis')
plt.plot(x, y)
plt.show()

凡例表示

In [None]:
plt.plot(x, np.sin(x), label='sine curve')
plt.plot(x, np.cos(x), label='cosine curve')
plt.legend()
plt.show()

タイトル表示

In [None]:
plt.title('Example')
plt.plot(x, np.sin(x))
plt.show()

## pandas<a name="pandas"></a>

### pandasとは<a name="pandas_description"></a>

データ分析のためのライブラリ。データフレームというスプレッドシートのような枠組みを提供してくれる。

### インポート<a name="pandas_import"></a>

慣例としてpdという名前をつける。

In [None]:
import pandas as pd

### データ読み込み<a name="pandas_read"></a>

csvデータを読み込み後、確認のため最後5行を出力。

In [None]:
df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data', header=None)
df.tail()

列ラベルを設定

In [None]:
df.columns = ['sepal length (cm)',  'sepal width (cm)',  'petal length (cm)',  'petal width (cm)', 'class']
df.head()

データの概要を表示

In [None]:
df.describe()

インデックスを指定して値を抽出。

In [None]:
df.iloc[-5:, [0, 2]]

In [None]:
df.iloc[-5:, [0, 2]].values

カラム名を指定して値を抽出。

In [None]:
df.loc[145:, 'sepal length (cm)':'sepal width (cm)']