# 1. Neural Network とは

## 1.1. はじめに

ChatGPT や画像生成などカジュアルにはAI とも呼ばれるこれらは,正式には**機械学習**(Machine Learning, ML)と呼ばれる技術です.
機械学習と聞くと比較的最近耳にするようになった印象もあるかもしれませんが, 実際には結構古い技術です.
実はみなさんも大学生の時分に触れていて, **fitting**という呼び方で馴染みがあるんじゃないでしょうか.

近年ではありとあらゆるところに機械学習が使われ,技術としても多種多様に見えますが, 根幹の技術は全てただのfittingです.
機械学習の話はイメージしにくいのが難点ですが, 単純なfittingで置き換えて考えるとかなり理解しやすくなります.
どんな機械学習の話もfittingとして実感できるようにする, というのがこのチュートリアルの目標です.

## 1.2. Fitting の概観

Fitting の詳細な技術はここでは無視して, 用語の定義と大まかな流れを確認します.

### 1.2.1 Fitting の目的

入力の集合$X$ から出力の集合$Y$ への写像を解析的な形で得ることが目的です.
ここで「解析的」という表現は「数式で表現できて,やろうと思えば局所的に微積分が可能」という意味で雑に使っています.
解析的な写像と解析的ではない写像の例を挙げます.

> **_NOTE_** <details close><summary>解析的な写像と解析的ではない写像の例</summary>
> 
> - 解析的な写像
>   - いわゆる普通の関数たち
>     - $f(x) = x^2 + 3x + 1$
>     - $g(x) = \sin(x)$
>     - $h(x) = (f \circ g)(x)$
> - 解析的でない写像
>     - 逐次計算で出るようなやつやら,手順踏めば解析的な形で究極的には出せそうだけどアルゴリズムの内部が見えないせいでわからない(シミュレーションとか)
>     - sort やらはそうだけど,混乱を避けるためにもなるべくフェアに連続写像で例示したい
> 
> </details>

### 1.2.3 Fitting の流れ

目的関数がおおよそ一次関数の場合を例に、一般的なfitting の流れをおさらいします。

0. Given: $D = \{(x_0, y_0), (x_1, y_1), \dots, (x_n, y_n)\}$

> <details close><summary>Table</summary>
> 
> |  i |          x |          y |
> |---:|-----------:|-----------:|
> |  0 | -1         | -3.46875   |
> |  1 | -0.894737  | -3.3587    |
> |  2 | -0.789474  | -3.18168   |
> |  3 | -0.684211  | -2.80816   |
> |  4 | -0.578947  | -2.57535   |
> |  5 | -0.473684  | -2.59838   |
> |  6 | -0.368421  | -2.034     |
> |  7 | -0.263158  | -2.12891   |
> |  8 | -0.157895  | -1.76289   |
> |  9 | -0.0526316 | -1.55701   |
> | 10 |  0.0526316 | -1.30737   |
> | 11 |  0.157895  | -1.14899   |
> | 12 |  0.263158  | -0.999317  |
> | 13 |  0.368421  | -0.695888  |
> | 14 |  0.473684  | -0.606254  |
> | 15 |  0.578947  | -0.402179  |
> | 16 |  0.684211  | -0.0366087 |
> | 17 |  0.789474  |  0.0456709 |
> | 18 |  0.894737  |  0.303446  |
> | 19 |  1         |  0.531963  |
> 
> </details>
> 
> <details close><summary>Plot</summary>
> 
> ![dataset](../assets/1_nn/fig/lin_dataset.png)
> 
> </details>

1. Fitting 関数の選定

   データセットを元に目的関数の形を考慮してfitting 関数を選びます.
   今回の場合はデータセットの分布がおおよそ線形なので, 目的関数が一次関数であると仮定して一次関数をfitting 関数としてfitting します.
   $$ \hat{f}(x \mid \theta) = \theta_1 x + \theta_2 $$

2. Fitting 関数のパラメータの最適化

   ここがfitting の肝ですが, 具体的にどうやって最適なパラメータを算出するかは今は考えないでおきましょう.
   ここでは手動でなんとなく良いものを選びます.

In [1]:
import numpy as np
import matplotlib.pyplot as plt
from ipywidgets import interact

dataset = np.array([
    [-1.0, -3.46875059],
    [-0.89473684, -3.35870235],
    [-0.78947368, -3.18168343],
    [-0.68421053, -2.80815538],
    [-0.57894737, -2.57535459],
    [-0.47368421, -2.5983788],
    [-0.36842105, -2.03399938],
    [-0.26315789, -2.12890873],
    [-0.15789474, -1.76288595],
    [-0.05263158, -1.55701026],
    [0.05263158, -1.30737102],
    [0.15789474, -1.14899177],
    [0.26315789, -0.99931722],
    [0.36842105, -0.69588818],
    [0.47368421, -0.60625409],
    [0.57894737, -0.40217878],
    [0.68421053, -0.03660866],
    [0.78947368, 0.04567089],
    [0.89473684, 0.30344603],
    [1.0, 0.53196308],
])
x = dataset[:, 0]
y = dataset[:, 1]

def f(x, theta1, theta2):
    return theta1 * x + theta2
def plot(theta1=1., theta2=-2.):
    _ = plt.scatter(x, y)
    _ = plt.plot(x, f(x, theta1, theta2), color='red', linestyle='-')
    _ = plt.xlim(-1.1, 1.1)
    _ = plt.ylim(-4, 1)
    _ = plt.xlabel('x')
    _ = plt.ylabel('y')
    _ = plt.title(f'Linear fitting function: θ1={theta1:.2f}, θ2={theta2:.2f}')
    _ = plt.grid()
    _ = plt.show()

_ = interact(plot, theta1=(-5.0, 5.0, 0.1), theta2=(-5.0, 5.0, 0.1))

interactive(children=(FloatSlider(value=1.0, description='theta1', max=5.0, min=-5.0), FloatSlider(value=-2.0,…

## 1.3. Neural Network

2015年以降の機械学習のほぼ全てに登場するのが**Neural Network** (NN)です。