# 学習の準備
以降は、最小限の実装でバックプロパゲーションを構築します。  
まずは、学習のためのデータとネットワークを回帰と分類それぞれで用意します。

## ●学習の準備 -回帰-
ニューラルネットワークに、以下のコードで描かれるsin関数を学習させます。  

In [None]:
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(-np.pi, np.pi)
y = np.sin(x)

plt.plot(x, y)
plt.show()

sin関数は上記のような滑らかな曲線を描きます。

ニューラルネットワークの設定ですが、$x$座標をネットワークへの入力、$y$座標をネットワークからの出力とします。  
そして、sin関数の値を正解とします。  
出力と正解の誤差を伝播させて重みとバイアスを修正することを繰り返すと、ネットワークは少しずつsin関数を学習していきます。  
  
sin関数は連続的な関数なので、このケースは回帰問題になります。  
今回は、以下のような入力層のニューロンが1つ、中間層のニューロンが3つ、出力層のニューロンが1つのシンプルなネットワークを使用します。

<img src="images/nn_sin_regression.png">

その他設定は以下の通りにします。

|||
|:-:|:-:|
| 中間層の活性化関数 | シグモイド関数 |
| 出力層の活性化関数 | 恒等関数 |
| 損失関数 | 二乗和誤差 |
| バッチサイズ | 1 |
|||

回帰問題なので出力層の活性化関数は恒等関数とし、損失関数は二乗和誤差とします。  

また、バッチサイズは1なので、オンライン学習になります。  
コードをシンプルにするため、コード全体はオンライン学習のみ対応にします。  
しかしながら、各層の実装はバッチ学習やミニバッチ学習にも対応できるようにします。

今回は全てのデータを訓練データとし、テストデータは用意しません。  
これは、今回は学習の様子を観察するに留めるためです。  

入力と正解を用意するために、以下のコードを使用します。

In [None]:
# -- 入力と正解の用意 --
input_data = np.linspace(-np.pi, np.pi)  # 入力
correct_data = np.sin(input_data)  # 正解

入力データははlinspace関数で用意します。  
$-\pi$から$\pi$までの範囲で入力データを用意した後に、NumPyのsin関数で正解データを作ります。  

今回はテストデータは使用しませんが、テストデータを作成する場合は入力データ、正解データを訓練用とテスト用に分割します。

## ●学習の準備 -分類-
ニューラルネットワークに入力したx、y座標がsinカーブよりも上の領域に位置するか、下の領域に位置するかを学習させます。  
以下の図に示すように、出力層における2つのニューロンの出力が、上の領域、下の領域、それぞれの領域に属する確率を表すようにします。 

<img src="images/sin_classification.png">

正解は[0, 1]もしくは[1, 0]のone-hot表現とします。出力と正解の誤差を伝播させて重みとバイアスを修正することを繰り返すと、ネットワークは少しずつ正確に分類できるようになっていきます。  
今回は、以下に示す入力層のニューロンが2つ、中間層のニューロンが6つ、出力層のニューロンが2つのシンプルなネットワークを使用します。

<img src="images/nn_sin_classification.png">

その他設定は以下の通りにします。

|||
|:-:|:-:|
| 中間層の活性化関数 | シグモイド関数 |
| 出力層の活性化関数 | ソフトマックス関数 |
| 損失関数 | 交差エントロピー誤差 |
| バッチサイズ | 1 |
|||

入力と正解を用意するために、以下のコードを使用します。

In [None]:
# -- 座標 --
X = np.arange(-1.0, 1.1, 0.1)
Y = np.arange(-1.0, 1.1, 0.1)

# -- 入力、正解データを作成 --
input_data = []
correct_data = []
for x in X:
    for y in Y:
        input_data.append([x, y])
        if y < np.sin(np.pi * x):  # y座標がsinカーブよりも下であれば
            correct_data.append([0, 1])  # 下の領域
        else:
            correct_data.append([1, 0])  # 上の領域
            
n_data = len(correct_data)  # データ数

input_data = np.array(input_data)
correct_data = np.array(correct_data)

X座標、Y座標をNumPyのarrange関数により用意します。   
そして、入力、正解データをfor文による2重のループで作成します。  
y座標がsinカーブよりも下であるかどうかで、異なる正解を`correct_data`に入れています。  
以上により、各座標がsinカーブの上下のどちらに属するかを表す、正解のデータを作ることができます。
今回も全てのデータを訓練データとし、テストデータは作成しません。

以上により、バックプロパゲーションによる学習のコードを書く準備ができました。