<a href="https://colab.research.google.com/github/udlbook/udlbook/blob/main/Notebooks/Chap03/3_2_Shallow_Networks_II.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **ノートブック 3.2 -- 浅いニューラルネットワーク II**

このノートブックの目的は、2次元入力を持つ浅いニューラルネットワークに慣れ親しむことです。図3.8に類似した例を通して作業し、異なる活性化関数を実験します。<br><br>

以下のセルを順番に実行しながら進めてください。各所で「TODO」という言葉が見つかります。これらの場所の指示に従って、関数を完成させるコードを書いてください。テキスト中には質問も散りばめられています。

間違いを見つけたり、何か提案がありましたら、udlbookmail@gmail.com までご連絡ください。

In [None]:
# 数学ライブラリをインポート
import numpy as np
# プロットライブラリをインポート
import matplotlib.pyplot as plt

In [None]:
# 2D関数を描画するコード -- 何が起こっているかを理解するために読んでください。変更する必要はありません
def draw_2D_function(ax, x1_mesh, x2_mesh, y):
    pos = ax.contourf(x1_mesh, x2_mesh, y, levels=256 ,cmap = 'hot', vmin=-10,vmax=10.0)
    ax.set_xlabel('x1');ax.set_ylabel('x2')
    levels = np.arange(-10,10,1.0)
    ax.contour(x1_mesh, x2_mesh, y, levels, cmap='winter')

# 浅いニューラルネットワークをプロット。入力範囲を[0,10],[0,10]、出力範囲を[-10,10]と仮定
def plot_neural_2_inputs(x1,x2, y, pre_1, pre_2, pre_3, act_1, act_2, act_3, w_act_1, w_act_2, w_act_3):

  fig, ax = plt.subplots(3,3)
  fig.set_size_inches(8.5, 8.5)
  fig.tight_layout(pad=3.0)
  draw_2D_function(ax[0,0], x1,x2,pre_1); ax[0,0].set_title('Preactivation')
  draw_2D_function(ax[0,1], x1,x2,pre_2); ax[0,1].set_title('Preactivation')
  draw_2D_function(ax[0,2], x1,x2,pre_3); ax[0,2].set_title('Preactivation')
  draw_2D_function(ax[1,0], x1,x2,act_1); ax[1,0].set_title('Activation')
  draw_2D_function(ax[1,1], x1,x2,act_2); ax[1,1].set_title('Activation')
  draw_2D_function(ax[1,2], x1,x2,act_3); ax[1,2].set_title('Activation')
  draw_2D_function(ax[2,0], x1,x2,w_act_1); ax[2,0].set_title('Weighted Act')
  draw_2D_function(ax[2,1], x1,x2,w_act_2); ax[2,1].set_title('Weighted Act')
  draw_2D_function(ax[2,2], x1,x2,w_act_3); ax[2,2].set_title('Weighted Act')
  plt.show()

  fig, ax = plt.subplots()
  draw_2D_function(ax,x1,x2,y)
  ax.set_title('Network output, $y$')
  ax.set_aspect(1.0)
  plt.show()

In [None]:
# 正規化線形ユニット（ReLU）関数を定義
def ReLU(preactivation):
  activation = preactivation.clip(0.0)
  return activation

In [None]:
# 2つの入力、1つの出力、3つの隠れユニットを持つ浅いニューラルネットワークを定義
def shallow_2_1_3(x1,x2, activation_fn, phi_0,phi_1,phi_2,phi_3, theta_10, theta_11,\
                  theta_12, theta_20, theta_21, theta_22, theta_30, theta_31, theta_32):
  # TODO 以下の行を置き換えて、thetaパラメータから3つの初期線形関数を計算してください
  # （図3.8a-c）。これらは前活性化です
  pre_1 = np.zeros_like(x1)
  pre_2 = np.zeros_like(x1)
  pre_3 = np.zeros_like(x1)

  # これらをReLU関数に通して、図3.8 d-fのように活性化を計算
  act_1 = activation_fn(pre_1)
  act_2 = activation_fn(pre_2)
  act_3 = activation_fn(pre_3)

  # TODO 以下のコードを置き換えて、phi1、phi2、phi3を使って活性化に重みを付けてください
  # 図3.8 g-iに相当するものを作成します
  w_act_1 = np.zeros_like(x1)
  w_act_2 = np.zeros_like(x1)
  w_act_3 = np.zeros_like(x1)

  # TODO 以下のコードを置き換えて、重み付き活性化を結合し、
  # phi_0を追加して図3.8jのように出力を作成してください
  y = np.zeros_like(x1)

  # 計算したすべてを返す
  return y, pre_1, pre_2, pre_3, act_1, act_2, act_3, w_act_1, w_act_2, w_act_3

In [None]:
# パラメータを定義してニューラルネットワークを実行
theta_10 =  -4.0 ;  theta_11 = 0.9; theta_12 = 0.0
theta_20 =  5.0  ; theta_21 = -0.9 ; theta_22 = -0.5
theta_30 =  -7  ; theta_31 = 0.5; theta_32 = 0.9
phi_0 = 0.0; phi_1 = -2.0; phi_2 = 2.0; phi_3 = 1.5

x1 = np.arange(0.0, 10.0, 0.1)
x2 = np.arange(0.0, 10.0, 0.1)
x1,x2 = np.meshgrid(x1,x2)  # https://www.geeksforgeeks.org/numpy-meshgrid-function/

# これらの入力値に対してニューラルネットワークを実行
y, pre_1, pre_2, pre_3, act_1, act_2, act_3, w_act_1, w_act_2, w_act_3 = \
    shallow_2_1_3(x1,x2, ReLU, phi_0,phi_1,phi_2,phi_3, theta_10, theta_11, theta_12, theta_20, theta_21, theta_22, theta_30, theta_31, theta_32)
# そしてプロット
plot_neural_2_inputs(x1,x2, y, pre_1, pre_2, pre_3, act_1, act_2, act_3, w_act_1, w_act_2, w_act_3)

このモデルによって作られる異なる線形多面体はいくつありますか？ネットワーク出力でそれぞれを特定してください。

今度は、このモデルを拡張して2つの出力$y_1$と$y_2$を持つようにします。それぞれを別々のヒートマップで可視化できます。これで、これらの出力のそれぞれに対応するパラメータセット$\phi_{10}, \phi_{11}, \phi_{12}, \phi_{13}$と$\phi_{20}, \phi_{21}, \phi_{22}, \phi_{23}$を持つことになります。

In [None]:
# 浅いニューラルネットワークをプロット。入力範囲を[0,10],[0,10]、出力範囲を[-10,10]と仮定
def plot_neural_2_inputs_2_outputs(x1,x2, y1, y2, pre_1, pre_2, pre_3, act_1, act_2, act_3, w_act_11, w_act_12, w_act_13, w_act_21, w_act_22, w_act_23):

  # フラグが設定されている場合は中間プロットを表示
  fig, ax = plt.subplots(4,3)
  fig.set_size_inches(8.5, 8.5)
  fig.tight_layout(pad=3.0)
  draw_2D_function(ax[0,0], x1,x2,pre_1); ax[0,0].set_title('Preactivation')
  draw_2D_function(ax[0,1], x1,x2,pre_2); ax[0,1].set_title('Preactivation')
  draw_2D_function(ax[0,2], x1,x2,pre_3); ax[0,2].set_title('Preactivation')
  draw_2D_function(ax[1,0], x1,x2,act_1); ax[1,0].set_title('Activation')
  draw_2D_function(ax[1,1], x1,x2,act_2); ax[1,1].set_title('Activation')
  draw_2D_function(ax[1,2], x1,x2,act_3); ax[1,2].set_title('Activation')
  draw_2D_function(ax[2,0], x1,x2,w_act_11); ax[2,0].set_title('Weighted Act 1')
  draw_2D_function(ax[2,1], x1,x2,w_act_12); ax[2,1].set_title('Weighted Act 1')
  draw_2D_function(ax[2,2], x1,x2,w_act_13); ax[2,2].set_title('Weighted Act 1')
  draw_2D_function(ax[3,0], x1,x2,w_act_21); ax[3,0].set_title('Weighted Act 2')
  draw_2D_function(ax[3,1], x1,x2,w_act_22); ax[3,1].set_title('Weighted Act 2')
  draw_2D_function(ax[3,2], x1,x2,w_act_23); ax[3,2].set_title('Weighted Act 2')
  plt.show()

  fig, ax = plt.subplots()
  draw_2D_function(ax,x1,x2,y1)
  ax.set_title('Network output, $y_1$')
  ax.set_aspect(1.0)
  plt.show()

  fig, ax = plt.subplots()
  draw_2D_function(ax,x1,x2,y2)
  ax.set_title('Network output, $y_2$')
  ax.set_aspect(1.0)
  plt.show()

In [None]:
# 2つの入力、2つの出力、3つの隠れユニットを持つ浅いニューラルネットワークを定義
def shallow_2_2_3(x1,x2, activation_fn, phi_10,phi_11,phi_12,phi_13, phi_20,phi_21,phi_22,phi_23, theta_10, theta_11,\
                  theta_12, theta_20, theta_21, theta_22, theta_30, theta_31, theta_32):

  # TODO -- この関数を書いてください -- 以下のダミーコードを置き換えてください
  pre_1 = np.zeros_like(x1)
  pre_2 = np.zeros_like(x1)
  pre_3 = np.zeros_like(x1)
  act_1 = np.zeros_like(x1)
  act_2 = np.zeros_like(x1)
  act_3 = np.zeros_like(x1)
  w_act_11 = np.zeros_like(x1)
  w_act_12 = np.zeros_like(x1)
  w_act_13 = np.zeros_like(x1)
  w_act_21 = np.zeros_like(x1)
  w_act_22 = np.zeros_like(x1)
  w_act_23 = np.zeros_like(x1)
  y1 = np.zeros_like(x1)
  y2 = np.zeros_like(x1)


  # 計算したすべてを返す
  return y1,y2, pre_1, pre_2, pre_3, act_1, act_2, act_3, w_act_11, w_act_12, w_act_13, w_act_21, w_act_22, w_act_23

In [None]:
# パラメータを定義してニューラルネットワークを実行
theta_10 =  -4.0 ;  theta_11 = 0.9; theta_12 = 0.0
theta_20 =  5.0  ; theta_21 = -0.9 ; theta_22 = -0.5
theta_30 =  -7  ; theta_31 = 0.5; theta_32 = 0.9
phi_10 = 0.0; phi_11 = -2.0; phi_12 = 2.0; phi_13 = 1.5
phi_20 = -2.0; phi_21 = -1.0; phi_22 = -2.0; phi_23 = 0.8

x1 = np.arange(0.0, 10.0, 0.1)
x2 = np.arange(0.0, 10.0, 0.1)
x1,x2 = np.meshgrid(x1,x2)  # https://www.geeksforgeeks.org/numpy-meshgrid-function/

# これらの入力値に対してニューラルネットワークを実行
y1, y2, pre_1, pre_2, pre_3, act_1, act_2, act_3, w_act_11, w_act_12, w_act_13, w_act_21, w_act_22, w_act_23 = \
    shallow_2_2_3(x1,x2, ReLU, phi_10,phi_11,phi_12,phi_13, phi_20,phi_21,phi_22,phi_23, theta_10, theta_11, theta_12, theta_20, theta_21, theta_22, theta_30, theta_31, theta_32)
# そしてプロット
plot_neural_2_inputs_2_outputs(x1,x2, y1, y2, pre_1, pre_2, pre_3, act_1, act_2, act_3, w_act_11, w_act_12, w_act_13, w_act_21, w_act_22, w_act_23)