<a href="https://colab.research.google.com/github/udlbook/udlbook/blob/main/Notebooks/Chap03/3_3_Shallow_Network_Regions.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **ノートブック 3.3 -- 浅層ネットワークの領域**

このノートブックの目的は、書籍の図3.9に示されている線形領域の最大可能数を計算することです。

以下のセルを順番に実行してください。様々な場所で「TODO」という文字が表示されます。これらの場所では指示に従ってコードを書き、関数を完成させてください。テキストの中には質問も散りばめられています。

間違いを見つけたり、提案がある場合は、udlbookmail@gmail.com までご連絡ください。

In [None]:
# 数学ライブラリをインポート
import numpy as np
# プロットライブラリをインポート
import matplotlib.pyplot as plt
# 数学ライブラリをインポート
import math

$D_i$個の入力と$D$個の隠れユニットを持つ浅層ニューラルネットワークによって作成される領域数$N$は、Zaslavskyの公式によって与えられます：

\begin{equation}N = \sum_{j=0}^{D_{i}}\binom{D}{j}=\sum_{j=0}^{D_{i}} \frac{D!}{(D-j)!j!} \end{equation} 



In [None]:
def number_regions(Di, D):
  # TODO -- Zaslavskyの公式を実装してください
  # math.comb()を使用できます https://www.w3schools.com/python/ref_math_comb.asp
  # このコードを置き換えてください
  N = 1;

  return N

In [None]:
# 図3.8jのように2次元入力（Di=2）と3つの隠れユニット（D=3）の領域数を計算
N = number_regions(2, 3)
print(f"Di=2, D=3, 領域数 = {int(N)}, 真の値 = 7")

In [None]:
# 10次元入力（Di=10）と50個の隠れユニット（D=50）の領域数を計算
N = number_regions(10, 50)
print(f"Di=10, D=50, 領域数 = {int(N)}, 真の値 = 13432735556")

これは機能しますが、複雑な問題があります。隠れユニット数$D$が入力次元数$D_i$より少ない場合、公式は失敗します。この場合、領域数は$2^D$個だけになります（理由を理解するには図3.10を参照してください）。

これを実演してみましょう：

In [None]:
# 実装方法によっては、$D_i > D$の場合に計算が失敗することがあります（心配無用...）
try:
  N = number_regions(10, 8)
  print(f"Di=10, D=8, 領域数 = {int(N)}, 真の値 = 256")
except Exception as error:
    print("例外が発生しました:", error)

In [None]:
# D<Diの場合の計算を適切に行いましょう（書籍の図3.10を参照）
D = 8; Di = 10
N = np.power(2,D)
# 同等にDを2回使ってnumber_regionsを呼び出すこともできます
# なぜこれが機能するかを考えてみてください
N2 = number_regions (D,D)
print(f"Di=10, D=8, 領域数 = {int(N)}, 領域数 = {int(N2)}, 真の値 = 256")

In [None]:
# 図3.9aのグラフをプロットしましょう
dims = np.array([1,5,10,50,100])
regions = np.zeros((dims.shape[0], 1000))
for c_dim in range(dims.shape[0]):
    D_i = dims[c_dim]
    print (f"{D_i}入力次元の領域数を計算中")
    for D in range(1000):
        regions[c_dim, D] = number_regions(np.min([D_i,D]), D)

fig, ax = plt.subplots()
ax.semilogy(regions[0,:],'k-')
ax.semilogy(regions[1,:],'b-')
ax.semilogy(regions[2,:],'m-')
ax.semilogy(regions[3,:],'c-')
ax.semilogy(regions[4,:],'y-')
ax.legend(['$D_i$=1', '$D_i$=5', '$D_i$=10', '$D_i$=50', '$D_i$=100'])
ax.set_xlabel("隠れユニット数, D")
ax.set_ylabel("領域数, N")
plt.xlim([0,1000])
plt.ylim([1e1,1e150])
plt.show()

In [None]:
# 図3.9bのようにパラメータ数の関数として領域数を計算してプロットしましょう
# まず入力次元と隠れユニット数の関数としてパラメータ数を計算する関数を書きましょう（出力が1つだけと仮定）

def number_parameters(D_i, D):
  # TODO -- このコードを適切な計算に置き換えてください
  N = 1

  return N ;

In [None]:
# コードをテストしましょう
N = number_parameters(10, 8)
print(f"Di=10, D=8, パラメータ数 = {int(N)}, 真の値 = 97")

In [None]:
# 図3.9bのグラフをプロットしましょう（約1分かかります）
dims = np.array([1,5,10,50,100])
regions = np.zeros((dims.shape[0], 200))
params = np.zeros((dims.shape[0], 200))

# 処理を高速化するために、今回は5つの線を別々に計算します
for c_dim in range(dims.shape[0]):
    D_i = dims[c_dim]
    print (f"{D_i}入力次元の領域数を計算中")
    for c_hidden in range(1, 200):
        # 異なる入力サイズに対して異なる範囲の隠れ変数数を反復処理
        D = int(c_hidden * 500 / D_i)
        params[c_dim, c_hidden] =  D_i * D +D + D +1
        regions[c_dim, c_hidden] = number_regions(np.min([D_i,D]), D)

fig, ax = plt.subplots()
ax.semilogy(params[0,:], regions[0,:],'k-')
ax.semilogy(params[1,:], regions[1,:],'b-')
ax.semilogy(params[2,:], regions[2,:],'m-')
ax.semilogy(params[3,:], regions[3,:],'c-')
ax.semilogy(params[4,:], regions[4,:],'y-')
ax.legend(['$D_i$=1', '$D_i$=5', '$D_i$=10', '$D_i$=50', '$D_i$=100'])
ax.set_xlabel("パラメータ数, D")
ax.set_ylabel("領域数, N")
plt.xlim([0,100000])
plt.ylim([1e1,1e150])
plt.show()