In [None]:
import numpy as np
import matplotlib.pyplot as plt

In [None]:
%matplotlib inline

## numpyの操作 復習

In [None]:
# 同じ要素数のベクトルを2つ、作ってみる
a = np.array([1, 2, 3], dtype=np.float32)

In [None]:
b = np.array([0, 1, 2], dtype=np.float32)

In [None]:
# 2つを足し算
a + b

In [None]:
# 2つを要素毎に掛け算
a * b

In [None]:
# 内積
np.dot(a, b)

In [None]:
a.dot(b)

In [None]:
# 行列を1つ 作ってみる（3×2 など）
m = np.array([[1, 2], [2, 3], [3, 4]], dtype=np.float32)
m

In [None]:
# 右下隅の要素を表示
m[2, 1]

In [None]:
# 1行目だけ表示
m[0, :]

In [None]:
# 1列目だけ表示
m[:, 0]

In [None]:
# shapeは？
m.shape

In [None]:
# 全要素数は？
m.size

In [None]:
# 軸の数は？
m.ndim

In [None]:
# 行列 m2を作り、先の mとの積をとってみる（shapeは、mと整合するように決める）

In [None]:
m2 = np.array([[-2, -1, 0, 1], [1, 1, 1, 1]], dtype=np.float32)
m2

In [None]:
np.dot(m, m2)

## binary_classification

In [None]:
# データ読み込み
data = np.load(open("binary_classification_data.npz", "br"))
data_x = data["input"]
result = data["label"]

# data_x： 入力変数
#   カラム0： x座標（-4〜4の範囲）
#   カラム1： y座標（-4〜4の範囲）
# result： 正解ラベル、0 or 1

In [None]:
# 入力変数のshape
data_x.shape

In [None]:
# 入力変数 最初の20件
data_x[:20]

In [None]:
# 正解ラベルのshape
result.shape

In [None]:
# 正解ラベル 最初の20件
result[:20]

In [None]:
# ラベルが "1" の件数
np.sum(result == 1)

In [None]:
# データの分布を可視化、青い点が 1、灰色の点が 0
pos_x_ar = data_x[result == 1, 0]
pos_y_ar = data_x[result == 1, 1]
neg_x_ar = data_x[result == 0, 0]
neg_y_ar = data_x[result == 0, 1]

plt.scatter(pos_x_ar, pos_y_ar)
plt.scatter(neg_x_ar, neg_y_ar, c="lightgray")

In [None]:
# シグモイド関数を用意
def sigmoid(x):
    return 1. / (1 + np.exp(-x))

In [None]:
# 結果レポート用の関数を用意
def report(y, rec_num=10):
    cnt = 0
    for i, y_val in enumerate(y[:rec_num]):
        x = data_x[i]
        result_val = result[i]

        if y_val > 0.5:
            pred = 1
        else:
            pred = 0

        print("x {:.03f}、y {:.02f} → 1の確率： {:.03f}、予測： {}, 正解： {}".format(
                x[0], x[1], y_val, pred, result_val))
        
    print("")
    print("全体での合致数： {}".format(np.sum((y > 0.5) == result)))

In [None]:
# 3層のニューラルネット、パラメータ
W1_list = [[-2.256, -4.61, -7.32, -4.58,  2.41, -4.74], 
        [4.68, -1.96, -3.16, -2.69, -5.02, -3.25]]
b1_list = [-6.52, 16.10, -0.302, 8.94, -2.24, -9.89]
w2_list = [-15.22, 16.31, 13.33, -15.15, -15.33, -14.27]
b2_scalar = -5.22

In [None]:
# パラメータの準備

W1 = np.array(W1_list, dtype=np.float32)
b1 = np.array(b1_list, dtype=np.float32)

w2 = np.array(w2_list, dtype=np.float32)
b2 = np.array(b2, dtype=np.float32)

# 実際の計算
a1 = np.dot(data_x, W1) + b1
h = sigmoid(a1)

a2 = np.dot(h, w2) + b2
y = sigmoid(a2)

# 結果レポート
report(y, 20)

In [None]:
# モデル 1層目のdecision boundaryを可視化

x_val = np.linspace(-4, 4, 101)
for i in range(6):
    a_coef = - W1[0, i] / W1[1, i]
    b_coef = - b1[i] / W1[1, i]
    y_val = a_coef * x_val + b_coef
    plt.plot(x_val, y_val, c="#eea29a", linewidth=3)
    
plt.scatter(pos_x_ar, pos_y_ar)
plt.scatter(neg_x_ar, neg_y_ar, c="lightgray")

plt.ylim([-4, 4])