In [2]:
from sklearn.datasets import make_classification

x, t = make_classification(
    n_samples=1000,
    n_features=20,
    n_informative=2,
    n_redundant=0,
    n_classes=2,
    random_state=0
)

x.shape, t.shape

((1000, 20), (1000,))

In [22]:
import numpy as np
import matplotlib.pyplot as plt
from optimizer import SGD
from sklearn.datasets import make_classification
from two_layer_net import TwoLayerNet

# 하이퍼 파라미터 설정
max_epoch = 100
batch_size = 30
hidden_size = 10
learning_rate = 1.0

# 데이터 읽기, 모델과 옵티마이저 생성
x, t = make_classification(
    n_samples=1000,
    n_features=20,
    n_informative=2,
    n_redundant=0,
    n_classes=2,
    random_state=0
)

model = TwoLayerNet(input_size=20, hidden_size=hidden_size, output_size=2)
optimizer = SGD(lr=learning_rate)

# 학습에 사용하는 변수
data_size = len(x)
max_iters = data_size // batch_size
total_loss = 0
loss_count = 0
loss_list = []

for epoch in range(max_epoch):
    # 데이터 뒤섞기
    idx = np.random.permutation(data_size)
    x = x[idx]
    t = t[idx]

    for iters in range(max_iters):
        batch_x = x[iters*batch_size:(iters+1)*batch_size]
        batch_t = t[iters*batch_size:(iters+1)*batch_size]

        # 기울기를 구해 매개변수 갱신
        loss = model.forward(batch_x, batch_t)
        model.backward()
        optimizer.update(model.params, model.grads)

        total_loss += loss
        loss_count += 1

        # 정기적으로 학습 결과 출력
        if (iters+1) % 10 == 0:
            avg_loss = total_loss / loss_count
            print('| 에폭 %d | 반복 %d / %d | 손실 %.2f' %(epoch+1, iters+1, max_iters, avg_loss))
            loss_list.append(avg_loss)
            total_loss, loss_count = 0, 0

| 에폭 1 | 반복 10 / 33 | 손실 0.72
| 에폭 1 | 반복 20 / 33 | 손실 0.68
| 에폭 1 | 반복 30 / 33 | 손실 0.53
| 에폭 2 | 반복 10 / 33 | 손실 0.26
| 에폭 2 | 반복 20 / 33 | 손실 0.22
| 에폭 2 | 반복 30 / 33 | 손실 0.16
| 에폭 3 | 반복 10 / 33 | 손실 0.17
| 에폭 3 | 반복 20 / 33 | 손실 0.19
| 에폭 3 | 반복 30 / 33 | 손실 0.18
| 에폭 4 | 반복 10 / 33 | 손실 0.15
| 에폭 4 | 반복 20 / 33 | 손실 0.15
| 에폭 4 | 반복 30 / 33 | 손실 0.18
| 에폭 5 | 반복 10 / 33 | 손실 0.17
| 에폭 5 | 반복 20 / 33 | 손실 0.18
| 에폭 5 | 반복 30 / 33 | 손실 0.16
| 에폭 6 | 반복 10 / 33 | 손실 0.19
| 에폭 6 | 반복 20 / 33 | 손실 0.16
| 에폭 6 | 반복 30 / 33 | 손실 0.14
| 에폭 7 | 반복 10 / 33 | 손실 0.16
| 에폭 7 | 반복 20 / 33 | 손실 0.17
| 에폭 7 | 반복 30 / 33 | 손실 0.12
| 에폭 8 | 반복 10 / 33 | 손실 0.14
| 에폭 8 | 반복 20 / 33 | 손실 0.18
| 에폭 8 | 반복 30 / 33 | 손실 0.11
| 에폭 9 | 반복 10 / 33 | 손실 0.14
| 에폭 9 | 반복 20 / 33 | 손실 0.10
| 에폭 9 | 반복 30 / 33 | 손실 0.16
| 에폭 10 | 반복 10 / 33 | 손실 0.13
| 에폭 10 | 반복 20 / 33 | 손실 0.12
| 에폭 10 | 반복 30 / 33 | 손실 0.16
| 에폭 11 | 반복 10 / 33 | 손실 0.13
| 에폭 11 | 반복 20 / 33 | 손실 0.10
| 에폭 11 | 반복 30 / 33 | 손실 0.14
| 에폭

In [23]:
from layers import SigmoidWithLoss
criterion = SigmoidWithLoss()
oh_t = np.zeros((len(t), 2), dtype=int)
oh_t[np.arange(t.size), t] = 1
criterion.forward(model.predict(x), oh_t)

0.08156028821849906