## 밑바닥부터 시작하는 딥러닝

## 3장 Mnist 예제

### 3.6 손글자 숫자 인식

Mnist 데이터를 이용해서 forward 알고리즘의 과정을 이해해보자

Mnist 데이터 셋은 기계학습 분야에서 유명한 데이터 셋으로 기계학습 알고리즘을 테스트 할때 실험용 데이터로 많이 쓰인다.

0 ~ 9까지 숫자 이미지로 구성이 되어있고, 훈련 이미지 60,000장 테스트 이미지 10,000장이 있다. 

데이터 셋의 크기는 28 X 28 크기 회색(1채널)이고 각 픽셀은 0 ~ 255값으로 되어있다.

#### 책에서 제공하는 데이터셋을 import 해보자!

In [3]:
import sys, os
sys.path.append(os.pardir)
from dataset.mnist import load_mnist

# (훈련이미지, 훈련레이블) (테스트 이미지, 테스트 레이블))
(x_train, t_train), (x_test, t_test) = load_mnist(flatten=True, normalize=False)


# 불러온 데이터들의 shape를 확인
print(x_train.shape)
print(t_train.shape)
print(x_test.shape)
print(t_test.shape)

(60000, 784)
(60000,)
(10000, 784)
(10000,)


#### Mnist 이미지를 화면으로 불러오기

In [4]:
import sys, os
sys.path.append(os.pardir)
import numpy as np
from dataset.mnist import load_mnist
from PIL import Image


def img_show(img):
    pil_img = Image.fromarray(np.uint8(img))
    pil_img.show()
    
(x_train, t_train) , (x_test, t_test) = load_mnist(flatten=True, normalize= False)

img = x_train[0]
label = t_train[0]
print(label) # 5

print(img.shape) # (784, )
img = img.reshape(28, 28) # 원래 이미지 모양으로 변경한다.
print(img.shape) # 원래 이미지를 출력

img_show(img)

5
(784,)
(28, 28)


### 신경망 추론처리

Mnist 데이터셋으로 신경망 추론을 구현해 봅시다.

구현할 신경망은 입력층 28 X 28 = 784

출력층은 10개 0 ~ 9 까지 숫자 갯수

그러면 히든레이어는??

첫번째 히든레이어는 50개 뉴런

두번째 히든레이어는 100개 뉴런을 배치!!

In [6]:
import pickle
sys.path.insert(0, './deep-learning-from-scratch/')
#sys.path.append(os.pardir)  # 부모 디렉터리의 파일을 가져올 수 있도록
from common.functions import sigmoid, softmax
#def sigmoid(x):
#    return 1 / (1 + np.exp(-x)) 

def get_data():
    (x_train, t_train), (x_test, t_test) = load_mnist(normalize = True, flatten=True, one_hot_label = False)
    
    return x_test, t_test

def init_network():
    with open("./deep-learning-from-scratch/ch03/sample_weight.pkl", 'rb') as f:
        network = pickle.load(f)
        
    return network

def predict(network, x):
    W1, W2, W3 = network['W1'], network['W2'], network['W3']
    b1, b2, b3 = network['b1'], network['b2'], network['b3']
    
    a1 = np.dot(x, W1) + b1
    z1 = sigmoid(a1)
    a2 = np.dot(z1, W2) + b2
    z2 = sigmoid(a2)
    a3 = np.dot(z2, W3) + b3
    y = softmax(a3)
    
    return y

In [7]:

x , t = get_data()

network = init_network()

accuracy_cnt = 0

for i in range(len(x)):
    y = predict(network, x[i])
    p= np.argmax(y) # 확률이 가장 높은 원소의 인덱스를 얻는다.
    if p == t[i]:
        accuracy_cnt += 1

print("Accuracy:" + str(float(accuracy_cnt) / len(x)))

Accuracy:0.9352
