#### mnist 파일 불러오기

In [9]:
import tensorflow as tf
from tensorflow import keras

import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
print(tf.__version__)   # Tensorflow의 버전을 출력

mnist = keras.datasets.mnist

# MNIST 데이터를 로드. 다운로드하지 않았다면 다운로드까지 자동으로 진행됩니다. 
(x_train, y_train), (x_test, y_test) = mnist.load_data()   

print(len(x_train))  # x_train 배열의 크기를 출력

img = x_train[0]

def img_show(img):
    pil_img = Image.fromarray(np.uint8(img))
    pil_img.show()
    
    
img_show(img)

img = x_train[10]
img_show(img)

2.17.0
60000


In [None]:
# load_mnist가 MNIST 데이터를 "(X_train y_train)(X_test, y_test)" 형식으로 반환한다.


# 인수로는 normalize, flatten, one_hot_label 세 가지를 설정할 수 있다.
# 세 인수 모두 bool값이다.


# 첫 번째 인수인 normalize는 입력 이미지의 픽셀 값을 0.0~1.0사이의 값으로 정규화 할지를 정한다.
# False로 설정하면 입력 이미지의 픽셀은 우너래 값 그대로 0~255 사이의 값을 유지한다.


# 두 번째 인수인 flatten은 입력 이미지를 평탄하게, 즉 1차원 배열로 만들지를 정한다.
# False로 설정하면 입력 이미지를 1*28*28의 3차원 배열로, 784개의 원소로 이뤄진 1차원 배열로 저장한다.


# 세 번째 인수인 one_hot_label은 레이블을 원-핫 인코딩 형태로 저장할지를 정한다. 
# 원-핫 인코딩이란, 예를 들어 [0,0,1,0,0,0]처럼 정답을 뜻하는 원소만 1이고 나머지는 모두 0인 배열이다.
# one_hot_label이 False면 '7'이나 '2'와 같이 숫자 형태의 레이블을 저장하고, True일 때는 레이블을 원-핫 인코딩하여 저장한다.


In [25]:
import numpy as np

# Sigmoid 함수
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

# ReLU 함수
def relu(x):
    return np.maximum(0, x)

# Softmax 함수
def softmax(x):
    c = np.max(x)
    exp_x = np.exp(x - c)  # overflow 방지
    sum_exp_x = np.sum(exp_x)
    return exp_x / sum_exp_x

In [44]:
import pickle 


def get_data():
    (x_train, t_train), (x_test, t_test) = mnist.load_data()
    return x_test, t_test

# sample_weight.pkl : 가중치와 편향 매개변수가 딕셔너리 변수로 저장되어 있음
def init_network():
    with open("sample_weight.pkl",'rb') as f :
        network = pickle.load(f)
        
    return network

def predict(network, x):
    W1, W2, W3 = network['W1'], network['W2'], network['W3']
    b1, b2, b3 = network['b1'], network['b2'], network['b3']
    
    x = x.flatten()
    
    a1 = np.dot(x, W1) + b1
    z1 = sigmoid(a1)
    
    a2 = np.dot(z1, W2) + b2
    z2 = sigmoid(a2)
    
    a3 = np.dot(z2, W3) + b3
    y = softmax(a3)
    
    return y
    

In [45]:
x, t = get_data()
network = init_network()

accuracy_cnt = 0

for i in range(len(x)):
    y = predict(network,x[i])
    p = np.argmax(y)    #확률이 가장 높은 원소의 인덱스얻기
    if p== t[i]:
        accuracy_cnt += 1
        
print(accuracy_cnt/len(x))

  return 1 / (1 + np.exp(-x))


0.9207


array([[[0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        ...,
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0]],

       [[0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        ...,
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0]],

       [[0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        ...,
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0]],

       ...,

       [[0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        ...,
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0]],

       [[0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        ...,
        [0, 0, 0, ..., 

In [46]:
print(x.shape)
print(28*28)
print(x[0].shape)
print(network['W1'].shape)
print(network['W2'].shape)
print(network['W3'].shape)

print(len(y))

(10000, 28, 28)
784
(28, 28)
(784, 50)
(50, 100)
(100, 10)
10
