In [None]:
# MNIST

# MNIST 데이터셋은 미국 국립표준기술원(NIST)이 고등학생과 인구조사국 직원 등이 쓴 손글씨를
# 이용해 만든 데이터로 구성되어 있다.
# 70,000개의 글자 이미지에 각각 0부터 9까지 이름표를 붙인 데이터셋으로, 머신러닝을 배우는 사람
# 이라면 자신의 알고리즘과 다른 알고리즘의 성과를 비교해 보고자 한 번씩 도전해 보는 가장 유명핚
# 데이터 중 하나이다.
# 각 이미지는 28 * 28 픽셀 크기로 되어있다.

# Mnist 데이터셋에는 총 70,000개의 데이터가 있는데, 이 데이터는 크게 아래와 같이 세종류의 데이터
# 셋으로 나눠 진다.
# 모델 학습을 위한 학습용 데이터인 mnist.train 그리고, 학습된 모델을 테스트하기 위한 테스트 데이터
# 셋은 minst.test, 그리고 모델을 확인하기 위핚 mnist.validation 데이터셋으로 구별된다.
# 각 데이터는 학습용 데이터 55,000개, 테스트용 10,000개, 그리고, 모델 확인용 데이터
# 5000개로 구성되어 있다.

MNIST 이미지 기본

# 학습데이터의 크기 : 60000개
print(x_train.shape) # (60000, 28, 28)

# 테스트 데이터 크기 : 10000개
print(x_test.shape) # (10000, 28, 28)

# 첫번째 이미지(5) 출력 : 배열로 출력 ( 0 ~ 255 )
print(x_train[0])

# 첫번째 이미지 라벨 출력 : 5
print(y_train[0]) # 5

print('학습셋 이미지 수: %d 개' %(x_train.shape[0])) # 학습셋 이미지 수: 60000 개
print('테스트셋 이미지 수: %d 개' %(x_test.shape[0])) # 테스트셋 이미지 수: 10000 개


In [None]:
# MNIST 예제

from tensorflow.keras.datasets import mnist
import matplotlib.pyplot as plt

# MNIST 데이터(학습데이터, 테스트데이터) 불러오기
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 학습데이터의 크기: 60000개
print(x_train.shape) # (60000, 28, 28)
print(y_train.shape) # (60000,)

# 테스트 데이터 크기 : 10000개
print(x_test.shape) # (10000, 28, 28)
print(y_test.shape) # (10000,)

print('학습셋 이미지 수: %d 개' %(x_train.shape[0])) # 학습셋 이미지 수: 60000 개
print('테스트셋 이미지 수: %d 개' %(x_test.shape[0])) # 테스트셋 이미지 수: 10000 개

# 첫번째 이미지 출력: 배열로 출력(0~255)
print(x_train[0])

# 그래픽으로 첫번째 이미지 출력
plt.imshow(x_train[0])

# plt.imshow(x_train[0], cmap='Greys')    # 흑백 이미지
plt.show()

# 첫번째 이미지 라벨 출력: 5
print(y_train[0])

# MNIST 데이터 중 10장만 표시
for i in range(10):
  plt.subplot(2,5, i+1)     # 2행 5열로 이미지 배치
  plt.title('M_%d' %i)
  plt.axis('off')
  plt.imshow(x_train[i], cmap=None)
  # plt.imshow(x_train[i], cmap='Greys')
plt.show()



In [None]:
# MNIST 이미지 예측하기

from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Activation

import numpy as np
import tensorflow as tf

# seed 값 설정
seed=0
np.random.seed(seed)
tf.random.set_seed(seed)

# 1.데이터 셋 생성하기

# 훈련셋과 시험셋 불러오기
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 데이터셋 전처리: 이미지 정규화(0~255 --> 0~1)
x_train = x_train.reshape(60000, 784).astype('float32')/255.0
x_test = x_test.reshape(10000, 784).astype('float32')/255.0

# 원핫인코딩(one-hot-encoding) 처리
y_train = tf.keras.utils.to_categorical(y_train)
y_test = tf.keras.utils.to_categorical(y_test)
print(y_train[0])   # MNIST의 첫번째 이미지(5)의 원핫인코딩: [0. 0. 0. 0. 0. 1. 0. 0. 0. 0.]

# 2. 모델 구성하기
model = Sequential()
model.add(Dense(64, input_dim=28*28, activation='relu'))    # 입력 28*28, 출력 node 64개
model.add(Dense(10, activation='softmax'))    # 입력 node 64개, 출력 node 10개(0~9)

# 3.모델 학습과정 설정하기
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# 4.모델 학습 시키기
hist = model.fit(x_train, y_train, epochs=5, batch_size=32)

# 5.학습 과정 살펴보기
# 5번 학습후 loss와 accuracy 결과 출력
print('# train loss and accuracy #')
print(hist.history['loss'])
print(hist.history['accuracy'])

# 6.모델 평가하기
loss_and_metrics = model.evaluate(x_test, y_test, batch_size=32)
print('# evaluation loss and metrics #')
print(loss_and_metrics)

# 결과
# [0.08869773894548416, 0.9749000072479248]

In [None]:
# MNIST 응용 예제
# mnist 데이터셋으로 학습한 모델을 파일로 저장한다.
# 케라스에서는 제공되는 save() 함수로 학습한 모델을 ‘h5’ 파일 형태로 저장할 수 있다.

# 학습한 모델 저장하기
model.save('mnist_mlp_model.h5')

# 학습한 모델 불러오기
from tensorflow.keras.models import load_model
model = load_model('mnist_mlp_model.h5')

In [None]:
# 학습한 모델 저장하기

from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Activation
import numpy as np
import tensorflow as tf

# seed 값 설정
seed = 0
np.random.seed(seed)
tf.random.set_seed(seed)

# 1. 데이터셋 생성하기
# 훈련셋과 시험셋 불러오기
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 데이터셋 전처리
x_train = x_train.reshape(60000, 784).astype('float32') / 255.0
x_test = x_test.reshape(10000, 784).astype('float32') / 255.0

# 원핫인코딩 (one-hot encoding) 처리
y_train = tf.keras.utils.to_categorical(y_train)
y_test = tf.keras.utils.to_categorical(y_test)

# 2. 모델 구성하기
model = Sequential()
model.add(Dense(units=64, input_dim=28*28, activation='relu'))
model.add(Dense(units=10, activation='softmax'))

# 3. 모델 학습과정 설정하기
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# 4. 모델 학습시키기
model.fit(x_train, y_train, epochs=5, batch_size=32)

# 5. 모델 평가하기
loss_and_metrics = model.evaluate(x_test, y_test, batch_size=32)
print('')
print('loss_and_metrics : ' + str(loss_and_metrics))

# 6. 모델 저장하기
from tensorflow.keras.models import load_model
model.summary()
model.save("/content/drive/My Drive/Colab Notebooks/mnist_mlp_model.h5") # 학습된 모델 저장하기



In [None]:
# 학습한 모델 불러오기, 모델 적용하기

# X server 문제 해결 코드
import os
os.environ["CUDA_VISIBLE_DEVICES"] = "1"

import numpy as np
import cv2
from tensorflow.keras.models import load_model

print('Loding model...')
model = load_model('/content/drive/My Drive/Colab Notebooks/mnist_mlp_model.h5')  # 학습된 모델 불러오기
print('Loding complete!')

onDown = False

xprev, yprev = None, None

def onmouse(event, x, y, flags, params):    # 마우스 이벤트 처리 함수
  global onDown, img, xprev, yprev
  if event == cv2.EVENT_MOUSEDOWN:          # 왼쪽 마우스 눌렀을 경우
    # print('DOWN: {0}, {1}'.format(x,y))
    onDown = True
  elif event == cv2.EVENT_MOUSEMOVE:        # 마우스 움직일 경우
    if onDown == True:
      print('MOVE: {0}, {1}'.format(x,y))
      cv2.line(img, (xprev,yprev), (x,y), (255,255,255), 20)
    elif event == cv2.EVENT_LBUTTONUP:      # 왼쪽 마우스 누르고 뗐을 때
      print('UP: {0}, {1]'.format(x,y))
      onDown = False
    xprev, yprev = x, y

cv2.namedWindow('image')                    # 윈도우 창의 title
cv2.setMouseCallback('image', onmouse)      # onmouse() 함수 호출
width, height = 280, 280
img = np.zeros((280,280,3), np.unit8)

while Ture:
  cv2.imshow('image', img)
  key = cv2.waitKey(1)

  if key == ord('r'):     # r버튼 클릭: clear
    img = np.zeros((280,280,3), np.unit8)
    print('clear')
  
  if key == ord('s'):     # s버튼 클릭: 예측값 출력
    x_resize = cv2.resize(img, dsize=(28,28), interpolation=cv2.INTER_AREA)
    x_gray=cv2.cvtColor(x_resize, cv2.COLOR_BGR2GRAY)
    x=x_gray.reshape(1, 28*28)
    y=model.predict_classes(x)    # 모델에서 예측값 구해오기
    print(y)                      # 예측값 출력

  if key == ord('q'):     # q버튼 클릭: 종료
    print('Good bye')
    break
cv2.destroyAllWindows()   # 윈도우 종료


