In [None]:
# 사용할 모듈 like include
from tensorflow.keras.datasets import cifar10
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten
from tensorflow.keras.utils import to_categorical
import matplotlib.pyplot as plt

# cifar10 데이터 로드, 유명한 데이터들은 keras 라이브러리에서 다운로드 가능
# 32 x 32, 10개 클래스, 60000장 이미지 (각 클래스 당 6000장, 5000 for training, 1000 for testing)
# 28x28 크기, 784 픽셀
# x_train:학습용 이미지,  y_train:학습용 이미지 레이블,  x_test:테스트용 이미지,  y_test:테스트용 이미지 레이블
labels = ['비행기', '자동차', '새', '고양이', '사슴', '개', '개구리', '말', '배', '트럭']
(x_train, y_train), (x_test, y_test) = cifar10.load_data()


Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz


In [None]:
print(x_train.shape)  # (50000, 32, 32, 3)
print(x_test.shape)  # (10000, 32, 32, 3)
print(y_train.shape)  # (50000, 1)
print(y_test.shape)  # (10000, 1)


In [None]:
plt.figure()
plt.imshow(x_train[0])
plt.show()

print(y_train[0][0])

print(labels[y_train[0][0]])

In [None]:
# 픽셀 값(0~255) to (0~1)
x_train = x_train / 255.0
x_test = x_test / 255.0

In [None]:
num_classes = 10    # 분류할 클래스 개수

# one-hot encoding : 0~9 라벨을 10차원 0,1 벡터로 표현 예) 3 --> (0, 0, 0, 1, 0, 0, 0, 0, 0, 0)
y_train = to_categorical(y_train, num_classes)
y_test = to_categorical(y_test, num_classes)

print(y_train[0])

print(y_train.shape)  # (50000, 10)
print(y_test.shape)  # (10000, 10)

In [None]:
# 순차모델
model = Sequential()
model.add(Flatten(input_shape = (32, 32, 3)))  # in : (32, 32, 3), out : 3072
model.add(Dense(1024, activation='relu'))    # in : 3072, out : 1024
model.add(Dense(128, activation='relu'))    # in : 1024, out : 128
model.add(Dense(num_classes, activation='softmax'))   # in : 128, out : 10
# Dense : Fully Connected Layer
# activation : 활성화 함수, 노드에 들어오는 값들에 대해 곧바로 다음 레이어로 전달하지 않고 주로 비선형 함수를 통과시킨 후 전달, 
# 비선형 함수를 사용하는 이유는 선형함수를 사용할 시 층을 깊게 하는 의미가 줄어들기 때문, relu, tanh, leakyrelu, softmax 등..
# relu : 최근 가장 많이 사용되는 활성화 함수
# softmax : 입력받은 값을 0~1사이의 값으로 모두 정규화하며 출력 값들의 총합은 항상 1이 되는 특성을 가진 활성화 함수, 분류용!

In [None]:
# 모델 출력
model.summary()

In [None]:
# 학습 방법
# loss : 손실함수, 일반적으로 회귀문제에서는 MSE('mean_squared_error'), 분류문제에서는 Cross Entropy Error('crossentropy')를 활용
# optimizer : 모델 업데이트 방법, 손실함수를 최소화 하는 매개변수를 찾는 과정, Adam, SGD, RMSprop 등..
# metrics : 훈련 단계와 테스트 단계를 모니터링하기 위해 사용
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

In [None]:
# 학습
# batch_size : 한번에 학습할 데이터의 갯수, 학습속도 vs 메모리
# epochs : 전체 데이터를 몇 번 반복해서 학습 시킬 것인가
# validation_data : 학습 중에 테스트할 데이터
history = model.fit(x_train, y_train, batch_size=128, epochs=30, verbose=1, validation_data=(x_test, y_test))

In [None]:
# 테스트 이미지
test_imgs = x_test[:5]

In [None]:
# 모델 테스트
pred_num = model.predict(test_imgs)


In [None]:
# 확인
for i, img in enumerate(test_imgs):
    plt.figure()
    plt.imshow(img)
    plt.show()
    class_num = pred_num[i].argmax()
    print(labels[class_num])