컨볼루션 레이어 적용 전

In [None]:
'''
컨볼루션 레이어가 없기 때문에, Flatten을 하면 응용력이 전혀 없다.
같은 이미지여도 위치만 조금만 바뀌어도 같은 이미지라고 인식하지 못한다.
'''


import tensorflow as tf
import matplotlib.pyplot as plt

### 구글에 있는 데이터셋 가져오기
    # 이미지를 숫자로 변환할 때는 RGB 코드를 사용한다.
    # RGB 코드는 0부터 255까지 있다.
(trainX, trainY), (testX, testY) = tf.keras.datasets.fashion_mnist.load_data()

### 불러온 데이터 값 확인하기
# print(trainX[0])

### 데이터 크기 확인하기
# print(trainX.shape)

### 카테고리 분류
    # 불러온 데이터에서 숫자가 나오는데, 0이면 'T-shirt/top'
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']


model = tf.keras.Sequential([
    tf.keras.layers.Dense(128, input_shape = (28, 28), activation = "relu"),
    tf.keras.layers.Dense(64, activation = "relu"),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(10, activation = "softmax")
])

model.summary()

model.compile(optimizer="adam", loss="sparse_categorical_crossentropy", metrics=["accuracy"])

model.fit(trainX, trainY, epochs=10)

컨볼루션 레이어 + 맥스풀링 적용 (오류 발생 // Conv2D에 있는 게 4차원 데이터가 아니여서)

In [None]:
'''
컨볼루션 레이어 = 이미지에서 특징 추출해서 만든 레이어
맥스풀링 = 특징 추출한 것중에서도 중요한 것만 추린 레이어

컴볼루션 레이어 + 맥스풀링 = 평면화 되어도 응용력 있게 활용 가능한 레이어 

---

model = tf.keras.Sequential([
    # 32개의 복사본을 만들겠다, 3x3 크기로, 이미지 변형 안되게 똑같게 하겠다, 활성함수를 사용해 음수를 0으로 만들겠다, 이미지 개수를 제외한 나머지 값만 입력하겠다.
        input_shape = (28, 28, 1)이 4차원 데이터로 해석되는 이유?
            Conv2D에 위와 같은 값을 넣으면, (None, 28, 28, 1)처럼 해석된다.
    tf.keras.layers.Conv2D(32, (3,3), padding = 'same', activation = 'relu', input_shape = (28, 28, 1)),
    tf.keras.layers.MaxPooling2D((2,2)),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128, activation = "relu"),
    tf.keras.layers.Dense(10, activation = "softmax")
])

컴볼루션 레이어를 적용할 때는, 관습적으로 위와 같은 순서로 Sequential([])을 배치한다.


'''

import tensorflow as tf
import matplotlib.pyplot as plt

### 구글에 있는 데이터셋 가져오기
    # 이미지를 숫자로 변환할 때는 RGB 코드를 사용한다.
    # RGB 코드는 0부터 255까지 있다.
(trainX, trainY), (testX, testY) = tf.keras.datasets.fashion_mnist.load_data()

### 불러온 데이터 값 확인하기
# print(trainX[0])

### 데이터 크기 확인하기
# print(trainX.shape)

### 카테고리 분류
    # 불러온 데이터에서 숫자가 나오는데, 0이면 'T-shirt/top'
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']


model = tf.keras.Sequential([
    tf.keras.layers.Conv2D(32, (3,3), padding = 'same', activation = 'relu', input_shape = (28, 28, 1)),
    tf.keras.layers.MaxPooling2D((2,2)),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128, activation = "relu"),
    tf.keras.layers.Dense(10, activation = "softmax")
])

model.summary()

exit()

model.compile(optimizer="adam", loss="sparse_categorical_crossentropy", metrics=["accuracy"])

model.fit(trainX, trainY, epochs=10)

컨볼루션 레이어 + 맥스풀링 적용 (오류 해결)

In [None]:
'''
이전 코드에서 

trainX = trainX.reshape((trainX.shape[0], 28, 28, 1))
testX = testX.reshape((testX.shape[0], 28, 28, 1))

위 코드를 추가한다.

이는 Conv2D에 맞는 데이터 형태로 만들기 위한 작업이다.
    위와 같이 코드를 추가하면, 기존에 3차원이었던(60000, 28, 28) 데이터가 (60000, 28, 28, 1)이 된다.
        여기서 1은 '채널'을 말한다. 
            채널은 '각 픽셀에 대한 정보'라고 생각하면 된다.
                흑백 사진은 흑백의 밝기 밖에 없기 때문에 채널이 1이다.
                그런데 컬러 사진은 빨강, 파랑, 노랑(RGB)이기 때문에 채널이 3이다.
'''

import tensorflow as tf
import matplotlib.pyplot as plt

### 구글에 있는 데이터셋 가져오기
    # 이미지를 숫자로 변환할 때는 RGB 코드를 사용한다.
    # RGB 코드는 0부터 255까지 있다.
(trainX, trainY), (testX, testY) = tf.keras.datasets.fashion_mnist.load_data()

### 불러온 데이터 값 확인하기
# print(trainX[0])

### 데이터 크기 확인하기
# print(trainX.shape)

### 카테고리 분류
    # 불러온 데이터에서 숫자가 나오는데, 0이면 'T-shirt/top'
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']


trainX = trainX.reshape((trainX.shape[0], 28, 28, 1))
testX = testX.reshape((testX.shape[0], 28, 28, 1))

model = tf.keras.Sequential([
    tf.keras.layers.Conv2D(32, (3,3), padding = 'same', activation = 'relu', input_shape = (28, 28, 1)),
    tf.keras.layers.MaxPooling2D((2,2)),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128, activation = "relu"),
    tf.keras.layers.Dense(10, activation = "softmax")
])

model.summary()

model.compile(optimizer="adam", loss="sparse_categorical_crossentropy", metrics=["accuracy"])

model.fit(trainX, trainY, epochs=3)

오버피팅 문제

In [None]:
'''
실행해보면, epochs에서 나온 accuracy와 evaluate에서 나온 accuracy 값이 다른 걸 알 수 있다.
    epochs에서 나온 accuracy 값이 더 높다. 이는 모델이 트레이닝 데이터 자체에 너무 익숙해 진 거 일수도 있다.
        그래서 새로운 데이터를 넣은 evaluate 데이터에는 높은 예측 확률을 보이지 못한 것이다.
            이를 어려운 말로 오버피팅이라고 한다.
'''


import tensorflow as tf
import matplotlib.pyplot as plt

### 구글에 있는 데이터셋 가져오기
    # 이미지를 숫자로 변환할 때는 RGB 코드를 사용한다.
    # RGB 코드는 0부터 255까지 있다.
(trainX, trainY), (testX, testY) = tf.keras.datasets.fashion_mnist.load_data()

### 불러온 데이터 값 확인하기
# print(trainX[0])

### 데이터 크기 확인하기
# print(trainX.shape)

### 카테고리 분류
    # 불러온 데이터에서 숫자가 나오는데, 0이면 'T-shirt/top'
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']


trainX = trainX.reshape((trainX.shape[0], 28, 28, 1))
testX = testX.reshape((testX.shape[0], 28, 28, 1))

model = tf.keras.Sequential([
    tf.keras.layers.Conv2D(32, (3,3), padding = 'same', activation = 'relu', input_shape = (28, 28, 1)),
    tf.keras.layers.MaxPooling2D((2,2)),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128, activation = "relu"),
    tf.keras.layers.Dense(10, activation = "softmax")
])

model.summary()

model.compile(optimizer="adam", loss="sparse_categorical_crossentropy", metrics=["accuracy"])

model.fit(trainX, trainY, epochs=3)

score = model.evaluate(testX, testY)
score

오버피팅 문제 해결

In [4]:
'''
model.fit(trainX, trainY, validation_data=(testX, testY), epochs=3)

모델을 학습 시킬 때 'validation_data=(testX, testY)'라는 인자를 넣었다.
    이는 모델한테 'validation_data에 넣은 데이터를 참고해서 학습해'라고 말하는 거다.
        그래서 최종 결과 값은 epochs의 accuracy와 evaluate의 accuracy가 별 차이 없는 거다.

'''


import tensorflow as tf
import matplotlib.pyplot as plt

### 구글에 있는 데이터셋 가져오기
    # 이미지를 숫자로 변환할 때는 RGB 코드를 사용한다.
    # RGB 코드는 0부터 255까지 있다.
(trainX, trainY), (testX, testY) = tf.keras.datasets.fashion_mnist.load_data()

### 불러온 데이터 값 확인하기
# print(trainX[0])

### 데이터 크기 확인하기
# print(trainX.shape)

### 카테고리 분류
    # 불러온 데이터에서 숫자가 나오는데, 0이면 'T-shirt/top'
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']


trainX = trainX.reshape((trainX.shape[0], 28, 28, 1))
testX = testX.reshape((testX.shape[0], 28, 28, 1))

model = tf.keras.Sequential([
    tf.keras.layers.Conv2D(32, (3,3), padding = 'same', activation = 'relu', input_shape = (28, 28, 1)),
    tf.keras.layers.MaxPooling2D((2,2)),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128, activation = "relu"),
    tf.keras.layers.Dense(10, activation = "softmax")
])

model.summary()

model.compile(optimizer="adam", loss="sparse_categorical_crossentropy", metrics=["accuracy"])

model.fit(trainX, trainY, validation_data=(testX, testY), epochs=3)

score = model.evaluate(testX, testY)
score

Model: "sequential_3"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d_3 (Conv2D)           (None, 28, 28, 32)        320       
                                                                 
 max_pooling2d_3 (MaxPoolin  (None, 14, 14, 32)        0         
 g2D)                                                            
                                                                 
 flatten_3 (Flatten)         (None, 6272)              0         
                                                                 
 dense_6 (Dense)             (None, 128)               802944    
                                                                 
 dense_7 (Dense)             (None, 10)                1290      
                                                                 
Total params: 804554 (3.07 MB)
Trainable params: 804554 (3.07 MB)
Non-trainable params: 0 (0.00 Byte)
__________________

[0.32329580187797546, 0.8852999806404114]