In [2]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow import keras

In [3]:
train_datagen = ImageDataGenerator(rescale=1./255, shear_range=0.2, zoom_range=0.2, horizontal_flip=True)
# 값을 255로 나눠서 모든 픽셀 하나하나에 특징 스케일링 적용 => 픽셀 = 0~255 이것을 255로 나누면 값이 0~1 사이 (필수적)
# 훈련세트 이미지들에 이미지 증대 / 과적합 예방 => shear_range, zoom_range, horizontal_flip


# 이미지 증대 도구를 훈련세트의 이미지에 연결
train_data = train_datagen.flow_from_directory("../../../data/cnn/training_set", target_size=(64, 64), batch_size=32, class_mode='binary')
# 이미지의 최종 크기, 컨볼루션 신경망에 입력될 이미지
# 배치의 크기로 각 배치에 들어가는 이미지의 장수 / 32는 전형적인 기본값
# binary / categorical 중 하나 -> 이진 결과 = binary

test_datagen = ImageDataGenerator(rescale=1./255)
test_data = test_datagen.flow_from_directory("../../../data/cnn/test_set", target_size=(64, 64), batch_size=32, class_mode='binary')

Found 8000 images belonging to 2 classes.
Found 2000 images belonging to 2 classes.


In [4]:
#building the CNN
model = keras.Sequential()

#Convolution
model.add(keras.layers.Conv2D(filters=32, kernel_size=3, activation='relu', input_shape=[64, 64, 3]))

#Pooling
model.add(keras.layers.MaxPool2D(pool_size=2, strides=2))
model.add(keras.layers.Conv2D(filters=32, kernel_size=3, activation='relu'))
model.add(keras.layers.MaxPool2D(pool_size=2, strides=2))

#Adding a second convolution layer
model.add(keras.layers.Flatten())

#Full Connection
model.add(keras.layers.Dense(units=128, activation='relu'))

#Output Layer
model.add(keras.layers.Dense(units=1, activation='sigmoid')) #units=1 -> 최종 출력 계층의 뉴련 숫자 / 이진 분류(0, 1)

model.summary()

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


In [5]:
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

model.fit(x = train_data, validation_data=test_data, epochs = 25) #validation_data=cnn을 평가하려는 세트

checkpoint_cb = keras.callbacks.ModelCheckpoint('cat-cnn-model.keras', save_best_only=True)
early_stopping_cb = keras.callbacks.EarlyStopping(patience=2, restore_best_weights=True)

history = model.fit(x=train_data, validation_data=test_data, epochs=20, callbacks=[checkpoint_cb, early_stopping_cb])

Epoch 1/25


  self._warn_if_super_not_called()


[1m250/250[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m13s[0m 51ms/step - accuracy: 0.5436 - loss: 0.7665 - val_accuracy: 0.5890 - val_loss: 0.6665
Epoch 2/25
[1m250/250[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 49ms/step - accuracy: 0.6499 - loss: 0.6293 - val_accuracy: 0.6795 - val_loss: 0.5932
Epoch 3/25
[1m250/250[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m13s[0m 49ms/step - accuracy: 0.6907 - loss: 0.5798 - val_accuracy: 0.7000 - val_loss: 0.5793
Epoch 4/25
[1m250/250[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m13s[0m 51ms/step - accuracy: 0.7153 - loss: 0.5633 - val_accuracy: 0.7355 - val_loss: 0.5443
Epoch 5/25
[1m250/250[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m13s[0m 50ms/step - accuracy: 0.7310 - loss: 0.5517 - val_accuracy: 0.7280 - val_loss: 0.5427
Epoch 6/25
[1m250/250[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m13s[0m 50ms/step - accuracy: 0.7265 - loss: 0.5327 - val_accuracy: 0.7320 - val_loss: 0.5252
Epoch 7/25
[1m250/250[0m 

KeyboardInterrupt: 

In [9]:
model = keras.Sequential()

model.add(keras.layers.Conv2D(32, kernel_size=3, activation='relu', padding='same', input_shape=(64, 64, 3)))
model.add(keras.layers.MaxPooling2D(2))
model.add(keras.layers.Conv2D(64, kernel_size=3, activation='relu', padding='same'))
model.add(keras.layers.MaxPooling2D(2))

model.add(keras.layers.Flatten())
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dropout(0.4))
model.add(keras.layers.Dense(1, activation='sigmoid'))

model.summary()

In [None]:
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
# loss='sparse_categorical_crossentropy': 다중 클래스 분류 문제에서 사용 / 클래스 레이블이 정수로 인코딩된 경우에 유
# categorical_crossentropy: 다중 클래스 분류 문제에서 레이블이 원-핫 인코딩된 경우
# binary_crossentropy: 이진 분류 문제에서 사용됩니다
# mean_squared_error: 회귀 문제 / 예측값과 실제값 간의 제곱 차이를 평균한 값
# mean_absolute_error: 회귀 문제 / 예측값과 실제값 간의 절대 차이를 평균한 값

model.fit(x = train_data, validation_data=test_data, epochs = 25) #validation_data=cnn을 평가하려는 세트

# checkpoint_cb = keras.callbacks.ModelCheckpoint('cat-cnn-model.keras', save_best_only=True)
# early_stopping_cb = keras.callbacks.EarlyStopping(patience=2, restore_best_weights=True)

# history = model.fit(x=train_data, validation_data=test_data, epochs=25, callbacks=[checkpoint_cb, early_stopping_cb])

Epoch 1/25
[1m250/250[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m13s[0m 48ms/step - accuracy: 0.8007 - loss: 0.4319 - val_accuracy: 0.7995 - val_loss: 0.4523
Epoch 2/25
[1m  1/250[0m [37m━━━━━━━━━━━━━━━━━━━━[0m [1m1:10[0m 285ms/step - accuracy: 0.8438 - loss: 0.3249

## 시각화

In [None]:
conv = model.layers[0]
print(conv.weights[0].shape, conv.weights[1].shape)
# 커널 크기 = (3, 3) / 깊이 1 / 필터 개수 32 -> (3, 3, 1, 32) / 필터마다 1개의 절편 -> (32, )

In [None]:
conv_weights = conv.weights[0].numpy()
print(conv_weights.mean(), conv_weights.std())

In [None]:
# 가중치의 분포
plt.hist(conv_weights.reshape(-1, 1))
plt.xlabel('weight')
plt.ylabel('count')
plt.show()

In [None]:
fig, axs = plt.subplots(2, 16, figsize=(15, 2))
for i in range(2):
    for j in range(16):
        axs[i, j].imshow(conv_weights[:, :, 0, i*16 + j], vmin=-0.5, vmax=0.5)
        axs[i, j].axis('off')
plt.show()

In [None]:
from keras.preprocessing import image

# predict 메소드는 훈련에 사용했던 것과 똑같은 형식에서 불러와야 한다.
test_image = image.load_img('../../../data/cnn/쫀떡.png', target_size=(64,64))

# pil => 이미지를 배열에 놓는 형식
test_image = image.img_to_array(test_image) # pil 이미지 인스턴스를 넘파이 배열로 변환하는 것
test_image = np.expand_dims(test_image, axis=0)
# 가짜 차원을 추가하거나 batch_size에 상응하는 차원을 추가 / 어디에 추가 차원을 넣을지 -> 항상 첫 번째 차원, 각 배치 안에 다른 이미지들이 들어간다

result = model.predict(test_image)
print(result)

train_data.class_indices #class_indices: 알맞은 클래스 인덱스를 갖게 된다
if result[0][0] == 1:
  prediction = 'dog'
else:
  prediction = 'cat'

In [None]:
print(prediction)

In [None]:
dense1 = keras.layers.Dense(100, activation='softmax')
dense2 = keras.layers.Dense(1, activation='sigmoid')

hidden = dense1(inputs)

outputs = dense2(hidden)

model = keras.Model(inputs, outputs)