# 파일 이동
> 파일 업로드 시 30분 정도 소요 됨으로 수업 진행 전달 데이터 전달

# 1. 데이터 확인

In [1]:
import os 

base_path = 'image/cats_and_dogs/data'
data_list = ['test', 'train', 'validation']
animal_list = ['cats', 'dogs']

for data_title in data_list:
    for animal in animal_list:
        print(data_title, ' ', animal, ' 이미지 전체 개수 : ', 
            len(os.listdir(base_path+"/"+data_title+"/"+animal)))

test   cats  이미지 전체 개수 :  500
test   dogs  이미지 전체 개수 :  500
train   cats  이미지 전체 개수 :  941
train   dogs  이미지 전체 개수 :  274
validation   cats  이미지 전체 개수 :  450
validation   dogs  이미지 전체 개수 :  420


복사가 잘 되었는지 확인하기 위해 각 분할(훈련/검증/테스트)에 들어 있는 사진의 개수를 카운트해 보죠:

이제 2,000개의 훈련 이미지, 1,000개의 검증 이미지, 1,000개의 테스트 이미지가 준비되었다.

# 2. 모델 구성하기

In [2]:
from keras import layers, Input, models 

model = models.Sequential()
model.add(Input(shape=(150, 150, 3)))
model.add(layers.Conv2D(32, (3,3), activation='relu'))
model.add(layers.MaxPool2D((2,2)))

In [3]:
model.summary()

In [4]:
model.add(layers.Conv2D(64, (3,3), activation='relu'))
model.add(layers.MaxPool2D((2,2)))

In [5]:
model.summary()

In [6]:
model.add(layers.Conv2D(128, (3,3), activation='relu'))
model.add(layers.MaxPool2D((2,2)))

In [7]:
model.summary()

In [8]:
model.add(layers.Conv2D(128, (3,3), activation='relu'))
model.add(layers.MaxPool2D((2,2)))

In [9]:
model.add(layers.Flatten())
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

> 개와 고양이 중 하나를 선택할 것이기 때문에 sigmoid를 최종으로 사용한다.

https://opentutorials.org/module/5268/29787

In [10]:
model.summary()

컴파일 단계에서 이전과 같이 `RMSprop` 옵티마이저를 선택하겠습니다. 네트워크의 마지막이 하나의 시그모이드 유닛이기 때문에 이진 크로스엔트로피(binary crossentropy)를 손실로 사용합니다(4장 5절에서 다양한 경우에 사용할 수 있는 손실 함수 목록을 볼 수 있습니다).

In [11]:
from keras import optimizers

model.compile(loss='binary_crossentropy', optimizer=optimizers.RMSprop(learning_rate=0.0001),
              metrics=['accuracy'])

# 3. 데이터 전처리

> 데이터는 네트워크에 주입되기 전에 부동 소수 타입의 텐서로 적절하게 전처리되어 있어야 한다. 현재 데이터는 JPEG 파일로 되어 있으므로 정수 타입의 데이터를 가지고 있다. 이미지를 네트워크에 주입하려면 다음 과정을 따라야 한다.
1.	사진 파일을 읽는다.
2.	이미지 콘텐츠를 RGB 픽셀 값으로 디코딩한다.
3.	디코딩한 결과를 부동 소수 타입의 텐서로 변환한다.

> 위의 복잡한 기능을 한번에 처리해 주는 것이 `ImageDataGenerator` 클래스이다.

## 3.1 부동 소수 타입의 텐서 변환

In [12]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator

In [13]:
train_datagen = ImageDataGenerator(rescale=1./255)
test_datagen = ImageDataGenerator(rescale=1./255)

## 3.2 generator 만들기

In [14]:
train_dir = base_path + "/train"

train_datagen = train_datagen.flow_from_directory (
    train_dir,
    target_size=(150, 150),
    batch_size=20,
    class_mode='binary'
)

Found 1215 images belonging to 2 classes.


> class_mode는 분류 방식에 대해서 지정한다.
- categorical : 2D one-hot 부호화된 라벨이 반환됨
- binary : 1D 이진 라벨이 반환됨
- sparse : 1D 정수 라벨이 반환됨
- None : 라벨이 반환되지 않음

In [15]:
validation_dir = base_path + "/validation"

validation_gen = test_datagen.flow_from_directory(
    validation_dir,
    target_size=(150, 150),
    batch_size=20,
    class_mode='binary'
)

Found 870 images belonging to 2 classes.


# 4. 모델 만들기

## 4.1 에코스텝 구하기

In [16]:
train_datagen

<keras.src.legacy.preprocessing.image.DirectoryIterator at 0x1e430af9610>

In [17]:
data_batch, labels_batch = train_datagen[0]
print('배치 데이터 크기 :', data_batch.shape)
print('배치 레이블 크기 :', labels_batch.shape)

배치 데이터 크기 : (20, 150, 150, 3)
배치 레이블 크기 : (20,)


> generator에는 data와 label 정보가 저장되어 있다. 3.2에서 generator 생성 시 이미지 사이트는 150 x 150으로 설정했고 batch size는 20으로 설정했다.

> 위 코드 실행 결과 20개의 데이터 (150, 150, 3)(가로, 세로, 색상)와 20개의 결과 정보가 있는 것을 확인할 수 있다. 훈련데이터의 경우 고양이 1000개 강아지 1000개 총 2000개의 데이터를 사용하고 있음으로 100번을 반복해야 모든 데이터를 학습시킬 수 있다.

## 4.2 모델 만들기

In [18]:
history = model.fit(
    train_datagen, epochs=30, validation_data=validation_gen
)

Epoch 1/30


  self._warn_if_super_not_called()


[1m61/61[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m20s[0m 301ms/step - accuracy: 0.7882 - loss: 0.5487 - val_accuracy: 0.5172 - val_loss: 0.8118
Epoch 2/30
[1m61/61[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m18s[0m 285ms/step - accuracy: 0.7611 - loss: 0.5585 - val_accuracy: 0.5172 - val_loss: 0.8234
Epoch 3/30
[1m61/61[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m18s[0m 290ms/step - accuracy: 0.7853 - loss: 0.5191 - val_accuracy: 0.5172 - val_loss: 0.8297
Epoch 4/30
[1m61/61[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m18s[0m 286ms/step - accuracy: 0.7736 - loss: 0.5314 - val_accuracy: 0.5172 - val_loss: 0.9836
Epoch 5/30
[1m61/61[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m17s[0m 283ms/step - accuracy: 0.7509 - loss: 0.5525 - val_accuracy: 0.5172 - val_loss: 0.8575
Epoch 6/30
[1m61/61[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m18s[0m 291ms/step - accuracy: 0.7803 - loss: 0.5132 - val_accuracy: 0.5333 - val_loss: 0.8251
Epoch 7/30
[1m61/61[0m [32m━━━

> 대략 15분 정도 소요됨

# 5. 백업

## 5.1 모델 저장

In [19]:
model.save('model/cats_and_dogs_0718.keras')

## 5.2 히스토리 저장

In [22]:
import numpy as np

np.save('model/my_history_0718.npy', history.history)