
## 구글 이미지 다운로더 설치

In [None]:
!git clone https://github.com/Joeclinton1/google-images-download.git

In [None]:
!cd google-images-download && python setup.py install

In [None]:
!pip install -U git+https://github.com/Joeclinton1/google-images-download.git

**런타임** - **런타임 다시 시작** 클릭

## 데이터셋 구성

In [None]:
# 다운로드 받고자 하는 키워드 정의 (쉼표로 구분, 공백 없음)
keywords = "사과,바나나,오렌지"

In [None]:
from google_images_download import google_images_download

response = google_images_download.googleimagesdownload()

arguments = {"keywords": keywords,
             "limit":99, # 최대 다운로드 사진 개수는 100장으로 제한
             "size": "medium",
             "print_urls":True, 
             "format":"jpg"}

paths = response.download(arguments)
print(paths) 

## 사용하지 않는 폴더 삭제

In [None]:
keywords_list = keywords.split(',')
keywords_list = [f.strip() for f in keywords_list]
keywords_list

In [None]:
import os
import glob

download_folder = 'downloads'

In [None]:
folder_list = os.listdir(download_folder)
folder_list

In [None]:
exempt_folders = [f for f in folder_list if f.strip() not in keywords_list]
exempt_folders

In [None]:
for folder in exempt_folders:
    if os.path.isdir(os.path.join(download_folder, folder)):
        files = glob.glob(os.path.join(download_folder, folder) + '/*')
        for f in files:
            os.remove(f)
        os.rmdir(os.path.join(download_folder, folder))

## AutoKeras 설치

In [None]:
!pip install autokeras

In [None]:
import autokeras as ak
import numpy as np

## 데이터 시각화

다운로드 받은 이미지 데이터 시각화

In [None]:
import matplotlib.pyplot as plt
import warnings
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# 경고 무시
warnings.filterwarnings('ignore')

# TRAIN, TEST 경로 지정
TRAIN_DIR = 'downloads'

# 데이터 시각화 코드
original_datagen = ImageDataGenerator(rescale=1./255)
original_generator = original_datagen.flow_from_directory(TRAIN_DIR, 
                                                          target_size=(224, 224), 
                                                          batch_size=32
                                                         )

for x, y in original_generator:
    print(x.shape, y.shape)
    print(y[0])
    
    fig, axes = plt.subplots(2, 5)
    fig.set_size_inches(15, 6)
    for i in range(10):
        axes[i//5, i%5].imshow(x[i])
        axes[i//5, i%5].set_title(f'{y[i].argmax()}', fontsize=15)
        axes[i//5, i%5].axis('off')
    break
plt.show()

## 디스크(disk) 공간에서 이미지 데이터 로드

In [None]:
batch_size = 32 
img_height = 224 # 이미지의 세로 사이즈
img_width = 224  # 이미지의 가로 사이즈

train_data = ak.image_dataset_from_directory(
    TRAIN_DIR,
    image_size=(224, 224),
    batch_size=batch_size,
    # # Use 20% data as testing data.
    # validation_split=0.2,
    # subset="training",
)

test_data = ak.image_dataset_from_directory(
    TRAIN_DIR,
    image_size=(img_height, img_width),
    batch_size=batch_size,
    validation_split=0.2,
    subset="validation",
)

## 고급 모델 생성

In [None]:
# 입력 노드 정의
input_node = ak.ImageInput()

# 출력 노드 정의
output_node = ak.ImageBlock(
    # Only search ResNet architectures.
    block_type="resnet",
    # Normalize the dataset.
    normalize=True,
    # data augmentation.
    augment=False,
)(input_node)

output_node = ak.ClassificationHead()(output_node)

model = ak.AutoModel(
    inputs=input_node, outputs=output_node, overwrite=True, max_trials=5
)

In [None]:
model.fit(train_data,
          validation_data=(test_data),
          epochs=10)

## Image URL로 예측

In [None]:
from skimage import io

In [None]:
def predict_image_from_url(url, model):
    # image 다운로드, 로드
    image = io.imread(url)

    # 시각화
    plt.imshow(image)
    plt.axis('off')
    plt.show()

    # 스케일, resize
    image = image / 255.0
    image = tf.image.resize(image, size=(224, 224))

    # 예측
    x = image.numpy()
    x = np.expand_dims(x, 0)
    pred = model.predict(x)
    print(f'예측 결과: {pred[0][0]}')

In [None]:
predict_image_from_url('https://kormedi.com/wp-content/uploads/2021/11/r658x025-580x407.jpg', model)

## 학습된 모델 내보내기

In [None]:
# 모델 내보내기 (저장&백업)
output_model = model.export_model()

print(type(output_model)) 

In [None]:
output_model.save("image_model.h5")

In [None]:
f = open("labels.txt", 'r', encoding='UTF8')
label = dict()
while True:
    line = f.readline()
    if not line: 
        break
    k, v = line.strip().split()
    label[int(k)] = v
f.close()

In [None]:
label

## 모델 로드

학습이 완료된 샘플 모델을 다운로드 받습니다.

In [None]:
from keras.models import load_model

In [None]:
loaded_model = load_model('image_model.h5')