# 실습 - 허리케인 피해 지역 구분하기


## 개요
  - 허리케인이 지나간 위치의 위성 이미지를 보고, 피해 여부를 판단하는 모델을 만들어 봅시다.

## 목표
  - validation dataset 에 대해 95% 이상의 정확도를 가지는 것이 목표입니다.

In [1]:
import urllib
import zipfile

import tensorflow as tf

In [2]:
def download_and_extract_data():
    url = 'https://storage.googleapis.com/download.tensorflow.org/data/certificate/satellitehurricaneimages.zip'
    urllib.request.urlretrieve(url, 'satellitehurricaneimages.zip')
    with zipfile.ZipFile('satellitehurricaneimages.zip', 'r') as zip_ref:
        zip_ref.extractall()

download_and_extract_data()

# 1. 이미지 전처리

  - image 전처리를 담당하는 함수를 만들어 봅시다.
  - 간단한 normalize 만 수행해도 충분합니다. 

In [4]:
def preprocess(image, label):
    # 함수 내용을 작성하세요.
    image = image  / 255

    max = tf.math.reduce_max(image)
    (image - min) / (max - min)
    
    return image, label

# 2. 데이터 준비

  - 다운로드 받은 데이터를 읽어서 준비합니다.
  - 위에서 정의한 preprocess 함수를 이용하여 전처리를 수행합니다.

In [6]:
IMG_SIZE = 128
BATCH_SIZE = 64

train_ds = tf.keras.preprocessing.image_dataset_from_directory(
    directory='train/',
    image_size= (IMG_SIZE,IMG_SIZE)
    , batch_size=BATCH_SIZE)

val_ds = tf.keras.preprocessing.image_dataset_from_directory(
    directory='validation/',
    image_size= (IMG_SIZE,IMG_SIZE)
    , batch_size=BATCH_SIZE)


train_ds = train_ds.map(
        preprocess, num_parallel_calls=tf.data.experimental.AUTOTUNE).prefetch(
        tf.data.experimental.AUTOTUNE)
val_ds = val_ds.map(
        preprocess, num_parallel_calls=tf.data.experimental.AUTOTUNE)

Found 10000 files belonging to 2 classes.
Found 2000 files belonging to 2 classes.


# 3. 모델 정의

  - 모델 모양을 정의합니다.
  - Input, Output 모양을 유의하세요.

In [10]:
model = tf.keras.models.Sequential([
    # 함수 내용을 작성하세요.
    tf.keras.layers.Conv2D(32, (3,3), activation='relu', input_shape=(IMG_SIZE, IMG_SIZE, 3)),
    tf.keras.layers.MaxPooling2D(2,2),
    tf.keras.layers.Conv2D(32, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),
    tf.keras.layers.Conv2D(32, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dropout(rate=0.2),
    tf.keras.layers.Dense(512, activation='relu'),
    tf.keras.layers.Dense(1, activation='sigmoid')
])

# 4. 모델 컴파일

  - 학습 방법을 정의하세요
  - loss, optimizer, metrics 를 올바르게 지정하면 충분합니다.

In [11]:
model.compile(
    # 함수 내용을 작성하세요.
    optimizer='adam',
    loss='binary_crossentropy',
    metrics = ['accuracy']
)

# 5. 모델 학습

  - 학습을 위한 epoch, batch_size 등을 설정하세요.
  - 이 외에 사용하고 싶은 기법들은 자유롭게 도입하셔도 됩니다.

In [13]:
model.fit(
        train_ds,
        validation_data=val_ds,
        epochs=20,
        batch_size=BATCH_SIZE
)

Epoch 1/20
[1m157/157[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m14s[0m 88ms/step - accuracy: 0.9626 - loss: 0.0951 - val_accuracy: 0.9320 - val_loss: 0.1835
Epoch 2/20
[1m157/157[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m14s[0m 87ms/step - accuracy: 0.9685 - loss: 0.0831 - val_accuracy: 0.9450 - val_loss: 0.1691
Epoch 3/20
[1m157/157[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m14s[0m 87ms/step - accuracy: 0.9746 - loss: 0.0728 - val_accuracy: 0.9610 - val_loss: 0.1133
Epoch 4/20
[1m157/157[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m14s[0m 90ms/step - accuracy: 0.9821 - loss: 0.0569 - val_accuracy: 0.9455 - val_loss: 0.1395
Epoch 5/20
[1m157/157[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m13s[0m 84ms/step - accuracy: 0.9787 - loss: 0.0640 - val_accuracy: 0.9580 - val_loss: 0.1164
Epoch 6/20
[1m157/157[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m14s[0m 89ms/step - accuracy: 0.9863 - loss: 0.0411 - val_accuracy: 0.9610 - val_loss: 0.1312
Epoch 7/20
[1m1

<keras.src.callbacks.history.History at 0x1dfab6fc190>

# Appendix

- 이미지를 View 합니다.
- model 로 predict 를 합니다.

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# Take one batch of images and labels
val_ds = tf.keras.preprocessing.image_dataset_from_directory(
    directory='validation/',
    image_size= (IMG_SIZE,IMG_SIZE)
    , batch_size=BATCH_SIZE)

In [None]:
images, labels = next(iter(val_ds.shuffle(buffer_size=10000)))

data_index = 0

selected_image = images[data_index].numpy().astype("uint8")
selected_label = labels[data_index].numpy()

image_to_predict = np.expand_dims(selected_image/255, axis=0)

# Make a prediction
predictions = model.predict(image_to_predict)
predicted_label = int(predictions.round())

plt.figure(figsize=(5,5))
plt.imshow(selected_image)
class_names = val_ds.class_names
plt.title(f"True Label: {class_names[selected_label]}, Predicted: {class_names[predicted_label]}")
plt.axis("off")
plt.show()

# Transfer Learning

- transfer learning 을 이용해서도 풀어봅시다.

In [None]:
# 자유롭게 작성하세요.