In [21]:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, Flatten
from tensorflow.keras.applications import VGG16,ResNet50

base_model = VGG16(weights = 'imagenet', include_top=True, input_shape=(224,224,3))
# include_top = True:extractor와 classifier 동시에 업로드
# False는 feature extractor만 업로드
base_model.summary()

Model: "vgg16"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 input_4 (InputLayer)        [(None, 224, 224, 3)]     0         
                                                                 
 block1_conv1 (Conv2D)       (None, 224, 224, 64)      1792      
                                                                 
 block1_conv2 (Conv2D)       (None, 224, 224, 64)      36928     
                                                                 
 block1_pool (MaxPooling2D)  (None, 112, 112, 64)      0         
                                                                 
 block2_conv1 (Conv2D)       (None, 112, 112, 128)     73856     
                                                                 
 block2_conv2 (Conv2D)       (None, 112, 112, 128)     147584    
                                                                 
 block2_pool (MaxPooling2D)  (None, 56, 56, 128)       0     

In [22]:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, Flatten
from tensorflow.keras.applications import VGG16,ResNet50,MobileNet,InceptionV3

base_model = VGG16(weights = 'imagenet', include_top=False, input_shape=(224,224,3))
# include_top = True:extractor와 classifier 동시에 업로드
# False는 feature extractor만 업로드
base_model.summary()

Model: "vgg16"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 input_5 (InputLayer)        [(None, 224, 224, 3)]     0         
                                                                 
 block1_conv1 (Conv2D)       (None, 224, 224, 64)      1792      
                                                                 
 block1_conv2 (Conv2D)       (None, 224, 224, 64)      36928     
                                                                 
 block1_pool (MaxPooling2D)  (None, 112, 112, 64)      0         
                                                                 
 block2_conv1 (Conv2D)       (None, 112, 112, 128)     73856     
                                                                 
 block2_conv2 (Conv2D)       (None, 112, 112, 128)     147584    
                                                                 
 block2_pool (MaxPooling2D)  (None, 56, 56, 128)       0     

In [23]:
model = Sequential()
model.add(base_model)
model.add(Flatten())

model.add(Dense(64,activation='relu'))
model.add(Dropout(0,25))
model.add(Dense(4,activation='softmax'))

model.compile(loss='spares_categorical_crossentropy',
              optimizer=tf.keras.optimizers.Adam(),
              metrics=['accuracy'])
model.summary()

Model: "sequential_3"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 vgg16 (Functional)          (None, 7, 7, 512)         14714688  
                                                                 
 flatten_1 (Flatten)         (None, 25088)             0         
                                                                 
 dense_4 (Dense)             (None, 64)                1605696   
                                                                 
 dropout_2 (Dropout)         (None, 64)                0         
                                                                 
 dense_5 (Dense)             (None, 4)                 260       
                                                                 
Total params: 16,320,644
Trainable params: 16,320,644
Non-trainable params: 0
_________________________________________________________________


In [24]:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.applications import Xception
from tensorflow.keras.layers import Dense, Dropout, Flatten ,GlobalAveragePooling2D
from tensorflow.keras.applications import VGG16,ResNet50,MobileNet,InceptionV3
from tensorflow.keras.preprocessing.image import ImageDataGenerator

In [25]:
!wget https://storage.googleapis.com/mledu-datasets/cats_and_dogs_filtered.zip
# 리눅스 명령어라 실행 안됨


'wget'��(��) ���� �Ǵ� �ܺ� ����, ������ �� �ִ� ���α׷�, �Ǵ�
��ġ ������ �ƴմϴ�.


In [26]:
import urllib.request
url = "https://storage.googleapis.com/mledu-datasets/cats_and_dogs_filtered.zip"
urllib.request.urlretrieve(url, "cats_and_dogs_filtered.zip")


('cats_and_dogs_filtered.zip', <http.client.HTTPMessage at 0x209871ea380>)

In [27]:
import os
import shutil

if os.path.exists('/cats_and_dogs_filtered/'):

    shutil.rmtree('/cats_and_dogs_filtered/ is removed !!!')

In [28]:
import zipfile
import os

# 압축 파일 위치
zip_path = './cats_and_dogs_filtered.zip'

# 압축 해제 위치 (현재 폴더 안에 풀기)
extract_to = './cats_and_dogs_filtered'

# 디렉토리 없으면 생성
os.makedirs(extract_to, exist_ok=True)

# 압축 해제 실행
with zipfile.ZipFile(zip_path, 'r') as target_file:
    target_file.extractall(extract_to)

print('압축 해제 완료 ✅')


압축 해제 완료 ✅


In [29]:
IMG_WIDTH = 224
IMG_HEIGHT = 224

In [30]:
base_model = Xception(weights='imagenet',include_top=False,input_shape=(IMG_WIDTH,IMG_HEIGHT,3))

base_model.summary()

Model: "xception"
__________________________________________________________________________________________________
 Layer (type)                   Output Shape         Param #     Connected to                     
 input_6 (InputLayer)           [(None, 224, 224, 3  0           []                               
                                )]                                                                
                                                                                                  
 block1_conv1 (Conv2D)          (None, 111, 111, 32  864         ['input_6[0][0]']                
                                )                                                                 
                                                                                                  
 block1_conv1_bn (BatchNormaliz  (None, 111, 111, 32  128        ['block1_conv1[0][0]']           
 ation)                         )                                                          

다음은 이미지에서 추출한 텍스트입니다:

---

```python
base_model = Xception(weights='imagenet', include_top=False,
                      input_shape=(IMG_WIDTH, IMG_HEIGHT, 3))

---

### 설명:

* `weights='imagenet'`:
  `weights='imagenet'` 옵션을 사용하면 **Xception** 모델이
  **ImageNet 데이터셋에서 사전 훈련된 가중치**를 사용하여 초기화됩니다.

* `include_top=False`:
  모델의 상단에 있는 **classifier**를 포함시키지 않는다.
  이를 통해 모델을 특정 작업에 맞게 **수정하고 재사용**할 수 있다.

* `input_shape=(IMG_WIDTH, IMG_HEIGHT, 3)`:
  입력 이미지의 형태를 정의.
  `IMG_WIDTH`와 `IMG_HEIGHT`는 이미지의 가로와 세로 크기이며,
  **3은 컬러 채널 수(RGB)**.
  입력 이미지는 이 크기로 사전에 전처리되어야 한다.
```


---

### 🔺 Xception :

> \*\*"Extreme Inception"\*\*의 약어로, Inception 모듈을 극단적으로 확장한 형태.
> 깊고 복잡한 네트워크 구조로 구성,
> 이미지 내에서 다양한 크기와 비율의 객체를 잘 인식할 수 있도록 설계.

공간의 특징을 추출하는 **Depthwise Convolution**은
입력 채널별로 컨볼루션을 수행하고,
채널간의 상호작용을 조절하고 특성을 결합.

⭐ **Pointwise Convolution**은 1x1 컨볼루션을 통해 채널 간의 선형 결합을 수행

---

### 2. Deep Learning

#### Xception :

이미지넷(ImageNet) 등 대규모 데이터셋에서 **사전훈련된(pre-trained)** 모델

1. **극도의 인셉션 구조**:
   Xception은 Inception 모델의 아이디어를 발전.
   Inception 모델은 다양한 커널 크기를 가진 **병렬적인 컨볼루션 계층**을 사용하여
   **효율적인 특징 추출** 수행.
   Xception은 이를 극단적으로 확장한 구조로 발전시켜
   모든 컨볼루션 계층에 대해 **1x1 컨볼루션을 사용**하고,
   병렬적인 컨볼루션과 연산을 연결한 깊은 구조를 채택.

2. **깊은 네트워크 아키텍처**:
   깊은 아키텍처는 더욱 복잡한 시각적 패턴을 학습할 수 있어
   다양한 이미지 분류 관련된 작업에서 매우 좋은 성능을 발휘할 수 있다.

3. **파라미터 효율성**:
   **1x1 컨볼루션을 사용하여 입력 텐서의 차원을 줄이고**,
   파라미터 수를 크게 감소.
   이는 모델의 학습 속도를 향상시키고, 메모리 사용량을 감소.

4. **사전훈련된 가중치**:
   이미지넷과 같은 대규모 데이터셋에서 **미리 학습된 가중치**를 가지고
   전이학습을 수행할 수 있음.

---



---

### 🔺 ImageNet :

> **약 1,000개의 다양한 클래스에 대해 약 1,400만장의 이미지로 구성.**

ImageNet은 **사전 훈련된 모델의 가중치를 제공**
사전 훈련된 모델을 기반으로 새로운 작업에 대해
**전이 학습(Transfer Learning)** 수행 가능

---

### 주요 특성 및 한계

1. **데이터셋 크기**:
   약 1,400만장의 이미지로 구성되어 있어 많은 컴퓨팅 자원과 시간이 필요.

2. **클래스 불균형**:
   일부 클래스는 많은 이미지를 가지고 있고,
   다른 클래스는 적은 이미지만 가지고 있을 수 있다.
   → 이로 인해 모델이 **불균형한 클래스에 대해 성능이 떨어질 수 있다.**

3. **정확도 한계**:
   일부 이미지에 대한 레이블이 부정확 → 모델 성능을 제한할 수 있음.

4. **새로운 도메인 적용의 어려움**:
   주로 **자연 이미지**에 대해 좋은 성능.
   하지만 특정 도메인의 이미지에 적용할 때는 **추가적인 조정**이 필요할 수 있다.

---

In [31]:
model = Sequential()

model.add(base_model)

model.add(GlobalAveragePooling2D())

model.add(Dense(16,activation='relu'))
model.add(Dropout(0.25))

model.add(Dense(2,activation='softmax'))

model.summary()

Model: "sequential_4"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 xception (Functional)       (None, 7, 7, 2048)        20861480  
                                                                 
 global_average_pooling2d_2   (None, 2048)             0         
 (GlobalAveragePooling2D)                                        
                                                                 
 dense_6 (Dense)             (None, 16)                32784     
                                                                 
 dropout_3 (Dropout)         (None, 16)                0         
                                                                 
 dense_7 (Dense)             (None, 2)                 34        
                                                                 
Total params: 20,894,298
Trainable params: 20,839,770
Non-trainable params: 54,528
_____________________________________



---

```python
model.add(GlobalAveragePooling2D())
```

---

## 🔍 설명

**Global Average Pooling**은 합성곱 신경망(CNN) 모델의 **마지막 부분에 추가되는 층**으로,

* 합성곱 층을 거치면서 공간 정보가 계속해서 축소되고,
* 마지막 합성곱 층 이후에는 **로컬한 정보가 아닌 전역적인 정보**를 고려해야 함.

---

### ✅ 핵심 기능

> **Global Average Pooling은 주어진 특성 맵의 공간 정보를 압축하여 전역적인 정보를 나타내는 특성으로 변환.**

* 특성 맵의 각 채널에 대해 **평균 값을 계산**하고,
* 이를 통해 각 채널이 어떤 특정한 패턴을 나타내는지 파악할 수 있음.

---

## 2. Deep Learning

```python
model = Sequential()
model.add(base_model)
model.add(GlobalAveragePooling2D())
```

---

### GlobalAveragePooling2D vs Flatten

* **Flatten과 달리** → 공간 정보를 보존하면서도 특성 맵의 차원을 축소할 수 있음.
* CNN의 마지막 부분에서 **이미지 분류 작업을 수행할 때 일반적으로 사용**.

---



```python
model.add(GlobalAveragePooling2D())
```

## ✅ 1D 데이터와 2D 데이터에 대한 사용법

---

### 🔹 1D 데이터:

* 입력 데이터의 형태: **(batch\_size, sequence\_length, features)**
* 예시: **텍스트 분류**를 위한 모델에서 단어 시퀀스를 입력으로 사용하는 경우
* 사용법: `GlobalAveragePooling1D()`

> → 시퀀스 길이에 상관없이 각 시퀀스의 평균을 계산하여 글로벌한 특성을 추출

---

### 🔹 2D 데이터:

* 입력 데이터의 형태: **(batch\_size, height, width, channels)**
* 예시: **이미지 분류**를 위한 모델에서 이미지를 입력으로 사용하는 경우
* 사용법: `GlobalAveragePooling2D()`

> → 각 채널의 특성 맵에 대해 평균을 계산하여 글로벌한 특성을 추출

---



In [32]:
train_data_gen = ImageDataGenerator(rescale=1./255,
                                    rotation_range=10, width_shift_range=0.1,
                                    height_shift_range=0.1, shear_range=0.1,zoom_range=0.1)
test_data_gen = ImageDataGenerator(rescale=1./255)

다음은 두 이미지에서 추출한 전체 텍스트입니다:

---

## 🧪 Keras의 `ImageDataGenerator`

> \*\*데이터 증강(data augmentation)\*\*을 수행.
> 기존의 데이터를 **변형하여** 데이터의 다양성을 높이는 기법으로,
> 모델의 성능과 일반화 능력 향상에 도움.

---

### 주요 파라미터:

* `rescale=1./255`: 픽셀 값을 0과 1 사이값으로 정규화
* `rotation_range=10`: 이미지를 최대 10도까지 회전
* `width_shift_range=0.1`: 이미지를 수평 방향으로 최대 10%까지 이동
* `height_shift_range=0.1`: 이미지를 수직 방향으로 최대 10%까지 이동
* `sheer_range=0.1`: 이미지를 비틀기 (shear 변환)
* `zoom_range=0.1`: 이미지를 최대 10%까지 확대 또는 축소

> 데이터 증강을 통해 **다양한 상황에 대응할 수 있는 능력을 키우고**,
> **과적합 방지**, **일반화 성능 향상**

---



In [33]:
train_dir = './cats_and_dogs_filtered/cats_and_dogs_filtered/train'
test_dir = './cats_and_dogs_filtered/cats_and_dogs_filtered/validation'


In [34]:
train_data = train_data_gen.flow_from_directory(train_dir,batch_size=32,color_mode='rgb',shuffle=True,class_mode='categorical',
                                                target_size=(IMG_WIDTH,IMG_HEIGHT))

test_data = test_data_gen.flow_from_directory(test_dir, batch_size=32,
                                              color_mode='rgb',shuffle = True,class_mode='categorical',
                                              target_size=(IMG_WIDTH,IMG_HEIGHT))

Found 2000 images belonging to 2 classes.
Found 1000 images belonging to 2 classes.



## 📁 `flow_from_directory` 함수

* **디렉토리 내의 이미지**를 자동으로 **레이블링**하고,
* 배치 단위로 이미지를 변환하는 **제너레이터** 생성.

> 모델의 `fit` 함수에 입력으로 사용되며,
> 이 때 **증강된 이미지가 실시간으로 생성**되어 학습 및 평가에 활용됨.

---

### 예시 계산:

* 전체 데이터 수 = `배치 크기 × 에포크 수 × 원본 데이터 수`

예:

* 배치 크기 = 32
* 에포크 수 = 10
  → 총 증강 데이터 수 = 32 × 10 × 원본 데이터 수

---


In [35]:
print(train_data.class_indices.items())
print(test_data.class_indices.items())

print(len(train_data.classes))
print(len(test_data.classes))

print(train_data.num_classes)
print(test_data.num_classes)


dict_items([('cats', 0), ('dogs', 1)])
dict_items([('cats', 0), ('dogs', 1)])
2000
1000
2
2


train_data.class_indices,  
test_data.class_indices :  
각각 훈련데이터와 테스트 데이터의 클래스 레이블과 해당 인덱스를 매핑한 딕셔너리.  
이를 출력하여 각 클래스 레이블과 인덱스를 확인할 수 있다.

In [36]:
model.compile(loss='categorical_crossentropy',  
              optimizer=tf.keras.optimizers.Adam(0.00002), metrics=['accuracy'])  


optimizer=tf.keras.optimizers.Adam(0.00002) :  
매우 작은 학습률을 사용하면 모델이 더 정확하고 안정적으로 최적화,  
검사 손실 문제를 완화함

전이 학습에서는 새로운 작업에 대한 가중치 업데이트를 조절하기 위해 작은 학습률을 사용.  

미세한 조정을 통해 새로운 작업에 미치는 영향을 최소화, 기존의 가중치를 보존  
이전에 학습한 특성을 유지하면서 새로운 작업에 적응할 수 있도록 함.


In [37]:
!pip install scipy




In [38]:
from datetime import datetime  
from tensorflow.keras.callbacks import ModelCheckpoint, EarlyStopping  
  
save_file_name = './cats_and_dogs_filtered_Xception_Colab.h5'  

checkpoint = ModelCheckpoint(save_file_name,  
                            monitor='val_loss',  
                            verbose=1,  
                            save_best_only=True,  
                            mode='auto'  
                            )  

earlystopping = EarlyStopping(monitor='val_loss',  
                            patience=5,  
                            )  

start_time = datetime.now()  

hist = model.fit(train_data, epochs=30,  
                validation_data=test_data,  
                callbacks=[checkpoint, earlystopping])  
#patience 5번(학습결과가 개선되지 않은 5번째에 early stopping)



Epoch 1/30
Epoch 1: val_loss improved from inf to 0.18065, saving model to .\cats_and_dogs_filtered_Xception_Colab.h5
Epoch 2/30

KeyboardInterrupt: 

In [None]:
print("Min Validation Loss:",min(hist.history['val_loss']))
print("Max Validation Accuracy:",max(hist.history['val_accuracy']))

In [None]:
import matplotlib.pyplot as plt

plt.title('accuracy trend')
plt.grid()
plt.xlabel('epochs')
plt.ylabel('accuray')
plt.plot(hist.history['accuracy'], label='train')
plt.plot(hist.history['val_accuracy'], label='validation')
plt.legend(loc='best')
plt.show()

In [None]:
import matplotlib.pyplot as plt

plt.title('loss trend')
plt.grid()
plt.xlabel('epochs')
plt.ylabel('loss')
plt.plot(hist.history['loss'], label='train')
plt.plot(hist.history['val_loss'], label='validation')
plt.legend(loc='best')
plt.show()