<a href="https://colab.research.google.com/github/Eunbijoanne/Eunbijoanne.github.io/blob/master/%EB%94%A5%EB%9F%AC%EB%8B%9D.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 새 섹션

In [None]:
import numpy as np
from tensorflow.keras.datasets import imdb
from tensorflow.keras.preprocessing.sequence import pad_sequences
from sklearn.model_selection import train_test_split
from tensorflow.keras.layers import SimpleRNN, GRU, LSTM, Dense, Dropout, Embedding, Input
from tensorflow.keras.models import Sequential
from tensorflow.keras.callbacks import EarlyStopping
from tensorflow.keras.losses import binary_crossentropy
import matplotlib.pyplot as plt

In [None]:
# 데이터 로드
(tr_x, tr_y), (tt_x, tt_y) = imdb.load_data(num_words=100)
X = np.concatenate([tr_x, tt_x])
y = np.concatenate([tr_y, tt_y])

# 데이터 전처리
for i in range(len(X)):
    X[i] = [w for w in X[i] if w > 2]

# 데이터 분할
x_data, tt_x, y_data, tt_y = train_test_split(X, y, test_size=0.3, random_state=42, stratify=y)
tr_x, val_x, tr_y, val_y = train_test_split(x_data, y_data, test_size=0.2, random_state=42, stratify=y_data)

# 패딩
p_tr_x = pad_sequences(tr_x, maxlen=100)
p_tt_x = pad_sequences(tt_x, maxlen=100)
p_val_x = pad_sequences(val_x, maxlen=100)

In [None]:
# 모델 구성
model = Sequential([
    Input(shape=(100,)),  # 명시적으로 입력 형태 지정
    Embedding(100, 32),
    LSTM(64, return_sequences=True),
    Dropout(0.2),
    LSTM(32),
    Dropout(0.2),
    Dense(16, activation='relu'),
    Dropout(0.2),
    Dense(1, activation='sigmoid')
])

# 모델 컴파일
model.compile(optimizer='adam', loss=binary_crossentropy, metrics=['accuracy'])

# 모델 요약
model.summary()

In [None]:
# 조기 종료 설정
early_stopping = EarlyStopping(monitor='val_loss', patience=3, restore_best_weights=True)

# 모델 학습
history = model.fit(p_tr_x, tr_y,
                    epochs=30,
                    batch_size=64,
                    validation_data=(p_val_x, val_y),
                    callbacks=[early_stopping])

Epoch 1/30
[1m438/438[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m60s[0m 128ms/step - accuracy: 0.6229 - loss: 0.6389 - val_accuracy: 0.7061 - val_loss: 0.5679
Epoch 2/30
[1m438/438[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m64s[0m 146ms/step - accuracy: 0.7102 - loss: 0.5662 - val_accuracy: 0.7199 - val_loss: 0.5400
Epoch 3/30
[1m438/438[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m73s[0m 125ms/step - accuracy: 0.7212 - loss: 0.5480 - val_accuracy: 0.7181 - val_loss: 0.5388
Epoch 4/30
[1m438/438[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m83s[0m 127ms/step - accuracy: 0.7267 - loss: 0.5497 - val_accuracy: 0.7291 - val_loss: 0.5330
Epoch 5/30
[1m438/438[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m81s[0m 124ms/step - accuracy: 0.7296 - loss: 0.5414 - val_accuracy: 0.7326 - val_loss: 0.5339
Epoch 6/30
[1m438/438[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m87s[0m 134ms/step - accuracy: 0.7300 - loss: 0.5413 - val_accuracy: 0.7361 - val_loss: 0.5186
Epoch 7/30

KeyboardInterrupt: 

In [None]:
# 학습 결과 시각화
import matplotlib.pyplot as plt

plt.figure(figsize=(12, 4))

# 훈련 정확도와 검증 정확도 그래프
plt.subplot(1, 2, 1)
plt.plot(history.history['accuracy'], label='Train Accuracy')
plt.plot(history.history['val_accuracy'], label='Validation Accuracy')
plt.title('Model Accuracy')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.legend()

# 훈련 손실과 검증 손실 그래프
plt.subplot(1, 2, 2)
plt.plot(history.history['loss'], label='Train Loss')
plt.plot(history.history['val_loss'], label='Validation Loss')
plt.title('Model Loss')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend()

plt.tight_layout()
plt.show()

# 테스트 세트에 대한 평가
test_loss, test_acc = model.evaluate(p_tt_x, tt_y)
print(f"Test Accuracy: {test_acc:.4f}")

# Keras 데이터셋 전처리 가이드

이 가이드에서는 Keras에서 제공하는 데이터셋을 사용할 때의 전처리 방법을 설명합니다. Boston Housing 데이터셋(회귀)과 CIFAR-10 데이터셋(이미지 분류)을 예로 들어 설명하겠습니다.

## 1. Boston Housing 데이터셋 (회귀 문제)

### 데이터 로드
```python
from keras.datasets import boston_housing

(x_train, y_train), (x_test, y_test) = boston_housing.load_data()
print(x_train.shape, y_train.shape, x_test.shape, y_test.shape)
```

### 전처리 단계

1. 특성 정규화 (Feature Normalization)
```python
from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
x_train_scaled = scaler.fit_transform(x_train)
x_test_scaled = scaler.transform(x_test)
```

2. 데이터 형태 확인 및 조정 (필요한 경우)
```python
print("훈련 데이터 형태:", x_train_scaled.shape)
print("테스트 데이터 형태:", x_test_scaled.shape)
print("훈련 레이블 형태:", y_train.shape)
print("테스트 레이블 형태:", y_test.shape)
```

3. 모델 구성 예시
```python
from keras.models import Sequential
from keras.layers import Dense

model = Sequential([
    Dense(64, activation='relu', input_shape=(13,)),
    Dense(32, activation='relu'),
    Dense(1)
])

model.compile(optimizer='adam', loss='mse', metrics=['mae'])
```

4. 모델 훈련
```python
history = model.fit(x_train_scaled, y_train,
                    validation_split=0.2,
                    epochs=100,
                    batch_size=32,
                    verbose=1)
```

## 2. CIFAR-10 데이터셋 (이미지 분류 문제)

### 데이터 로드
```python
from keras.datasets import cifar10

(x_train, y_train), (x_test, y_test) = cifar10.load_data()
print(x_train.shape, y_train.shape, x_test.shape, y_test.shape)
```

### 전처리 단계

1. 픽셀 값 정규화
```python
x_train_normalized = x_train.astype('float32') / 255
x_test_normalized = x_test.astype('float32') / 255
```

2. 레이블 원-핫 인코딩
```python
from keras.utils import to_categorical

y_train_encoded = to_categorical(y_train, 10)
y_test_encoded = to_categorical(y_test, 10)
```

3. 데이터 형태 확인
```python
print("훈련 이미지 형태:", x_train_normalized.shape)
print("테스트 이미지 형태:", x_test_normalized.shape)
print("훈련 레이블 형태:", y_train_encoded.shape)
print("테스트 레이블 형태:", y_test_encoded.shape)
```

4. 데이터 증강 (선택사항)
```python
from keras.preprocessing.image import ImageDataGenerator

datagen = ImageDataGenerator(
    rotation_range=15,
    width_shift_range=0.1,
    height_shift_range=0.1,
    horizontal_flip=True
)
datagen.fit(x_train_normalized)
```

5. 모델 구성 예시
```python
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout

model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    Flatten(),
    Dense(64, activation='relu'),
    Dropout(0.5),
    Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
```

6. 모델 훈련
```python
# 데이터 증강을 사용하지 않는 경우
history = model.fit(x_train_normalized, y_train_encoded,
                    validation_split=0.2,
                    epochs=50,
                    batch_size=64,
                    verbose=1)

# 데이터 증강을 사용하는 경우
history = model.fit(datagen.flow(x_train_normalized, y_train_encoded, batch_size=64),
                    steps_per_epoch=len(x_train_normalized) // 64,
                    epochs=50,
                    validation_data=(x_test_normalized, y_test_encoded),
                    verbose=1)
```

## 주의사항
- 데이터셋마다 특성이 다르므로, 적절한 전처리 방법을 선택해야 합니다.
- 테스트 데이터에는 훈련 데이터의 통계를 사용하여 전처리해야 합니다 (예: StandardScaler의 경우).
- 이미지 데이터의 경우, 채널 순서가 'channels_last' (높이, 너비, 채널)인지 확인하세요. 필요하다면 `keras.backend.image_data_format()`으로 확인할 수 있습니다.
- 대용량 데이터셋의 경우, `fit_generator`를 사용하여 메모리 효율적으로 훈련할 수 있습니다.

# 딥러닝 모델 구성 및 컴파일 가이드

## 1. 모델 구성 (Model Architecture)

### Sequential API 사용
간단한 모델의 경우:

```python
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, LSTM, Dropout

model = Sequential([
    Dense(64, activation='relu', input_shape=(100,)),
    Dense(32, activation='relu'),
    Dense(1, activation='sigmoid')
])
```

### Functional API 사용
복잡한 모델이나 다중 입력/출력 모델의 경우:

```python
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Input, Dense

inputs = Input(shape=(100,))
x = Dense(64, activation='relu')(inputs)
x = Dense(32, activation='relu')(x)
outputs = Dense(1, activation='sigmoid')(x)

model = Model(inputs=inputs, outputs=outputs)
```

### 주요 요령:
1. 문제에 적합한 층(Layer) 선택 (예: CNN for 이미지, RNN/LSTM for 시퀀스 데이터)
2. 적절한 활성화 함수 선택 (예: ReLU for 은닉층, Sigmoid for 이진 분류)
3. 과적합 방지를 위한 정규화 기법 사용 (예: Dropout, BatchNormalization)
4. 모델 복잡도 조절 (너무 깊거나 넓지 않게)

## 2. 모델 컴파일 (Model Compilation)

기본 구조:
```python
model.compile(optimizer='adam',
              loss='binary_crossentropy',
              metrics=['accuracy'])
```

### 주요 요령:
1. Optimizer 선택
   - Adam: 대부분의 경우에 좋은 선택
   - SGD: 더 세밀한 제어가 필요할 때
   - RMSprop: RNN에 효과적

2. Loss Function 선택
   - Binary Crossentropy: 이진 분류
   - Categorical Crossentropy: 다중 분류
   - Mean Squared Error: 회귀 문제

3. Metrics 선택
   - Accuracy: 분류 문제
   - Mean Absolute Error: 회귀 문제

4. 학습률(Learning Rate) 설정
   ```python
   from tensorflow.keras.optimizers import Adam
   optimizer = Adam(learning_rate=0.001)
   model.compile(optimizer=optimizer, ...)
   ```

5. 사용자 정의 손실 함수나 메트릭 사용 (필요시)

### 추가 팁:
- `model.summary()`를 사용하여 모델 구조 확인
- 복잡한 모델의 경우 시각화 도구 사용 (예: TensorBoard)
- 실험을 통해 최적의 하이퍼파라미터 찾기

# LSTM 모델 레이어 파라미터 가이드

```python
model = Sequential([
    Input(shape=(100,)),
    Embedding(100, 32),
    LSTM(64, return_sequences=True),
    Dropout(0.2),
    LSTM(32),
    Dropout(0.2),
    Dense(16, activation='relu'),
    Dropout(0.2),
    Dense(1, activation='sigmoid')
])
```

## 1. Input Layer
```python
Input(shape=(100,))
```
- `shape=(100,)`: 각 입력 시퀀스의 길이가 100임을 의미합니다.
- 이는 패딩된 시퀀스의 최대 길이와 일치해야 합니다.

## 2. Embedding Layer
```python
Embedding(100, 32)
```
- 첫 번째 인자 `100`: 어휘 크기(vocabulary size)를 나타냅니다. 이는 데이터셋의 고유한 단어(또는 토큰) 수보다 크거나 같아야 합니다.
- 두 번째 인자 `32`: 임베딩 벡터의 차원을 나타냅니다. 이는 조정 가능한 하이퍼파라미터입니다.

## 3. LSTM Layers
```python
LSTM(64, return_sequences=True)
LSTM(32)
```
- `64`와 `32`: LSTM 유닛(셀)의 수를 나타냅니다. 이는 조정 가능한 하이퍼파라미터입니다.
- `return_sequences=True`: 첫 번째 LSTM 레이어에서 모든 시간 단계의 출력을 반환합니다. 이는 두 번째 LSTM 레이어로 시퀀스를 전달하기 위해 필요합니다.
- 두 번째 LSTM에는 `return_sequences=True`가 없으므로 마지막 시간 단계의 출력만 반환합니다.

## 4. Dropout Layers
```python
Dropout(0.2)
```
- `0.2`: 20%의 뉴런을 랜덤하게 비활성화합니다. 이 비율은 조정 가능한 하이퍼파라미터입니다.

## 5. Dense Layers
```python
Dense(16, activation='relu')
Dense(1, activation='sigmoid')
```
- `16`: 첫 번째 Dense 레이어의 유닛 수입니다. 이는 조정 가능한 하이퍼파라미터입니다.
- `1`: 출력 레이어의 유닛 수입니다. 이진 분류 문제이므로 1개의 유닛을 사용합니다.
- `activation='relu'`: ReLU 활성화 함수를 사용합니다.
- `activation='sigmoid'`: 이진 분류를 위한 시그모이드 활성화 함수를 사용합니다.

## 주의사항:
1. Embedding 레이어의 첫 번째 인자(어휘 크기)는 데이터셋의 고유 단어 수보다 크거나 같아야 합니다.
2. Input 레이어의 `shape`는 실제 데이터의 shape와 일치해야 합니다.
3. LSTM과 Dense 레이어의 유닛 수는 문제의 복잡성과 데이터셋의 크기에 따라 조정할 수 있습니다.
4. Dropout 비율은 과적합 정도에 따라 조정할 수 있습니다.

# SimpleRNN 가이드 및 사용 예시

SimpleRNN (Simple Recurrent Neural Network)은 기본적인 형태의 순환 신경망입니다.

## 특징
- 시퀀스 데이터 처리에 적합
- 이전 시점의 정보를 현재 시점으로 전달
- 장기 의존성 문제로 인해 긴 시퀀스에서는 성능이 떨어질 수 있음

## 주요 용도
SimpleRNN은 주로 텍스트나 시계열 데이터 처리에 더 유리합니다. 그 이유는 다음과 같습니다:

1. 순차적 정보 처리: 텍스트나 시계열 데이터는 본질적으로 순차적이며, SimpleRNN은 이러한 순차적 정보를 처리하는 데 적합합니다.
2. 시간적 의존성: SimpleRNN은 이전 시점의 정보를 다음 시점으로 전달할 수 있어, 텍스트의 문맥이나 시계열 데이터의 시간적 패턴을 잡아낼 수 있습니다.

하지만 이미지 처리에도 사용될 수 있습니다:

1. 이미지를 1D 시퀀스로 변환: 2D 이미지를 1D 시퀀스로 변환하여 처리할 수 있습니다.
2. 특정 이미지 처리 작업: 예를 들어, 이미지 캡션 생성과 같은 작업에서 CNN과 결합하여 사용될 수 있습니다.

## 사용 예시

### 1. 텍스트 처리 (감성 분석)

```python
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, SimpleRNN, Dense

vocab_size = 10000  # 어휘 크기
max_length = 100    # 시퀀스 최대 길이

model = Sequential([
    Embedding(vocab_size, 32, input_length=max_length),
    SimpleRNN(64, return_sequences=True),
    SimpleRNN(32),
    Dense(1, activation='sigmoid')
])

model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
```

### 2. 시계열 데이터 처리 (주식 가격 예측)

```python
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import SimpleRNN, Dense

model = Sequential([
    SimpleRNN(50, activation='relu', input_shape=(None, 1), return_sequences=True),
    SimpleRNN(50, activation='relu'),
    Dense(1)
])

model.compile(optimizer='adam', loss='mse')
```

### 3. 이미지 처리 (MNIST 손글씨 분류)

```python
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import SimpleRNN, Dense, Reshape

# MNIST 이미지 크기: 28x28
model = Sequential([
    Reshape((28, 28), input_shape=(784,)),  # 1D 입력을 2D로 변환
    SimpleRNN(128, activation='relu', input_shape=(28, 28)),
    Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
```

이 예시에서는 MNIST 이미지를 28개의 28차원 벡터 시퀀스로 취급합니다.

## 주의사항
- SimpleRNN은 장기 의존성 문제로 인해 긴 시퀀스에서는 성능이 떨어질 수 있습니다. 이런 경우 LSTM이나 GRU를 고려해볼 수 있습니다.
- 이미지 처리에 SimpleRNN을 사용할 때는 일반적으로 CNN보다 성능이 떨어질 수 있습니다. 복잡한 이미지 처리 작업에는 CNN이나 더 발전된 아키텍처를 사용하는 것이 좋습니다.

# 텍스트 처리를 위한 딥러닝 모델 가이드

## 1. GRU (Gated Recurrent Unit)
GRU는 LSTM의 간소화된 버전으로, 비슷한 성능을 보이면서도 계산 효율성이 더 높습니다.

장점:
- LSTM보다 간단한 구조로 학습 속도가 빠름
- 적은 파라미터로 LSTM과 유사한 성능

사용 예:
```python
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, GRU, Dense

model = Sequential([
    Embedding(vocab_size, 32, input_length=max_length),
    GRU(64, return_sequences=True),
    GRU(32),
    Dense(1, activation='sigmoid')
])
```

## 2. 1D CNN (1-Dimensional Convolutional Neural Network)
1D CNN은 텍스트의 지역적 패턴을 잡아내는 데 효과적이며, 병렬 처리가 가능해 학습 속도가 빠릅니다.

장점:
- 빠른 학습 속도
- 지역적 특징 추출에 효과적

사용 예:
```python
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, Conv1D, GlobalMaxPooling1D, Dense

model = Sequential([
    Embedding(vocab_size, 32, input_length=max_length),
    Conv1D(128, 5, activation='relu'),
    GlobalMaxPooling1D(),
    Dense(1, activation='sigmoid')
])
```

## 3. Transformer
Transformer는 주목(Attention) 메커니즘을 기반으로 하며, 긴 시퀀스 처리에 효과적입니다.

장점:
- 병렬 처리로 인한 빠른 학습
- 장거리 의존성 포착에 탁월

사용 예:
```python
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Input, Embedding, MultiHeadAttention, LayerNormalization, Dense, Dropout, GlobalAveragePooling1D

def transformer_encoder(inputs, head_size, num_heads, ff_dim, dropout=0):
    x = MultiHeadAttention(key_dim=head_size, num_heads=num_heads, dropout=dropout)(inputs, inputs)
    x = Dropout(dropout)(x)
    x = LayerNormalization(epsilon=1e-6)(x)
    res = x + inputs
    
    x = Dense(ff_dim, activation="relu")(res)
    x = Dropout(dropout)(x)
    x = Dense(inputs.shape[-1])(x)
    x = LayerNormalization(epsilon=1e-6)(x)
    
    return x + res

model = Sequential([
    Input(shape=(max_length,)),
    Embedding(vocab_size, 32),
    transformer_encoder(head_size=32, num_heads=2, ff_dim=32),
    GlobalAveragePooling1D(),
    Dense(1, activation="sigmoid")
])
```

## 4. BERT (Bidirectional Encoder Representations from Transformers)
BERT는 사전 학습된 Transformer 기반 모델로, 다양한 NLP 태스크에서 최고 수준의 성능을 보입니다.

장점:
- 강력한 텍스트 이해 능력
- 다양한 태스크에 적용 가능 (전이 학습)

사용 예:
```python
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Input, Dense, GlobalAveragePooling1D
from transformers import TFBertModel, BertTokenizer

tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
bert = TFBertModel.from_pretrained('bert-base-uncased')

model = Sequential([
    Input(shape=(max_length,), dtype='int32'),
    bert.layers[0],
    GlobalAveragePooling1D(),
    Dense(64, activation='relu'),
    Dense(1, activation='sigmoid')
])

# 입력 데이터 준비 (토큰화 및 패딩)
inputs = tokenizer("Your text here", padding=True, truncation=True, return_tensors="tf")
```

## 선택 가이드:
- 간단한 문제, 빠른 학습이 필요한 경우: GRU 또는 1D CNN
- 긴 시퀀스, 복잡한 관계 파악이 필요한 경우: Transformer
- 최고의 성능이 필요하고 컴퓨팅 리소스가 충분한 경우: BERT

# 이미지 처리를 위한 딥러닝 모델 가이드


## 1. CNN (Convolutional Neural Network)
CNN은 이미지 처리 태스크에서 가장 기본적이고 널리 사용되는 모델입니다.

장점:
- 이미지의 지역적 특징을 효과적으로 추출
- 파라미터 공유로 인한 효율적인 학습

사용 예:
```python
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense

model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224, 3)),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    Flatten(),
    Dense(64, activation='relu'),
    Dense(10, activation='softmax')
])
```

## 2. ResNet (Residual Network)
ResNet은 skip connection을 사용하여 매우 깊은 네트워크를 효과적으로 학습할 수 있게 합니다.

장점:
- 매우 깊은 네트워크 학습 가능
- 그래디언트 소실 문제 해결

사용 예:
```python
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, BatchNormalization, Activation, Add, Input, GlobalAveragePooling2D, Dense

def residual_block(x, filters, kernel_size=3, stride=1):
    y = Conv2D(filters, kernel_size, padding='same', strides=stride)(x)
    y = BatchNormalization()(y)
    y = Activation('relu')(y)
    y = Conv2D(filters, kernel_size, padding='same')(y)
    y = BatchNormalization()(y)
    
    if stride != 1 or x.shape[-1] != filters:
        x = Conv2D(filters, 1, strides=stride, padding='same')(x)
        x = BatchNormalization()(x)
    
    out = Add()([x, y])
    out = Activation('relu')(out)
    return out

model = Sequential([
    Input(shape=(224, 224, 3)),
    Conv2D(64, 7, strides=2, padding='same'),
    BatchNormalization(),
    Activation('relu'),
    MaxPooling2D(3, strides=2, padding='same'),
    residual_block(filters=64),
    residual_block(filters=64),
    residual_block(filters=128, stride=2),
    residual_block(filters=128),
    residual_block(filters=256, stride=2),
    residual_block(filters=256),
    residual_block(filters=512, stride=2),
    residual_block(filters=512),
    GlobalAveragePooling2D(),
    Dense(1000, activation='softmax')
])
```

## 3. Inception
Inception 모델은 다양한 크기의 컨볼루션 필터를 병렬로 사용하여 다양한 스케일의 특징을 추출합니다.

장점:
- 다양한 스케일의 특징 추출
- 효율적인 파라미터 사용

사용 예:
```python
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Concatenate, GlobalAveragePooling2D, Dense, Input

def inception_module(x, filters):
    conv1x1 = Conv2D(filters, (1, 1), padding='same', activation='relu')(x)
    
    conv3x3 = Conv2D(filters, (1, 1), padding='same', activation='relu')(x)
    conv3x3 = Conv2D(filters, (3, 3), padding='same', activation='relu')(conv3x3)
    
    conv5x5 = Conv2D(filters, (1, 1), padding='same', activation='relu')(x)
    conv5x5 = Conv2D(filters, (5, 5), padding='same', activation='relu')(conv5x5)
    
    pool = MaxPooling2D((3, 3), strides=(1, 1), padding='same')(x)
    pool = Conv2D(filters, (1, 1), padding='same', activation='relu')(pool)
    
    output = Concatenate()([conv1x1, conv3x3, conv5x5, pool])
    return output

inputs = Input(shape=(224, 224, 3))
x = Conv2D(64, (7, 7), strides=(2, 2), padding='same', activation='relu')(inputs)
x = MaxPooling2D((3, 3), strides=(2, 2), padding='same')(x)

x = inception_module(x, 64)
x = inception_module(x, 120)
x = MaxPooling2D((3, 3), strides=(2, 2), padding='same')(x)

x = inception_module(x, 240)
x = inception_module(x, 360)

x = GlobalAveragePooling2D()(x)
x = Dense(1000, activation='softmax')(x)

model = Sequential([inputs, x])
```

## 4. U-Net
U-Net은 인코더-디코더 구조를 가진 모델로, 이미지 세그멘테이션 태스크에 주로 사용됩니다.

장점:
- 고해상도 특징 보존
- 적은 학습 데이터로도 좋은 성능

사용 예:
```python
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, UpSampling2D, Concatenate, Input

def conv_block(inputs, filters):
    x = Conv2D(filters, 3, activation='relu', padding='same')(inputs)
    x = Conv2D(filters, 3, activation='relu', padding='same')(x)
    return x

def encoder_block(inputs, filters):
    x = conv_block(inputs, filters)
    p = MaxPooling2D((2, 2))(x)
    return x, p

def decoder_block(inputs, skip_features, filters):
    x = UpSampling2D((2, 2))(inputs)
    x = Concatenate()([x, skip_features])
    x = conv_block(x, filters)
    return x

inputs = Input((256, 256, 3))

# Encoder
e1, p1 = encoder_block(inputs, 64)
e2, p2 = encoder_block(p1, 128)
e3, p3 = encoder_block(p2, 256)
e4, p4 = encoder_block(p3, 512)

# Bridge
b = conv_block(p4, 1024)

# Decoder
d1 = decoder_block(b, e4, 512)
d2 = decoder_block(d1, e3, 256)
d3 = decoder_block(d2, e2, 128)
d4 = decoder_block(d3, e1, 64)

outputs = Conv2D(1, 1, activation='sigmoid')(d4)

model = Sequential([inputs, outputs])
```

## 선택 가이드:
- 일반적인 이미지 분류 태스크: CNN 또는 ResNet
- 복잡한 이미지 분류 태스크, 높은 정확도 필요: Inception 또는 ResNet의 변형(예: ResNeXt, DenseNet)
- 이미지 세그멘테이션: U-Net 또는 그 변형(예: DeepLab)
- 객체 탐지: YOLO, SSD, 또는 Faster R-CNN 계열의 모델