# pretrained-network convnet 

* **pretrained-network**란?
    - 대규모 이미지 분류문제를 위해 대량의 데이터셋에서 미리 훈련되어 저장된 네트워크
    - ImageNet dataset에 network를 훈련한다
        + 1400만개의 label과 1000개의 class로 이뤄짐


* `keras.applications`에서 import할 수 있는 이미지 분류 model
    - VGG
    - Inception
    - ResNet
    - Inception-ResNet
    - Xception


* pretrained model을 사용하는 2가지 방식
    1. Feature extraction
        - Pretrained-network의 표현을 사용해 새로운 sample에서 적절한 feature을 뽑아내는 것 -> 이 feature을 이용해 새로운 classifier를 처음부터 훈련시킴
    2. Fine tuning

## Feature extraction
![image.png](attachment:image.png)
ex) convnet= convolutional base(Conv+Maxpooling) + 완전연결분류기
- convnet에서의 feature extraction
    * convolutional base layer을 선택해 새로운 data를 통과시켜 출력값을 얻음
    * 그 출력으로 새로운 classifier를 훈련


- feature extraction 특징
    * convnet의 feature map은 사진에 대한 일반적인 콘셉트의 존재 여부를 기록한 map
    * 그러나 classifier에선 학습한 표현이 존재 여부가 아닌 model의 훈련된 class 집합에 특화돼있음 -> class의 존재 확률에 관한 정보를 담음
     * classifier인 완전연결층은 공간 개념을 제거(객체 위치 정보 없음)
     * convolutional base layer의 feature map은 객체 위치 고려!
        

**feature extraction의 성능은 model 층 깊이에 달려있다**
- model의 하위층은 지역적이고 일반적인 특성을 다룸 ex) 에지,색깔, 질감 등
- 상위층은 추상적인 개념을 다룸 ex) 고양이 귀, 강아지 눈

>**TIP**    
>새로운 dataset이 원본 model이 훈련한 dataset과 많이 다르다면 전체 convolutional base layer을 사용하는 것보다는 modeldm


![image.png](attachment:image.png)

In [7]:
from keras.applications import VGG16

conv_base_1=VGG16(weights='imagenet',
               include_top=False, #최상위 완전연결 분류기를 포함하지 않겠다
               input_shape=(150,150,3))

# weights: model을 초기화할 가중치 checkpoint를 지정
# include_top: network의 최상위 완전 연결 분류기를 포함할지 안할지를 결정
# input_shape: network에 주입할 image tensor 크기

# include_top 값이 True가 되면 분류기 층이 추가되기 떄문에 input_shape은 원본 model과 동일한 (224, 224, 3)이 되어야 함 ???

### VGG16

In [5]:
from keras.applications import ResNet50

conv_base_2=ResNet50(weights='imagenet',
                    include_top=False,
                    input_shape=(150,150,3))

In [6]:
conv_base_2.summary()

Model: "resnet50"
__________________________________________________________________________________________________
Layer (type)                    Output Shape         Param #     Connected to                     
input_3 (InputLayer)            (None, 150, 150, 3)  0                                            
__________________________________________________________________________________________________
conv1_pad (ZeroPadding2D)       (None, 156, 156, 3)  0           input_3[0][0]                    
__________________________________________________________________________________________________
conv1 (Conv2D)                  (None, 75, 75, 64)   9472        conv1_pad[0][0]                  
__________________________________________________________________________________________________
bn_conv1 (BatchNormalization)   (None, 75, 75, 64)   256         conv1[0][0]                      
___________________________________________________________________________________________

### ResNet50

#### 1. argumentation을 사용하지 않는 feature extraction

새로운 dataset에서 conv base layer를 실행하고 출력을 넘파이 배열로 디스크에 저장    
그 다음 독립된 완전 연결 분류기에 입력으로 사용    
- 입력 image에 대해 conv base layer을 한번만 실행하면 되기 때문에 빠르고 비용이 적게 듬
- 그러나 data argumentation을 사용할 수 없기 때문에 data 수가 적을 때는 over-fitting의 우려가 있음

In [11]:
import os
import numpy as np
from keras.preprocessing.image import ImageDataGenerator

base_dir='./datasets/cats_and_dog_small'
train_dir=os.path.join(base_dir, 'train')
validation_dir=os.path.join(base_dir, 'validation')
test_dir=os.path.join(base_dir, 'test')

datagen=ImageDataGenerator(rescale=1./255) #gneralization
batch_size=20

def extract_features(directory, sample_count, conv_base):

    features=np.zeros(shape=(sample_count,4,4,512)) #conv layer output shape
    labels = np.zeros(shape=(sample_count))
    generator = datagen.flow_from_directory(directory,
                                           target_size=(150,150),
                                           batch_size=batch_size,
                                           class_mode='binary')
    i=0
    for inputs_batch, lables_batch in generator:
        feature_batch=conv_base.predict(inputs_batch)
        features[i*batch_size:(i+1)*batch_size]=feature_batch
        labels[i*batch_size:(i+1)*batch_size]=labels_batch
        i += 1
        if i * batch_size> sample_count:
            break
    return features, labels


In [12]:
train_features, train_labels= extract_features(train_dir, 2000, conv_base_1)
validation_features, validation_labels= extract_features(validation_dir, 2000, conv_base_1)
test_features, test_labels= extract_features(test_dir, 2000, conv_base_1)

FileNotFoundError: [WinError 3] 지정된 경로를 찾을 수 없습니다: './datasets/cats_and_dog_small\\train'

#### 2. argumentation을 사용한 feature extraction