## EfficientNet v2
- Paper : (2021)_EfficientNet V2-Smaller Models and Faster Training

- 기존의 EfficientNet은 NAS를 활용한 baseline mocel (B0)을 생성 후 compound scaling을 활용해 파라미터는 많이 증가시키지 않은채로 네트워크의 capacity를 증가시키는 방법
- **Training efficiency를 향상시키기 위해 빠른 학습과 효율적인 파라미터 사용에 집중**
- **이미지 크기에 따라 정규화 조정하는 progressive learning 방법 제안**


![efficientnet_v2_efficiency](img/efficientnet_v2_efficiency.PNG)

- Efficientnet v1 대비 학습속도(4배), 파라미터(6.8배) 로 비슷한 정확도 달성

<hr>

### Efficiency 및 병목 현상에 대한 연구
- 학습 속도를 느리게 하는 3가지 요소 설명

#### 1. Training with very large image sizes is slow
    - 큰 입력 이미지로 학습시, 메모리가 제한되어 적은 batch size로 학습하게 되며, 전체 이미지 학습에 시간이 오래걸림

#### 2. Depthwise convolutions are slow in early layers
![efficientnet_v2_mbconv](img/efficientnet_v2_mbconv.png)
- Depthwise convolution은 MobileNetV1, Xception에서 제안된 방법
- Depthwise convolution은 conv 연산량을 낮춰, 제한된 연산량 내에 더 많은 filter를 사용할 수 있는 이점
- Depthwise convolution은 modern accelerator를 활용x 
    - 학습 속도를 느리게 함
- MBConv를 Fused-MBConv로 일부 대체(초기 stage만) 및 두 블록의 최적 조합으로 구성
- **Fused-MBConv는 MBConv의 1x1 conv + 3x3 depthwise conv 대신, 하나의 3x3conv를 사용**
![efficientnet_v2_fused_mbconv](img/efficientnet_v2_fused_mbconv.png)

#### 3. Equally scaling up every stage is sub-optimal
- 기존 EfficientNet : compound scaling을 통해 모든 Stage에 동일하게 모델 확장 
    - ex) depth가 2이면 모드 stage(=block개념)의 layer가 2배
- stage마다 훈련 속도에 기여하는 정도가 다르며, **non-uniform scaling 전략 사용**
    - non-uniform scaling strategy :  stage가 증가할 수록 layer가 증가하는 정도를 높인 것
- compound scaling의 이미지 사이즈에 따른 훈련 효율 감소 최소화를 위해 이미지 사이즈 최댓값을 작은 값으로 제한
- progressive learning시 학습 속도 느리게 하는 것 방지

<hr>


### Progressive Learning
- **훈련 시 이미지의 크기를 점진적으로 증가시키는 것**
- 학습 속도를 빠르게 하기 위해 사용하지만, 정확도가 감소한다는 문제점 존재
    - 정확도 감소의 문제는 작은 이미지에 동일한 정규화를 사용하기 때문
- 입력 이미지 크기에 따라 정규화 방법 다르게 설정
    - **입력 이미지가 작을 시 약한 정규화**
        - Augmentation / Dropout / Mixup 확률을 낮게 설정
    - **입력 이미지가 클 시 강한 정규화**
        - Augmentation / Dropout / Mixup 확률 높게 설정
    - 입력 이미지가 커질 수록 RandAug magnitude를 높게 설정하여 성능이 향상
    
#### Progressive Results
- 입력 이미지가 커질 수록 RandAug manitude를 높게 설정, 성능 향상

![efficientnet_v2_progressive_learning](img/efficientnet_v2_progressive_learning.png)

![efficientnet_v2_progressive_learning2](img/efficientnet_v2_progressive_learning2.png)

#### Progressive Training Setting
- 입력 이미지가 커질수록 점진적으로 Option 값 증가

![efficientnet_v2_progressive_learning3](img/efficientnet_v2_progressive_learning3.png)


#### Progressive 다른 모델 적용
- 다른 모델에 적용해도 성능 향상

![efficientnet_v2_progressive_learning_result](img/efficientnet_v2_progressive_learning_result.png)


### EfficientNet v2 Architecture & Performance

![efficientnet_v2_architecture](img/efficientnet_v2_architecture.png)

![efficientnet_v2_performance](img/efficientnet_v2_performance.png)

<hr>

## 참고문헌

- https://seing.tistory.com/164
- https://deep-learning-study.tistory.com/567