# Object Detection - Mission 7
#### Ensemble
앙상블은 최종 아웃풋의 품질과 가장 직점적으로 연관이 있고, 시간 대비 좋은 결과를 낼 수 있는 방법입니다!
지금까지 학습시킨 모델들을 혹은 Sample Submission을 이용해 앙상블 코드를 작성해봅시다.
<br>Ensemble의 자세한 내용은 09강: Ready for Competition 강의를 참고합니다.

## 대회 데이터셋 구성
Custom 데이터를 구현하여 대회 데이터셋에 Ensemble 방법을 적용해봅니다. <br>
데이터셋의 자세한 개요는 [대회 플랫폼](https://next.stages.ai/competitions/)의 데이터 설명을 참고합니다.
> Copyright: CC BY 2.0

### dataset
    ├── train.json
    ├── test.json
    ├── train
    └── test

In [None]:
!pip install ensemble_boxes

In [19]:
import pandas as pd
from ensemble_boxes import *
import numpy as np
from pycocotools.coco import COCO

In [20]:
# ensemble csv files
submission_files = ['/data/ephemeral/home/level2-objectdetection-cv-10/develop/yumin/assignments/emsemble_5679.csv',
                   '/data/ephemeral/home/level2-objectdetection-cv-10/develop/yumin/assignments/emsemble_5708.csv',
                   '/data/ephemeral/home/level2-objectdetection-cv-10/develop/yumin/assignments/ensemble_5975.csv']
submission_df = [pd.read_csv(file) for file in submission_files]

In [21]:
image_ids = submission_df[0]['image_id'].tolist()

In [22]:
# ensemble 할 file의 image 정보를 불러오기 위한 json
annotation = '../../../dataset/test.json'
coco = COCO(annotation)

loading annotations into memory...
Done (t=0.02s)
creating index...
index created!


In [23]:
prediction_strings = []
file_names = []
# ensemble 시 설정할 iou threshold 이 부분을 바꿔가며 대회 metric에 알맞게 적용해봐요!
iou_thr = 0.55
skip_box_thr = 0.0001


# 각 image id 별로 submission file에서 box좌표 추출
for i, image_id in enumerate(image_ids):
    prediction_string = ''
    boxes_list = []
    scores_list = []
    labels_list = []
    image_info = coco.loadImgs(i)[0]
#     각 submission file 별로 prediction box좌표 불러오기
    for df in submission_df:
        predict_string = df[df['image_id'] == image_id]['PredictionString'].tolist()[0]
        predict_list = str(predict_string).split()

        if len(predict_list)==0 or len(predict_list)==1:
            continue

        predict_list = np.reshape(predict_list, (-1, 6))
        box_list = []

        for box in predict_list[:, 2:6].tolist():
            box[0] = float(box[0]) / image_info['width']
            box[1] = float(box[1]) / image_info['height']
            box[2] = float(box[2]) / image_info['width']
            box[3] = float(box[3]) / image_info['height']
            box_list.append(box)

        boxes_list.append(box_list)
        scores_list.append(list(map(float, predict_list[:, 1].tolist())))
        labels_list.append(list(map(int, predict_list[:, 0].tolist())))



    #예측 box가 있다면 이를 ensemble 수행
    if len(boxes_list):
        #boxes, scores, labels = nms(boxes_list, scores_list, labels_list, iou_thr=iou_thr)
        boxes, scores, labels = weighted_boxes_fusion(boxes_list, scores_list, labels_list, iou_thr=iou_thr, skip_box_thr = skip_box_thr)
        for box, score, label in zip(boxes, scores, labels):
            prediction_string += str(int(label)) + ' ' + str(score) + ' ' + str(box[0] * image_info['width']) + ' ' + str(box[1] * image_info['height']) + ' ' + str(box[2] * image_info['width']) + ' ' + str(box[3] * image_info['height']) + ' '

    prediction_strings.append(prediction_string)
    file_names.append(image_id)



In [24]:
submission = pd.DataFrame()
submission['PredictionString'] = prediction_strings
submission['image_id'] = file_names
submission.to_csv('../../../ensemble_wbf_2.csv', index=False)

submission.head(10)

Unnamed: 0,PredictionString,image_id
0,7 0.9331467151641846 215.4086456298828 49.6362...,test/0000.jpg
1,5 0.8649659156799316 131.83596801757812 0.1347...,test/0001.jpg
2,1 0.897677481174469 423.9166259765625 268.0089...,test/0002.jpg
3,9 0.6743699312210083 141.8920440673828 261.537...,test/0003.jpg
4,1 0.6247485876083374 201.36680603027344 268.65...,test/0004.jpg
5,2 0.9243066906929016 351.7372741699219 224.574...,test/0005.jpg
6,5 0.8172712922096252 352.92816162109375 454.23...,test/0006.jpg
7,1 0.6490755081176758 100.41976928710938 77.622...,test/0007.jpg
8,7 0.8881844282150269 387.2281799316406 458.391...,test/0008.jpg
9,0 0.8284757137298584 283.6282958984375 110.991...,test/0009.jpg


### Reference
https://github.com/ZFTurbo/Weighted-Boxes-Fusion

###**콘텐츠 라이선스**

<font color='red'><b>**WARNING**</b></font> : **본 교육 콘텐츠의 지식재산권은 재단법인 네이버커넥트에 귀속됩니다. 본 콘텐츠를 어떠한 경로로든 외부로 유출 및 수정하는 행위를 엄격히 금합니다.** 다만, 비영리적 교육 및 연구활동에 한정되어 사용할 수 있으나 재단의 허락을 받아야 합니다. 이를 위반하는 경우, 관련 법률에 따라 책임을 질 수 있습니다.
