In [1]:
import os
import numpy as np
import pandas as pd
from itertools import combinations
from sklearn.metrics import accuracy_score, recall_score, precision_score, f1_score
import sklearn
import warnings

# 경고 메시지를 무시하고 숨기거나
warnings.filterwarnings(action='ignore')

In [2]:
#label_to_num dict
l2n_dict ={'no_relation': 0, 'org:top_members/employees': 1, 'org:members': 2, 'org:product': 3, 'per:title': 4, 'org:alternate_names': 5, 'per:employee_of': 6, 'org:place_of_headquarters': 7, 'per:product': 8, 'org:number_of_employees/members': 9, 'per:children': 10, 
         'per:place_of_residence': 11, 'per:alternate_names': 12, 'per:other_family': 13, 'per:colleagues': 14, 'per:origin': 15, 'per:siblings': 16, 'per:spouse': 17, 'org:founded': 18, 'org:political/religious_affiliation': 19, 'org:member_of': 20, 
         'per:parents': 21, 'org:dissolved': 22, 'per:schools_attended': 23, 'per:date_of_death': 24, 'per:date_of_birth': 25, 'per:place_of_birth': 26, 'per:place_of_death': 27, 'org:founded_by': 28, 'per:religion': 29}



#num_to_label dict
n2l_dict = {value:key for key, value in list(l2n_dict.items())}



#labels 숫자형태로 만들기(모범답안)
test_with_label = pd.read_csv("../data/test_with_label.csv")
labels = list(test_with_label["label"])

for i in range(len(labels)):
    labels[i] = l2n_dict[labels[i]]



# f1계산해주는 함수
def klue_re_micro_f1(preds, labels):
    """KLUE-RE micro f1 (except no_relation)"""
    label_list = ['no_relation', 'org:top_members/employees', 'org:members',
       'org:product', 'per:title', 'org:alternate_names',
       'per:employee_of', 'org:place_of_headquarters', 'per:product',
       'org:number_of_employees/members', 'per:children',
       'per:place_of_residence', 'per:alternate_names',
       'per:other_family', 'per:colleagues', 'per:origin', 'per:siblings',
       'per:spouse', 'org:founded', 'org:political/religious_affiliation',
       'org:member_of', 'per:parents', 'org:dissolved',
       'per:schools_attended', 'per:date_of_death', 'per:date_of_birth',
       'per:place_of_birth', 'per:place_of_death', 'org:founded_by',
       'per:religion']
    no_relation_label_idx = label_list.index("no_relation")
    label_indices = list(range(len(label_list)))
    label_indices.remove(no_relation_label_idx)
    return sklearn.metrics.f1_score(labels, preds, average="micro", labels=label_indices) * 100.0



# 성능 계산해주는 함수
def score_calculator(file_list):
    scores = []
    for i in range(len(file_list)):
        
        temp = eval(f"df{i}")
        
        #preds를 숫자로 바꾸기
        preds = list(temp["pred_label"])
        for i in range(len(preds)):
            preds[i] = l2n_dict[preds[i]]
            
            
        scores.append(klue_re_micro_f1(preds, labels))
        
    return scores

# 앙상블 해주는 함수
def ensemble(file_list, num):
    for candidates in combinations(range(len(file_list)), num):
        temp = pd.DataFrame({"id":list(range(7765)) , "pred_label":range(7765), "probs":[[0.0]*30 for _ in range(7765)] })


        score_sum = 0
        for i in candidates:
            for j in range(7765):
                temp["probs"][j] = temp["probs"][j] + np.array(eval(eval(f"df{i}")["probs"][j]))*scores[i]

            score_sum += scores[i]


        for k in range(7765):

            #최종 temp의 pred_label 채워 놓기
            temp["pred_label"][k] = n2l_dict[np.argmax(temp["probs"][k])]

            #최종 temp의 probs 채워 놓기
            temp["probs"][k] = str(list(temp["probs"][k]/score_sum))



        #preds를 숫자로 바꾸기
        preds = list(temp["pred_label"])
        for i in range(len(preds)):
            preds[i] = l2n_dict[preds[i]] 


        print("들어간 모델: ", candidates)
        print(klue_re_micro_f1(preds, labels))
        print()
        
# 성능 계산해주는 함수
def submission(file_list, candidates):
    temp = pd.DataFrame({"id":list(range(7765)) , "pred_label":range(7765), "probs":[[0.0]*30 for _ in range(7765)] })
    score_sum = 0
    
    for i in candidates:
        for j in range(7765):
            temp["probs"][j] = temp["probs"][j] + np.array(eval(eval(f"df{i}")["probs"][j]))*scores[i]

            score_sum += scores[i]
            
    for k in range(7765):

        #최종 temp의 pred_label 채워 놓기
        temp["pred_label"][k] = n2l_dict[np.argmax(temp["probs"][k])]

        #최종 temp의 probs 채워 놓기
        temp["probs"][k] = str(list(temp["probs"][k]/score_sum))
        
    return temp

In [3]:
# ensemble 폴더에 있는 csv 파일이름 담긴 리스트 만들기
# origin = "/Users/kowoojin/Desktop/앙상블 후보군/selected"
origin = os.getcwd()
# origin = "/Users/kowoojin/Desktop/앙상블 후보군"
file_list = os.listdir(origin + "/submission")
#file_list.remove( 'selected')
#file_list.remove( '.DS_Store')
file_list.sort()
file_list = file_list[1:]
file_list

['bert-base-with_label_del_hanja_unk_64_5000.csv',
 'klueroberta-base_lr5e-5_v2.1_65.5374.csv',
 'klueroberta-base_lr5e-5_v2.2_65.9225.csv',
 'klueroberta-large38-69.9271.csv',
 'l-yohai-klue-roberta-base-finetuned-ner_65.1861.csv',
 'roberta-base_64_1500.csv',
 'roberta-base_96_2500.csv',
 'roberta-base_focal_loss_64_4000.csv',
 'roberta-base_imbal_ce_64_4000.csv',
 'submission_final_recent.csv',
 'submission_klue-bert-base_batch16_ett_kor_loss.csv',
 'submission_klue-roberta-large_batch32_ett_kor_loss.csv',
 'woojin_result_71_068.csv',
 'woojin_result_71_0868.csv',
 'woojin_result_71_259.csv']

In [16]:
i = [0,1,3,10,11]
[file_list[j] for j in i]

['bert-base-with_label_del_hanja_unk_64_5000.csv',
 'klueroberta-base_lr5e-5_v2.1_65.5374.csv',
 'klueroberta-large38-69.9271.csv',
 'submission_klue-bert-base_batch16_ett_kor_loss.csv',
 'submission_klue-roberta-large_batch32_ett_kor_loss.csv']

In [4]:
# 각각의 파일을 불러오기(df_{i} 형식)
for i in range(len(file_list)):
    globals()[f"df{i}"] = pd.read_csv(f"{origin}/submission/{file_list[i]}")

In [5]:
# #models: df들을 모아 놓은 리스트
# models =[] 
# for i in range(len(file_list)):
#     models.append(globals()[f"df{i}"])
    
    
#scores: 각 df의 리더보드 점수를 모아 놓은 리스트
scores = score_calculator(file_list)
scores

[66.10143363650377,
 64.33338276731426,
 64.87505893446487,
 68.4503557067739,
 64.42993775618643,
 64.92561983471074,
 64.1818744200433,
 64.88902589395808,
 64.2373613711652,
 50.89682116853134,
 65.35384615384616,
 66.27074767778285,
 71.0688836104513,
 71.08685182212233,
 71.259282667088]

# 앙상블 돌리는 코드!!!

In [6]:
print(file_list)
print(scores)

['bert-base-with_label_del_hanja_unk_64_5000.csv', 'klueroberta-base_lr5e-5_v2.1_65.5374.csv', 'klueroberta-base_lr5e-5_v2.2_65.9225.csv', 'klueroberta-large38-69.9271.csv', 'l-yohai-klue-roberta-base-finetuned-ner_65.1861.csv', 'roberta-base_64_1500.csv', 'roberta-base_96_2500.csv', 'roberta-base_focal_loss_64_4000.csv', 'roberta-base_imbal_ce_64_4000.csv', 'submission_final_recent.csv', 'submission_klue-bert-base_batch16_ett_kor_loss.csv', 'submission_klue-roberta-large_batch32_ett_kor_loss.csv', 'woojin_result_71_068.csv', 'woojin_result_71_0868.csv', 'woojin_result_71_259.csv']
[66.10143363650377, 64.33338276731426, 64.87505893446487, 68.4503557067739, 64.42993775618643, 64.92561983471074, 64.1818744200433, 64.88902589395808, 64.2373613711652, 50.89682116853134, 65.35384615384616, 66.27074767778285, 71.0688836104513, 71.08685182212233, 71.259282667088]


In [26]:
ensemble(file_list, num=2)

들어간 모델:  (0, 1)
67.47437092264678

들어간 모델:  (0, 2)
66.89774696707104

들어간 모델:  (0, 3)
69.99685830977064

들어간 모델:  (0, 4)
67.1662763466042

들어간 모델:  (0, 5)
67.4414902085655

들어간 모델:  (0, 6)
67.22213488445213

들어간 모델:  (0, 7)
67.29117876658862

들어간 모델:  (0, 8)
67.46802280782863

들어간 모델:  (0, 9)
66.50054508643515

들어간 모델:  (0, 10)
67.15625

들어간 모델:  (0, 11)
67.331360024926

들어간 모델:  (0, 12)
66.10143363650377

들어간 모델:  (0, 13)
66.10143363650377

들어간 모델:  (0, 14)
66.10143363650377

들어간 모델:  (1, 2)
67.06249999999999

들어간 모델:  (1, 3)
69.59228135698724

들어간 모델:  (1, 4)
65.98410757946212

들어간 모델:  (1, 5)
67.0888079784708

들어간 모델:  (1, 6)
66.6252716547656

들어간 모델:  (1, 7)
67.39297222648459

들어간 모델:  (1, 8)
66.70621385140146

들어간 모델:  (1, 9)
65.0091519219036

들어간 모델:  (1, 10)
66.84041085390159

들어간 모델:  (1, 11)
66.47337097512589

들어간 모델:  (1, 12)
64.33338276731426

들어간 모델:  (1, 13)
64.33338276731426

들어간 모델:  (1, 14)
64.33338276731426

들어간 모델:  (2, 3)
69.54050213169114

들어간 모델:  (2, 4)
65.8742571

In [27]:
ensemble(file_list, num=3)

들어간 모델:  (0, 1, 2)
68.20609487904493

들어간 모델:  (0, 1, 3)
71.02335057201066

들어간 모델:  (0, 1, 4)
67.99069045771915

들어간 모델:  (0, 1, 5)
68.64675984752225

들어간 모델:  (0, 1, 6)
68.41203054386786

들어간 모델:  (0, 1, 7)
68.25470963724116

들어간 모델:  (0, 1, 8)
68.31050228310502

들어간 모델:  (0, 1, 9)
67.53044021230097

들어간 모델:  (0, 1, 10)
68.96981014628074

들어간 모델:  (0, 1, 11)
69.26889714993804

들어간 모델:  (0, 1, 12)
67.47437092264678

들어간 모델:  (0, 1, 13)
67.47437092264678

들어간 모델:  (0, 1, 14)
67.47437092264678

들어간 모델:  (0, 2, 3)
70.07761761444638

들어간 모델:  (0, 2, 4)
67.47404844290658

들어간 모델:  (0, 2, 5)
66.99951683040747

들어간 모델:  (0, 2, 6)
67.23484848484848

들어간 모델:  (0, 2, 7)
67.12955657251065

들어간 모델:  (0, 2, 8)
67.62835427330542

들어간 모델:  (0, 2, 9)
66.96428571428572

들어간 모델:  (0, 2, 10)
68.7351590945069

들어간 모델:  (0, 2, 11)
68.49271690943635

들어간 모델:  (0, 2, 12)
66.89774696707104

들어간 모델:  (0, 2, 13)
66.89774696707104

들어간 모델:  (0, 2, 14)
66.89774696707104

들어간 모델:  (0, 3, 4)
69.95910663730733

들어간

들어간 모델:  (2, 8, 10)
67.78979907264296

들어간 모델:  (2, 8, 11)
67.47879722436392

들어간 모델:  (2, 8, 12)
66.56483885749196

들어간 모델:  (2, 8, 13)
66.56483885749196

들어간 모델:  (2, 8, 14)
66.56483885749196

들어간 모델:  (2, 9, 10)
67.17850287907868

들어간 모델:  (2, 9, 11)
67.5835598912522

들어간 모델:  (2, 9, 12)
65.25979216626698

들어간 모델:  (2, 9, 13)
65.25979216626698

들어간 모델:  (2, 9, 14)
65.25979216626698

들어간 모델:  (2, 10, 11)
68.60502065459167

들어간 모델:  (2, 10, 12)
66.90017513134852

들어간 모델:  (2, 10, 13)
66.90017513134852

들어간 모델:  (2, 10, 14)
66.90017513134852

들어간 모델:  (2, 11, 12)
67.02616970658207

들어간 모델:  (2, 11, 13)
67.02616970658207

들어간 모델:  (2, 11, 14)
67.02616970658207

들어간 모델:  (2, 12, 13)
64.87505893446487

들어간 모델:  (2, 12, 14)
64.87505893446487

들어간 모델:  (2, 13, 14)
64.87505893446487

들어간 모델:  (3, 4, 5)
69.68775020016012

들어간 모델:  (3, 4, 6)
68.88331242158094

들어간 모델:  (3, 4, 7)
69.5297805642633

들어간 모델:  (3, 4, 8)
69.58256599140577

들어간 모델:  (3, 4, 9)
69.14826498422714

들어간 모델:  (3, 4, 10)
69

들어간 모델:  (8, 10, 12)
66.46822443816045

들어간 모델:  (8, 10, 13)
66.46822443816045

들어간 모델:  (8, 10, 14)
66.46822443816045

들어간 모델:  (8, 11, 12)
66.40188290673727

들어간 모델:  (8, 11, 13)
66.40188290673727

들어간 모델:  (8, 11, 14)
66.40188290673727

들어간 모델:  (8, 12, 13)
64.2373613711652

들어간 모델:  (8, 12, 14)
64.2373613711652

들어간 모델:  (8, 13, 14)
64.2373613711652

들어간 모델:  (9, 10, 11)
67.38035264483626

들어간 모델:  (9, 10, 12)
65.7016991818754

들어간 모델:  (9, 10, 13)
65.7016991818754

들어간 모델:  (9, 10, 14)
65.7016991818754

들어간 모델:  (9, 11, 12)
65.5824039653036

들어간 모델:  (9, 11, 13)
65.5824039653036

들어간 모델:  (9, 11, 14)
65.5824039653036

들어간 모델:  (9, 12, 13)
50.89682116853134

들어간 모델:  (9, 12, 14)
50.89682116853134

들어간 모델:  (9, 13, 14)
50.89682116853134

들어간 모델:  (10, 11, 12)
67.61786600496278

들어간 모델:  (10, 11, 13)
67.61786600496278

들어간 모델:  (10, 11, 14)
67.61786600496278

들어간 모델:  (10, 12, 13)
65.35384615384616

들어간 모델:  (10, 12, 14)
65.35384615384616

들어간 모델:  (10, 13, 14)
65.35384615384616

들어간

In [28]:
ensemble(file_list, num=4)

들어간 모델:  (0, 1, 2, 3)
70.35748180955393

들어간 모델:  (0, 1, 2, 4)
68.00438940272771

들어간 모델:  (0, 1, 2, 5)
68.0606544293695

들어간 모델:  (0, 1, 2, 6)
68.11457349700976

들어간 모델:  (0, 1, 2, 7)
68.33333333333333

들어간 모델:  (0, 1, 2, 8)
68.49992275606365

들어간 모델:  (0, 1, 2, 9)
68.2192648922687

들어간 모델:  (0, 1, 2, 10)
69.15211577788266

들어간 모델:  (0, 1, 2, 11)
69.0749175435841

들어간 모델:  (0, 1, 2, 12)
68.20609487904493

들어간 모델:  (0, 1, 2, 13)
68.20609487904493

들어간 모델:  (0, 1, 2, 14)
68.20609487904493

들어간 모델:  (0, 1, 3, 4)
70.48126665621571

들어간 모델:  (0, 1, 3, 5)
70.96052421288158

들어간 모델:  (0, 1, 3, 6)
70.70515854235683

들어간 모델:  (0, 1, 3, 7)
70.95860223516449

들어간 모델:  (0, 1, 3, 8)
70.43693833281687

들어간 모델:  (0, 1, 3, 9)
70.98707032481867

들어간 모델:  (0, 1, 3, 10)
70.81038552321007

들어간 모델:  (0, 1, 3, 11)
71.09509634967883

들어간 모델:  (0, 1, 3, 12)
71.02335057201066

들어간 모델:  (0, 1, 3, 13)
71.02335057201066

들어간 모델:  (0, 1, 3, 14)
71.02335057201066

들어간 모델:  (0, 1, 4, 5)
68.50269072491295

들어간 모델:  

들어간 모델:  (0, 3, 12, 14)
69.99685830977064

들어간 모델:  (0, 3, 13, 14)
69.99685830977064

들어간 모델:  (0, 4, 5, 6)
67.60966306420852

들어간 모델:  (0, 4, 5, 7)
67.98794989693991

들어간 모델:  (0, 4, 5, 8)
67.8672095208268

들어간 모델:  (0, 4, 5, 9)
67.6272814601345

들어간 모델:  (0, 4, 5, 10)
69.07232955452659

들어간 모델:  (0, 4, 5, 11)
68.8089528377298

들어간 모델:  (0, 4, 5, 12)
67.88844621513945

들어간 모델:  (0, 4, 5, 13)
67.88844621513945

들어간 모델:  (0, 4, 5, 14)
67.88844621513945

들어간 모델:  (0, 4, 6, 7)
67.84596117720726

들어간 모델:  (0, 4, 6, 8)
68.15935762816552

들어간 모델:  (0, 4, 6, 9)
67.6109537299339

들어간 모델:  (0, 4, 6, 10)
68.81483810122603

들어간 모델:  (0, 4, 6, 11)
68.72052813580635

들어간 모델:  (0, 4, 6, 12)
67.6236542362303

들어간 모델:  (0, 4, 6, 13)
67.6236542362303

들어간 모델:  (0, 4, 6, 14)
67.6236542362303

들어간 모델:  (0, 4, 7, 8)
68.29869130100079

들어간 모델:  (0, 4, 7, 9)
67.68552071844965

들어간 모델:  (0, 4, 7, 10)
69.09547738693468

들어간 모델:  (0, 4, 7, 11)
68.44751728472659

들어간 모델:  (0, 4, 7, 12)
67.90625

들어간 모델:  (0, 4,

들어간 모델:  (1, 2, 6, 7)
67.60651629072682

들어간 모델:  (1, 2, 6, 8)
67.64934057408844

들어간 모델:  (1, 2, 6, 9)
67.55008676447389

들어간 모델:  (1, 2, 6, 10)
68.38304552590267

들어간 모델:  (1, 2, 6, 11)
68.02763819095478

들어간 모델:  (1, 2, 6, 12)
67.31340948208417

들어간 모델:  (1, 2, 6, 13)
67.31340948208417

들어간 모델:  (1, 2, 6, 14)
67.31340948208417

들어간 모델:  (1, 2, 7, 8)
67.80133065140028

들어간 모델:  (1, 2, 7, 9)
67.54925137903862

들어간 모델:  (1, 2, 7, 10)
68.72246696035242

들어간 모델:  (1, 2, 7, 11)
68.37070722910458

들어간 모델:  (1, 2, 7, 12)
67.103620474407

들어간 모델:  (1, 2, 7, 13)
67.103620474407

들어간 모델:  (1, 2, 7, 14)
67.103620474407

들어간 모델:  (1, 2, 8, 9)
67.46203904555314

들어간 모델:  (1, 2, 8, 10)
68.59440235039432

들어간 모델:  (1, 2, 8, 11)
68.49907350216183

들어간 모델:  (1, 2, 8, 12)
67.30148978651513

들어간 모델:  (1, 2, 8, 13)
67.30148978651513

들어간 모델:  (1, 2, 8, 14)
67.30148978651513

들어간 모델:  (1, 2, 9, 10)
68.40855106888361

들어간 모델:  (1, 2, 9, 11)
68.26574088685497

들어간 모델:  (1, 2, 9, 12)
66.60377358490565

들어간 

들어간 모델:  (1, 6, 12, 14)
66.6252716547656

들어간 모델:  (1, 6, 13, 14)
66.6252716547656

들어간 모델:  (1, 7, 8, 9)
67.91819291819291

들어간 모델:  (1, 7, 8, 10)
68.56879889553612

들어간 모델:  (1, 7, 8, 11)
68.89161053276179

들어간 모델:  (1, 7, 8, 12)
67.57534454036045

들어간 모델:  (1, 7, 8, 13)
67.57534454036045

들어간 모델:  (1, 7, 8, 14)
67.57534454036045

들어간 모델:  (1, 7, 9, 10)
68.71762674619369

들어간 모델:  (1, 7, 9, 11)
68.6044694483513

들어간 모델:  (1, 7, 9, 12)
67.38250855897915

들어간 모델:  (1, 7, 9, 13)
67.39299610894942

들어간 모델:  (1, 7, 9, 14)
67.38250855897915

들어간 모델:  (1, 7, 10, 11)
69.26677067082683

들어간 모델:  (1, 7, 10, 12)
68.42841598010261

들어간 모델:  (1, 7, 10, 13)
68.42841598010261

들어간 모델:  (1, 7, 10, 14)
68.42841598010261

들어간 모델:  (1, 7, 11, 12)
68.92059553349876

들어간 모델:  (1, 7, 11, 13)
68.92059553349876

들어간 모델:  (1, 7, 11, 14)
68.92059553349876

들어간 모델:  (1, 7, 12, 13)
67.39297222648459

들어간 모델:  (1, 7, 12, 14)
67.39297222648459

들어간 모델:  (1, 7, 13, 14)
67.39297222648459

들어간 모델:  (1, 8, 9, 10)
68.

들어간 모델:  (2, 6, 7, 9)
66.79316888045541

들어간 모델:  (2, 6, 7, 10)
67.12977581307231

들어간 모델:  (2, 6, 7, 11)
67.25579927410446

들어간 모델:  (2, 6, 7, 12)
66.6981429021089

들어간 모델:  (2, 6, 7, 13)
66.6981429021089

들어간 모델:  (2, 6, 7, 14)
66.6981429021089

들어간 모델:  (2, 6, 8, 9)
66.98892873849992

들어간 모델:  (2, 6, 8, 10)
67.77501553760098

들어간 모델:  (2, 6, 8, 11)
67.61001399471311

들어간 모델:  (2, 6, 8, 12)
66.80086714152989

들어간 모델:  (2, 6, 8, 13)
66.80086714152989

들어간 모델:  (2, 6, 8, 14)
66.80086714152989

들어간 모델:  (2, 6, 9, 10)
67.39786997297726

들어간 모델:  (2, 6, 9, 11)
66.96357563225703

들어간 모델:  (2, 6, 9, 12)
65.59923906150918

들어간 모델:  (2, 6, 9, 13)
65.59923906150918

들어간 모델:  (2, 6, 9, 14)
65.59923906150918

들어간 모델:  (2, 6, 10, 11)
68.15660168013949

들어간 모델:  (2, 6, 10, 12)
67.41431053546043

들어간 모델:  (2, 6, 10, 13)
67.41431053546043

들어간 모델:  (2, 6, 10, 14)
67.41431053546043

들어간 모델:  (2, 6, 11, 12)
67.17171717171716

들어간 모델:  (2, 6, 11, 13)
67.17171717171716

들어간 모델:  (2, 6, 11, 14)
67.171717

들어간 모델:  (3, 7, 8, 12)
69.210647791968

들어간 모델:  (3, 7, 8, 13)
69.210647791968

들어간 모델:  (3, 7, 8, 14)
69.210647791968

들어간 모델:  (3, 7, 9, 10)
70.44804575786463

들어간 모델:  (3, 7, 9, 11)
70.54522333492291

들어간 모델:  (3, 7, 9, 12)
69.75269499048827

들어간 모델:  (3, 7, 9, 13)
69.75269499048827

들어간 모델:  (3, 7, 9, 14)
69.75269499048827

들어간 모델:  (3, 7, 10, 11)
70.85371626952818

들어간 모델:  (3, 7, 10, 12)
70.14009129545097

들어간 모델:  (3, 7, 10, 13)
70.14009129545097

들어간 모델:  (3, 7, 10, 14)
70.14009129545097

들어간 모델:  (3, 7, 11, 12)
70.8274231678487

들어간 모델:  (3, 7, 11, 13)
70.8274231678487

들어간 모델:  (3, 7, 11, 14)
70.8274231678487

들어간 모델:  (3, 7, 12, 13)
69.62403649520215

들어간 모델:  (3, 7, 12, 14)
69.62403649520215

들어간 모델:  (3, 7, 13, 14)
69.62403649520215

들어간 모델:  (3, 8, 9, 10)
70.42209807572937

들어간 모델:  (3, 8, 9, 11)
70.61383061383061

들어간 모델:  (3, 8, 9, 12)
69.35933147632312

들어간 모델:  (3, 8, 9, 13)
69.35933147632312

들어간 모델:  (3, 8, 9, 14)
69.35933147632312

들어간 모델:  (3, 8, 10, 11)
70.848822

들어간 모델:  (5, 6, 10, 14)
67.88696210661527

들어간 모델:  (5, 6, 11, 12)
67.21075372059529

들어간 모델:  (5, 6, 11, 13)
67.21075372059529

들어간 모델:  (5, 6, 11, 14)
67.21075372059529

들어간 모델:  (5, 6, 12, 13)
66.02840274453487

들어간 모델:  (5, 6, 12, 14)
66.02840274453487

들어간 모델:  (5, 6, 13, 14)
66.02840274453487

들어간 모델:  (5, 7, 8, 9)
67.44405924992121

들어간 모델:  (5, 7, 8, 10)
68.51472672861867

들어간 모델:  (5, 7, 8, 11)
68.47723704866563

들어간 모델:  (5, 7, 8, 12)
67.47063429913861

들어간 모델:  (5, 7, 8, 13)
67.47063429913861

들어간 모델:  (5, 7, 8, 14)
67.47063429913861

들어간 모델:  (5, 7, 9, 10)
68.34625322997417

들어간 모델:  (5, 7, 9, 11)
68.24935400516794

들어간 모델:  (5, 7, 9, 12)
66.29870129870129

들어간 모델:  (5, 7, 9, 13)
66.29870129870129

들어간 모델:  (5, 7, 9, 14)
66.29870129870129

들어간 모델:  (5, 7, 10, 11)
69.29133858267717

들어간 모델:  (5, 7, 10, 12)
68.36422240128928

들어간 모델:  (5, 7, 10, 13)
68.36422240128928

들어간 모델:  (5, 7, 10, 14)
68.36422240128928

들어간 모델:  (5, 7, 11, 12)
68.13434035031335

들어간 모델:  (5, 7, 11, 13)

In [None]:
ensemble(file_list, num=5)

들어간 모델:  (0, 1, 2, 3, 4)
70.064495831367

들어간 모델:  (0, 1, 2, 3, 5)
70.35851472471191

들어간 모델:  (0, 1, 2, 3, 6)
69.90843069150617

들어간 모델:  (0, 1, 2, 3, 7)
70.10439734261311

들어간 모델:  (0, 1, 2, 3, 8)
70.4375

들어간 모델:  (0, 1, 2, 3, 9)
70.31746031746032

들어간 모델:  (0, 1, 2, 3, 10)
71.05554676372843

들어간 모델:  (0, 1, 2, 3, 11)
70.57147380085483

들어간 모델:  (0, 1, 2, 3, 12)
70.35748180955393

들어간 모델:  (0, 1, 2, 3, 13)
70.35748180955393

들어간 모델:  (0, 1, 2, 3, 14)
70.35748180955393

들어간 모델:  (0, 1, 2, 4, 5)
67.90712468193384

들어간 모델:  (0, 1, 2, 4, 6)
68.37981823879662

들어간 모델:  (0, 1, 2, 4, 7)
68.23087752229

들어간 모델:  (0, 1, 2, 4, 8)
68.47069738673265

들어간 모델:  (0, 1, 2, 4, 9)
68.15748031496062

들어간 모델:  (0, 1, 2, 4, 10)
69.22592825676526

들어간 모델:  (0, 1, 2, 4, 11)
68.92975011786892

들어간 모델:  (0, 1, 2, 4, 12)
68.00438940272771

들어간 모델:  (0, 1, 2, 4, 13)
68.00438940272771

들어간 모델:  (0, 1, 2, 4, 14)
68.00438940272771

들어간 모델:  (0, 1, 2, 5, 6)
68.05798948542298

들어간 모델:  (0, 1, 2, 5, 7)
67.932354818

In [None]:
ensemble(file_list, num=6)

In [None]:
ensemble(file_list, num=7)

In [None]:
ensemble(file_list, num=8)

# to_csv

In [7]:
result = submission(file_list, candidates = [13, 14])

In [8]:
result

Unnamed: 0,id,pred_label,probs
0,0,org:product,"[8.510122456906633e-10, 1.0735913209925928e-10..."
1,1,per:alternate_names,"[4.520943234218814e-10, 3.794097991957415e-11,..."
2,2,no_relation,"[1.5280814102743022e-08, 7.913519439733931e-11..."
3,3,no_relation,"[1.4529972945632942e-08, 4.052037897854392e-11..."
4,4,no_relation,"[1.2368368959548458e-08, 3.006381357553403e-09..."
...,...,...,...
7760,7760,org:place_of_headquarters,"[3.000718718469694e-09, 8.687540398054457e-11,..."
7761,7761,no_relation,"[1.5097838858034163e-08, 1.6672054821780552e-1..."
7762,7762,org:top_members/employees,"[5.055295322855102e-10, 1.4758228969422753e-08..."
7763,7763,no_relation,"[1.1731948220028303e-08, 2.993972899794863e-11..."


In [9]:
result.to_csv("./woojin_result_71_259.csv")