In [1]:
from utils.utils import *

In [61]:
import torch
from accelerate import Accelerator
from accelerate import PartialState
from accelerate.utils import gather_object
import argparse
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, GenerationConfig, TextStreamer, BitsAndBytesConfig
from utils.utils import *
from utils.metrics import *
import pickle
import argparse

def get_args():
    parser = argparse.ArgumentParser()
    parser.add_argument("--model_path", type=str)
    parser.add_argument("--test_data", type=str)
    parser.add_argument("--output_dir", type=str)
    parser.add_argument("--max_new_tokens", type=int)
    parser.add_argument("--batch_size", type=int, default=1)
    parser.add_argument('--use_flash_attention_2', action='store_true')
    parser.add_argument('--add_bos_token', action='store_true')
    args,_ = parser.parse_known_args()
    return args


def get_tokenizer_and_model(args):
    tokenizer = AutoTokenizer.from_pretrained(args.model_path, trust_remote_code=True)
    if args.use_flash_attention_2:
        model = AutoModelForCausalLM.from_pretrained(args.model_path, device_map={"": accelerator.process_index}, attn_implementation="flash_attention_2", trust_remote_code=True, torch_dtype=torch.bfloat16)
    else:
        model = AutoModelForCausalLM.from_pretrained(args.model_path, trust_remote_code=True)
    tokenizer.padding_side='left'
    if tokenizer.pad_token is None:
        tokenizer.pad_token = tokenizer.eos_token
    return tokenizer, model

# QA
def get_prompt(tokenizer, title, context, question, tokenize=False, add_bos_token=False):
    
    document = title+' '+context
    prompt = f"질문:{question}\n지문:{document}\n답변:"
    if add_bos_token:
        prompt = tokenizer.bos_token + prompt
    return prompt
# def get_prompt(tokenizer, premise, hypothesis, tokenize=False, add_bos_token=False):
#     prompt = f"전제: {premise}\n가설: {hypothesis}\n주어진 가설과 전제는 어떠한 관계인가\n{OPTIONS}"#prompt = f"질문:{question}\n지문:{document}\n답변:"
#     if add_bos_token:
#         prompt = tokenizer.bos_token + prompt
#     return prompt

In [53]:
from utils.data_utils import *

In [2]:
seed_everything(42)
args = get_args()
accelerator = Accelerator()

In [62]:
! ls ../kt_output

huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)


data			     midm_10b_plm_70k
domain_refine_flatten	     midm_v3_normal_adjusted
domain_refine_merge_version  midm_v3_only_josa_adjusted
gpt4			     nli
heuristic_filtering	     remove_duplicate
llama3.1


In [87]:
args.model_path = f'../kt_output/midm_v3_normal_adjusted/qa/model_2'
args.test_data = '/home/work/g-earth-22/hoyoun/downstream/data/KorQuad_dev.jsonl'
# args.test_data = '/home/work/user/ocw/SFT/data/klue_nli_dev.jsonl'
args.use_flash_attention_2=True
args.max_new_tokens=64
args.add_bos_token = False

In [88]:
# tokenizer, model
tokenizer, model  = get_tokenizer_and_model(args)
test_data = load_jsonl(args.test_data)
batch_size = args.batch_size

5774it [00:00, 87395.21it/s]


In [65]:
# normal

In [89]:
for i in test_data:
    prompt = get_prompt(tokenizer, i['title'],i['context'], i['question'], tokenize=False, add_bos_token=args.add_bos_token)
#     prompt = get_prompt(tokenizer, i['premise'], i['hypothesis'], tokenize=False, add_bos_token=args.add_bos_token)
    i['input']=prompt

terminators = [tokenizer.eos_token_id]
streamer = None
if accelerator.is_main_process and batch_size == 1:
    streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True) 
completions_per_process = []
n_samples = 50
for d in tqdm(test_data[:n_samples], disable=accelerator.is_main_process != True):
    batch = tokenizer(d['input'], add_special_tokens=False, return_tensors='pt')
    batch = batch.to(accelerator.device)
    length = batch['input_ids'].size(1)
    print(length)
    # just greedy
    outputs = model.generate(input_ids = batch['input_ids'], streamer=streamer, eos_token_id=terminators, pad_token_id = tokenizer.eos_token_id, num_beams=1, max_new_tokens=args.max_new_tokens, do_sample=False)
    outputs = outputs[:,length:].contiguous()
    generated_text = tokenizer.batch_decode(outputs, skip_special_tokens=True)
    completions_per_process.extend(generated_text)
#     print(LABEL2STR[d['label']])
#     print('=========================================')
#     input()        


  0% 0/50 [00:00<?, ?it/s]

250
1989년 2월 15일


  2% 1/50 [00:00<00:15,  3.09it/s]

253
임수경


  4% 2/50 [00:00<00:09,  4.81it/s]

251
1989년


  6% 3/50 [00:00<00:08,  5.86it/s]

246
경희대학교
246
서울지방경찰청 공안분실


 10% 5/50 [00:00<00:06,  6.58it/s]

258
임종석
259
폭력행위등처벌에관한법률위반


 14% 7/50 [00:01<00:06,  6.37it/s]

202
허영
207
10차 개헌안


 18% 9/50 [00:01<00:05,  6.99it/s]

192
제89조


 20% 10/50 [00:01<00:05,  7.24it/s]

198
허영
190
부참모 총장


 24% 12/50 [00:01<00:04,  7.88it/s]

198
국무장관
193
로널드 레이건


 28% 14/50 [00:02<00:04,  7.86it/s]

192
리처드 닉슨


 30% 15/50 [00:02<00:04,  7.60it/s]

189
부참모 총장


 32% 16/50 [00:02<00:04,  7.70it/s]

192
2세
198
국무장관


 36% 18/50 [00:02<00:03,  8.71it/s]

195
경고:현실주의, 레이건과 외교 정책


 38% 19/50 [00:02<00:04,  6.34it/s]

202
퍼트리샤 앤토이넷 폭스


 40% 20/50 [00:03<00:05,  5.48it/s]

201
1944년


 42% 21/50 [00:03<00:04,  5.94it/s]

207
3명
192
노터데임 대학교


 46% 23/50 [00:03<00:04,  6.35it/s]

191
퍼트리샤 앤토이넷 폭스


 48% 24/50 [00:03<00:04,  5.40it/s]

194
노터데임


 50% 25/50 [00:03<00:04,  5.67it/s]

205
기갑 훈련소


 52% 26/50 [00:04<00:04,  5.91it/s]

195
퍼트리샤 앤토이넷 폭스


 54% 27/50 [00:04<00:04,  5.11it/s]

186
1979년


 56% 28/50 [00:04<00:03,  5.71it/s]

194
닉슨
184
5년


 60% 30/50 [00:04<00:02,  7.14it/s]

188
1979년


 62% 31/50 [00:04<00:02,  7.31it/s]

194
미국 유럽 연합군


 64% 32/50 [00:04<00:02,  7.13it/s]

186
1979년


 66% 33/50 [00:05<00:02,  7.40it/s]

187
미국 기술 주식 회사


 68% 34/50 [00:05<00:02,  7.18it/s]

161
외교 정책의 아마추어


 70% 35/50 [00:05<00:02,  7.39it/s]

160
1988년


 72% 36/50 [00:05<00:01,  7.63it/s]

157
Worldwide Associates Inc.


 74% 37/50 [00:05<00:01,  6.88it/s]

158
1988년


 76% 38/50 [00:05<00:01,  7.25it/s]

160
외교 정책의 아마추어


 78% 39/50 [00:05<00:01,  7.43it/s]

156
1988년


 80% 40/50 [00:05<00:01,  7.53it/s]

318
노아
313
창세기


 84% 42/50 [00:06<00:00,  8.62it/s]

313
고페르나무


 86% 43/50 [00:06<00:00,  8.46it/s]

316
하나님의 명령
312
3층


 90% 45/50 [00:06<00:00,  9.28it/s]

312
아스팔트와 비슷한 성분


 92% 46/50 [00:06<00:00,  8.01it/s]

313
약 135m


 94% 47/50 [00:06<00:00,  7.60it/s]

313
8층
310
고페르나무


 98% 49/50 [00:07<00:00,  8.24it/s]

161
기독교


100% 50/50 [00:07<00:00,  7.06it/s]


In [90]:
normal = copy.deepcopy(completions_per_process)

In [85]:
josa = copy.deepcopy(completions_per_process)

In [7]:
from utils.metrics import *

In [86]:
get_scores(normal,[[i['answer']] for i in test_data[:n_samples]])

{'f1': 0.846952380952381, 'em': 0.76}

In [91]:
get_scores(josa,[[i['answer']] for i in test_data[:n_samples]])

{'f1': 0.846952380952381, 'em': 0.76}

In [92]:
normal = load_jsonl('/home/work/user/ocw/kt_output/midm_v3_normal_adjusted/qa/model_2/attached.jsonl')

5774it [00:00, 47683.38it/s]


In [93]:
josa = load_jsonl('/home/work/user/ocw/kt_output/midm_v3_only_josa_adjusted/qa/model_2/attached.jsonl')

5774it [00:00, 50908.23it/s]


In [96]:
get_scores([i['predict'] for i in josa],[[i['answer']] for i in normal])

{'f1': 0.6395260312561997, 'em': 0.584170419120194}

In [97]:
get_scores([i['predict'] for i in normal],[[i['answer']] for i in normal])

{'f1': 0.5314202692969565, 'em': 0.4823346033945272}

In [135]:
differences = []
# both_wrongs = []
just_normal_wrongs = []
for i,j in zip(normal, josa):
    if i['answer']!=i['predict'] and j['answer']==j['predict']:
        
#     if i['predict']!=j['predict']:
        normal_predict = i['predict']
        josa_predict = j['predict']
        tmp = copy.deepcopy(i)
        tmp['normal_predict']=normal_predict
        tmp['josa_predict']=josa_predict
#         differences.append(copy.deepcopy(tmp))
#         both_wrongs.append(tmp)
        just_normal_wrongs.append(tmp)

In [111]:
normal_wrong = []
josa_wrong = []
for i in differences:
#     print('document')
#     print(i['title']+' '+i['context'])
#     print('question')
#     print(i['question'])
    if i['normal_predict']!=i['answer']:
        normal_wrong.append(i)
        # normal이 틀린 경우
#         print('normal_wrong')
#         print(f'normal ----- %s'%i['normal_predict'])
#         print(f'josa ----- %s'%i['josa_predict'])
#         print(f'answer ----- %s'%i['answer'])
    elif i['josa_predict']!=i['answer']:
        josa_wrong.append(i)
#         print('normal_wrong')
#         print(f'normal ----- %s'%i['normal_predict'])
#         print(f'josa ----- %s'%i['josa_predict'])
#         print(f'answer ----- %s'%i['answer'])
#     input()

In [136]:
samples = random.sample(just_normal_wrongs, k=20)

In [137]:
# 


In [138]:
for i in samples:
    print('document')
    print(i['title']+' '+i['context'])
    print('question')
    print(i['question'])
    print('normal_wrong')
    print(f'normal ----- %s'%i['normal_predict'])
    print(f'josa ----- %s'%i['josa_predict'])
    print(f'answer ----- %s'%i['answer'])
#     elif i['josa_predict']!=i['answer']:
#         josa_wrong.append(i)
# #         print('normal_wrong')
# #         print(f'normal ----- %s'%i['normal_predict'])
# #         print(f'josa ----- %s'%i['josa_predict'])
# #         print(f'answer ----- %s'%i['answer'])
    i['memo']=input()

document
우루과이_축구_국가대표팀 FIFA에서는 월드컵 우승 팀에게 유니폼에 '우승'을 상징하는 '별'을 달 것을 권장하고 있다. 우루과이는 2회 월드컵 우승(1930, 1950)에 더해, 월드컵 창립 이전에 실시된 올림픽경기대회 축구 종목에서의 금메달 2회 획득(1924, 1928)을 근거로, 총 별 4개를 유니폼에 새겨넣고 있다. 1920년대의 올림픽 우승을 기리는 이유는 당시는 월드컵 대회가 출범하기 이전이었으며, 유럽팀이 최강이라는 인식이 자리 잡고 있던 시기에 올림픽 축구를 남미국가가 제패함으로써, 아마추어 선수로 출전자격이 제한된 올림픽 무대와는 별도로 진정한 세계 최강팀을 가리는 대회를 만들자는 공감대가 형성되었으며, 그로인해 1930년 제1회 우루과이 월드컵이 개최되는 계기가 되었기 때문이다.
question
FIFA월드컵 우승팀이 유니폼에 다는 것은?
normal_wrong
normal ----- 4개
josa ----- 별
answer ----- 별


 원하는 것을 더 못찾음


document
이회창 1997년 대선 당시 한나라당 이회창 후보는 지역감정 문제에 대한 공방에 "영남출신 대의원들이 비영남인 저를 뽑아준 이 정당이 지역주의입니까? 90 몇 %를 차지하고 전혀 다른 지역 출신의 개입을 허용하지 않는 정당이 지역주의 정당입니까?"라는 발언으로 지역감정을 유발한다. 또 12월 16일 서울에서 열린 선거 유세에서는 "여러분이 김대중 후보를 당선시켜서 이 나라를 혼란에 빠뜨리고 불안정하게 하는 것이 소망이라고 생각하신다면은 그러면 이인제나 김대중 후보에게 표를 던지십시요."라는 위험수위를 넘는 발언으로 논란을 빚었다. 다음날인 12월 17일 부산에서 열린 선거 유세에서는 "이분(이인제)에게 던지는 표는 이것은 바로 아무런 효과도 내지 못하는 죽은 표가 될 뿐 아니라 바로 우리가 걱정하는 김대중 총재를 위한 표가 될 것입니다"라는 발언으로 반호남정서를 유발하는 발언을 한다.
question
1997년 당시 이회창의 발언으로 무엇을 유발하였나?
normal_wrong
normal ----- 김대중
josa ----- 지역감정
answer ----- 지역감정


 원하는 것을 못찾음


document
대한민국_아파트의_역사 1941년과 1944년에 부산토지공사가 지은 청풍장-소화장아파트는 부산광역시에 지어진 최초의 4층 짜리 아파트이다. 초기에는 아파트와 부산광역시청 겸용으로 지었으나 이후 건물 전체가 아파트로 사용되었으며 부산 최고의 공동주택이었는데 1980년대까지 외관은 아주 노후해서 놀라고, 안에 들어가면 넓어서 또 놀라고, 그리고 집주인이 부자라서 놀라서 세 번 놀란다는 말까지 생길 정도로 당시 최고급 아파트라는 것을 인증했다. 그러나 1996년 안전진단에서 D등급을 판정받았으나 부지가 작아 재개발이 시행되지 않고 있다. 그러다가 문화재청이 등록문화재로 지정하려고 부산광역시에 알리면서 관심이 커졌으며 문화유산으로 지정은 되지 않았지만 부산광역시의 근대문화유산으로 지정, 보존을 추진하고 있다.
question
청풍장-소화장아파트는 부산광역시에서 등록문화재 대신 무엇으로 지정되었는가?
normal_wrong
normal ----- 문화재
josa ----- 근대문화유산
answer ----- 근대문화유산


 원하는 것을 못찾음


document
뉘르부르크링 노르트슐라이페의 랩타임을 차량의 성능과 드라이버의 실력을 평가하는 좋은 척도가 된다. 그래서 랩타임 기록을 깨기위한 수많은 노력이 있었고, 그 실력을 인정받은 드라이버는 링마이스터 칭호를 받을 수 있었다. 지금까지 트랙에 변화가 여러번 있었기 때문에, 1920년대 부터 통용되는 공식 순위는 없으나, 트랙 개량에 따라 랩 타임 순위가 나뉘어 있다. 지금까지 가장 빠른 기록은 6분 11초 13로, 1983년에 뉘르부르크링 1000km에서 스테판 벨로프 선수가 포르쉐 956으로 기록하였다. 현재는 노르트슐라이페에서 메이저 경기가 열리지 않기 때문에, 스테판 벨로프 선수의 기록보다 빠른 기록은 없다. 레이스카를 제외한 차량 중 가장 빠른 기록은 포르쉐 911 GT2 RS 가 세운 6분 47초이다.
question
스테판 벨로프 선수가 가장 빠른 랩타임을 기록한 당시 탔던 차량은?
normal_wrong
normal ----- 포르쉐 911 GT2 RS
josa ----- 포르쉐 956
answer ----- 포르쉐 956


 원하는 것을 못찾음


document
금강산 현대그룹 창업자 정주영이 1989년 방북하여 금강산 관광개발 의정서를 체결한 9년 뒤인 1998년 11월 18일에 금강호가 첫 출항함으로써 본격적인 금강산 관광이 시작되었다. 2001년 1월 6일부터 3년 동안 한국 최초의 호텔식 테마 여객선 설봉호를 이용하여 해로 관광이 가능해졌다. 금강산 지역은 2002년 11월 23일에 금강산관광지구라는 특별행정구역으로 명명되었다. 2003년 2월 14일 DMZ를 통과하는 역사적인 육로 관광이 시범 운영된 뒤로 육로 관광이 계속 유지되고 있으며, 이 육로 관광은 버스를 이용하여 금강산으로 갈 수 있도록 되어 있다. 매년 관광객 수 증가에 큰 영향을 미치고 있다. 도중에 몇 차례 중단된 적이 있었는데, 정몽헌의 자살, 사스 사태, 민간인 민영미 억류 사건이 일어났을 때이다. 이중 억류 사건은, 관광 세칙과 신변안전보장 합의서를 체결한 후 일단락되었다. 2008년 3월부터는 자가용을 이용한 승용차관광도 할 수 있게 되었다. 현대아산 측은 2005년 6월에 금강산 관광객이 100만 명을 돌파했다고 발표 했으며, 2008년 말 기준으로 통산 관광객 수는 195만 명에 달한다.
question
DMZ를 통과하는 금강산 육로관광이 시작된 해는?
normal_wrong
normal ----- 2008년
josa ----- 2003년
answer ----- 2003년


 원하는 것을 못찾음


document
이회창 8월 26일 이회창은 심대평 대표에 대한 총리 기용설과 관련, "앞으로 이에 관한 이야기는 일체 나오지 않았으면 한다"고 밝혔다. 이 총재는 이날 국회에서 열린 당5역회의에서 "심 대표의 총리 기용 여부와 관련해 마치 당에 내분이 일어나는 것처럼 비쳐지고 있는 것은 매우 유감스러운 일"이라고 말했다. 이 발언은 정치연대의 틀 없이 선진당 소속 의원이 내각에 참여할 수 없다는 기존 원칙을 강조한 것으로 보인다는 평가가 있다. 그는 또한 "당직자들이 개인 의견을 말하는 것은 당에 전혀 도움이 되지 않는다"며 "외부의 추측과 풍문 때문에 쓸데없이 우리당 스스로 내분과 같은 양상으로 비쳐지는 것은 경계해야 한다"고 지적했다. 이후 8월 30일 자유선진당 심대평 대표가 이회창 총재의 독선적 당 운영에 불만을 제기하면서 탈당하였다. 심 대표의 탈당으로 자유선진당과 창조한국당이 함께 구성한 교섭단체(선진과 창조의 모임)가 붕괴되었다. 탈당에 대해 이회창은 "어려움을 함께 하면서 여기까지 왔는데 이렇게 돼서 안타깝고 가슴 아프다" 고 말했다고 박선영 대변인이 전했다. 9월 3일 그가 자유선진당 세비기금 전달차 들른 대전 서구 둔산동 오페라웨딩에서 가진 기자회견에서 "자유선진당이 원내교섭단체 지위를 잃었다고 해서 생명줄이 끊어진 것은 아니다"며 "우리는 17석을 갖고 최대한 맡은 일을 해낼 것이고, 원내교섭단체 구성도 모색할 것"이라고 밝혔다. 또 심대평 대표의 국무총리 입각 반대 배경에 대해 "심 전 대표가 국무총리에 입각하는 것은 현 정권의 한복판에 들어가는 것인데 과연 그렇게 했을 때 선진당이 그동안 반대해 온 '4대강 살리기 사업' 등을 강하게 비판하고 반대할 수 있겠느냐"며 반문했다. 그는 그러면서 "선진당이 미디어법 등 개별사안에 대해 다른 정당과 정책적으로 공조하는 것과 총리 입각 등 큰 틀에서 공조하는 것은 차원이 전혀 다르다"고 강조했다. 자유선진당이 이회창 총재한테 너무 많은 권한이 집중돼 있다는 지적이 있는데 일선에 후퇴할 생각이 없

 원하는 것을 못찾음


document
중화인민공화국의_법 중재(중국에서는 이를 公斷이라고도 한다)에 대하여 중화인민공화국 성립이전에는 중국에 중재법이나 독립적인 중재기구가 존재하지 않았다. 중화인민공화국이 성립한 후 중국정부는 대외 무역 촉진에 힘쓰는 한편 대외무역에 있어서 중재의 효용을 인식하게 되었고, 현재는 “중재법”이 제정되어 있다. 동법은 가족관계에 관한 민사분쟁, 행정쟁송, 노동분쟁 (별도로 중재제도를 정하고 있다.), 농업집단경제조직 내부의 농업 도급 계약 분쟁 (별도의 중재제도를 정하고 있다.)에 대하여는 적용되지 않는다. 동법의 적용이 있는 민사분쟁에 대하여는 당사자는 중재합의를 기반으로, 일반 행정구 인민정부 소재시의 인민정부에 설치되어 있는 중재위원회에 중재의 신청을 할 수 있다.(중재합의가 있는데도 인민정부에 제소하여도 수리되지 아니한다.) 중재는 중재위원회가 사건마다 임명하는 중재인이 행한다. 중재 재정은 1심으로 종국 판단을 하여, 절차의 하자를 이유로 인민법원에 취소를 구하는 것이 가능한 이외에는, 불복을 신청할 수 없다. 중국 민사소송법 제231조는 소송의 해결까지 사이에, 외국인 당사자에 대하여 인민법원에 의한 출국정지처분을 인정하고 있다. 근래에 일본기업에 대해 종업원이나 거래선이 소송을 제기하여, 기업의 책임자 등이 출국정지처분을 받는 예가 급증하여, 문제가 되고 있다.
question
중국에서 중재인을 임명하는 곳은 어디인가?
normal_wrong
normal ----- 인민법원
josa ----- 중재위원회
answer ----- 중재위원회


 원하는 것을 못찾음


document
바이오쇼크 게임은 1960년 랩쳐가 붕괴된 직후 잭(게임의 주인공)이 탄 비행기가 대서양을 지나는 중 불시착하는 것으로 시작한다. 추락 후에, 잭은 이 참사에서 살아남은 사람은 자신밖에 없음을 알게 되고, 가까운 곳에 등대가 설치된 섬을 발견하고 수영해 간다. 그 곳에는 수중 도시인 랩쳐로 들어가기 위한 구형 잠수기가 설치되어 있었다. 아일랜드 사람이라고 밝힌 아틀라스는 잠수함에 있는 무전기로 잭을 안전하게 인도한다. 그러는 동안 라이언은 잭을 육지 국가에서 온 요원으로 믿고 랩쳐의 자동화 시스템과 그의 페로몬으로 조정하는 스플라이서를 이용해 공격하게 한다. 아틀라스는 잭에게 살 수 있는 유일한 방법은 플라스미드로부터 받은 능력을 이용하고, ADAM을 추출하기 위해 반드시 리틀 시스터를 죽여야 한다고 말한다. 아틀라스의 말을 우연히 들은 테넌바움 박사는 잭에게 리틀 시스터를 살려야 한다고 강하게 주장하며, 각각의 리틀 시스터가 깊숙히 갖고 있던 바다 달팽이를 바꿔 플라스미드로 줄 거라고 말한다. 아틀라스는 그의 아내와 자식들이 잠수함에 숨어 있다고 하며 잭을 잠수함으로 인도한다. 잭과 아틀라스가 잠수함이 있는 만(灣)에 도착하는데 그때 라이언이 그것을 파괴시킨다. 분노한 아틀라스는 잭에게 라이언을 죽여달라고 요청한다.
question
잠수함에 있는 무전기로 잭을 안전하게 인도한 아일랜드 사람의 이름은 무엇인가?
normal_wrong
normal ----- 테넌바움
josa ----- 아틀라스
answer ----- 아틀라스


 원하는 것을 못찾음


document
대한민국_아파트의_역사 개포주공아파트는 1981년 현대건설이 지은 주공아파트이다. 또한 전두환 정권이 도입하였던 택지개발촉진법의 첫 사례이기도 하다. 1980년대 당시 강남개발로 인해 사람들이 강남에 몰리자 정부는 주택난을 해소하기 위하여 주공아파트를 여러 곳에 짓기로 결심한다. 이곳 중 잘 알려진 곳이 개포주공아파트와 개포시영아파트이다. 개포주공아파트는 1단지에서 7단지까지 지어졌으며 현재 재개발에 들어갈 예정이다. 서울시는 이전부터 재개발계획이 있었으나 여러 문제로 인해 미루어지다 최근 들어서 조합이 설립되는 등 재개발시행에 본격적으로 들어갔다. 하지만 서울시의 층수제한에 많은 논란이 일면서 갈등이 있었으나 현재는 용적률 300%로 동의가 된 상태로 이제 최종허가와 보상만 하면 되는 실정이다.
question
개포주공아파트는 몇 단지로 이루어져 있나?
normal_wrong
normal ----- 개포주공아파트
josa ----- 7단지
answer ----- 7단지


KeyboardInterrupt: Interrupted by user

In [140]:
tokenizer('개포주공아파트는 몇 단지로 이루어져 있나?')

{'input_ids': [539, 714, 31855, 7531, 271, 2039, 40676, 11852, 11964, 33], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1]}

In [142]:
tokenizer_josa = AutoTokenizer.from_pretrained('../kt_output/midm_v3_only_josa_adjusted/qa/model_2')

'개'

In [147]:
tokenizer('개포주공아파트는 몇 단지로 이루어져 있나?')

{'input_ids': [539, 714, 31855, 7531, 271, 2039, 40676, 11852, 11964, 33], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1]}

In [165]:
for i in tokenizer.encode('스테판 벨로프 선수가 가장 빠른 랩타임을 기록한 당시 탔던 차량은?'):
    print(tokenizer.decode([i]))

스테
판
 벨
로프
 선수가
 가장
 빠른
 랩
타임을
 기록한
 당시
 탔
던
 차량은
?


In [166]:
for i in tokenizer_josa.encode('스테판 벨로프 선수가 가장 빠른 랩타임을 기록한 당시 탔던 차량은?'):
    print(tokenizer_josa.decode([i]))
    

스테
판
 벨
로프
 선수
가
 가장
 빠른
 랩
타임
을
 기록한
 당시
 탔
던
 차량
은
?


In [123]:
from collections import defaultdict,Counter

In [124]:
Counter([i['memo'] for i in samples])

Counter({'원하는 부분을 못찾음': 6, '맞음': 3, '맞음 (분석 필요)': 1})

In [None]:
defaultdict()

In [112]:
len(normal_wrong)

2438

In [113]:
len(josa_wrong)

596

In [102]:
differences[0][1]['predict']

'1989년 2월 15일'

In [77]:
get_scores(josa,[[i['answer']] for i in test_data[:n_samples]])

{'f1': 0.7373333333333334, 'em': 0.64}