In [78]:
from collections import Counter

def calculate_sparse_and_topN_accuracy(dense_result, mrc, are_texts_similar, topk=[1,2,3,5,10,15,20]):
    # 각 top N에 정답이 몇 개 있는지 카운팅할 Counter
    correct_topN_counter = Counter()

    # 전체 row 수
    total_rows = len(dense_result)
    total_cols = len(dense_result.columns)

    # dense_result의 모든 row에 대해 반복
    for idx, row in dense_result.iterrows():
        mrc_id = row['id']  # 각 row의 id 추출

        # mrc에서 해당 id의 context 추출
        try:
            mrc_context = mrc[mrc['id'] == mrc_id]['context'].values[0]
        except IndexError:
            print(f"Context not found for ID: {mrc_id}")
            continue  # 만약 mrc에서 id가 없으면 다음 row로 넘어감

        # topN_context들 중에서 mrc_context와 일치하는 index를 찾음
        for i in range(1, total_cols-1):  # top1_context부터 top100_context까지 확인
            top_context = row[f'top{i}_context']

            # 공백 및 줄바꿈 처리
            mrc_context = mrc_context.strip().replace("\n\n", " ").replace("\n", " ")
            top_context = top_context.strip().replace("\n\n", " ").replace("\n", " ")

            # 유사도 비교
            if are_texts_similar(mrc_context, top_context):
                correct_topN_counter[i] += 1  # 해당하는 topN에 카운트 추가
                break

    # Sparse accuracy 계산 및 출력
    sparse_accuracy = (sum(correct_topN_counter.values()) / total_rows) * 100
    print(f"Total Count: {total_rows}")
    print(f"Missing Count: {total_rows - sum(correct_topN_counter.values())}")
    print(f"Top 100 Sparse accuracy: {sparse_accuracy:.2f}%")

    # 각 topN에 대한 정확도 출력
    print("\nAccuracy Results:")
    for top_n in topk:  # top1부터 top5까지 정확도 확인
        correct_count = sum([count for n, count in correct_topN_counter.items() if n <= top_n])
        accuracy = (correct_count / total_rows) * 100
        print(f"Top {top_n} accuracy: {accuracy:.2f}% ({correct_count}/{total_rows})")

In [66]:
from difflib import SequenceMatcher

def are_texts_similar(text1, text2, threshold=0.95, print_score=False):
    """
    두 텍스트가 주어진 유사도 threshold 이상으로 유사한지 확인하는 함수.
    
    Parameters:
        text1 (str): 첫 번째 텍스트
        text2 (str): 두 번째 텍스트
        threshold (float): 유사도를 판단하는 기준 (0 ~ 1 사이 값, 기본값은 0.9)

    Returns:
        bool: 유사도가 threshold 이상이면 True, 그렇지 않으면 False
    """
    
    # 불필요한 공백, 줄바꿈 등을 제거
    text1_clean = text1.strip().replace("\n\n", " ").replace("\n", " ")
    text2_clean = text2.strip().replace("\n\n", " ").replace("\n", " ")

    # 유사도 계산 함수
    def similarity(a, b):
        return SequenceMatcher(None, a, b).ratio()

    # 유사도 계산
    similarity_score = similarity(text1_clean, text2_clean)
    if print_score:
        print(f"Similarity: {similarity_score * 100:.2f}%")

    # 유사도가 threshold 이상이면 True 반환
    return similarity_score >= threshold

In [35]:
import json
import pandas as pd
from datasets import load_from_disk


data = json.load(open('../data/raw/wikipedia_documents.json'))
wiki = pd.DataFrame(data).T

dataset = load_from_disk("../data/raw/train_dataset/")
train_df = pd.DataFrame(dataset['train'])
valid_df = pd.DataFrame(dataset['validation'])

mrc = pd.concat([train_df, valid_df])

In [84]:
import json
import pandas as pd

BGEm3ko_max = pd.read_csv('../data/pipeline/BM25Ensemble_top100_BGEm3ko_max.csv')
gteMultibase = pd.read_csv('../data/pipeline/BM25Ensemble_top100_gteMultibase_max.csv')
KoE5_max = pd.read_csv('../data/pipeline/BM25Ensemble_top100_KoE5_max.csv')
KoE5_mean = pd.read_csv('../data/pipeline/BM25Ensemble_top100_KoE5_mean.csv')
original = pd.read_csv('../data/pipeline/BM25Ensemble_top100_original.csv')
ParaMiniLM_max = pd.read_csv('../data/pipeline/BM25Ensemble_top100_ParaMiniLM_max.csv')
# qwen_max = pd.read_csv('../data/pipeline/BM25Ensemble_top100_Qwen_max.csv')
upskyyBGEm3korean_max = pd.read_csv('../data/pipeline/BM25Ensemble_top100_upskyyBGEm3korean_max.csv')
qwen2_1_5b_max = pd.read_csv('../data/pipeline/BM25Ensemble_top100_Qwen2-1_5b_max.csv')

In [85]:
topk = [1,2,3,5,10,15,20]
calculate_sparse_and_topN_accuracy(qwen2_1_5b_max, mrc, are_texts_similar, topk=topk)
print('*'*50)
# calculate_sparse_and_topN_accuracy(gteMultibase, mrc, are_texts_similar, topk=topk)
# print('*'*50)
# calculate_sparse_and_topN_accuracy(ParaMiniLM_max, mrc, are_texts_similar, topk=topk)
# print('*'*50)
# calculate_sparse_and_topN_accuracy(original, mrc, are_texts_similar, topk=topk)
# print('*'*50)
# calculate_sparse_and_topN_accuracy(upskyyBGEm3korean_max, mrc, are_texts_similar, topk=topk)
# print('*'*50)
# calculate_sparse_and_topN_accuracy(BGEm3ko_max, mrc, are_texts_similar, topk=topk)
# print('*'*50)
# calculate_sparse_and_topN_accuracy(KoE5_max, mrc, are_texts_similar, topk=topk)
# print('*'*50)
# calculate_sparse_and_topN_accuracy(KoE5_mean, mrc, are_texts_similar, topk=topk)


Total Count: 240
Missing Count: 5
Top 100 Sparse accuracy: 97.92%

Accuracy Results:
Top 1 accuracy: 57.08% (137/240)
Top 2 accuracy: 67.08% (161/240)
Top 3 accuracy: 73.75% (177/240)
Top 5 accuracy: 80.83% (194/240)
Top 10 accuracy: 85.42% (205/240)
Top 15 accuracy: 88.33% (212/240)
Top 20 accuracy: 90.83% (218/240)
**************************************************


In [92]:
import pandas as pd
from collections import Counter

# 여러 dataframe을 받아 hard voting 수행
def hard_voting(df_list):
    result_rows = []  # 결과를 저장할 리스트
    
    # 각 query마다 처리
    for idx in range(len(df_list[0])):
        id_val = df_list[0].iloc[idx]['id']
        question_val = df_list[0].iloc[idx]['question']
        chosen_contexts = []  # 각 query에 대해 선택된 topn_context를 저장할 리스트

        # top1_context부터 top100_context까지 처리
        for top_n in range(1, 101):
            candidates = []

            # 모든 dataframe에서 해당 query의 topn_context 후보 수집
            for df in df_list:
                candidates.append(df.iloc[idx][f'top{top_n}_context'])

            # 다수결로 가장 많이 나온 후보 선택 (중복된 문서 제외)
            filtered_candidates = [c for c in candidates if c not in chosen_contexts]
            if len(filtered_candidates) == 0:
                chosen_context = None
            else:
                chosen_context = Counter(filtered_candidates).most_common(1)[0][0]

            chosen_contexts.append(chosen_context)

        # 결과에 저장
        result_rows.append([id_val, question_val] + chosen_contexts)
    
    # 리스트로 모은 결과를 DataFrame으로 변환
    result = pd.DataFrame(result_rows, columns=df_list[0].columns)
    
    return result

# hard voting 실행
# df_list = [BGEm3ko_max, gteMultibase, KoE5_max, KoE5_mean, original, ParaMiniLM_max, upskyyBGEm3korean_max]
df_list = [BGEm3ko_max, KoE5_max, original]
final_df = hard_voting(df_list)

x = 20
final_df_cut = final_df[['id', 'question'] + [f'top{i}_context' for i in range(1, x+1)]]
# check is null
print(final_df_cut.isnull().sum().sum())
calculate_sparse_and_topN_accuracy(final_df_cut, mrc, are_texts_similar, topk=topk)

5
Total Count: 240
Missing Count: 8
Top 100 Sparse accuracy: 96.67%

Accuracy Results:
Top 1 accuracy: 72.92% (175/240)
Top 2 accuracy: 82.92% (199/240)
Top 3 accuracy: 86.67% (208/240)
Top 5 accuracy: 90.00% (216/240)
Top 10 accuracy: 95.00% (228/240)
Top 15 accuracy: 96.25% (231/240)
Top 20 accuracy: 96.67% (232/240)


In [121]:
import pandas as pd
from collections import Counter

# 여러 dataframe을 받아 hard voting 수행
def hard_voting(df_list):
    result_rows = []  # 결과를 저장할 리스트

    # 각 query마다 처리
    for idx in range(len(df_list[0])):
        id_val = df_list[0].iloc[idx]['id']
        question_val = df_list[0].iloc[idx]['question']
        chosen_contexts = []  # 각 query에 대해 선택된 topn_context를 저장할 리스트

        top_n = 1  # top_n의 초기값 설정
        while top_n <= 100:  # top_n이 100 이하일 때까지 반복
            candidates = []

            # 모든 dataframe에서 해당 query의 topn_context 후보 수집
            for df in df_list:
                candidates.append(df.iloc[idx][f'top{top_n}_context'])

            # 다수결로 가장 많이 나온 후보 선택 (중복된 문서 제외)
            filtered_candidates = [c for c in candidates if c not in chosen_contexts]

            if len(filtered_candidates) > 0:
                chosen_context = Counter(filtered_candidates).most_common(1)[0][0]
                chosen_contexts.append(chosen_context)
                top_n += 1  # 다음 top_n으로 이동
            else:
                top_n += 1  # 후보가 없으면 top_n만 증가하고 다시 반복

            # 후보가 없을 때 (None 추가)
            if top_n > 100:
                chosen_contexts.append(None)
                break

        # 결과에 저장
        result_rows.append([id_val, question_val] + chosen_contexts[:100])

    # 리스트로 모은 결과를 DataFrame으로 변환
    result = pd.DataFrame(result_rows, columns=df_list[0].columns)
    
    return result

# hard voting 실행
# df_list = [BGEm3ko_max, gteMultibase, KoE5_max, KoE5_mean, original, ParaMiniLM_max, upskyyBGEm3korean_max]
'''
original, BGEm3ko_max, (KoE5_max, KoE5_mean)

original, BGEm3ko_max
original, KoE5_max
original, KoE5_mean
BGEm3ko_max, KoE5_max
BGEm3ko_max, KoE5_mean
original, BGEm3ko_max, KoE5_max
original, BGEm3ko_max, KoE5_mean
'''

df_list = [original, BGEm3ko_max, KoE5_mean]
final_df = hard_voting(df_list)

x = 20
final_df_cut = final_df[['id', 'question'] + [f'top{i}_context' for i in range(1, x+1)]]
# check is null
print(f'Null sum(): {final_df_cut.isnull().sum().sum()}')
# topk = [i for i in range(1, 21)]
topk = [1,2,3,5,10,15,20]
calculate_sparse_and_topN_accuracy(final_df_cut, mrc, are_texts_similar, topk=topk)


Null sum(): 0
Total Count: 240
Missing Count: 20
Top 100 Sparse accuracy: 91.67%

Accuracy Results:
Top 1 accuracy: 72.50% (174/240)
Top 2 accuracy: 82.50% (198/240)
Top 3 accuracy: 85.42% (205/240)
Top 5 accuracy: 86.67% (208/240)
Top 10 accuracy: 89.58% (215/240)
Top 15 accuracy: 91.25% (219/240)
Top 20 accuracy: 91.67% (220/240)


In [105]:
final_df

Unnamed: 0,id,question,top1_context,top2_context,top3_context,top4_context,top5_context,top6_context,top7_context,top8_context,...,top91_context,top92_context,top93_context,top94_context,top95_context,top96_context,top97_context,top98_context,top99_context,top100_context
0,mrc-0-003264,처음으로 부실 경영인에 대한 보상 선고를 받은 회사는?,2008년 11월에는 금융감독원 내에 금융위원회와 합동으로 ‘기업재무개선지원단’을 ...,1884년 5월 4일 테네시주의 기차의 1등석에 앉아 있던 웰스를 향해 승무원이 열...,"순천여자고등학교 졸업, 1973년 이화여자대학교를 졸업하고 1975년 제17회 사법...","세계 1차 대전이 일어나자, 메테스키는 미국 해병대에 지원해 전기 전공자로 상하이의...",2012년 8월 17일 미국 증권거래위원회는 폴 벅스와 노스 캐롤라이나 주의 지크 ...,룰루레몬은 1998년 캐나다 브리티시컬럼비아주 밴쿠버에서 칩 윌슨(Chip Wils...,1939년 일본 입명관 대학 법과를 졸업하고 1940년 일본고등문관 사법과와 만주 ...,서울민사지방법원 22단독 판사로 재직하던 1980년 9월 24일에 자기앞 수표 발행...,...,메리 루이스 부스(Mary Louise Booth)는 현재의 애팽크인 Millvil...,1940년 8월 8일 경상남도 통영시에서 태어나 부산고등학교와 서울대학교(58학번)...,1934년 전라북도 진안군에서 태어나 전주고등학교와 전북대학교 정치학과를 나왔다. ...,"날짜=2017-12-06\n \n \n집행유예(執行猶豫, probation)는 형법...","전남 목포(木浦)사람으로, 1905년(15세?) 경 부친 강영숙을 따라 하와이로 ...",1945년 3월 23일 충청남도 논산에서 4남매 중 막내로 태어났다. 불교와 미신 ...,"샤를 1세 드 부르봉 (Charles Ier de Bourbon, 1401년 – 1...",각급 선거관리위원회 위원의 임기는 6년이며(114조 3항) 연임에 관해서는 제한이 ...,"1879년, 스위스의 수도 베른 교외의 뮌헨부흐제(Münchenbuchsee)에서 ...",주민등록이라 함은 행정기관이 관할구역 안에 거주하는 주민의 거주상황과 이동실태를 파...
1,mrc-0-004762,스카버러 남쪽과 코보콘그 마을의 철도 노선이 처음 연장된 연도는?,요크 카운티 동쪽에 처음으로 여객 열차 운행이 시작한 시점은 1868년 토론토 & ...,3호선 스카버러(Line 3 Scarborough) 또는 스카버러 RT (Scarb...,1878년에 개통된 사설 협궤 철도인 순스발-토르프스하마르 철도에서 시작한다. 18...,이 역이 교통 허브로 거듭나게 된 것은 거의 우연에 가까웠으며 기존에 스카버러 타운...,"1896년 1월에 ""보소 철도""가 소가 역과 오아미 역 사이에 철도를 놓은 것이 시...",이 역의 미래는 아직까지는 불투명하며 노후한 RT를 교체하기 위한 경전철 또는 중전...,1950년 10월 1일 슬루센-회카렝엔 구간이 개통되었다. 1957년 회토리에트-슬...,마운트조이역을 지나는 철도가 지어진 시점은 마컴 역이 지어진 시점은 1871년으로 ...,...,"라치오 철도(Ferrovie Laziali, 줄여서 FL) 혹은 로마 교외 철도는 ...","스페인의 교통은 여러 도로와 철도, 급속절철, 항공로, 항구 등을 포함하는 스페인 ...","법률적 의미로서의 궤도는 대한민국에서 과거 궤도사업법, 현재 이를 계승한 삭도·궤도...","라티나 역은 넓은 1층짜리 건물로, 화물 보관소와 인접한 곳에 위치해 있다. 승객 ...",싼충은 단수이 서안에 펼쳐진 대만의 중심지였고 맹갑(艋舺)이나 대도(大稲)의 대안에...,"쓰루미 선(鶴見線, つるみせん)은 일본의 철도 노선 중 하나이다. 동일본 여객철도가...",다카이시 시는 오사카 부의 센슈 지역의 북부(센보쿠)에 위치하고 북쪽과 동쪽은 사카...,"일둘브 막 카우산틴(Ildulb mac Causantín, ? - 962년) 침략왕...",수도인 비엔티안 인근에 왓타이 국제공항이 있다. 국내선 공항은 왓타이 국제공항을 ...,
2,mrc-1-001810,촌락에서 운영 위원 후보자 이름을 쓰기위해 사용된 것은?,촌주의 연원은 고대 국가의 발전 과정에서 부족 사회의 크고 작은 촌락 집단을 이끌던...,촌락공동체(村落共同體)의 연구는 고대의 제도적 역사를 논하는 중요한 방식들 가운데 ...,"촐라 정부\n 촐라의 정부 체제는 전제군주제였으며,2001 촐라의 군주는 절대적인 ...","앨리스와 밥은 암호학에서 널리 쓰이지만, 나머지 것들은 그만큼 널리 쓰이지는 않는다...","원시공동사회에 있어서는 토지가 촌락에 의해 공동으로 소유되어 있었으나, 사유재산제의...","'노동-협동조합당'은 영국 선거위원회에 공통으로 등록된 명칭이며, 투표용지에도 후보...",플랙은 호주로 돌아와서 1898년에는 멜버른에 가족 회계 회사를 차렸으며 그가 주말...,1905년부터 그는 경성부에 설립 예정이던 대한도서관 설립을 위한 자금 모금과 부지...,...,에너지에 대한 접근성도 중요한 이슈다. 세계적으로 에너지에 대한 접근성은 평등하지 ...,브라운베스(Brown Bess)는 18세기 영국 육군의 제식 머스킷과 그 파생 무기...,연안이씨의 시조 이 무(李 茂) 의정공파 종중의 종중원으로서 1947년 4월 28일...,불을 가지고 노는 소녀는 리스벳이 1년동안의 세계여행을 끝내고 스웨덴으로 돌아오는 ...,"유럽의 마지막 빙하기는 기원전 130,000년 경에서부터 70,000년 경까지 지속...","이 지역에 인류가 정착한 것은 최소 기원전 4백만년전으로 추정되지만, 역사에 처음 ...",성매매문제에 포괄적으로 접근할 수 있는 법체계가 성매매법으로 도입된 것은 아니었다는...,뮐하우젠(Mühlhausen)은 독일 튀링겐주에 위치한 도시이다. 면적은 86.34...,포르투갈의 행정 구역은 본토의 18개 현(distrito)을 포함한 5개 지방(re...,
3,mrc-1-000219,로타이르가 백조를 구하기 위해 사용한 것은?,프랑스의 십자군 무훈시는 1099년 예루살렘 왕국의 통치자가 된 고드프루아 드 부용...,백조가 배지로 널리 사용된 이유는 백조 기사 전설 때문이다. 이 이야기는 오늘날 라...,가스통 파리가 구분한 버전 II는 백조 기사 자신의 이야기가 포함된다. 이 이야기는...,"로엔그린\n13세기 초, 독일 시인 볼프람 폰 에셴바흐는 서사시 《파르치팔》에 백조...",리버리 배지\n\n던스터블 백조 장신구는 중세 시기 사용된 리버리 배지 가운데 가장...,;故 에드워드 뉴게이트(통칭 '흰 수염' 일 '시로히게')\n:성우 : 아리모토 킨...,〈로키의 말다툼〉은 로키가 다른 신들에게 악담을 퍼붓는 것이 주 내용이다. 로키는 ...,"백조는 유럽과 소련, 몽고, 중국 등지에서 번식하고 겨울에는 아프리카, 인도, 우리...",...,"미란 샤 (1366년 - 1408년 4월 16일?, 페르시아어: میران شاہ)...","1945년 1월 남은 기간 동안, 호엔슈타우펜은 독일 본토로 철수하기 위해 퇴각전을...",레기네는 1822년 1월 23일에 덴마크 코펜하겐의 프레데리크베르크 구역에서 태어났...,하르드라디 왕조(Hardrådeætta) 는 11세기에서 12세기 사이 북유럽의 강...,대흥동의 동명은 ‘동막하리’를 ‘대흥정’이라 하여 1936년 서울의 구역을 확장할 ...,소그디아나 (ə) 또는 소그디아는 고대 이란족 계열의 유목민족인 스키타이인들을 부르...,첼시는 창단 이래로 스탬퍼드 브리지 이외에 다른 경기장을 사용한 적이 없다. 스탬퍼...,펑후 제도는 군도 전체가 중화민국 타이완성의 펑후현에 속하고 있고 펑후섬(澎湖島)에...,,
4,mrc-1-000285,의견을 자유롭게 나누는 것은 조직 내 어떤 관계에서 가능한가?,조직후원인식과 정서적 몰입사이의 관계는 Eisenberger et al (1986)...,조직후원인식에 대한 선행연구는 직원의 조직에 대한 관심이 조직의 노력에 대한 직원의...,탈관료제화는 현대사회에서 관료제 성격이 약화되는 현상이다. 현대사회에서 관료제는 약...,개인특성 변수인 자기감시성향이 높을수록 타인의 행동에 민감하며 조직 내 상황에 대한...,조직 내에서 공정성의 원천을 분배공정성(distributive justice)과 절...,"재빠른 예로서는, 1980년대에 덴마크에서 발달한 의견 일치 회의를 들 수 있다.\...",집단학습이라는 말은 넓은 의미에서는 개인학습과 대조되는 개념으로 사용되어 집단상태로...,""" 유대인의 질문 ""에서 칼 마르크스는 부르주아 이데올로기 로 인간과 시민의 권리 ...",...,"《삼국사기》 및 《고려사》는 특히 궁예의 최후에 대해서, 미복차림으로 도망치던 중에...",프로토타입(Prototype)은 래디컬 엔터테이먼트가 제작하고 액티비전 퍼블리싱(A...,"루트비히 구를리트(Ludwig Gurlitt, 1855년 ~ 1931년)는 엘렌 케...",리비아의 전 총리 무아마르 알 카다피는 53개의 아프리카 국가들을(그 당시 남수단이...,그는 제2차 세계 대전 중 프랑스 방송국 내에 실험 스튜디오를 설립하여 시인들을 중...,일반적으로 PvP에서 해적계열과 백병전특화계열의 직업이 포격계열 보다 불리하기 때문...,"그가 강원도 도지사로 재직 당시 춘천 일대는 툭하면 밤손님이 찾아드는데, 지칭 의병...",인도의 루피화는 공식 부문에서 그다지 눈에 띄는 역할을 하지 못하는 것으로 보인다....,트리스탄에 대한 소재는 아일랜드의 전설세계의 한 부분이라 볼 수 있다. 이 소재를 ...,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
235,mrc-0-000484,전단이 연나라와의 전쟁에서 승리했을 당시 제나라의 왕은 누구인가?,기원전 284년에 이르러 당시 제나라의 왕이었던 제 민왕은 강력한 국력을 믿고 교만...,"연나라 군대의 사령관이 악의에서 기겁으로 교체되자, 전단은 스스로 신령의 계시를 받...","이세황제 원년(기원전 209년), 종형 전담(田儋)과 아우 전횡(田橫)과 함께 봉기...","기원전 265년(효성왕 1), 제나라의 안평군 전단(田單)이 조나라의 군사를 거느리...","연나라 군대를 격파하고 제나라를 구원한 직후에 전단은 적인(狄人, 오랑캐)을 정벌하...","기원전 279년, 연나라에서는 악의를 중용하여 상장군으로 삼았던 연 소왕이 죽고 그...",이후 전단은 과거 연나라에게 빼앗겼던 제나라의 땅인 요성(聊城)을 공격하였으나 1년...,"전안(田安, ? ~ 기원전 206년)은 진나라 말기의 인물이다. 제왕 건의 손자며 ...",...,16세기 잉글랜드와 네덜란드 공화국은 합스부르크 가의 야망에 맞서 군사 동맹을 맺었...,"기원전 5세기에 이미 존재하고 있었지만, 기원전 3세기 초에 내용이 개혁되어 곧바로...","또는 통일이 한 명의 왕 치세에 불연속적으로 이루어진 것이 아니라, 점진적 과정으로...",붉은 셔츠단(Camicie Rosse) 또는 붉은 코트단(Giubbe Rosse)은...,"강(姜, Jiang)은 중국 인구 600만명으로 중국 성씨 인구 순위 51위이다. ...",하비스 마잘리(حابس المجالي; ‎ 1914 –2001년 4월 22일)는 요...,러데르흐 1세 하엘(Rhydderch I Hael: fl. 580년-614년경)는 ...,프랑스 혁명 전쟁\n프랑스 혁명으로 탄생한 프랑스 공화국 정부와 공화제에 반대하는 ...,클로틸드는 474년경 부르군트 왕국의 리옹(Lyon)에서 태어났다. 부르군트의 왕 ...,"""스마트파워""라는 용어의 기원은 현재 논쟁 중에 있으며 현재까지로는 수잔 노셀과 조..."
236,mrc-0-002095,공놀이 경기장 중 일부는 어디에 위치하고 있나?,경기장은 인사르 강 동쪽 둑에 있는 사란스크의 중심부에 위치해 있다. 경기장은 승용...,현재 우리가 볼 수 있는 티칼의 모습은 펜실베이니아 대학교와 과테말라 정부의 협조 ...,위치는 경기도 과천시 막계동에 있으며 서울대공원 내에 위치하고 있으나 서울특별시가 ...,산마리노의 축구단은 홈그라운드전을 치르지 않으며 애초에 홈 구장이 없다. 대신 매 ...,"장치기는 '격구' '타구'와 마찬가지로 공채로 공을 치면서 노는, 오늘날의 '하키'...",프리울리는 우디네 중심지에서 4km 떨어진 리치에 위치해있다. 1976년에 개장하였...,베를린 올림픽 스타디움(Olympiastadion Berlin)은 독일의 수도인 베...,만경대학생소년궁전(萬景臺學生少年宮殿)은 평양직할시 만경대구역 팔골동에 위치하고 있는...,...,"1861년 3월, 남북전쟁이 일어나기 직전 미육군을 퇴역했다. 버지니아 주(州)가 ...",길버트 갸라한(Gilbert Garraghan)은 비평을 여섯 가지 질문으로 나누었...,"소크라테스 이전 철학자(독일어: Vorsokratiker, 영어: Presocrat...","증언에 따르면 스탈린은 격무에 시달리다가도 집에 돌아오면 ""나의 작은 보스는 어디에...",18 세기 공리주의 철학자 제레미 벤담은 비판 시민 남자와 권리의 선언을 자신의 텍...,김 루치아는 용기와 품위 그리고 재주를 겸비한 젊고 아름다운 여성이었다. 그녀는 부...,2017년 10월 후오비는 조직구조와 업무를 재정비해 그룹 형 기업으로 전환했다. ...,R. J. 셰퍼는 목격자의 증언을 검증하는 점검 목록을 제공한다. \n\n# 저술이...,김 테레사는 1798년 충청도 면천의 솔뫼 마을 있는 한 순교자 가문에서 태어났다....,1839년 7월에 유진길은 집에서 체포되었다. 그의 친척들 중 많은 사람들이 그에게...
237,mrc-0-003083,창씨개명령의 시행일을 미루는 것을 수락한 인물은?,1940년 5월 1일 오전 창씨개명에 비협조적이라는 이유로 조선총독부 경무국에서 소...,그는 만해 한용운 등과 가깝게 지냈고 1939년 7월 12일 한용운의 회갑연에 참여...,태평양 전쟁|창씨 개명\n\n1939년 4월부터 1942년 8월까지 경성 계성국민학...,"또한 흥업구락부사건, 조선어 학회 사건 등을 주동하여 국내에서는 가장 격렬한 항일투...","생몰년은 미상이며, 1917년 경상남도 양산의 통도사 지방학림 불교전문과를 졸업했다...","경기도 시흥군 서면 노온사리(훗날의 광명시 학온동) 출신으로, 강하석의 아들로 태어...",출생 연도와 출가 시기는 알려져 있지 않다. 봉은사 관내의 여러 말사인 경기도 고양...,1918년 9월 23일 함경남도 도장관으로 발령받았다. 1919년 3·1 만세 운동...,...,;항아(姮娥)\n: 17세.상냥하고 다정한 성격을 가진 소녀로 나비의 주인. 비령의...,"{| align=right\n|-\n|style=""vertical-align:top...","마르세유판 타로 등의 전통적인 물건에서는, 그려져 있는 모습은 마술을 하는 노상의 ...",그의 극작가로서의 경력은 1889년의 <왕녀 말렌>에서 시작되나 <침입자>(1890...,그 이름이 나타내는 대로 교황과 쌍둥이 성직자가 모티프로 여겨져 교황이 사람들을 축...,영산전 벽화는 벽체와 포벽은 물론 내목도리 윗벽과 대량ㆍ창방 등 내ㆍ외부 전체에 고...,〈붉은 스위트피〉(아카이스이토피)는 일본의 가수 마츠다 세이코의 여덟 번째 싱글 앨...,"의(,\n,\n,\n,\n,\n,\n,\n)는 다음의 분류, 그룹 또는 체계의 한 ...","레벨파이브 측에서 이나즈마 일레븐 스트라이커스의 영상 및 ""특별선행 가족체험회"" 영...","법규명령이라 함은 행정기관이 헌법에 근거하여, 국민의 자유와 권리에 관한 사항(법규..."
238,mrc-0-002978,망코 잉카가 쿠스코를 되찾기 위해 마련한 군사는 총 몇 명인가?,빌카밤바 지역은 파차쿠티 황제 때 부터 잉카 제국에 속해있던 지역이었다. 스페인 군...,"파울루 잉카는 우아이나 카팍의 아들이고, 우아스카르, 아타우알파, 투팍 우알파, 망...","망코 잉카 유팡키가 빌카밤바로 이동하여 새로운 나라를 세운 뒤, 그는 그 곳에서 게...",사이리 투팍의 아버지 망코 잉카 유팡키는 스페인 군대에 의해 황제의 자리에 오른 인...,"잉카 제국의 역사 전체를 통틀어서, 모든 사파 잉카(황제)들은 제국의 영토를 넓히기...",빌카밤바가 위치한 라 컨벤시온 지방은 안데스산맥의 북동쪽에 있는 산줄기에 자리잡고 ...,"1531년 1월, 프란치스코 피사로는 잉카 제국의 영토 안으로 들어오게 되었다. 그...",잉카인들이 서양의 무기 기술을 도입하여 그들과 상대할 수 있을 정도의 경험을 쌓기 ...,...,"돈 한(Don Hahn, 1955년 시카고 출생)은 과거 20년 동안 큰 성공을 거...","루퍼트는 1619년 보헤미아 왕국 프라하에서 태어났으며, 루사티아 공국의 공작으로 ...","""스마트파워""라는 용어의 기원은 현재 논쟁 중에 있으며 현재까지로는 수잔 노셀과 조...",경상북도는 전통적으로 보수 성향이 매우 강한 곳으로 보수 정당의 굳건한 텃밭인 곳이...,"프랑스 식민제국은 16세기부터 지속된 프랑스 본토와 프랑스 지배 하의 식민지, 보호...",서울 디자인 한마당(Seoul Design Fair)은 서울특별시가 국제 산업 디자...,뮤지컬 《신흥무관학교》는 육군본부가 주최하고 공연제작사 쇼노트가 제작한 창작 뮤지컬...,《손자산경》은 기원후 3세기에서 5세기 사이(삼국 시대~남북조 시대)에 집필되었다고...,,
