In [None]:
import torch
from transformers import BertForPreTraining, BertTokenizer, BertForSequenceClassification, AdamW
from transformers import get_linear_schedule_with_warmup

# BERT 모델 및 토크나이저 불러오기
model_name = "bert-base-multilingual-cased"
tokenizer = BertTokenizer.from_pretrained(model_name)
model = BertForSequenceClassification.from_pretrained(model_name, num_labels=2)  # 이 예제에서는 이진 분류를 위해 라벨 수를 2로 설정

# 미세조정을 위한 데이터 로딩 (이 부분은 실제 데이터에 맞게 수정해야 합니다)
train_texts = ["한글 데이터 예시 1", "한글 데이터 예시 2", ...]
train_labels = [0, 1, ...]  # 이진 분류의 경우에는 0 또는 1로 라벨을 설정

# 데이터를 모델 입력 형식으로 변환
inputs = tokenizer(train_texts, return_tensors="pt", padding=True, truncation=True)
labels = torch.tensor(train_labels)

# 미세조정을 위한 옵티마이저 설정
optimizer = AdamW(model.parameters(), lr=5e-5)
epochs = 3  # 적절한 횟수로 설정

# 학습 루프
for epoch in range(epochs):
    outputs = model(**inputs, labels=labels)
    loss = outputs.loss
    loss.backward()
    optimizer.step()
    optimizer.zero_grad()

# 학습이 끝나면 모델을 저장할 수 있습니다.
model.save_pretrained("fine_tuned_model")

In [44]:
import numpy as np
import pandas as pd

In [45]:
sample_data = pd.read_json('book_subject//Training//subject_train//etc//CNTS-00047966743_5_5-0.json')
sample_data

Unnamed: 0,passage_id,metadata,chapter,passage,summary
author,CNTS-00047966743_5_5-0,신수송 저,머리말,형태론(Morphology)이라는 용어는 Johann Wolfgang von Goe...,언어학에서 형태론이란 단어의 형태를 연구하는 이론분야를 말한다. 최근 형태론은 자연...
doc_id,CNTS-00047966743_5_5-0,CNTS-00047966743,머리말,형태론(Morphology)이라는 용어는 Johann Wolfgang von Goe...,언어학에서 형태론이란 단어의 형태를 연구하는 이론분야를 말한다. 최근 형태론은 자연...
doc_name,CNTS-00047966743_5_5-0,독일어 형태론,머리말,형태론(Morphology)이라는 용어는 Johann Wolfgang von Goe...,언어학에서 형태론이란 단어의 형태를 연구하는 이론분야를 말한다. 최근 형태론은 자연...
doc_type,CNTS-00047966743_5_5-0,도서,머리말,형태론(Morphology)이라는 용어는 Johann Wolfgang von Goe...,언어학에서 형태론이란 단어의 형태를 연구하는 이론분야를 말한다. 최근 형태론은 자연...
kdc_code,CNTS-00047966743_5_5-0,750,머리말,형태론(Morphology)이라는 용어는 Johann Wolfgang von Goe...,언어학에서 형태론이란 단어의 형태를 연구하는 이론분야를 말한다. 최근 형태론은 자연...
kdc_label,CNTS-00047966743_5_5-0,독일어,머리말,형태론(Morphology)이라는 용어는 Johann Wolfgang von Goe...,언어학에서 형태론이란 단어의 형태를 연구하는 이론분야를 말한다. 최근 형태론은 자연...
published_year,CNTS-00047966743_5_5-0,2006,머리말,형태론(Morphology)이라는 용어는 Johann Wolfgang von Goe...,언어학에서 형태론이란 단어의 형태를 연구하는 이론분야를 말한다. 최근 형태론은 자연...
publisher,CNTS-00047966743_5_5-0,역락,머리말,형태론(Morphology)이라는 용어는 Johann Wolfgang von Goe...,언어학에서 형태론이란 단어의 형태를 연구하는 이론분야를 말한다. 최근 형태론은 자연...


In [46]:
sample_data['passage'][0]

  sample_data['passage'][0]


'형태론(Morphology)이라는 용어는 Johann Wolfgang von Goethe(1749-1832)에 의해 생물학적인 연구에서 처음 사용되었다. 언어학에서 Morphology란 형태(Form)를 의미하는 희랍어의 ‘morph’라는 단어에서부터 유리한 것으로 단어의 형태를 연구하는 이론분야를 말한다. 전통문법에서 형태론은 언어연구에 있어서 중요한 위치를 차지하였다. 19세기만 하더라도 형태론은 언어의 발전과정과 언어유형론 연구에 있어서 필요한 경험적인 자료들을 제공하는 가장 중요한 문법 분야였다. 최근에는 형태론에서 추구하는 연구 목표가 자연언어에 존재하는 다양한 단어의 구조를 분석하여 언어보편적인 형태소의 구조를 밝히고 기술하는 데에 모아진다. \n 이 책의 목적은 형태론의 기초이론을 제시하고 독일어 단어의 굴절(Flexion)과 파생(Derivation)에 대한 체계적인 분석을 시도하는 데 있다. 나아가 독일어 형태론 연구와 더불어 형태음운론, 형태통사론과 같은 인접분야와 연계된 연구도 아울러 제시할 것이다. 독일어에서의 형태론 연구는 긴 세월에 걸친, 독일어의 역사적인 변천과정에서 나타난 동사의 활용과 명사의 굴절, 그리고 파생에 의한 어휘의 확장과 같은 다양한 변화를 취급하면서 오늘의 체계를 갖추게 되었다. 그러나 이 형태론 체계를 기술하는 데에는 통사론이나 음운론 분야에서 보다 더 많은 예외적인 현상이 존재하기 때문에, 이 책에서는 비교적 규칙적으로 파악될 수 있는 현상들에 국한하여 이론적인 연구를 진행할 것이다.'

In [47]:
sample_data['summary'][0]

  sample_data['summary'][0]


'언어학에서 형태론이란 단어의 형태를 연구하는 이론분야를 말한다. 최근 형태론은 자연언어에 존재하는 단어의 언어보편적인 형태소의 구조를 밝히고 기술하는 것을 목표로 한다. 독일어에서 형태론연구는 동사의 활용, 명사의 굴절, 파생에 의한 다양한 변화를 취급하며 체계를 갖추었는데, 이 책에서는 규칙적으로 파악될 수 있는 현상들만 다룰 예정이다.'

In [48]:
import os
import json

# 주어진 디렉토리 경로
directory_path = 'book_subject//Training//subject_train//etc//'

file_list = []
# 디렉토리 내의 모든 파일 확인
for filename in os.listdir(directory_path):
    # 파일 경로 생성
    file_path = os.path.join(directory_path, filename)

    # 파일이 JSON 형식인지 확인
    if filename.endswith('.json'):
        file_list.append(str(filename))

# 위의 코드는 각 JSON 파일을 읽어서 변수 json_data에 저장하게 됩니다.
# 여기에서 json_data를 사용하여 원하는 작업을 수행하면 됩니다.

In [49]:
len(file_list)

6753

In [50]:
file_list[0]

'CNTS-00047966743_15_16-0.json'

In [51]:
trainx = []
trainy = []
directory_path = 'book_subject//Training//subject_train//etc//'
for filename in file_list:
    sample_data = pd.read_json(f'book_subject//Training//subject_train//etc//{filename}')
    trainx.append(sample_data['passage'][0])
    trainy.append(sample_data['summary'][0])


  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.append(sample_data['summary'][0])
  trainx.append(sample_data['passage'][0])
  trainy.ap

In [52]:
train_x = pd.Series(trainx)
train_x

0       제1부. 형태론의 기초\nⅠ. 형태론의 기본개념들\n 형태론은 단어의 내적 구조를 ...
1       Ⅰ.1. 동사의 활용\nⅠ.1.1.음운론적으로 규정된 변이형태들\n 과거시제의 변이...
2       앞 절 서두에서 우리는 파생조어의 구성성분이 접두사(=전철Prafix)와 어간이 결...
3       Ⅰ-1. 형태소와 형태\n 여러개의 상이한 형태소들이 그룹을 이루면서 각각 동일한 ...
4       Ⅵ. 형태 통사자질에 의한 통사론\n 앞 장에서는 기본적인 어휘형태로서 동사, 명사...
                              ...                        
6748    둘째는 최저임금제도를 원용하여 가맹점주에게 적어도 최저임금법상의 최저임금을 노동시간...
6749    한국의 영화산업은 좋은 선례가 될 수 있을 것이다. 영화산업에서는 영화인들의 소득 ...
6750    그러나 진정한 의미로 이해되는 의사 자치는 그 자치의 내용과 결과를 보증하는 제삼자...
6751    사회법론자들의 눈에 무과실책임이란 지극히 당연한 것이다. 사회법은 추상적인 의사의 ...
6752    가맹본부가 노동법상 사용자로 정의될 수 있는가? 우선 이 질문부터 검토하자. 노동조...
Length: 6753, dtype: object

In [53]:
train_y = pd.Series(trainy)
train_y

0       언어학은 언어가 갖고 있는 내용면과 표현면의 기호체계를 연구하는 학문이다. 형태론은...
1       변이형태 –et가 나타나는 음운론적 환경은 형태소 어간말음이 폐쇄음인 경우, 폐쇄음...
2       앞절에서는 파생조어의 구성성분을 접두사와 어간이 결합한 경우와 어간에 접미사가 결합...
3       상이한 형태소들이 동일한 형태로 실현되는 대응관계는 영어의 동음이의 형태에서도 나타...
4       앞 장에서는 기본적인 어휘형태를 형태 통사자질묶음으로 기술하고, 이 어휘형태소들과 ...
                              ...                        
6748    가맹점주의 노동시간은 곧 영업시간이므로 최저임금제도를 이용하여 가맹점주에게도 최소한...
6749    한국은 정부의 개입으로 2014년 이해관계자간의 협약을 체결해 영화인들의 근로조건을...
6750    진정한 의미의 의사자치는 제 삼자의 존재가 없으면 성립하지 않는다. 계약의 효력을 ...
6751    오늘날 노동과정은 원청에 의하여 지배되고 있기 때문에, 하청 근로자가 일하다가 다치...
6752    가맹본부가 노동법상 사용자로 정의 될 수 있는지는 노동법과 노조법의 사용자 정의를 ...
Length: 6753, dtype: object

In [71]:
etc_save = pd.concat([train_x,train_y],axis=1)
etc_save.to_csv('etc_save.csv',header=None,index=None, sep =";",encoding='utf-8')

In [73]:
pd.read_csv('etc_save.csv',sep=';',header=None)

Unnamed: 0,0,1
0,제1부. 형태론의 기초\nⅠ. 형태론의 기본개념들\n 형태론은 단어의 내적 구조를 ...,언어학은 언어가 갖고 있는 내용면과 표현면의 기호체계를 연구하는 학문이다. 형태론은...
1,Ⅰ.1. 동사의 활용\nⅠ.1.1.음운론적으로 규정된 변이형태들\n 과거시제의 변이...,"변이형태 –et가 나타나는 음운론적 환경은 형태소 어간말음이 폐쇄음인 경우, 폐쇄음..."
2,앞 절 서두에서 우리는 파생조어의 구성성분이 접두사(=전철Prafix)와 어간이 결...,앞절에서는 파생조어의 구성성분을 접두사와 어간이 결합한 경우와 어간에 접미사가 결합...
3,Ⅰ-1. 형태소와 형태\n 여러개의 상이한 형태소들이 그룹을 이루면서 각각 동일한 ...,상이한 형태소들이 동일한 형태로 실현되는 대응관계는 영어의 동음이의 형태에서도 나타...
4,"Ⅵ. 형태 통사자질에 의한 통사론\n 앞 장에서는 기본적인 어휘형태로서 동사, 명사...","앞 장에서는 기본적인 어휘형태를 형태 통사자질묶음으로 기술하고, 이 어휘형태소들과 ..."
...,...,...
6748,둘째는 최저임금제도를 원용하여 가맹점주에게 적어도 최저임금법상의 최저임금을 노동시간...,가맹점주의 노동시간은 곧 영업시간이므로 최저임금제도를 이용하여 가맹점주에게도 최소한...
6749,한국의 영화산업은 좋은 선례가 될 수 있을 것이다. 영화산업에서는 영화인들의 소득 ...,한국은 정부의 개입으로 2014년 이해관계자간의 협약을 체결해 영화인들의 근로조건을...
6750,그러나 진정한 의미로 이해되는 의사 자치는 그 자치의 내용과 결과를 보증하는 제삼자...,진정한 의미의 의사자치는 제 삼자의 존재가 없으면 성립하지 않는다. 계약의 효력을 ...
6751,사회법론자들의 눈에 무과실책임이란 지극히 당연한 것이다. 사회법은 추상적인 의사의 ...,"오늘날 노동과정은 원청에 의하여 지배되고 있기 때문에, 하청 근로자가 일하다가 다치..."


In [36]:
import torch
from transformers import BertTokenizer, BertForSequenceClassification, AdamW

# BERT 모델 및 토크나이저 불러오기
model_name = "bert-base-multilingual-cased"
tokenizer = BertTokenizer.from_pretrained(model_name)
model = BertForSequenceClassification.from_pretrained(model_name, num_labels=2)

# 미세조정을 위한 데이터 로딩 (이 부분은 실제 데이터에 맞게 수정해야 합니다)
train_texts = train_x
train_labels = train_y  # 이진 분류의 경우에는 0 또는 1로 라벨을 설정

# 데이터를 모델 입력 형식으로 변환
inputs = tokenizer(train_texts, return_tensors="pt", padding=True, truncation=True)
labels = torch.tensor(train_labels)  # 레이블을 텐서로 변환

# 미세조정을 위한 옵티마이저 설정
optimizer = AdamW(model.parameters(), lr=5e-5)
epochs = 1  # 적절한 횟수로 설정

# 학습 루프
for epoch in range(epochs):
    outputs = model(**inputs, labels=labels)
    loss = outputs.loss
    loss.backward()
    optimizer.step()
    optimizer.zero_grad()

# 학습이 끝나면 모델을 저장할 수 있습니다.
model.save_pretrained("fine_tuned_model")

TypeError: 'BertTokenizer' object is not callable

'\n그리고는 그 자백서를 가지고 조선어학회의 남은 주요 회원을 차례로 잡아 가두었다. 모두 33사람에 이르렀다. 이들을 날마다 아침 저녁 두 차례씩 감방에서 경찰 무술 연습장으로 끌어내어, 회원들 사이의 우정을 끊기 위한 고문도 하였다.\n또 지식인들로서의 수치심을 갖게 하려고, 서로 마주 선 동지의 얼굴 반쪽에다가 먹물로 먹칠하게 하거나, 회원들의 등에다가 “나는 거짓말쟁이다, 너를 극도로 미워한다.” 라는 일본말을 먹물로 쓰게 한 다음에, 장내를 한 바퀴씩 번갈아 돌아오게 하였다. 그때 돌지 않고 있던 회원은 한 바퀴를 돌고 오는 회원의 뺨을 한 대씩 때리고 정강이도 한 번씩 발로 걷어차게 하였다. 이 때에 뺨을 얻어맞거나 정강이를 발로 채일 때는 반드시 “나는 황국 신민(일본 천왕의 백성)이 아니다. 그러므로 뺨을 맞는다”라는 소리를 지르게 하였다. 만일 마주한 이를 가만히 때리거나, 뺨 맞는 이가 구호를 작게 지를 때에는 두 사람 똑같이 다섯 대씩의 몽둥이로 맞는 벌을 가했다. 그리하여 항상 매맞는 회원이 “한 방에 넘어지도록 때려라” 고 미리 주문하였다. 그러나 회원들은 아무리 왜놈들에게 혹독한 매를 맞을지언정 “우리는 동지의 뺨을 칠 수 없다”고 고집하다가 피투성이가 되도록 얻어맞을 때가 한두 번이 아니었다.'