In [153]:
import warnings
warnings.filterwarnings('ignore')
import csv
import glob
import io
import numpy as np
import re

In [154]:
# Function to parse corpus files

def parse_corpus(fname, corpus):
    
    f = open(fname, 'r', encoding='utf-8')
    # File is non-csv format but comma "," does not exist.
    # Csv reader is used to avoid text garbling.
    iter_obj = csv.reader(f)
    lines = [v for v in iter_obj]
    f.close()
    
    text = ''
    for line in lines:
        if len(line) == 0:
            continue

        s = line[0]
        if len(s) == 0: continue

        # ％ｃｏｍ： is supplementary info
        if s[0:5] == "％ｃｏｍ：":
#                 print(' - Line', i, ': skip ％ｃｏｍ')
            continue

        if s[0] == '＠':
#                 print(' - Line', i, ': skip ＠ meta info ')
            continue
        else:
            #Replace stars with UNK
            s = s.replace('＊＊＊','UNK')
            #Replace speaker symbols with a separater
            if s[0] == 'F' or s[0] == 'M':
                s = 'SSSS'+s[5:]
            if s[0:2] == 'Ｘ：':
                s = 'SSSS'+s[2:]

            s = re.sub('F[0-9]{3}',"UNK",s)
            s = re.sub('M[0-9]{3}',"UNK",s)
            s = s.replace("＊","")


        # ?? Should be after concatinating the values ??
        for L, R in zip(['（', '＜', '【'], ['）', '＞', '】']):
            while s.find(L) != -1:
                left_pos = s.find(L)
                if s.find(R) != -1:
                    right_pos = s.find(R)
                    if left_pos > right_pos:
                        if s[0:4] == 'SSSS':
                            s = s.replace(s[4:right_pos+1], '', 1)
                        else:
                            s = s.replace(s[:right_pos+1], '', 1)
                    else:
                        s = s.replace(s[left_pos:right_pos+1], '')
                        if len(s) == 0:
                            continue
                else:
                    s=s[0:left_pos]

        if s != "\n" and s != "SSSS":
            text += s


    if text[0:4] != 'SSSS':
        text = 'SSSS' + text
    while text[0:4] == 'SSSS':
        next_pos = text[4:].find("SSSS")
        if next_pos == -1:
            corpus.append(text)
            break
        else:
            corpus.append(text[:4+next_pos])
            text = text[4+next_pos:]
        # Breaks up a long sentence
        # ?? The split lines are considered a talk between 2. Any influence in training ??
        if len(corpus[-1]) > 50:
            xs = corpus[-1].split('。')
            if len(xs) == 1:
                continue
            corpus.pop()
            if len(xs[0]) > 30:
                corpus.append(xs[0].split('、')[0] + '。')
            else:
                corpus.append(xs[0] + '。')
            while xs[-1] == '' or xs[-1] == ' ' or xs[-1] == '　':
                xs.pop()
            if len(xs) > 1:
                if len(xs[-1]) > 30:
                    corpus.append('SSSS' + xs[-1].split('、')[-1] + '。')
                else:
                    corpus.append('SSSS' + xs[-1] + '。')


In [121]:
# Parse corpus

print('...Started parsing corpus files\n')

fname_list = glob.glob('data/nucc/*')
print('The number of the corpus files are', len(fname_list), '\n')

corpus = []
for fname in fname_list:
    parse_corpus(fname, corpus)
print('The number of the corpus is', len(corpus), '\n')

with open('data/nucc_corpus.txt', 'w', encoding='utf-8') as f:
    for line in corpus:
        f.write(line + "\n")
print('...completed parsing corpus into "data/nucc_corpus.txt"\n')


...Started parsing corpus files

The number of the corpus files are 129 

The number of the corpus is 83076 

...completed parsing corpus into "data/nucc_corpus.txt"



In [98]:
# Morphological analysis

# !! Note this step can take more than minutes !!

print('...Started morphological analysis on "data/nucc_corpus.txt"\n')

!jumanpp -f < data/nucc_corpus.txt > data/nucc_corpus_analyzed.txt

print('...completed the analysis into "data/nucc_corpus_analyzed.txt"\n')
print('...extracting only tokens from "data/nucc_corpus.txt"\n')

!cat data/nucc_corpus_analyzed.txt | cut -f1 -d\  > data/nucc_tokens.txt

print('...completed the extracting into "data/nucc_tokens.txt"\n')

...Started morphological analysis on "data/nucc_corpus.txt"

...completed the analysis into "data/nucc_corpus_analyzed.txt"

...extracting only tokens from "data/nucc_corpus.txt"

...completed the extracting into "data/nucc_tokens.txt"



In [155]:
# Function to tokenize parsed corpus file

def tokenize_corpus(src_fname, dst_fname):
    
    f = open(src_fname, 'r')
    data = f.read()
    f.close()
    print('Input file is', src_fname.split('/')[-1], '\n')
    
    data = re.sub('.*SSSS.*', 'SSSS', data)
    data = re.sub('.*UNK.*', 'UNK', data)
    data = re.sub('@\n', '', data)
    data = re.sub('EOS\n', '', data)
    
#     with open(dst_fname, 'w') as f:
#         f.write(data)
    
    
    # File is non-csv format but comma "," does not exist.
    # Csv reader is used to avoid text garbling.
    iter_obj = csv.reader(io.StringIO(data))
    
    token_list = [v for v in iter_obj]
    print('The number of the input token is', len(token_list), '\n')
    
#     c = 0
#     for token in token_list:
#         if c >10: break
#         print(token)


In [None]:
# Tokenize corpus

print('...Started tokenizing corpus file\n')

tokenize_corpus('data/nucc_tokens.txt', 'data/nucc_tokens.npy')

print('...completed tokenizing into "data/nucc_tokens.npy"\n')


...Started tokenizing corpus file

Input file is nucc_tokens.txt 

The number of the input token is 811177 

['SSSS']
['の']
['町']
['と']
['いう']
['の']
['は']
['ちい']
['ちゃく']
['って']
['。']
['SSSS']
['１']
['時間']
['かから']
['ない']
['ぐらい']
['だ']
['ね']
['。']
['４']
['、']
['５０']
['分']
['で']
['。']
['SSSS']
['そうそう']
['。']
['SSSS']
['散歩']
['を']
['して']
['る']
['ワン']
['ちゃん']
['に']
['会った']
['んだ']
['。']
['SSSS']
['城壁']
['の']
['上']
['を']
['やっぱ']
['観光']
['客']
['な']
['んだ']
['けど']
['ワン']
['ちゃん']
['連れて']
['きて']
['る']
['人']
['たち']
['結構']
['多くて']
['。']
['SSSS']
['で']
['。']
['SSSS']
['そう']
['したら']
['。']
['SSSS']
['おー']
['、']
['そら']
['地球']
['は']
['やっぱり']
['丸かった']
['みたいだ']
['ね']
['。']
['\u3000']
['SSSS']
['そう']
['したら']
['その']
['ワン']
['ちゃん']
['が']
['なんか']
['か']
['喜んじゃ']
['って']
['。']
['SSSS']
['なんか']
['すごーい']
['な']
['つかれちゃ']
['って']
['ね']
['。']
['SSSS']
['さっき']
['ね']
['、']
['別に']
['、']
['そんなに']
['なでて']
['も']
['い']
['ない']
['んだ']
['よ']
['。']
['SSSS']
['よしよし']
['って']
['言った']
['だけ']
['な']
['のに']
['。']
['SSSS']
['あら']
['ワン']


['もう']
['１']
['つ']
['簡易']
['ベッド']
['が']
['出せる']
['ような']
['部屋']
['な']
['んだ']
['けど']
['。']
['SSSS']
['あんた']
['たち']
['だけ']
['で']
['使って']
['いい']
['から']
['って']
['言って']
['。']
['SSSS']
['これ']
['が']
['ね']
['、']
['これ']
['が']
['１']
['日']
['目']
['の']
['チェスター']
['の']
['ホテル']
['。']
['その']
['汚い']
['。']
['SSSS']
['見かけ']
['は']
['きれいだ']
['けど']
['ここ']
['、']
['ここ']
['や']
['どっか']
['に']
['。']
['SSSS']
['見かけ']
['は']
['きれいだ']
['けど']
['。']
['SSSS']
['見かけ']
['は']
['きれいだった']
['わ']
['。']
['SSSS']
['うん']
['。']
['そう']
['そうそう']
['。']
['SSSS']
['ちょっと']
['ちょっと']
['こう']
['すきま']
['を']
['見る']
['と']
['ほこり']
['たまって']
['る']
['みたい']
['な']
['。']
['SSSS']
['の']
['ホテル']
['。']
['SSSS']
['これ']
['が']
['チェスター']
['の']
['カシードラル']
['の']
['中庭']
['。']
['SSSS']
['と']
['か']
['だったら']
['自分']
['たち']
['で']
['料理']
['すれば']
['いい']
['し']
['さあ']
['。']
['それ']
['は']
['キッチン']
['が']
['ついて']
['いる']
['わけで']
['は']
['ない']
['？']
['SSSS']
['じゃ']
['ない']
['。']
['SSSS']
['全然']
['。']
['それ']
['は']
['ＢＢ']
['と']
['いう']
['の']
['は']
['ベッド']
['・']
['アンド']
['・']
['ブレ

['？']
['\u3000']
['SSSS']
['それ']
['が']
['さあ']
['、']
['あの']
['さあ']
['、']
['ウィンダミヤ']
['の']
['さあ']
['、']
['レストラン']
['が']
['最低だった']
['。']
['SSSS']
['まずい']
['？']
['SSSS']
['だ']
['から']
['その']
['前']
['の']
['日']
['の']
['ジャケッツ']
['で']
['あたし']
['は']
['懲りて']
['いる']
['わけ']
['よ']
['。']
['SSSS']
['もう']
['今日']
['こそ']
['は']
['あったかい']
['もの']
['が']
['食べ']
['たい']
['と']
['。']
['SSSS']
['そう']
['。']
['で']
['、']
['パスタ']
['が']
['食べ']
['たい']
['と']
['か']
['って']
['思って']
['。']
['SSSS']
['で']
['。']
['SSSS']
['ちょっと']
['フラフラ']
['歩き']
['ながら']
['途中']
['で']
['いい']
['店']
['が']
['あったら']
['。']
['SSSS']
['あったら']
['そこ']
['に']
['入って']
['みよう']
['か']
['と']
['。']
['SSSS']
['入っちゃ']
['おう']
['か']
['と']
['思い']
['つつ']
['行った']
['じゃ']
['ん']
['。']
['SSSS']
['ポーク']
['。']
['SSSS']
['チキン']
['カレー']
['が']
['あった']
['の']
['。']
['SSSS']
['日本']
['の']
['カレー']
['と']
['も']
['違い']
['ます']
['よ']
['ね']
['。']
['SSSS']
['わあー']
['カレー']
['ライス']
['食べよう']
['と']
['思って']
['、']
['あったかい']
['し']
['と']
['思って']
['。']
['SSSS']
['ご飯']
['が']
['食べ']
['れる']
['と']
['か']

['そんな']
['の']
['流れて']
['た']
['。']
['SSSS']
['最初']
['から']
['。']
['SSSS']
['最初']
['から']
['？']
['SSSS']
['だ']
['から']
['。']
['SSSS']
['このまま']
['の']
['状態']
['だった']
['もん']
['で']
['いっちゃ']
['った']
['じゃ']
['ん']
['。']
['SSSS']
['あー']
['、']
['それ']
['で']
['行って']
['る']
['間']
['に']
['。']
['SSSS']
['ほい']
['で']
['行って']
['る']
['間']
['に']
['。']
['SSSS']
['あー']
['、']
['落ちた']
['、']
['落ちた']
['。']
['SSSS']
['あたし']
['。']
['SSSS']
['飛行機']
['が']
['落ちたー']
['と']
['か']
['と']
['言って']
['。']
['SSSS']
['何']
['か']
['あった']
['よ']
['って']
['言って']
['、']
['アクシデント']
['だ']
['と']
['か']
['な']
['んだ']
['か']
['と']
['か']
['って']
['言って']
['る']
['けど']
['って']
['言って']
['。']
['SSSS']
['で']
['。']
['SSSS']
['知ら']
['ん']
['かった']
['じゃ']
['ん']
['ね']
['。']
['SSSS']
['まだまだ']
['だ']
['わ']
['って']
['。']
['SSSS']
['知って']
['るっ']
['と']
['か']
['言わ']
['れて']
['、']
['はっと']
['か']
['って']
['言って']
['。']
['SSSS']
['知ら']
['ない']
['よ']
['って']
['。']
['何']
['が']
['と']
['か']
['言って']
['。']
['SSSS']
['ねー']
['。']
['SSSS']
['明らかに']
['。']
['SSSS']
['で']
['も']
['それ']
['って']

['よ']
['ね']
['。']
['SSSS']
['ビンラディン']
['が']
['出て']
['こ']
['ない']
['もん']
['。']
['SSSS']
['どう']
['UNK']
['して']
['も']
['さあ']
['、']
['ほか']
['の']
['もの']
['が']
['さあ']
['。']
['SSSS']
['やめ']
['ない']
['と']
['言って']
['た']
['もん']
['ね']
['。']
['SSSS']
['最終']
['目標']
['は']
['ビンラディン']
['だ']
['から']
['さあ']
['。']
['SSSS']
['どう']
['するー']
['。']
['SSSS']
['ビンラディン']
['とっ']
['つかまえる']
['まで']
['は']
['きっと']
['UNK']
['。']
['SSSS']
['なんで']
['でも']
['証拠']
['を']
['見せ']
['ない']
['の']
['。']
['SSSS']
['証拠']
['は']
['ある']
['と']
['か']
['言って']
['た']
['よ']
['ねー']
['。']
['SSSS']
['言って']
['て']
['見せる']
['って']
['言って']
['て']
['。']
['SSSS']
['明らかな']
['の']
['は']
['ある']
['と']
['か']
['って']
['言って']
['た']
['よ']
['ね']
['。']
['SSSS']
['で']
['、']
['ペーパー']
['で']
['見せる']
['って']
['言って']
['、']
['それ']
['は']
['見て']
['ない']
['よ']
['ね']
['。']
['SSSS']
['見せて']
['ない']
['もの']
['。']
['何で']
['見せ']
['ない']
['の']
['。']
['SSSS']
['ない']
['んじゃ']
['ない']
['の']
['。']
['実は']
['。']
['SSSS']
['うーん']
['。']
['SSSS']
['あの']
['さあ']
['、']
['そう']
['、']
['そう']
['、']
['そう']


['感じ']
['だった']
['。']
['若']
['作り']
['して']
['る']
['おば']
['様']
['。']
['SSSS']
['なんか']
['髪']
['の']
['毛']
['も']
['真っ赤じゃ']
['なかった']
['。']
['SSSS']
['そうそう']
['。']
['真っ']
['かっか']
['で']
['え']
['、']
['ちょっと']
['ロング']
['ヘア']
['で']
['真っ']
['かっか']
['でー']
['。']
['SSSS']
['もう']
['おば']
['様']
['って']
['感じ']
['だった']
['けど']
['。']
['SSSS']
['３０']
['過ぎて']
['る']
['って']
['感じ']
['の']
['、']
['もう']
['４０']
['ぐらい']
['じゃ']
['ない']
['。']
['て']
['感じ']
['の']
['おば']
['様']
['だった']
['よ']
['。']
['SSSS']
['あっ']
['そう']
['。']
['SSSS']
['ほい']
['で']
['さあ']
['。']
['SSSS']
['。']
['SSSS']
['あの']
['身障']
['者']
['の']
['トイレ']
['が']
['あった']
['から']
['そこ']
['に']
['入っちゃ']
['った']
['。']
['Ａ子']
['ね']
['。']
['SSSS']
['鉄板']
['、']
['すごく']
['大きな']
['鉄板']
['が']
['こういうふうに']
['これ']
['ぐらい']
['の']
['幅']
['の']
['波']
['を']
['打た']
['せて']
['あって']
['、']
['こう']
['、']
['あのー']
['。']
['SSSS']
['なんか']
['おしゃれな']
['トイレ']
['な']
['んだ']
['けど']
['。']
['SSSS']
['とんがって']
['は']
['い']
['ない']
['んだ']
['けど']
['、']
['こういう']
['感じ']
['で']
['。']
['SSSS']
['波']
['が']
['、']
['う']

['いい']
['なー']
['。']
['SSSS']
['だ']
['もん']
['で']
['さあ']
['、']
['１']
['日']
['目']
['は']
['宿']
['を']
['取って']
['おいて']
['もらって']
['、']
['２']
['日']
['目']
['から']
['コンコン']
['と']
['か']
['って']
['、']
['その']
['。']
['SSSS']
['見せて']
['と']
['か']
['言って']
['。']
['SSSS']
['の']
['ところ']
['に']
['行って']
['見せて']
['。']
['SSSS']
['で']
['、']
['４６']
['に']
['して']
['もらって']
['。']
['SSSS']
['すごい']
['。']
['ディスカウント']
['。']
['SSSS']
['もう']
['そこ']
['は']
['。']
['SSSS']
['あ']
['、']
['部屋']
['に']
['？']
['SSSS']
['そう']
['、']
['そう']
['、']
['そう']
['。']
['SSSS']
['あー']
['、']
['それ']
['は']
['いい']
['なあ']
['。']
['SSSS']
['だもんで']
['。']
['SSSS']
['プリクラ']
['撮った']
['んだ']
['よ']
['。']
['SSSS']
['えっ見']
['してー']
['。']
['SSSS']
['ひどい']
['の']
['。']
['品質']
['が']
['。']
['まだ']
['向こう']
['は']
['ねえ']
['最近']
['できた']
['と']
['こと']
['か']
['って']
['言って']
['、']
['色']
['ついとう']
['へんでしょう']
['。']
['SSSS']
['で']
['も']
['なんとなく']
['ね']
['、']
['なんとなく']
['カラー']
['な']
['んだ']
['よ']
['ね']
['。']
['これ']
['で']
['。']
['SSSS']
['ほんとだ']
['。']
['ほんとだ']
['。']
['なんか']
['すごい']
['

['んだ']
['から']
['。']
['行か']
['ない']
['んだ']
['から']
['しょうがない']
['。']
['SSSS']
['しょうがない']
['。']
['しょうがない']
['。']
['SSSS']
['ウィ']
['・']
['アー']
['・']
['アウェイ']
['・']
['フロム']
['・']
['ホーム']
['・']
['ソーリー']
['って']
['。']
['SSSS']
['なんか']
['で']
['も']
['さあ']
['、']
['Ｊ']
['は']
['なんか']
['ゆっくり']
['話して']
['くれる']
['んだ']
['よ']
['ね']
['。']
['SSSS']
['そう']
['、']
['そう']
['、']
['そう']
['、']
['そう']
['。']
['SSSS']
['そう']
['な']
['んだ']
['。']
['SSSS']
['は']
['弾丸']
['の']
['ように']
['しゃべって']
['。']
['SSSS']
['相変わらず']
['。']
['SSSS']
['は']
['わかり']
['やすい']
['から']
['ね']
['。']
['SSSS']
['の']
['英語']
['は']
['すごく']
['わかり']
['やすい']
['ねえ']
['。']
['SSSS']
['そう']
['。']
['Ｊ']
['は']
['一生懸命']
['きちんと']
['ね']
['、']
['あの']
['丁寧に']
['ゆっくり']
['しゃべって']
['くれて']
['。']
['SSSS']
['そう']
['な']
['んだ']
['。']
['UNK']
['。']
['いい']
['なー']
['。']
['いき']
['たい']
['なー']
['。']
['SSSS']
['でも']
['、']
['日本']
['に']
['Ｊ']
['は']
['来']
['たい']
['って']
['言って']
['た']
['よ']
['ね']
['。']
['SSSS']
['言って']
['た']
['よ']
['ね']
['。']
['うんうん']
['。']
['来て']
['と']
['か']
['言って']
['

['あ']
['、']
['取る']
['取る']
['取る']
['取る']
['。']
['あ']
['、']
['Ｅ']
['先輩']
['は']
['、']
['と']
['さん']
['にー']
['は']
['とる']
['よ']
['。']
['SSSS']
['受講']
['票']
['出し']
['とった']
['もん']
['。']
['SSSS']
['あ']
['、']
['しまった']
['。']
['SSSS']
['ど']
['した']
['？']
['SSSS']
['何']
['か']
['さあ']
['。']
['SSSS']
['そんな']
['こと']
['言わ']
['れた']
['の']
['ね']
['。']
['SSSS']
['うん']
['、']
['うん']
['。']
['私']
['、']
['特論']
['で']
['出した']
['。']
['前期']
['１']
['単位']
['の']
['方']
['演習']
['できて']
['る']
['から']
['。']
['SSSS']
['私']
['さ']
['。']
['SSSS']
['たぶん']
['、']
['あれ']
['、']
['なに']
['で']
['出した']
['んだろう']
['。']
['SSSS']
['で']
['も']
['さあ']
['。']
['SSSS']
['同じ']
['時間']
['帯']
['で']
['やって']
['て']
['。']
['SSSS']
['えー']
['、']
['でも']
['先生']
['それ']
['で']
['やって']
['く']
['つもりでしょう']
['？']
['SSSS']
['受講']
['票']
['で']
['？']
['SSSS']
['うん']
['、']
['だって']
['、']
['何']
['か']
['掲示']
['に']
['したって']
['、']
['その']
['４']
['限']
['の']
['やつ']
['を']
['取る']
['人']
['は']
['、']
['何']
['時']
['に']
['UNK']
['で']
['も']
['。']
['SSSS']
['。']
['書いて']
['あった']
['ね']
['。']

['ずっと']
['行っ']
['と']
['って']
['。']
['SSSS']
['でも']
['、']
['今週']
['で']
['最後の']
['週']
['らしい']
['よ']
['。']
['SSSS']
['あ']
['、']
['そう']
['な']
['んだ']
['。']
['SSSS']
['また']
['混む']
['よ']
['。']
['SSSS']
['ねえー']
['。']
['SSSS']
['あー']
['私']
['それ']
['より']
['、']
['明日']
['の']
['１']
['限']
['が']
['心配']
['。']
['起き']
['れる']
['の']
['か']
['なあ']
['。']
['１']
['限']
['つらい']
['よ']
['。']
['SSSS']
['私']
['、']
['１']
['限']
['全部']
['外した']
['よ']
['。']
['SSSS']
['１']
['限']
['外そう']
['と']
['思った']
['んだ']
['けど']
['、']
['水曜日']
['だけ']
['は']
['どうしても']
['外せん']
['かった']
['んだ']
['って']
['。']
['SSSS']
['そう']
['な']
['んだ']
['。']
['え']
['、']
['何の']
['授業']
['？']
['SSSS']
['心理']
['だ']
['けど']
['、']
['なんか']
['取り']
['たかった']
['から']
['。']
['もう']
['これ']
['は']
['しょうがない']
['、']
['我慢']
['して']
['取る']
['か']
['と']
['思って']
['。']
['SSSS']
['え']
['、']
['だれ']
['の']
['心理']
['？']
['SSSS']
['心理']
['の']
['女']
['の']
['先生']
['、']
['な']
['んだった']
['っけ']
['な']
['。']
['SSSS']
['あー']
['何となく']
['わかる']
['。']
['夜間']
['の']
['授業']
['持って']
['る']
['よ']
['ね']
['。']
['で

['勉強']
['する']
['日本']
['語']
['と']
['さ']
['必ずしも']
['一緒じゃ']
['ないじゃ']
['ん']
['。']
['SSSS']
['そう']
['だ']
['ね']
['。']
['SSSS']
['何']
['か']
['その']
['、']
['いろんな']
['言葉']
['が']
['入っ']
['とる']
['、']
['省略']
['も']
['多い']
['し']
['さ']
['。']
['SSSS']
['比ゆ']
['的な']
['表現']
['を']
['すごい']
['使う']
['じゃ']
['ん']
['。']
['SSSS']
['うん']
['、']
['まあ']
['。']
['SSSS']
['逆の']
['こと']
['を']
['言って']
['笑い']
['取ったり']
['と']
['か']
['さあ']
['。']
['SSSS']
['うん']
['、']
['語彙']
['が']
['ない']
['んだ']
['よ']
['、']
['要は']
['。']
['SSSS']
['ボキャ']
['不足']
['って']
['感じ']
['？']
['SSSS']
['うん']
['、']
['ボキャ']
['貧']
['。']
['SSSS']
['いわゆる']
['ボキャ']
['貧']
['だ']
['よ']
['。']
['自分']
['も']
['含めて']
['ね']
['。']
['SSSS']
['うんうんうんうん']
['。']
['SSSS']
['レポート']
['と']
['か']
['書いて']
['る']
['と']
['涙']
['出て']
['こ']
['ん']
['？']
['書け']
['ん']
['くて']
['。']
['SSSS']
['ボキャ']
['貧']
['だ']
['もん']
['なあ']
['。']
['SSSS']
['ほんと']
['ほ']
['だ']
['よ']
['ね']
['。']
['SSSS']
['あ']
['、']
['ところで']
['、']
['あんた']
['ちゃん']
['と']
['ナビ']
['、']
['して']
['ね']
['。']
['SSSS']
['オーライ']
['。']
['S

['ね']
['、']
['ああ']
['。']
['SSSS']
['１']
['姫']
['・']
['２']
['和泉']
['・']
['３']
['三河']
['って']
['いう']
['らしい']
['じゃ']
['ん']
['ね']
['。']
['あたし']
['の']
['記憶']
['が']
['正しければ']
['だ']
['けど']
['。']
['SSSS']
['それ']
['は']
['何']
['でしょう']
['か']
['。']
['SSSS']
['運転']
['の']
['荒い']
['。']
['SSSS']
['ああー']
['、']
['ちょ']
['、']
['ほんとに']
['ね']
['。']
['SSSS']
['１']
['番']
['が']
['姫路']
['。']
['SSSS']
['まいっ']
['か']
['と']
['か']
['言って']
['。']
['SSSS']
['逆に']
['僕']
['。']
['SSSS']
['うん']
['。']
['あなた']
['は']
['安全']
['運転']
['よ']
['ね']
['。']
['あたし']
['ね']
['、']
['さすが']
['に']
['人']
['を']
['乗せたら']
['安全']
['運転']
['だ']
['よ']
['。']
['SSSS']
['うん']
['、']
['俺']
['も']
['１']
['人']
['の']
['とき']
['は']
['、']
['がーって']
['行く']
['けど']
['さあ']
['。']
['SSSS']
['まっすぐ']
['？']
['。']
['SSSS']
['うん']
['。']
['SSSS']
['逆に']
['そのー']
['。']
['SSSS']
['うーん']
['、']
['だって']
['親']
['が']
['悲しむ']
['じゃ']
['ん']
['。']
['SSSS']
['うん']
['。']
['て']
['か']
['、']
['もう']
['乗った']
['時点']
['で']
['でも']
['さあ']
['、']
['そんな']
['の']
['。']
['SSSS']
['そう']
['？']
['SSSS']
['

['１１']
['月']
['の']
['２４']
['日']
['に']
['、']
['ＯＢ']
['現役']
['。']
['SSSS']
['あー']
['うんうん']
['、']
['それ']
['は']
['もう']
['空けて']
['る']
['。']
['SSSS']
['よし']
['。']
['がんばれよ']
['。']
['SSSS']
['待って']
['あんた']
['行か']
['ん']
['と']
['か']
['言わ']
['ん']
['よ']
['ね']
['、']
['ちょっと']
['。']
['SSSS']
['俺']
['、']
['ＯＢ']
['総会']
['出た']
['から']
['。']
['SSSS']
['ちょーっと']
['、']
['あんた']
['。']
['SSSS']
['タッチ']
['タッチ']
['。']
['タッチタッチ']
['タッチ']
['タッチ']
['。']
['SSSS']
['何']
['を']
['言っ']
['とる']
['。']
['あたし']
['も']
['その']
['、']
['ＯＢ']
['総会']
['の']
['。']
['え']
['、']
['行こう']
['よ']
['。']
['SSSS']
['あんねー']
['、']
['ごめん']
['。']
['あの']
['合宿']
['な']
['んだ']
['。']
['SSSS']
['何の']
['？']
['SSSS']
['あの']
['、']
['ゼミ']
['の']
['。']
['SSSS']
['何で']
['そんな']
['都合']
['よく']
['そんな']
['ところ']
['に']
['行く']
['んだ']
['？']
['SSSS']
['俺']
['も']
['よっ']
['しゃ']
['と']
['か']
['思って']
['。']
['SSSS']
['よっ']
['しゃ']
['と']
['か']
['じゃ']
['ない']
['でしょ']
['。']
['ちょっと']
['待って']
['。']
['SSSS']
['違う']
['、']
['ほんとに']
['空け']
['とった']
['んだ']
['けどー']
['、']
['その']
['。']
['SSSS

['。']
['ていう']
['か']
['早く']
['決めよう']
['。']
['あんね']
['、']
['まず']
['、']
['あの']
['、']
['１１']
['月']
['４']
['日']
['の']
['話']
['。']
['SSSS']
['あ']
['、']
['そっち']
['が']
['先']
['なんか']
['。']
['SSSS']
['ちゃう']
['、']
['ちゃうちゃう']
['ちゃう']
['。']
['SSSS']
['うんと']
['１１']
['月']
['４']
['日']
['の']
['話']
['は']
['えー']
['と']
['１']
['時']
['半']
['に']
['あそこ']
['の']
['駐車']
['場']
['。']
['SSSS']
['昼']
['の']
['１']
['時']
['半']
['か']
['。']
['SSSS']
['うん']
['。']
['朝']
['、']
['よ']
['な']
['、']
['夜中']
['から']
['集まって']
['も']
['別に']
['。']
['SSSS']
['お']
['昼']
['か']
['って']
['いう']
['意味']
['で']
['言った']
['んで']
['そういう']
['、']
['何']
['、']
['あそこ']
['の']
['Ｊ']
['＆']
['Ａ']
['の']
['駐車']
['場']
['？']
['SSSS']
['あのー']
['Ｊ']
['＆']
['Ａ']
['の']
['、']
['Ａ']
['さん']
['と']
['この']
['駐車']
['場']
['で']
['、']
['それ']
['で']
['、']
['それ']
['で']
['、']
['じょうざ']
['ん']
['苑']
['に']
['行って']
['、']
['何']
['か']
['。']
['SSSS']
['俺']
['、']
['知ら']
['ない']
['よ']
['。']
['じょう']
['ざん']
['苑']
['って']
['知ら']
['ない']
['よ']
['。']
['SSSS']
['あたし']
['も']
['知ら']
['ない']
['。']
['SSS

['。']
['SSSS']
['うん']
['。']
['かなり']
['ね']
['、']
['ガンガン']
['冷えて']
['た']
['。']
['ガンガン']
['に']
['冷えて']
['た']
['。']
['SSSS']
['こんばんは']
['。']
['SSSS']
['こんばんは']
['。']
['お邪魔']
['して']
['おり']
['ます']
['。']
['SSSS']
['いえ']
['、']
['勝手に']
['どうぞ']
['。']
['SSSS']
['すいまっせん']
['。']
['SSSS']
['あーら']
['よ']
['。']
['SSSS']
['これ']
['、']
['みやげ']
['あげる']
['。']
['SSSS']
['はい']
['？']
['SSSS']
['いい']
['もん']
['じゃ']
['ない']
['けど']
['、']
['はい']
['。']
['SSSS']
['いい']
['んです']
['か']
['。']
['SSSS']
['いい']
['よ']
['。']
['SSSS']
['ありがとう']
['ございまーす']
['。']
['SSSS']
['はい']
['。']
['SSSS']
['地域']
['限定']
['リンゴ']
['ガム']
['。']
['え']
['、']
['どこ']
['行って']
['た']
['んです']
['か']
['？']
['SSSS']
['東北']
['。']
['さっき']
['帰って']
['きた']
['とこ']
['。']
['SSSS']
['えー']
['。']
['SSSS']
['どこ']
['も']
['くちゃくちゃ']
['やん']
['。']
['SSSS']
['いつも']
['やん']
['。']
['SSSS']
['いや']
['何']
['、']
['ここ']
['に']
['ね']
['、']
['ここ']
['に']
['それ']
['らしい']
['何']
['か']
['こう']
['、']
['お']
['みやげ']
['の']
['数々']
['が']
['並んで']
['る']
['なあ']
['と']
['。']
['SSSS']
['どうした']
['？']
['どう

['、']
['い']
['なかった']
['っけ']
['。']
['SSSS']
['わかんない']
['。']
['いた']
['かも']
['しれ']
['ない']
['けどー']
['。']
['SSSS']
['何']
['か']
['東南']
['アジア']
['系']
['の']
['人']
['連れて']
['きた']
['。']
['日本']
['人']
['で']
['は']
['ない']
['顔']
['。']
['日本']
['人']
['だ']
['けど']
['、']
['顔']
['は']
['日本']
['人']
['じゃ']
['ない']
['。']
['SSSS']
['あ']
['、']
['そう']
['な']
['んだ']
['。']
['SSSS']
['そ']
['したら']
['さ']
['、']
['こない']
['だ']
['。']
['SSSS']
['初対面']
['な']
['のに']
['。']
['SSSS']
['そう']
['そうそう']
['。']
['初対面']
['じゃ']
['なーい']
['。']
['SSSS']
['初対面']
['、']
['基本']
['的に']
['初対面']
['じゃ']
['ん']
['。']
['SSSS']
['違う']
['よ']
['。']
['そんな']
['こと']
['ない']
['って']
['。']
['SSSS']
['あ']
['、']
['そう']
['。']
['SSSS']
['何']
['か']
['彼']
['は']
['やたら']
['親しみ']
['を']
['持って']
['くれ']
['とる']
['し']
['。']
['SSSS']
['どう']
['する']
['？']
['。']
['SSSS']
['三ヶ根山']
['。']
['三ヶ根山']
['。']
['SSSS']
['香嵐渓']
['？']
['SSSS']
['あ']
['、']
['香嵐渓']
['も']
['いい']
['ね']
['。']
['でも']
['紅葉']
['始ま']
['、']
['まだ']
['始まって']
['ない']
['んだ']
['よ']
['ね']
['、']
['こっち']
['でも']
['ね']
['。']
['

['努力']
['系']
['だ']
['よ']
['。']
['SSSS']
['。']
['SSSS']
['あたし']
['、']
['ごめん']
['。']
['SSSS']
['は']
['努力']
['家']
['。']
['SSSS']
['そう']
['見える']
['でしょう']
['。']
['SSSS']
['ついて']
['いけて']
['ない']
['んです']
['よ']
['、']
['ほんとに']
['。']
['SSSS']
['うち']
['は']
['あほ']
['系']
['なんで']
['いい']
['けど']
['さ']
['。']
['SSSS']
['な']
['、']
['手']
['に']
['負え']
['ん']
['よ']
['な']
['。']
['Ｍ']
['だけ']
['か']
['、']
['こう']
['、']
['せめても']
['頑張って']
['る']
['って']
['いう']
['。']
['SSSS']
['や']
['、']
['ほれ']
['でも']
['その']
['わりに']
['伸びて']
['ない']
['よ']
['。']
['SSSS']
['そんな']
['身']
['も']
['ふた']
['も']
['ない']
['。']
['だめ']
['、']
['そういう']
['、']
['受験']
['生']
['に']
['は']
['禁物']
['な']
['言葉']
['だめ']
['よ']
['。']
['SSSS']
['あんま']
['気']
['に']
['して']
['ない']
['ね']
['、']
['その辺']
['は']
['ね']
['。']
['SSSS']
['ちゃん']
['大丈夫']
['よ']
['。']
['SSSS']
['大丈夫じゃ']
['ない']
['よ']
['。']
['全然']
['大丈夫じゃ']
['ない']
['よ']
['。']
['よう']
['言う']
['わ']
['。']
['SSSS']
['大丈夫だ']
['と']
['思い']
['ます']
['よ']
['、']
['と']
['か']
['。']
['SSSS']
['大丈夫だ']
['と']
['思う']
['で']
['、']
['あー']
['

['Ｄ']
['は']
['遅い']
['んでしょ']
['？']
['SSSS']
['は']
['１０']
['時']
['ぐらい']
['に']
['集合']
['。']
['SSSS']
['早く']
['集まれる']
['人']
['だけ']
['先']
['に']
['買い']
['に']
['いけば']
['いい']
['やん']
['、']
['そし']
['たら']
['。']
['SSSS']
['そう']
['ね']
['。']
['SSSS']
['うん']
['。']
['父さん']
['帰って']
['きた']
['ね']
['。']
['SSSS']
['お']
['父さん']
['、']
['今日']
['UNK']
['８']
['時']
['半']
['UNK']
['。']
['SSSS']
['どっか']
['遊ん']
['どん']
['じゃ']
['ない']
['？']
['SSSS']
['女']
['か']
['。']
['SSSS']
['知ら']
['ん']
['わ']
['あ']
['。']
['SSSS']
['女']
['だって']
['、']
['大した']
['女']
['じゃ']
['ない']
['だろう']
['ね']
['。']
['SSSS']
['そんな']
['ぼろくそに']
['。']
['SSSS']
['ま']
['、']
['いい']
['よ']
['。']
['ちょっと']
['くらい']
['遊んで']
['くれ']
['ん']
['と']
['ね']
['。']
['SSSS']
['じゃ']
['、']
['どう']
['する']
['。']
['SSSS']
['どーし']
['よっか']
['なあー']
['。']
['SSSS']
['もう']
['すぐ']
['１']
['時']
['か']
['な']
['。']
['また']
['あれ']
['書いて']
['くれる']
['？']
['紙']
['。']
['SSSS']
['いい']
['よ']
['。']
['SSSS']
['うん']
['、']
['お']
['願い']
['し']
['ます']
['ね']
['。']
['どう']
['する']
['ね']
['。']
['SSSS']
['ちょ']
['、

['、']
['おもしろ']
['話']
['を']
['。']
['SSSS']
['何']
['が']
['ある']
['か']
['なー']
['。']
['SSSS']
['情報']
['を']
['。']
['お']
['店']
['情報']
['を']
['。']
['SSSS']
['あー']
['、']
['ケーキ']
['屋']
['さん']
['いい']
['なー']
['。']
['SSSS']
['コーヒー']
['の']
['おいしい']
['お']
['店']
['が']
['あった']
['んです']
['よー']
['。']
['SSSS']
['あー']
['、']
['ある']
['ね']
['。']
['テレビ']
['で']
['やって']
['た']
['。']
['そう']
['言えば']
['。']
['SSSS']
['あっ']
['、']
['そう']
['な']
['んです']
['か']
['。']
['SSSS']
['うん']
['。']
['SSSS']
['どこ']
['の']
['辺']
['な']
['の']
['。']
['SSSS']
['あのー']
['、']
['マツヤ']
['電気']
['って']
['ある']
['じゃ']
['ない']
['です']
['か']
['。']
['SSSS']
['はい']
['、']
['はい']
['、']
['はい']
['、']
['はい']
['、']
['はい']
['、']
['はい']
['。']
['SSSS']
['あの']
['十字']
['路']
['をー']
['、']
['奥']
['に']
['入って']
['いく']
['んです']
['よ']
['。']
['SSSS']
['へえー']
['。']
['どっち']
['に']
['？']
['SSSS']
['えーっ']
['と']
['どっち']
['に']
['。']
['SSSS']
['炭焼き']
['コーヒー']
['で']
['、']
['すっごい']
['おいしかった']
['です']
['。']
['SSSS']
['うん']
['、']
['何']
['か']
['やって']
['た']
['、']
['テレビ']
['で']
['。']
['へえーっ'

['？']
['SSSS']
['３０']
['分']
['ぐらい']
['だったらー']
['、']
['まあ']
['そんな']
['。']
['SSSS']
['バス']
['と']
['か']
['何とか']
['乗り']
['継いで']
['と']
['か']
['。']
['SSSS']
['そっ']
['かー']
['。']
['遠']
['いって']
['、']
['私']
['も']
['かて']
['きょう']
['、']
['遠い']
['んです']
['けど']
['ね']
['。']
['SSSS']
['しかたがない']
['。']
['車']
['の']
['場合']
['そんなに']
['苦']
['じゃ']
['ない']
['。']
['SSSS']
['本当に']
['考え']
['といて']
['。']
['だれ']
['か']
['やら']
['ない']
['？']
['私']
['の']
['アルバイト']
['。']
['SSSS']
['あーっ']
['、']
['私']
['ちょっと']
['考え']
['たい']
['です']
['。']
['うん']
['。']
['SSSS']
['１０００']
['円']
['で']
['ねー']
['。']
['SSSS']
['私']
['も']
['やり']
['たい']
['なー']
['、']
['でも']
['。']
['SSSS']
['何']
['人']
['も']
['いら']
['ない']
['です']
['か']
['。']
['SSSS']
['１']
['人']
['です']
['よ']
['ねー']
['。']
['SSSS']
['あっ']
['、']
['わかんない']
['。']
['もし']
['か']
['して']
['いる']
['かも']
['しれ']
['ない']
['。']
['わかんない']
['。']
['聞い']
['と']
['くわ']
['、']
['ほれ']
['じゃあ']
['。']
['SSSS']
['今']
['、']
['スタッフ']
['１']
['週間']
['に']
['どれ']
['くらい']
['です']
['か']
['。']
['SSSS']
['えっ']
['と']
['ね']
['。']
['

['ほんとに']
['。']
['SSSS']
['でも']
['いい']
['です']
['ね']
['。']
['SSSS']
['自分']
['の']
['責任']
['で']
['それ']
['自己']
['負担']
['し']
['なくちゃ']
['いけない']
['らしくて']
['。']
['SSSS']
['へえ']
['、']
['そう']
['な']
['の']
['。']
['SSSS']
['そういう']
['の']
['を']
['。']
['SSSS']
['えー']
['、']
['すごい']
['、']
['すごい']
['、']
['すごい']
['。']
['SSSS']
['１']
['箱']
['か']
['。']
['すごい']
['いい']
['。']
['SSSS']
['私']
['は']
['さらに']
['それ']
['を']
['持って']
['飲み']
['会']
['と']
['か']
['、']
['部屋']
['飲み']
['と']
['か']
['行って']
['、']
['じゃがりこ']
['と']
['か']
['いっぱい']
['持って']
['て']
['。']
['SSSS']
['いい']
['な']
['、']
['それ']
['は']
['。']
['いい']
['な']
['。']
['SSSS']
['おい']
['、']
['じゃがりこ']
['しか']
['ない']
['の']
['か']
['よって']
['ぐらい']
['。']
['SSSS']
['と']
['、']
['じゃがりこ']
['。']
['SSSS']
['ごめん']
['、']
['次']
['も']
['じゃがりこ']
['。']
['SSSS']
['ねー']
['、']
['じゃがりこ']
['に']
['お']
['湯']
['入れた']
['こと']
['ある']
['？']
['SSSS']
['なーい']
['よー']
['。']
['SSSS']
['あれ']
['、']
['入れたら']
['ねー']
['、']
['あれ']
['に']
['なる']
['。']
['マッシュ']
['ポテト']
['。']
['。']
['SSSS']
['あっ']
['、']
['どっか']
['、'

['で']
['ない']
['色']
['って']
['ちょっと']
['怖い']
['です']
['ね']
['。']
['SSSS']
['怖い']
['よ']
['ねー']
['。']
['SSSS']
['イカ']
['すみ']
['の']
['スパゲティ']
['と']
['か']
['、']
['最初']
['見た']
['とき']
['びっくり']
['した']
['。']
['SSSS']
['アメリカ']
['で']
['さー']
['、']
['紫']
['と']
['さー']
['、']
['緑']
['の']
['ケチャップ']
['が']
['出た']
['の']
['知って']
['る']
['？']
['SSSS']
['何']
['から']
['作る']
['んです']
['か']
['。']
['SSSS']
['たぶん']
['着色']
['料']
['が']
['混ざって']
['る']
['。']
['SSSS']
['はー']
['。']
['SSSS']
['うん']
['、']
['たぶん']
['。']
['このまま']
['八']
['事']
['に']
['行ける']
['？']
['出']
['れる']
['？']
['SSSS']
['行け']
['ます']
['、']
['行け']
['ます']
['。']
['SSSS']
['じゃあ']
['、']
['そっち']
['の']
['方']
['から']
['行った']
['方']
['が']
['。']
['SSSS']
['あのー']
['、']
['ジャスコ']
['の']
['下']
['。']
['SSSS']
['それ']
['を']
['あがっ']
['、']
['あ']
['、']
['それ']
['を']
['右']
['にー']
['。']
['SSSS']
['あっ']
['、']
['ケーキ']
['屋']
['さん']
['。']
['SSSS']
['そう']
['、']
['そう']
['、']
['うん']
['、']
['じゃあ']
['、']
['右']
['に']
['曲がって']
['もらって']
['。']
['SSSS']
['雨']
['が']
['降って']
['きちゃ']
['った']
['よ']
['。']

['。']
['SSSS']
['車']
['は']
['いい']
['ねー']
['。']
['やっぱり']
['ね']
['。']
['SSSS']
['うーん']
['、']
['いい']
['です']
['ねー']
['。']
['車']
['って']
['でも']
['維持']
['費']
['かかる']
['よ']
['ね']
['。']
['SSSS']
['かかる']
['？']
['SSSS']
['うーん']
['、']
['駐車']
['場']
['代']
['が']
['。']
['SSSS']
['月']
['に']
['それ']
['を']
['２']
['回']
['やった']
['と']
['したら']
['。']
['SSSS']
['あー']
['、']
['６０００']
['円']
['ねー']
['。']
['SSSS']
['で']
['、']
['駐車']
['場']
['代']
['が']
['７０００']
['円']
['。']
['SSSS']
['何で']
['そんな']
['ちょくちょく']
['帰る']
['の']
['？']
['SSSS']
['何']
['か']
['別に']
['、']
['何']
['か']
['ある']
['よー']
['と']
['か']
['言う']
['と']
['すぐ']
['に']
['。']
['SSSS']
['近い']
['もん']
['ね']
['。']
['SSSS']
['で']
['、']
['その']
['バイト']
['、']
['バイト']
['やん']
['ない']
['と']
['か']
['で']
['。']
['SSSS']
['バイト']
['に']
['帰る']
['の']
['？']
['SSSS']
['えーっ']
['、']
['それ']
['だ']
['と']
['UNK']
['ちゃん']
['の']
['こと']
['何も']
['言え']
['んじゃ']
['ん']
['。']
['SSSS']
['あっ']
['、']
['そっ']
['か']
['。']
['SSSS']
['と']
['、']
['家']
['帰る']
['ついで']
['と']
['か']
['、']
['友達']
['が']
['集まる']
['って'

['通って']
['らっしゃる']
['んです']
['か']
['。']
['SSSS']
['通って']
['る']
['って']
['いう']
['か']
['。']
['SSSS']
['適当に']
['アレンジ']
['できる']
['んです']
['けど']
['。']
['SSSS']
['先生']
['、']
['授業']
['は']
['どの']
['、']
['月']
['、']
['月']
['、']
['火']
['、']
['水']
['、']
['木']
['。']
['SSSS']
['水']
['、']
['木']
['、']
['金']
['。']
['SSSS']
['水']
['、']
['木']
['、']
['金']
['。']
['SSSS']
['でも']
['、']
['来']
['学期']
['も']
['なんか']
['、']
['月']
['、']
['水']
['、']
['金']
['か']
['、']
['月']
['、']
['木']
['、']
['金']
['か']
['。']
['SSSS']
['英語']
['は']
['あれ']
['です']
['よ']
['ね']
['。']
['教えて']
['らっしゃる']
['んです']
['よ']
['ね']
['。']
['大変です']
['よ']
['ね']
['。']
['SSSS']
['先生']
['は']
['何']
['を']
['教えて']
['いらっしゃる']
['んです']
['か']
['。']
['SSSS']
['フランス']
['語']
['です']
['。']
['SSSS']
['あっ']
['、']
['フランス']
['語']
['の']
['方']
['なんか']
['もっと']
['大変']
['。']
['SSSS']
['いえ']
['、']
['そんな']
['もっと']
['大変で']
['なくて']
['。']
['SSSS']
['それ']
['を']
['こう']
['しよう']
['と']
['思って']
['生きて']
['きた']
['わけじゃ']
['ない']
['んです']
['よ']
['ね']
['。']
['SSSS']
['はい']
['、']
['違う']
['んです']
['。

['強い']
['。']
['SSSS']
['うーん']
['、']
['知ら']
['ん']
['けどー']
['、']
['なんかー']
['。']
['それ']
['は']
['あれ']
['です']
['か']
['。']
['どんな']
['とこ']
['で']
['教え']
['てらした']
['んです']
['か']
['。']
['SSSS']
['えっとー']
['。']
['SSSS']
['なんか']
['そういう']
['感じ']
['です']
['。']
['SSSS']
['日本']
['語']
['の']
['先生']
['と']
['して']
['働いて']
['。']
['SSSS']
['はい']
['。']
['何']
['年間']
['か']
['、']
['はい']
['、']
['働いて']
['ました']
['。']
['SSSS']
['ふん']
['、']
['ふん']
['。']
['それ']
['、']
['大学']
['で']
['。']
['SSSS']
['大学']
['で']
['、']
['はい']
['。']
['だから']
['全然']
['違う']
['んです']
['ね']
['、']
['こっち']
['の']
['大学生']
['と']
['。']
['はい']
['。']
['SSSS']
['違い']
['ます']
['よ']
['ね']
['、']
['それ']
['は']
['確かに']
['。']
['SSSS']
['。']
['SSSS']
['そう']
['、']
['訓練']
['です']
['よ']
['ね']
['。']
['きっと']
['。']
['SSSS']
['訓練']
['、']
['うん']
['、']
['習って']
['ない']
['から']
['ね']
['。']
['SSSS']
['うーん']
['。']
['SSSS']
['でも']
['仕事']
['が']
['増えた']
['な']
['と']
['思って']
['。']
['SSSS']
['そや']
['けど']
['、']
['ゆう']
['て']
['も']
['まだ']
['早い']
['。']
['まだ']
['早い']
['って']
['、']
['まだ']
['、']
[

['。']
['SSSS']
['いえ']
['。']
['SSSS']
['ちょうど']
['いい']
['なって']
['いう']
['感じ']
['です']
['よ']
['ね']
['。']
['SSSS']
['まあ']
['、']
['ここ']
['でも']
['忙しい']
['です']
['よ']
['ね']
['。']
['SSSS']
['もう']
['いっそがしい']
['ところ']
['で']
['。']
['SSSS']
['何']
['か']
['事務']
['的な']
['こと']
['が']
['たくさん']
['ある']
['んです']
['よ']
['ね']
['。']
['SSSS']
['事務']
['的な']
['こと']
['も']
['いっぱい']
['ある']
['けど']
['。']
['SSSS']
['楽しく']
['やって']
['ます']
['。']
['SSSS']
['みんな']
['、']
['いい']
['人']
['です']
['ね']
['、']
['ここ']
['。']
['SSSS']
['いい']
['人']
['でしょう']
['。']
['SSSS']
['うん']
['。']
['SSSS']
['別']
['に']
['悪い']
['イメージ']
['じゃ']
['なかった']
['んです']
['けど']
['、']
['どー']
['しよう']
['と']
['思って']
['。']
['SSSS']
['うん']
['、']
['心配だった']
['けどー']
['って']
['いう']
['こと']
['で']
['ね']
['。']
['SSSS']
['はい']
['。']
['SSSS']
['事務']
['の']
['人']
['も']
['いい']
['人']
['だ']
['し']
['。']
['SSSS']
['ええ']
['、']
['ほんとに']
['もう']
['。']
['SSSS']
['はい']
['。']
['SSSS']
['そう']
['です']
['か']
['。']
['SSSS']
['んで']
['。']
['SSSS']
['偉い']
['ね']
['。']
['出し']
['たん']
['。']
['SSSS']
['もう']
['

In [101]:
iter_obj = csv.reader(open('data/nucc_corpus_analyzed.txt', 'r'), delimiter=' ')


In [102]:
li = [v[0] for v in iter_obj] 

In [80]:
mat = [v[0] for v in li] 

In [103]:
len(li)

935512