必要ModuleをImport

In [1]:
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.optim import Adam

import math

import random
import time
import pickle
import tqdm
from collections import Counter

from torch.utils.data import Dataset
import numpy as np

from utils import GELU, PositionwiseFeedForward, LayerNorm, SublayerConnection, LayerNorm

import matplotlib
%matplotlib inline
import matplotlib.pyplot as plt
from ipywidgets import FloatProgress
from IPython.display import display, clear_output

In [2]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

read_dir = './data/merged_bert/'
output_dir = './output/merged_bert/'
processed_train_txt = read_dir + 'train_X.txt'
processed_valid_txt = read_dir + 'valid_X.txt'
processed_test_txt = read_dir + 'test_X.txt'

Attentionセルを定義する

In [3]:
class Attention(nn.Module):
    """
    Scaled Dot Product Attention
    """
    def forward(self, query, key, value, mask=None, dropout=None):
        scores = torch.matmul(query, key.transpose(-2, -1)) / math.sqrt(query.size(-1))

        if mask is not None:
            scores = scores.masked_fill(mask == 0, -1e9)

        p_attn = F.softmax(scores, dim=-1)

        if dropout is not None:
            p_attn = dropout(p_attn)

        return torch.matmul(p_attn, value), p_attn


Multi Head Attentionを定義する

In [4]:
class MultiHeadedAttention(nn.Module):

    def __init__(self, h, d_model, dropout=0.1):
        super().__init__()
        assert d_model % h == 0

        # We assume d_v always equals d_k
        self.d_k = d_model // h
        self.h = h

        self.linear_layers = nn.ModuleList([nn.Linear(d_model, d_model) for _ in range(3)])
        self.output_linear = nn.Linear(d_model, d_model)
        self.attention = Attention()

        self.dropout = nn.Dropout(p=dropout)

    def forward(self, query, key, value, mask=None):
        batch_size = query.size(0)

        query, key, value = [l(x).view(batch_size, -1, self.h, self.d_k).transpose(1, 2) for l, x in zip(self.linear_layers, (query, key, value))]

        x, attn = self.attention(query, key, value, mask=mask, dropout=self.dropout)

        x = x.transpose(1, 2).contiguous().view(batch_size, -1, self.h * self.d_k)

        return self.output_linear(x)


Transformerを定義する

In [5]:
class TransformerBlock(nn.Module):
    def __init__(self, hidden, attn_heads, feed_forward_hidden, dropout):
        super().__init__()
        self.attention = MultiHeadedAttention(h=attn_heads, d_model=hidden, dropout=dropout)
        self.feed_forward = PositionwiseFeedForward(d_model=hidden, d_ff=feed_forward_hidden, dropout=dropout)
        self.input_sublayer = SublayerConnection(size=hidden, dropout=dropout)
        self.output_sublayer = SublayerConnection(size=hidden, dropout=dropout)
        self.dropout = nn.Dropout(p=dropout)

    def forward(self, x, mask):
        x = self.input_sublayer(x, lambda _x: self.attention.forward(_x, _x, _x, mask=mask))
        x = self.output_sublayer(x, self.feed_forward)
        return self.dropout(x)


BERTクラスを定義する

In [6]:
class BERT(nn.Module):

    def __init__(self, vocab_size, hidden=768, n_layers=12, attn_heads=12, dropout=0.1):
        super().__init__()
        self.hidden = hidden
        self.n_layers = n_layers
        self.attn_heads = attn_heads
        self.feed_forward_hidden = hidden * 4
        # embedding for BERT
        self.embedding = BERTEmbedding(vocab_size=vocab_size, embed_size=hidden, dropout=dropout)

        self.transformer_blocks = nn.ModuleList([TransformerBlock(hidden, attn_heads, hidden * 4, dropout) for _ in range(n_layers)])

    def forward(self, x):
        # xの中で0以上は1, 0未満は0として, maskテンソルを作る
        mask = (x > 0).unsqueeze(1).repeat(1, x.size(1), 1).unsqueeze(1)
        x = self.embedding(x)

        for transformer in self.transformer_blocks:
            x = transformer.forward(x, mask)
        return x


BERTのEmbedding層を定義する

In [7]:
class TokenEmbedding(nn.Embedding):
    def __init__(self, vocab_size, embed_size=512):
        super().__init__(vocab_size, embed_size, padding_idx=0)

class PositionalEmbedding(nn.Module):

    def __init__(self, d_model, max_len=512):
        super().__init__()

        pe = torch.zeros(max_len, d_model).float()
        pe.require_grad = False

        position = torch.arange(0, max_len).float().unsqueeze(1)
        div_term = (torch.arange(0, d_model, 2) * -(math.log(10000.0) / d_model)).float().exp()

        pe[:, 0::2] = torch.sin(position * div_term)
        pe[:, 1::2] = torch.cos(position * div_term)

        pe = pe.unsqueeze(0)
        self.register_buffer('pe', pe)

    def forward(self, x):
        return self.pe[:, :x.size(1)]


class BERTEmbedding(nn.Module):
    def __init__(self, vocab_size, embed_size, dropout=0.1):
        super().__init__()
        self.token = TokenEmbedding(vocab_size=vocab_size, embed_size=embed_size)
        self.position = PositionalEmbedding(d_model=self.token.embedding_dim)
        self.dropout = nn.Dropout(p=dropout)
        self.embed_size = embed_size

    #def forward(self, sequence, segment_label):
    def forward(self, sequence):
        x = self.token(sequence) + self.position(sequence)
        return self.dropout(x)


学習用にマスク予測の層を追加する<br>
Next Sentence Prediction用のクラスは削除してある

In [8]:
class BERTLM(nn.Module):
    def __init__(self, bert: BERT, vocab_size):
        super().__init__()
        self.bert = bert
        self.mask_lm = MaskedLanguageModel(self.bert.hidden, vocab_size)

    def forward(self, x):
        x = self.bert(x)
        return self.mask_lm(x)

class MaskedLanguageModel(nn.Module):
    def __init__(self, hidden, vocab_size):
        super().__init__()
        self.linear = nn.Linear(hidden, vocab_size)
        self.softmax = nn.LogSoftmax(dim=-1)

    def forward(self, x):
        return self.softmax(self.linear(x))

In [9]:
class BERTHybrid(nn.Module):
    def __init__(self, bert: BERT, head):
        super().__init__()
        self.bert = bert
        self.epd = ErrorPositionDetectionHead(self.bert.hidden, head)
        self.esd = ErrorSentenceDetectionHead(head)
    def forward(self, x):
        x = self.bert(x)
        x = self.epd(x)
        return x, self.esd(x) 

class ErrorSentenceDetectionHead(nn.Module):
    def __init__(self, hidden):
        super().__init__()
        self.linear = nn.Linear(hidden, 2)
        self.softmax = nn.LogSoftmax(dim=-1)

    def forward(self, x):
        return self.softmax(self.linear(x[:, 0]))
    
class ErrorPositionDetectionHead(nn.Module):
    def __init__(self, hidden, head):
        super().__init__()
        self.linear = nn.Linear(hidden, head)
        self.softmax = nn.LogSoftmax(dim=-1)

    def forward(self, x):
        return self.softmax(self.linear(x))

BERT用のVocabを生成するクラスを定義する

In [10]:
import pickle
import tqdm
from collections import Counter

class TorchVocab(object):
    """
    :property freqs: collections.Counter, コーパス中の単語の出現頻度を保持するオブジェクト
    :property stoi: collections.defaultdict, string → id の対応を示す辞書
    :property itos: collections.defaultdict, id → string の対応を示す辞書
    """
    def __init__(self, counter, max_size=None, min_freq=1, specials=['<pad>', '<oov>'],
                 vectors=None, unk_init=None, vectors_cache=None):
        """
        :param coutenr: collections.Counter, データ中に含まれる単語の頻度を計測するためのcounter
        :param max_size: int, vocabularyの最大のサイズ. Noneの場合は最大値なし. defaultはNone
        :param min_freq: int, vocabulary中の単語の最低出現頻度. この数以下の出現回数の単語はvocabularyに加えられない.
        :param specials: list of str, vocabularyにあらかじめ登録するtoken
        :param vecors: list of vectors, 事前学習済みのベクトル. ex)Vocab.load_vectors
        """
        self.freqs = counter
        counter = counter.copy()
        min_freq = max(min_freq, 1)

        self.itos = list(specials)
        # special tokensの出現頻度はvocabulary作成の際にカウントされない
        for tok in specials:
            del counter[tok]

        max_size = None if max_size is None else max_size + len(self.itos)

        # まず頻度でソートし、次に文字順で並び替える
        words_and_frequencies = sorted(counter.items(), key=lambda tup: tup[0])
        words_and_frequencies.sort(key=lambda tup: tup[1], reverse=True)
        
        # 出現頻度がmin_freq未満のものはvocabに加えない
        for word, freq in words_and_frequencies:
            if freq < min_freq or len(self.itos) == max_size:
                break
            self.itos.append(word)

        # dictのk,vをいれかえてstoiを作成する
        self.stoi = {tok: i for i, tok in enumerate(self.itos)}

        self.vectors = None
        if vectors is not None:
            self.load_vectors(vectors, unk_init=unk_init, cache=vectors_cache)
        else:
            assert unk_init is None and vectors_cache is None

    def __eq__(self, other):
        if self.freqs != other.freqs:
            return False
        if self.stoi != other.stoi:
            return False
        if self.itos != other.itos:
            return False
        if self.vectors != other.vectors:
            return False
        return True

    def __len__(self):
        return len(self.itos)

    def vocab_rerank(self):
        self.stoi = {word: i for i, word in enumerate(self.itos)}

    def extend(self, v, sort=False):
        words = sorted(v.itos) if sort else v.itos
        for w in words:
            if w not in self.stoi:
                self.itos.append(w)
                self.stoi[w] = len(self.itos) - 1


class Vocab(TorchVocab):
    def __init__(self, counter, max_size=None, min_freq=1):
        self.pad_index = 0
        self.unk_index = 1
        self.eos_index = 2
        self.sos_index = 3
        self.mask_index = 4
        super().__init__(counter, specials=["<pad>", "<unk>", "<eos>", "<sos>", "<mask>"], max_size=max_size, min_freq=min_freq)

    # override用
    def to_seq(self, sentece, seq_len, with_eos=False, with_sos=False) -> list:
        pass

    # override用
    def from_seq(self, seq, join=False, with_pad=False):
        pass

    @staticmethod
    def load_vocab(vocab_path: str) -> 'Vocab':
        with open(vocab_path, "rb") as f:
            return pickle.load(f)

    def save_vocab(self, vocab_path):
        with open(vocab_path, "wb") as f:
            pickle.dump(self, f)


# テキストファイルからvocabを作成する
class WordVocab(Vocab):
    def __init__(self, texts, max_size=None, min_freq=1):
        print("Building Vocab")
        counter = Counter()
        for line in texts:
            if isinstance(line, list):
                words = line
            else:
                words = line.replace("\n", "").replace("\t", "").split()

            for word in words:
                counter[word] += 1
        super().__init__(counter, max_size=max_size, min_freq=min_freq)

    def to_seq(self, sentence, seq_len=None, with_eos=False, with_sos=False, with_len=False):
        if isinstance(sentence, str):
            sentence = sentence.split()

        seq = [self.stoi.get(word, self.unk_index) for word in sentence]

        if with_eos:
            seq += [self.eos_index]  # this would be index 1
        if with_sos:
            seq = [self.sos_index] + seq

        origin_seq_len = len(seq)

        if seq_len is None:
            pass
        elif len(seq) <= seq_len:
            seq += [self.pad_index for _ in range(seq_len - len(seq))]
        else:
            seq = seq[:seq_len]

        return (seq, origin_seq_len) if with_len else seq

    def from_seq(self, seq, join=False, with_pad=False):
        words = [self.itos[idx]
                 if idx < len(self.itos)
                 else "<%d>" % idx
                 for idx in seq
                 if not with_pad or idx != self.pad_index]

        return " ".join(words) if join else words

    @staticmethod
    def load_vocab(vocab_path: str) -> 'WordVocab':
        with open(vocab_path, "rb") as f:
            return pickle.load(f)


def build(corpus_path, output_path, vocab_size=None, encoding='utf-8', min_freq=1):
    with open(corpus_path, "r", encoding=encoding) as f:
        vocab = WordVocab(f, max_size=vocab_size, min_freq=min_freq)

    print("VOCAB SIZE:", len(vocab))
    vocab.save_vocab(output_path)

Dataloaderを定義する.<br>
ここで文章中の単語をMASKする処理を行う<br>
Windowsでの並列化処理のために外部ファイル(dataset.py)で定義する  
MACやLinuxならこのipynbに直接定義しても良いはず

Trainerクラスを定義する.  
Masked Language Model : 文章中の一部の単語をマスクして,予測を行うタスク.  
- `save_bert`はbert本体のみを保存する
- `save_pretrain`は事前学習用のHeadも含んだ全体を保存する
- `load_bert`と`load_pretrain`も同様

In [11]:
import datetime
dt_now = str(datetime.datetime.now()).replace(' ', '')
dt_now = dt_now.replace(':','_')

In [12]:
from torch.utils.data import DataLoader
class HybridTrainer:
    def __init__(self, bert: BERT, train_dataloader: DataLoader, 
                 valid_dataloader: DataLoader = None,
                 lr: float = 1e-4, betas=(0.9, 0.999), weight_decay: float = 0.01,
                 with_cuda: bool = True, log_freq: int = 10, head = 9):
        # GPU環境において、GPUを指定しているかのフラグ
        cuda_condition = torch.cuda.is_available() and with_cuda
        self.device = torch.device("cuda:0" if cuda_condition else "cpu")

        self.bert = bert
        self.model = BERTHybrid(self.bert, head).to(self.device)

        if torch.cuda.device_count() > 1:
            print("Using %d GPUS for BERT" % torch.cuda.device_count())
            self.model = nn.DataParallel(self.model)

        self.train_data = train_dataloader
        self.valid_data = valid_dataloader

        self.optim = Adam(self.model.parameters(), lr=lr, betas=betas, weight_decay=weight_decay)

        # masked_token予測のためのLoss関数を設定
        self.criterion = nn.NLLLoss()
        self.log_freq = log_freq
        print("Total Parameters:", sum([p.nelement() for p in self.model.parameters()]))
        
        self.train_losses = []
        self.valid_losses = []
        self.train_epd_accs = []
        self.valid_epd_accs = []
        self.train_esd_accs = []
        self.valid_esd_accs = []

    def train(self, epoch):
        self.iteration(epoch, self.train_data)

    def valid(self, epoch):
        self.iteration(epoch, self.valid_data, train=False)

    def iteration(self, epoch, data_loader, train=True):
        str_code = "train" if train else "valid"
        data_iter = tqdm.tqdm(enumerate(data_loader), desc="EP_%s:%d" % (str_code, epoch), total=len(data_loader), bar_format="{l_bar}{r_bar}")
        avg_loss = 0.0
        total_epd_correct = 0
        total_esd_correct = 0
        total_element = 0
        for i, data in data_iter:
            data = {key: value.to(self.device) for key, value in data.items()}
            epd_output, esd_output = self.model.forward(data["bert_input"])
            epd_loss = self.criterion(epd_output.transpose(1, 2), data["token_label"])
            esd_loss = self.criterion(esd_output, data["label"])
            
            loss = epd_loss + esd_loss
            # training時のみ,backwardとoptimizer更新を行う
            if train:
                self.optim.zero_grad()
                loss.backward()
                self.optim.step()
            
            epd_correct = epd_output.argmax(dim=-1).eq(data["token_label"]).sum().item()
            esd_correct = esd_output.argmax(dim=-1).eq(data["label"]).sum().item()
            avg_loss += loss.item()
            total_epd_correct += epd_correct
            total_esd_correct += esd_correct
            total_element += data["label"].nelement()
            post_fix = {
                "epoch": epoch,
                "iter": i,
                "avg_loss": avg_loss / (i + 1),
                "avg_epd_acc": total_epd_correct / (total_element*128) * 100,
                "avg_esd_acc": total_esd_correct / total_element * 100,                
                "loss": loss.item()
            }

            if i % self.log_freq == 0:
                data_iter.write(str(post_fix))

        print("EP%d_%s, avg_loss=" % (epoch, str_code), avg_loss / len(data_iter),  
              "total_epd_acc=", total_epd_correct / (total_element*128) * 100,
                "total_esd_acc=", total_esd_correct * 100.0 / total_element)
        if train:
            self.train_losses.append(avg_loss / len(data_iter))
            self.train_epd_accs.append(total_epd_correct / (total_element*128) * 100 )
            self.train_esd_accs.append(total_esd_correct * 100.0 / total_element)
        else:
            self.valid_losses.append(avg_loss / len(data_iter))
            self.valid_epd_accs.append(total_epd_correct / (total_element*128) * 100)
            self.valid_esd_accs.append(total_esd_correct * 100.0 / total_element)
        
    def save_bert(self, epoch, file_path=output_dir + "bert_model"):
        output_path = file_path + ".ep%d" % epoch
        torch.save(self.bert.state_dict(), output_path)
        self.bert.to(self.device)
        print("EP:%d Model Saved on:" % epoch, output_path)
        return output_path
    
    def save_pretrain(self, epoch, file_path=output_dir + "mlm_model"):
        state = {
            'epoch' : epoch,
            'state_dict' : self.model.module.state_dict(),
            'optimizer' : self.optim.state_dict(),
            'train_epd_acc': self.train_epd_accs[-1],
            'train_esd_acc': self.train_esd_accs[-1],
            'valid_epd_acc': self.train_epd_accs[-1],
            'valid_esd_acc': self.train_esd_accs[-1]
        }
        output_path = file_path + ".ep%d" % epoch
        torch.save(state, output_path)
        self.bert.to(self.device)
        print("EP:%d Model Saved on:" % epoch, output_path)
        return output_path
 
    def load_bert(self, file_path):
        self.bert.state_dict(torch.load(file_path))
    
    def load_epd(self, file_path):
        state = torch.load(file_path)
        self.epd.load_state_dict(state['state_dict'])
    
    def load_pretrain(self, file_path):
        state = torch.load(file_path)
        #state = self.fix_model_state_dict(state)
        self.model.module.load_state_dict(state['state_dict'])
        self.optim.load_state_dict(state['optimizer'])
        return state

In [13]:
class MLMTrainer:
    def __init__(self, bert: BERT, vocab_size: int,
                 train_dataloader: DataLoader, valid_dataloader: DataLoader = None,
                 lr: float = 1e-4, betas=(0.9, 0.999), weight_decay: float = 0.01,
                 with_cuda: bool = True, log_freq: int = 10):
        # GPU環境において、GPUを指定しているかのフラグ
        cuda_condition = torch.cuda.is_available() and with_cuda
        self.device = torch.device("cuda:0" if cuda_condition else "cpu")
        self.bert = bert
        self.model = BERTLM(bert, vocab_size).to(self.device)

        if torch.cuda.device_count() > 1:
            print("Using %d GPUS for BERT" % torch.cuda.device_count())
            self.model = nn.DataParallel(self.model)

        self.train_data = train_dataloader
        self.valid_data = valid_dataloader

        self.optim = Adam(self.model.parameters(), lr=lr, betas=betas, weight_decay=weight_decay)

        # masked_token予測のためのLoss関数を設定
        self.criterion = nn.NLLLoss()
        self.log_freq = log_freq
        print("Total Parameters:", sum([p.nelement() for p in self.model.parameters()]))
        
        self.train_losses = []
        self.valid_losses = []
        self.train_accs = []
        self.valid_accs = []

    def train(self, epoch):
        self.iteration(epoch, self.train_data)

    def valid(self, epoch):
        self.iteration(epoch, self.valid_data, train=False)

    def iteration(self, epoch, data_loader, train=True):
        """
        :param epoch: 現在のepoch
        :param data_loader: torch.utils.data.DataLoader
        :param train: trainかtestかのbool値
        """
        str_code = "train" if train else "valid"
        data_iter = tqdm.tqdm(enumerate(data_loader), desc="EP_%s:%d" % (str_code, epoch), total=len(data_loader), bar_format="{l_bar}{r_bar}")
        avg_loss = 0.0
        total_correct = 0
        total_element = 0

        for i, data in data_iter:
            # 0. batch_dataはGPU or CPUに載せる
            data = {key: value.to(self.device) for key, value in data.items()}
            # 1. forward the next_sentence_prediction and masked_lm model
            mask_lm_output = self.model.forward(data["bert_input"])
            # 2-2. NLLLoss(negative log likelihood) : predicting masked token word
            mask_loss = self.criterion(mask_lm_output.transpose(1, 2), data["bert_label"])
            # 2-3. next_lossとmask_lossの合計をlossとする
            loss = mask_loss
            # 3. training時のみ,backwardとoptimizer更新を行う
            if train:
                self.optim.zero_grad()
                loss.backward()
                self.optim.step()

            correct = mask_lm_output.argmax(dim=-1).eq(data["bert_label"]).sum().item()
            avg_loss += loss.item()
            total_element += data["bert_label"].nelement() * 128
            total_correct += correct
            post_fix = {
                "epoch": epoch,
                "iter": i,
                "avg_loss": avg_loss / (i + 1),
                "avg_acc": total_correct / total_element * 100,
                "loss": loss.item()
            }

            if i % self.log_freq == 0:
                data_iter.write(str(post_fix))
            
        if train:
            self.train_losses.append(avg_loss / len(data_iter))
            self.train_accs.append(total_correct * 100.0 / total_element)
        else:
            self.valid_losses.append(avg_loss / len(data_iter))
            self.valid_accs.append(total_correct * 100.0 / total_element)

        print("EP%d_%s, avg_loss=" % (epoch, str_code), avg_loss / len(data_iter))

        
    def save_bert(self, epoch, file_path=output_dir + "bert"):
        output_path = file_path + ".ep%d" % epoch
        torch.save(self.bert.state_dict(), output_path)
        self.bert.to(self.device)
        print("EP:%d Model Saved on:" % epoch, output_path)
        return output_path
    
    def save_pretrain(self, epoch, file_path=output_dir + "mlm"):
        state = {
            'epoch' : epoch,
            'state_dict' : self.model.module.state_dict(),
            'optimizer' : self.optim.state_dict(),
            'train_loss' : self.train_losses,
            'valid_loss' : self.valid_losses
        }
        output_path = file_path + ".ep%d" % epoch
        torch.save(state, output_path)
        self.bert.to(self.device)
        print("EP:%d Model Saved on:" % epoch, output_path)
        return output_path
 
    def load_bert(self, file_path):
        self.bert.state_dict(torch.load(file_path))
        
    def load_pretrain(self, file_path):
        state = torch.load(file_path)
        self.model.module.load_state_dict(state['state_dict'])
        self.optim.load_state_dict(state['optimizer'])
        self.train_losses = state['train_loss']
        self.valid_losses = state['valid_loss']
        return state

In [14]:
import matplotlib.pyplot as plt

import matplotlib.ticker as ticker
import numpy as np
plt.style.use('ggplot')

def showPlot(points):

    fig, ax = plt.subplots()
    plt.plot(points)
    plt.show()
    
def savePlot(points, figure_path):
    plt.switch_backend('Agg')
    plt.figure()
    fig, ax = plt.subplots()
    loc = ticker.MultipleLocator(base=0.2)
    ax.yaxis.set_major_locator(loc)
    plt.plot(points)
    plt.savefig(figure_path)

In [15]:
# 訓練用パラメタを定義する
vocab_path= read_dir + 'vocab.txt'

hidden=256 #768
layers=2 #12
attn_heads=4 #12
seq_len=128

batch_size=128
num_workers=0
with_cuda=True
log_freq=100
corpus_lines=None

lr=1e-3
adam_weight_decay=0.00
adam_beta1=0.9
adam_beta2=0.999

dropout=0.0

min_freq=7

label_path=None

In [16]:
#corpus_path=processed_train_txt
#build(corpus_path, vocab_path, min_freq=min_freq)

In [17]:

print("Loading Vocab", vocab_path)
vocab = WordVocab.load_vocab(vocab_path)

from dataset import MixDataset
print("Loading Train Dataset", processed_train_txt)
train_dataset = MixDataset(processed_train_txt, vocab, seq_len=seq_len, label_path=label_path, corpus_lines=corpus_lines)

print("Loading Valid Dataset", processed_valid_txt)
valid_dataset = MixDataset(processed_valid_txt, vocab, seq_len=seq_len, label_path=label_path) if processed_valid_txt is not None else None

print("Creating Dataloader")
train_data_loader = DataLoader(train_dataset, batch_size=batch_size, num_workers=num_workers)
valid_data_loader = DataLoader(valid_dataset, batch_size=batch_size, num_workers=num_workers) if processed_valid_txt is not None else None

Loading Vocab ./data/merged_bert/vocab.txt
Loading Train Dataset ./data/merged_bert/train_X.txt
Loading Valid Dataset ./data/merged_bert/valid_X.txt
Creating Dataloader


In [18]:
print("Building BERT model")
hybrid_bert = BERT(len(vocab), hidden=hidden, n_layers=layers, attn_heads=attn_heads, dropout=dropout)
hybrid_trainer = HybridTrainer(hybrid_bert, train_dataloader=train_data_loader, valid_dataloader=valid_data_loader,lr=lr, 
                            betas=(adam_beta1, adam_beta2), weight_decay=adam_weight_decay,with_cuda=with_cuda, 
                            log_freq=log_freq, head=9)


layers=4 #12
attn_heads=8 #12
mlm_bert = BERT(len(vocab), hidden=hidden, n_layers=layers, attn_heads=attn_heads, dropout=dropout)
mlm_trainer = MLMTrainer(mlm_bert, len(vocab), train_dataloader=train_data_loader, valid_dataloader=valid_data_loader,
                  lr=lr, betas=(adam_beta1, adam_beta2), weight_decay=adam_weight_decay,
                  with_cuda=with_cuda, log_freq=log_freq)


Building BERT model
Using 2 GPUS for BERT
Total Parameters: 2761501
Using 2 GPUS for BERT
Total Parameters: 5522944


In [19]:
hybrid_model_path = output_dir + 'mix/hybrid/small.ep26'
mlm_model_path = output_dir + 'mlm/mid/.ep16'
_ = hybrid_trainer.load_pretrain(hybrid_model_path)

_ = mlm_trainer.load_pretrain(mlm_model_path)


In [22]:
test_dataset = MixDataset(processed_test_txt, vocab, seq_len=seq_len, label_path=label_path, is_train=False)
test_loader = DataLoader(test_dataset, batch_size=1, num_workers=num_workers, shuffle=True)

In [44]:
def test_all():
    hybrid_trainer.model.eval()
    mlm_trainer.model.eval()
    with torch.no_grad():
        for batch in test_loader:
            input_line = []
            text = batch['bert_input'][0]
            original = batch['original'][0]
            epd_output, esd_output = hybrid_trainer.model(batch['bert_input'])
            org_text = [vocab.itos[i] for i in original if i!=0]
            print("".join(org_text))
            processed_text = [vocab.itos[i] for i in text if i!=0]
            processed_text = processed_text[1:-1]
            print("".join(processed_text))
            print(batch['label'].item(), esd_output.argmax(dim=-1).item())
            
            #NG文だけ次のステップへ
            if esd_output.argmax(dim=-1).item()==1:
                predict_list = []
                masked_list = []
                masked_label = []
                for j in range(len(text)):
                    predict = epd_output[0,j].argmax(dim=-1).item()
                    if predict == 0:
                        # 正しい場合
                        masked_list.append(text[j])
                        masked_label.append(-1)
                        predict_list.append(0)
                    elif predict == 1:
                        # 脱字(1文字)
                        masked_list.extend([text[j], vocab.mask_index])
                        masked_label.extend([-1,-2])
                        predict_list.extend([1,-1])
                    elif predict == 2:
                        # 脱字(2文字)
                        masked_list.extend([text[j],vocab.mask_index, vocab.mask_index])
                        masked_label.extend([-1,-2,-2])
                        predict_list.extend([2,-1,-1])
                    elif predict == 3:
                        # 誤字
                        masked_list.append(vocab.mask_index)
                        masked_label.append(text[j])
                        predict_list.append(3)
                    elif predict == 4:
                        # 誤字かつ脱字(1文字)
                        masked_list.extend([vocab.mask_index, vocab.mask_index])
                        masked_label.extend([text[j],-2])
                        predict_list.extend([4,-1])
                    elif predict == 5:
                        # 誤字かつ脱字(2文字)
                        masked_list.extend([vocab.mask_index, vocab.mask_index, vocab.mask_index])
                        masked_label.extend([text[j],-2,-2])
                        predict_list.extend([5,-1,-1])
                    elif predict == 6:
                        # 衍字
                        predict_list.append(6)
                    elif predict == 7:
                        # 衍字かつ脱字(1文字)
                        masked_list.append(vocab.mask_index)
                        masked_label.append(-2)
                        predict_list.extend([7,-1])
                    elif predict == 8:
                        # 衍字かつ脱字(2文字)
                        masked_list.extend([vocab.mask_index, vocab.mask_index])
                        masked_label.extend(-2,-2)
                        predict_list.extend([8,-1,-1])
                no_pad_text = [vocab.itos[i] for i in masked_list if i!=0]
                no_pad_text = no_pad_text[1:-1]
                print("".join(no_pad_text))
                masked_list = masked_list[:128]
                masked_label = masked_label[:128]
                predict_list = predict_list[:128]
                masked_text = [vocab.itos[i] for i in masked_list]
                masked_batch = torch.tensor(masked_list)
                masked_batch = masked_batch.unsqueeze(0)
                mlm_output = mlm_trainer.model(masked_batch)
                print(len(epd_output[0]))
                print(len(masked_text))
                enji_flag = False
                for j in range(len(masked_text)):
                    _, topi = mlm_output[0, j].topk(3)
                    predict = [vocab.itos[index.item()] for index in topi]
                    if masked_list[j] in [0,2,3]:
                        continue

                    if predict_list[j] in [6,7,8]:
                        print(predict_list[j],":<del>")

                    print(predict_list[j],":",end="")
                    if masked_label[j] == -1:
                        print(masked_text[j])
                    elif masked_label[j] == -2:
                        print(masked_text[j],':脱:',predict)
                    else:
                        print(masked_text[j],':誤:',predict)

test_all()

議論がコソボに集中すれば、従来にも増してサミットでの日本の存在感がかすむのは確実。
議論がコソボに集中すすば、従来には増してサミットでの日本の存在感がかすむは確実。
1 1
議論がコソボに集中すば、従来には増してサミットでの日本の存在感がかす<mask>確実。
128
126
0 :議
0 :論
0 :が
0 :コ
0 :ソ
0 :ボ
0 :に
0 :集
0 :中
6 :<del>
6 :す
0 :ば
0 :、
0 :従
0 :来
0 :に
0 :は
0 :増
0 :し
0 :て
0 :サ
0 :ミ
0 :ッ
0 :ト
0 :で
0 :の
0 :日
0 :本
0 :の
0 :存
0 :在
0 :感
0 :が
0 :か
0 :す
0 :<mask> :誤: ['が', 'も', 'は']
3 :確
6 :<del>
6 :実
0 :。
バブル崩壊後の株式市況低迷で業績が悪化していたのに加え、１９９９年の株式委託手数料完全自由化をにらみ、単独での生き残りは難しいと判断した。外資系証券との競争が本格化する中、日興も系列証券を支援する余力は限られており、合併によるリストラで、系列証券の体質強化を図る。
バブル崩壊後のの株式市況低迷でで業績が悪化ていたのに加え、１９９９年の株式委託手数料完全自由化をにみ、単独の生き残りも難しいと判断した。外資系証券と競争が本格化する中、日興も系列証券を支援る余力は限らｒており、合併よるリストラで、系列証券の体質強化を図
1 1
バブル崩壊後のの株式市況低迷でで業績が悪化ていたのに加え、１９９９年の株式委託手数料完全自由化をにみ、単独の生き残りも難しいと判断した。外資系証券と競争が本格化する中、日興も系列証券を支援る余力は限ら<mask>ており、合併よるリストラで、系列証券の体質強化を
128
127
0 :バ
0 :ブ
0 :ル
0 :崩
0 :壊
0 :後
0 :の
0 :の
0 :株
0 :式
0 :市
0 :況
0 :低
0 :迷
0 :で
0 :で
0 :業
0 :績
0 :が
0 :悪
0 :化
0 :て
0 :い
0 :た
0 :の
0 :に
0 :加
0 :え
0 :、
0 :１
0 :９
0 :９
0 :９
0 :年
0 :の
0 :株
0 :式
0 :委
0 :託
0 :手
0 :数
0 :料
0 :完
0 :全
0 :自


IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



:工
0 :乳
0 :と
0 :乳
0 :飲
0 :料
0 :の
0 :商
0 :品
0 :名
0 :に
0 :「
0 :牛
0 :乳
0 :」
0 :文
0 :言
3 :<mask> :誤: ['を', 'で', 'が']
0 :使
0 :用
0 :す
0 :る
0 :場
0 :合
0 :、
0 :従
0 :来
0 :の
0 :成
0 :分
0 :規
0 :定
0 :に
0 :加
0 :え
6 :<del>
6 :、
0 :新
0 :た
0 :に
0 :「
0 :生
0 :乳
0 :を
0 :５
0 :０
0 :％
0 :超
0 :使
0 :用
0 :<mask> :誤: ['す', 'せ', 'あ']
3 :る
0 :こ
0 :と
0 :」
0 :を
0 :要
0 :件
0 :に
0 :加
0 :た
6 :<del>
6 :。
その後、男性が持つＹ染色体を調べた研究でも現代男性の祖先は１９万年前のアフリカ男性にたどり着いている。
そ後、男性がが持つＹ染色体を調にた研究も現代男性の祖先は１９万年前のアフリカ男性にたどさ着いといる。
1 1
そ後、男性が持つＹ染色体を調にた研究も現代男性の祖先は１９万年前のアフリカ男性にた<mask>さ<mask>着いといる。
128
128
0 :そ
0 :後
0 :、
0 :男
0 :性
0 :が
6 :<del>
6 :持
0 :つ
0 :Ｙ
0 :染
0 :色
0 :体
0 :を
0 :調
0 :に
0 :た
0 :研
0 :究
0 :も
0 :現
0 :代
0 :男
0 :性
0 :の
0 :祖
0 :先
0 :は
0 :１
0 :９
0 :万
0 :年
0 :前
0 :の
0 :ア
0 :フ
0 :リ
0 :カ
0 :男
0 :性
0 :に
0 :た
0 :<mask> :誤: ['く', 'た', 'る']
3 :さ
1 :<mask> :脱: ['れ', 'え', 'が']
-1 :着
0 :い
0 :と
0 :い
0 :る
0 :。
３年前、自民党に推されて北海道知事選に出馬、敗れて、いまは弁護士稼業である。
３年前、自民党に推ｓれて北海道知事選出馬、敗れて、まは弁護士稼業である。
1 1
３年前、自民党に推<mask>れて北海道知事選出馬、敗れて、まは弁護士稼業である。
128
128
0 :３
0 :年
0 :

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



 :面
0 :で
0 :な
0 :く
0 :百
0 :面
0 :相
0 :で
0 :応
0 :る
0 :時
0 :、
0 :べ
0 :の
0 :人
0 :は
0 :快
0 :調
0 :と
0 :み
0 :て
0 :い
0 :い
0 :。
中小零細企業や個人に適用される現行の和議法に代わる法律として政府が制定を予定しており、成果が不確実な和議手続きの欠陥を補いながらスピーディーな簡易型手続きを盛り込んだのが特徴だ。
中小零細企業ｙ個人に適用される現行の和議法に代わる法律とでて政府がが制定を予定ししておおり、成果が不確実な和議手続の欠陥を補いがらスピーディー簡易型手続きを盛り込んだだののが特徴だ。
1 1
中小零細企業<mask>個人に適用される現行の和議法に代わる法律とでて政府がが制定を予定ししており、成果が不確実な和議手続の欠陥を補いがらスピーディー簡易型手続きを盛り込んだののが特徴。
128
125
0 :中
0 :小
0 :零
0 :細
0 :企
0 :業
3 :<mask> :誤: ['や', 'が', 'は']
0 :個
0 :人
0 :に
0 :適
0 :用
0 :さ
0 :れ
0 :る
0 :現
0 :行
0 :の
0 :和
0 :議
0 :法
0 :に
0 :代
0 :わ
0 :る
0 :法
0 :律
0 :と
0 :で
0 :て
0 :政
0 :府
0 :が
0 :が
0 :制
0 :定
0 :を
0 :予
0 :定
0 :し
0 :し
0 :て
6 :<del>
6 :お
0 :り
0 :、
0 :成
0 :果
0 :が
0 :不
0 :確
0 :実
0 :な
0 :和
0 :議
0 :手
0 :続
0 :の
0 :欠
0 :陥
0 :を
0 :補
0 :い
0 :が
0 :ら
0 :ス
0 :ピ
0 :ー
0 :デ
0 :ィ
0 :ー
0 :簡
0 :易
0 :型
0 :手
0 :続
0 :き
0 :を
0 :盛
0 :り
0 :込
0 :ん
0 :だ
0 :の
6 :<del>
6 :の
0 :が
0 :特
0 :徴
0 :。
近く自由党も交えて最終的な合意書を取り交わす。
近自由党交えて最終的ｎ合意書を取り交す。
1 1
近自由党交えて最終的<mask>合意書を取り交す。
128
128
0 :近
0 :自
0 :由
0 :党
0 :交
0 

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)




0 :セ
0 :ン
0 :タ
0 :ー
0 :は
0 :、
0 :消
0 :費
0 :者
0 :ら
0 :相
0 :談
0 :は
0 :苦
0 :情
0 :を
0 :受
0 :て
0 :、
0 :事
0 :故
3 :<mask> :誤: ['の', 'で', 'や']
0 :内
0 :容
0 :を
0 :を
0 :調
0 :べ
0 :り
0 :、
0 :被
0 :害
0 :者
3 :<mask> :誤: ['と', 'の', 'や']
0 :メ
0 :ー
0 :カ
0 :ー
0 :双
0 :方
0 :か
0 :ら
0 :聞
0 :き
0 :取
0 :り
6 :<del>
6 :な
0 :<mask> :誤: ['ど', 'し', 'べ']
3 :を
0 :行
0 :う
0 :。
任意整理は、債権者と債務者の話し合いだけで行われる会社整理の手続き。通常、債権者会議選出の債権者委員会によって調査、債権回収、配当が行われる。東京商工リサーチ関西支社などによると、同社は有名ホテルの大阪進出に対抗するため、１９９４年４月に大規模な改装を実施。改装効果で売り上げは伸び、９５年３月期には３５億円の売り上げを計上したが、その後、大阪駅前への大型ホテルの進出や不況などから業績が悪化した。
任意整理は、債権者と債務者の話を合いだけけで行れる会社整理の手続き。通常、債権者会議選出債権者委員会にって調査、債権回収、配当がが行われ。東京商工リサーチ関西支社などによると、同社は有名ホテルの大阪進出に対抗するため、１９９４年４月大規模な改装をを実施
1 0
米がトルコをイスラエルと同様に地域の同盟国にしたがっていることを、欧州が不快に思っている、という背景がある。
米がトルコイスラエルと同様に地域の同盟国ににしたがっていることを、欧州不快に思っている、とう背景がある。
1 1
米がトルコイスラエルと同様に地域の同盟国ににしたがっていることを、欧州不快に思っている、とう背景がある。
128
128
0 :米
0 :が
0 :ト
0 :ル
0 :コ
0 :イ
0 :ス
0 :ラ
0 :エ
0 :ル
0 :と
0 :同
0 :様
0 :に
0 :地
0 :域
0 :の
0 :同
0 :盟
0 :国
0 :に
0 :に
0 :し
0 :た
0 :が
0 :っ
0 :て
0 :い
0 :る
0 :こ
0

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)




0 :費
0 :で
0 :運
0 :営
0 :さ
0 :れ
0 :、
0 :運
0 :営
0 :費
0 :は
0 :署
0 :内
0 :で
0 :管
0 :理
0 :さ
0 :て
0 :い
0 :と
0 :い
0 :う
0 :。
0 :元
0 :幹
0 :部
0 :は
0 :こ
0 :<mask> :誤: ['の', 'う', 'こ']
0 :「
3 :友
0 :で
0 :会
0 :」
0 :の
0 :帳
0 :簿
0 :も
0 :保
0 :管
0 :し
0 :て
0 :て
0 :い
0 :る
0 :。
仰木監督は「金田には、これからいくらでもチャンスがあるんだから」と言った。
仰木監督は「金田ににはは、これからいくらでもチャンスがあるんから」と言った。
1 1
仰木監督は「金田ににはは、これからいくでもチャンスがあるんから」と言った。
128
127
0 :仰
0 :木
0 :監
0 :督
0 :は
0 :「
0 :金
0 :田
0 :に
0 :に
0 :は
0 :は
0 :、
0 :こ
0 :れ
0 :か
0 :ら
0 :い
0 :く
6 :<del>
6 :で
0 :も
0 :チ
0 :ャ
0 :ン
0 :ス
0 :が
0 :あ
0 :る
0 :ん
0 :か
0 :ら
0 :」
0 :と
0 :言
0 :っ
0 :た
0 :。
脱渋すると渋みが消え、甘みが増してきます。
脱渋すると渋みがが消え、甘みがが増しでます。
1 1
脱渋ると渋みがが消え、甘みが増しでます。
128
126
0 :脱
0 :渋
6 :<del>
6 :る
0 :と
0 :渋
0 :み
0 :が
0 :が
0 :消
0 :え
0 :、
0 :甘
0 :み
0 :が
0 :増
6 :<del>
6 :し
0 :で
0 :ま
0 :す
0 :。
しかし、在留邦人が情報交換しているホームぺージには１５日、「マレーシア航空がチャーター便。同国のパスポートを持つ人のみ」など各国政府のチャーター便情報が次々寄せられる一方で、日本政府の対応の遅さを指摘する声が出始めている。
しかし、在留邦人も情報交換しているホームどージには１５日、「マレーシア航空がチャーター便。同国のパスポートを持人のみ」など各国政府ののチャーター便情報が次々寄せられれの一方で、日本政府のの対応の遅さを指摘する声が出始ｍていいる。


IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)




0 :、
0 :プ
0 :ロ
0 :野
0 :球
0 :界
0 :と
0 :無
0 :縁
0 :は
0 :な
0 :。
0 :昨
0 :年
0 :観
0 :客
0 :数
0 :が
0 :増
0 :え
0 :ぶ
0 :の
0 :は
0 :３
0 :８
0 :年
6 :<del>
6 :り
0 :と
0 :日
0 :本
0 :一
0 :に
0 :沸
0 :い
0 :た
0 :横
0 :浜
0 :だ
0 :<mask> :誤: ['け', 'の', 'っ']
3 :だ
0 :。
0 :球
0 :界
0 :全
0 :体
0 :で
0 :も
0 :約
0 :８
0 :％
0 :観
0 :客
0 :数
0 :が
0 :減
0 :少
0 :し
0 :た
0 :。
0 :今
0 :こ
0 :そ
0 :、
6 :<del>
6 :広
0 :く
0 :く
0 :フ
0 :ァ
0 :ン
0 :の
0 :声
0 :を
0 :吸
0 :い
0 :上
0 :げ
0 :、
0 :魅
0 :力
0 :あ
0 :る
0 :プ
6 :<del>
6 :レ
0 :ー
0 :を
0 :を
0 :提
0 :供
0 :し
0 :な
0 :な
0 :け
0 :れ
0 :ば
0 :な
0 :な
0 :ら
0 :な
0 :い
0 :。
本来、奨学金とは、経済的理由により就学困難な者に与えられるものだ。
本来、奨学金とは、経済的理由より就学困難な者与ええられれるるもばだ。
1 1
本来、奨学金とは、経済的理由より就学困難な者与えられれるるもばだ。
128
127
0 :本
0 :来
0 :、
0 :奨
0 :学
0 :金
0 :と
0 :は
0 :、
0 :経
0 :済
0 :的
0 :理
0 :由
0 :よ
0 :り
0 :就
0 :学
0 :困
0 :難
0 :な
0 :者
0 :与
0 :え
6 :<del>
6 :ら
0 :れ
0 :れ
0 :る
0 :る
0 :も
0 :ば
0 :だ
0 :。
定年間近だが、単純作業だけは黙々とこなす。
定年間近だが、単純作業だけは黙々とこなす。
0 1
定年間近だが、単純作業だけは黙々とこなす。
128
128
0 :定
0 :年
0 :間
0 :近
0 :だ
0 :が
0 :、
0 :単
0 :純
0 :作
0 :業
0 :だ
0 :け
0 :は
0 :黙
0 :々


IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)




0 :グ
0 :提
0 :訴
0 :は
0 :は
0 :７
0 :件
0 :で
0 :の
0 :ぼ
0 :っ
0 :て
0 :い
0 :る
0 :。
0 :の
0 :う
0 :う
0 :ち
0 :、
0 :ス
0 :テ
0 :ン
0 :レ
0 :ス
0 :関
0 :連
0 :の
0 :３
0 :件
0 :は
0 :は
0 :今
0 :回
0 :で
3 :<mask> :誤: ['す', 'な', 'あ']
0 :べ
0 :て
0 :最
0 :終
0 :決
0 :定
0 :が
0 :出
0 :た
3 :<mask> :誤: ['こ', 'も', 'あ']
0 :と
0 :に
0 :な
0 :る
0 :る
0 :。
0 :薄
0 :板
0 :、
0 :線
0 :材
0 :は
0 :「
0 :ク
0 :ロ
0 :」
0 :と
0 :な
0 :た
0 :が
0 :、
0 :鋼
0 :線
0 :は
0 :「
0 :シ
0 :ロ
0 :」
0 :だ
0 :っ
0 :た
0 :。
0 :普
0 :通
0 :鋼
0 :関
0 :連
0 :で
0 :は
0 :、
0 :新
0 :な
0 :ダ
0 :ン
0 :ピ
0 :ン
0 :グ
0 :提
0 :訴
0 :を
0 :検
0 :討
0 :す
6 :<del>
6 :る
0 :動
0 :も
0 :あ
0 :り
0 :、
0 :米
0 :国
0 :内
0 :で
0 :で
0 :保
0 :護
民主党は１８日の幹部会で、企業・団体献金の在り方について協議した。
民主党は１８日の幹部会で、企業・団体献金の在方について協議しした。
1 1
民主党は１８日の幹部会で、企業・団体献金の在方について協議した。
128
127
0 :民
0 :主
0 :党
0 :は
0 :１
0 :８
0 :日
0 :の
0 :幹
0 :部
0 :会
0 :で
0 :、
0 :企
0 :業
0 :・
0 :団
0 :体
0 :献
0 :金
0 :の
0 :在
0 :方
0 :に
0 :つ
0 :い
0 :て
0 :協
0 :議
0 :し
6 :<del>
6 :た
0 :。
ＧＩＴＩＣは、海外向け債務が１５９億元あり、邦銀はその融資額が最も多く、全体の４割近くを占めている。このため、邦銀を含めた外銀は外債の優先的な返済を強く求めている。
ＧＩＴＩＣは、海外向け債務が１

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)




0 :税
0 :、
0 :個
0 :人
0 :住
0 :民
0 :税
0 :を
0 :課
0 :税
0 :し
6 :<del>
6 :な
0 :い
0 :。
ある幹部は「党の組織に間違いがあったわけではない。中選挙区時代の後援会中心の運動を引きずっている議員個人のモラルの問題だ」と断じた。
ある幹部は「党の組織にに間違いがあっったわけでもない。中選挙区時代後援会中心の運動や引ききずっていいる議員個人モラルの問題だ」とと断た。
1 1
ある幹部は「党の組織にに間違いがあっったわけでもない。中選挙区時代後援会中心の運動や引きずっていいる議員個人モラルの問題だ」とと断た。
128
127
0 :あ
0 :る
0 :幹
0 :部
0 :は
0 :「
0 :党
0 :の
0 :組
0 :織
0 :に
0 :に
0 :間
0 :違
0 :い
0 :が
0 :あ
0 :っ
0 :っ
0 :た
0 :わ
0 :け
0 :で
0 :も
0 :な
0 :い
0 :。
0 :中
0 :選
0 :挙
0 :区
0 :時
0 :代
0 :後
0 :援
0 :会
0 :中
0 :心
0 :の
0 :運
0 :動
0 :や
0 :引
0 :き
6 :<del>
6 :ず
0 :っ
0 :て
0 :い
0 :い
0 :る
0 :議
0 :員
0 :個
0 :人
0 :モ
0 :ラ
0 :ル
0 :の
0 :問
0 :題
0 :だ
0 :」
0 :と
0 :と
0 :断
0 :た
0 :。
供給サイドの産業競争力強化策と雇用対策を検討する同会議の論議を受け、政府は６月半ばに総合的な政策パッケージを取りまとめるが、来月１日に発表される４月の完全失業率が５％の大台に乗ることも予想され、雇用問題は小渕政権の基盤を揺るがしかねない重要課題に浮上している。今後は秋にも開かれる臨時国会をにらみ、対策の具体化と補正予算との関連が焦点になりそうだ。
供給サイドの産業競争力強化策と雇用対策を検討する同会議の論議を受け、政府は６月半ばに総合的な政策パッケージを取りまとめるが、来月１日に発表される４月の完全失業率が５％の大台に乗ることも予想され、雇用問題は小渕政権の基盤を揺るがしかねない重要課題に浮上し
0 0
巨人が打撃戦を制して連敗を４で止めた。一回に松井の２ランで先制。三回に村田真の２点打などで３点。その後も好機

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



1
水俣病の原因企業・チッソ行政との直談判で患者救済を目指した「自主交渉派」のリーダー、チッソ水俣病患者連盟委員長の川本輝夫さんが１８日午後１１時５５分、肝不全のため熊本県水俣市病院で亡<mask>な<mask>た。
128
126
0 :水
0 :俣
0 :病
0 :の
0 :原
0 :因
0 :企
0 :業
0 :・
0 :チ
0 :ッ
0 :ソ
6 :<del>
6 :行
6 :<del>
6 :政
0 :と
0 :の
0 :直
0 :談
0 :判
0 :で
0 :患
0 :者
0 :救
0 :済
0 :を
0 :目
0 :指
0 :し
0 :た
0 :「
0 :自
0 :主
0 :交
0 :渉
0 :派
0 :」
0 :の
0 :リ
0 :ー
0 :ダ
0 :ー
0 :、
0 :チ
0 :ッ
0 :ソ
0 :水
0 :俣
0 :病
0 :患
0 :者
0 :連
0 :盟
0 :委
0 :員
0 :長
0 :の
0 :川
0 :本
0 :輝
0 :夫
0 :さ
0 :ん
0 :が
0 :１
0 :８
0 :日
0 :午
0 :後
0 :１
0 :１
0 :時
0 :５
0 :５
0 :分
0 :、
0 :肝
0 :不
0 :全
0 :の
0 :た
0 :め
0 :熊
0 :本
0 :県
0 :水
0 :俣
0 :市
0 :病
0 :院
0 :で
0 :亡
0 :<mask> :誤: ['く', 'に', 'と']
0 :な
3 :<mask> :誤: ['っ', 'り', 'る']
0 :た
3 :。
このモデルとなり８０年の歴史を誇る世界最高峰のブラスバンド、グライムソープ・コリアリー・バンドが出演。
このモデルとなり８０年の歴史を誇る世界最高峰のブラスバンド、グライムソープ・コリアリー・バンドが出演。
0 0
どうしても、企業献金を存続させようとするのなら、衆院を解散して国民の信を問うべきだと思う。
どうししても、企業献金を存続させようとするｎならら、衆院を解散しか国民の信を問うべきだに思う。
1 1
どうしても、企業献金を存続させようとする<mask>なら、衆院を解散しか国民の信を問うべきだに思う。
128
126
0 :ど
0 :う
0 :し
6 :<del>
6 :て
0 :も
0 :、
0 :企
0 :業
0 :献
0 :金
0 :を
0 :存
0

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



0 :り
0 :回
0 :し
0 :て
0 :い
6 :<del>
6 :ら
0 :立
0 :を
0 :あ
0 :ぼ
6 :<del>
6 :に
0 :し
0 :た
0 :。
出雲の鉄文化の原点をまさに須佐之男神話は語っているといえる。
出雲の鉄文化の原点をままさに須佐之男神話ｈ語っていいぅといえる。
1 1
出雲の鉄文化原点をまさに須佐之男神話<mask>語っていい<mask>といえる。
128
126
0 :出
0 :雲
0 :の
0 :鉄
0 :文
0 :化
6 :<del>
6 :原
0 :点
0 :を
0 :ま
0 :さ
6 :<del>
6 :に
0 :須
0 :佐
0 :之
0 :男
0 :神
0 :話
0 :<mask> :誤: ['で', 'を', 'が']
0 :語
3 :っ
0 :て
0 :い
0 :い
0 :<mask> :誤: ['か', 'こ', 'な']
0 :と
3 :い
0 :え
0 :る
0 :。
それならば、私も協力できる。
そたならば、私も協力きふ。
1 1
そたならば、私も協力き<mask>。
128
128
0 :そ
0 :た
0 :な
0 :ら
0 :ば
0 :、
0 :私
0 :も
0 :協
0 :力
0 :き
3 :<mask> :誤: ['る', 'た', 'だ']
0 :。
“足で考える”後輩の一人への温かいまなざしで……。
“足で考えるる”後輩の一人へや温かいまななざしで……。
1 1
“足で考えるる”後輩の一人へや温かいまななざしで……。
128
128
0 :“
0 :足
0 :で
0 :考
0 :え
0 :る
0 :る
0 :”
0 :後
0 :輩
0 :の
0 :一
0 :人
0 :へ
0 :や
0 :温
0 :か
0 :い
0 :ま
0 :な
0 :な
0 :ざ
0 :し
0 :で
0 :…
0 :…
0 :。
１番人気は３、８、４着で一度も期待に応えていない。２、３番人気が合わせて３連対では上位人気馬は信頼できない。馬連配当は順に１５４０円、５２２０円、２４５０円と波乱傾向で、穴党には見逃せないレース。
１番人気は３、８、４着で一度も期待に応えてていない。２、３番人気が合わせて３連対ででは上位人気馬ｈ信頼でぜな。馬連配当は順に１５４０円、５２２０円、２４５０円と波乱傾向で、穴党に見逃せないレース。


IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



128
127
0 :一
0 :方
0 :、
0 :Ｐ
0 :Ｋ
0 :Ｏ
0 :は
0 :基
0 :本
0 :的
0 :の
0 :は
0 :は
0 :停
0 :戦
0 :合
0 :意
0 :が
0 :成
0 :立
0 :し
0 :た
0 :後
0 :、
0 :兵
0 :力
3 :<mask> :誤: ['の', 'を', 'が']
0 :引
0 :離
0 :し
0 :や
0 :停
0 :戦
0 :監
0 :視
0 :を
0 :を
0 :し
0 :平
0 :和
0 :を
0 :維
0 :持
0 :す
0 :る
0 :た
0 :め
0 :派
0 :遣
0 :さ
0 :る
6 :<del>
6 :。
0 :派
0 :遣
0 :要
0 :員
0 :は
0 :本
0 :国
0 :か
0 :ら
0 :を
0 :指
0 :示
0 :は
0 :受
0 :け
0 :ず
0 :、
0 :国
0 :連
0 :事
0 :務
0 :総
0 :長
0 :の
0 :指
0 :揮
0 :下
0 :に
0 :置
0 :か
0 :れ
0 :る
0 :。
0 :自
0 :衛
0 :の
0 :た
0 :め
0 :か
0 :任
0 :務
0 :遂
0 :行
0 :の
0 :た
0 :め
0 :以
0 :外
0 :の
0 :武
0 :力
0 :行
0 :使
0 :は
0 :許
0 :さ
0 :れ
0 :て
0 :い
0 :な
0 :。
○…三塁を踏ませない完ぺきな内容だった。
○…三塁を踏ｍないい完ぺｋな内容ｄった。
1 1
○…三塁を踏<mask>ない完ぺ<mask>な内容<mask>った。
128
127
0 :○
0 :…
0 :三
0 :塁
0 :を
0 :踏
3 :<mask> :誤: ['ま', 'め', 'み']
0 :な
0 :い
6 :<del>
6 :完
0 :ぺ
0 :<mask> :誤: ['き', 'い', 'ん']
3 :な
0 :内
0 :容
0 :<mask> :誤: ['だ', 'な', 'あ']
3 :っ
0 :た
0 :。
監修は大原簿記学校。
監修は大原簿記学校。
0 0
９４年初め、アゼルバイジャンが攻勢に転じ、拠点を奪回していったが同年５月、ロシアなどの仲介で停戦に合意した。
９４年初め、アゼルバイジャンが攻勢転じ、拠点を奪回ししていっったが同年５月、ロシアなどど

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



0 :や
0 :さ
0 :れ
3 :<mask> :誤: ['た', 'る', 'の']
0 :ま
0 :ま
0 :焦
0 :げ
0 :つ
0 :い
0 :た
0 :。
男子はカザフスタン、女子は中国にどこまで迫れるか。
男子はカザフスタン、女子は中国にどこまで迫れるか。
0 0
「旅の人」「どこの馬の骨」と面と向かって言われたこともある。「知的欲求不満のストレスを解消したい」と、４人の主婦が集まり、かたつむりを意味する「マイマイ」を名前に選んだ。「カタツムリのようにゆっくり歩いていこうと」。東京に戻った２年後の９０年から編集作業は一人になった。
「旅の人」「どこのの馬し骨」と面と向かっ言わたたことどある。「知的欲求不満のストレスを解消したぼ」と、４人の主婦が集まり、たつむむり意味すｒ「マイマイ」を名前選んだ。「カタツムリのようにゆっくり歩いをいここと」。東京にに戻た２年後の９０年ら編集作業は一
1 1
「旅の人」「どこのの馬し骨」と面と向かっ言わたたことどある。「知的欲求不満のストレスを解消したぼ」と、４人の主婦が集まり、たつむり意味す<mask>「マイマイ」を名前選んだ。「カタツムリのようにゆっくり歩いをいここと」。東京にに戻た２年後の９０年ら編集作業は一
128
127
0 :「
0 :旅
0 :の
0 :人
0 :」
0 :「
0 :ど
0 :こ
0 :の
0 :の
0 :馬
0 :し
0 :骨
0 :」
0 :と
0 :面
0 :と
0 :向
0 :か
0 :っ
0 :言
0 :わ
0 :た
0 :た
0 :こ
0 :と
0 :ど
0 :あ
0 :る
0 :。
0 :「
0 :知
0 :的
0 :欲
0 :求
0 :不
0 :満
0 :の
0 :ス
0 :ト
0 :レ
0 :ス
0 :を
0 :解
0 :消
0 :し
0 :た
0 :ぼ
0 :」
0 :と
0 :、
0 :４
0 :人
0 :の
0 :主
0 :婦
0 :が
0 :集
0 :ま
0 :り
0 :、
0 :た
0 :つ
6 :<del>
6 :む
0 :り
0 :意
0 :味
0 :す
0 :<mask> :誤: ['る', 'ら', 'と']
3 :「
0 :マ
0 :イ
0 :マ
0 :イ
0 :」
0 :を
0 :名
0 :前
0 :選
0 :ん
0 :だ
0 :。
0 :「
0 :カ

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



0 :置
0 :す
0 :こ
6 :<del>
6 :と
0 :を
0 :決
0 :め
0 :。
その結婚は王権の拡大を意味する表現であるといえよう。
その結婚は王権の拡大を意味する表現であるといえよう。
0 0
「直球のスピードと制球がもう少し……。まあ、欲を言えばだが」。先発の川上評を質問された星野監督の表情が、ついつい緩む。山本昌、武田とベテラン先発投手陣が崩れた後だけに、川上の５回被安打２、無四球の無失点投球が監督を上機嫌にした。
「直球スピードと制球ががも少し……。あ、欲を言えばだが」。先発の川上評を質問された星野監督の表情が、いいい緩む。山本昌、武田てベテラン先発投手陣が崩れた後だに、川上の５回被安打２、無四球の無失点投球監督を上機嫌ににしたた。
1 1
「直球スピードと制球ががも少し……。あ、欲を言えばだが」。先発の川上評を質問された星野監督の表情が、いいい緩む。山本昌、武田てベテラン先発投手陣が崩れた後だに、川上の５回被安打２、無四球の無失点投球監督を上機嫌ににしたた。
128
128
0 :「
0 :直
0 :球
0 :ス
0 :ピ
0 :ー
0 :ド
0 :と
0 :制
0 :球
0 :が
0 :が
0 :も
0 :少
0 :し
0 :…
0 :…
0 :。
0 :あ
0 :、
0 :欲
0 :を
0 :言
0 :え
0 :ば
0 :だ
0 :が
0 :」
0 :。
0 :先
0 :発
0 :の
0 :川
0 :上
0 :評
0 :を
0 :質
0 :問
0 :さ
0 :れ
0 :た
0 :星
0 :野
0 :監
0 :督
0 :の
0 :表
0 :情
0 :が
0 :、
0 :い
0 :い
0 :い
0 :緩
0 :む
0 :。
0 :山
0 :本
0 :昌
0 :、
0 :武
0 :田
0 :て
0 :ベ
0 :テ
0 :ラ
0 :ン
0 :先
0 :発
0 :投
0 :手
0 :陣
0 :が
0 :崩
0 :れ
0 :た
0 :後
0 :だ
0 :に
0 :、
0 :川
0 :上
0 :の
0 :５
0 :回
0 :被
0 :安
0 :打
0 :２
0 :、
0 :無
0 :四
0 :球
0 :の
0 :無
0 :失
0 :点
0 :投
0 :球
0 :監
0 :督
0 :を
0 :上
0 :機
0 :嫌
0 :に
0 :に
0 :し
0 

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



:す
0 :る
0 :事
0 :実
0 :上
0 :の
0 :の
0 :「
0 :信
0 :任
0 :」
0 :に
0 :に
0 :終
0 :わ
0 :っ
0 :た
0 :。
それほどに重要な法律である。
そほｄに重要法律である。
1 1
そほ<mask>に重要法律である。
128
128
0 :そ
0 :ほ
3 :<mask> :誤: ['ど', 'な', 'う']
0 :に
0 :重
0 :要
0 :法
0 :律
0 :で
0 :あ
0 :る
0 :。
権力は当然そういうことを計算して圧力を掛けているんだと思います。
権力は当然そういうことを計算して圧力を掛けているんだと思います。
0 0
鍋島さんらはこの遺伝子が老化抑制に働いていると考え、ギリシャ神話の運命の女神にちなみ「クロトー」と名付けた。
鍋島さんらはこの遺伝子が老化抑制に働いていると考え、ギリシャ神話の運命の女神にちなみ「クロトー」と名付けた。
0 0
小高い丘にある緑ヶ丘病院は２５床の児童病棟を持つ。
小高い丘にある緑ヶ丘病院は２５床の児童病棟を持つ。
0 1
小高い丘にある緑ヶ丘病院は２５床の児童病棟を持つ。
128
128
0 :小
0 :高
0 :い
0 :丘
0 :に
0 :あ
0 :る
0 :緑
0 :ヶ
0 :丘
0 :病
0 :院
0 :は
0 :２
0 :５
0 :床
0 :の
0 :児
0 :童
0 :病
0 :棟
0 :を
0 :持
0 :つ
0 :。
その「大安」に、なぜクレームが付いたのか。
その「大安」に、なぜクレームがが付いたたのか。
1 1
その「大安」に、なぜクレームが付いたのか。
128
126
0 :そ
0 :の
0 :「
0 :大
0 :安
0 :」
0 :に
0 :、
0 :な
0 :ぜ
0 :ク
0 :レ
0 :ー
0 :ム
0 :が
6 :<del>
6 :付
0 :い
0 :た
0 :の
6 :<del>
6 :か
0 :。
勿論、それも呼出しの仕事。
勿論、それも呼出し仕事。
1 1
勿論、それも呼出し仕事。
128
128
0 :勿
0 :論
0 :、
0 :そ
0 :れ
0 :も
0 :呼
0 :出
0 :し
0 :仕
0 :事
0 :。
手作りのビラからホームページの事務局長として、ネット時代の運動スタイルを模索する。
手作りのビラからホームペー

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



:１
0 :万
0 :１
0 :０
0 :８
0 :１
0 :・
0 :６
0 :２
0 :ド
0 :ル
0 :と
0 :<mask> :誤: ['い', 'な', 'も']
3 :<mask> :誤: ['う', 'い', 'も']
3 :伸
0 :悩
0 :ん
0 :<mask> :誤: ['で', 'だ', 'に']
3 :推
0 :移
0 :し
0 :て
6 :<del>
6 :い
0 :る
0 :。
小説なのに、なんでこんなに普通の話なんだろう、とみんな思った。
小説なののに、なんでこんなに普通の話なんだろう、とみんな思った。
1 1
小説なののに、なんでこんなに普通の話なんだろう、とみんな思った。
128
128
0 :小
0 :説
0 :な
0 :の
0 :の
0 :に
0 :、
0 :な
0 :ん
0 :で
0 :こ
0 :ん
0 :な
0 :に
0 :普
0 :通
0 :の
0 :話
0 :な
0 :ん
0 :だ
0 :ろ
0 :う
0 :、
0 :と
0 :み
0 :ん
0 :な
0 :思
0 :っ
0 :た
0 :。
被ばく量は０・１ミリシーベルト程度で、健康には影響ないとみられる。
被ばばく量０・１ミリシーベルト程度で、健康は影響ないとみｒれれる。
1 1
被く量０・１ミリシーベルト程度で、健康は影響ないとみ<mask>れる。
128
125
0 :被
6 :<del>
6 :く
6 :<del>
6 :量
0 :０
0 :・
0 :１
0 :ミ
0 :リ
0 :シ
0 :ー
0 :ベ
0 :ル
0 :ト
0 :程
0 :度
0 :で
0 :、
0 :健
0 :康
0 :は
0 :影
0 :響
0 :な
0 :い
0 :と
0 :み
0 :<mask> :誤: ['ら', 'て', 'と']
0 :れ
3 :る
0 :。
「映画は貴重な文化資料、保存する大切さが身に染みました」と話すのは毎日映画コンクール選定委員で、１８日に「エリア・カザン自伝」の共訳で第５３回毎日出版文化賞を受賞した村川英さん＝写真。
「映画は貴重な文化資料、保存する大切さが身に染みました」と話すのは毎日映画コンクール選定委員で、１８日に「エリア・カザン自伝」の共訳で第５３回毎日出版文化賞を受賞した村川英さん＝写真。
0 1
「映画は貴重な文化資料、保存する大切さが身に染み

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



:有
0 :害
0 :物
0 :質
0 :と
0 :被
0 :害
0 :の
0 :因
0 :果
0 :関
0 :係
0 :が
0 :証
0 :明
3 :<mask> :誤: ['し', 'っ', 'で']
0 :て
0 :か
0 :ら
0 :で
0 :は
0 :遅
0 :い
0 :。
0 :そ
3 :<mask> :誤: ['れ', 'こ', 'う']
6 :<del>
6 :が
0 :公
0 :害
0 :問
0 :題
0 :の
0 :教
0 :訓
0 :<mask> :誤: ['か', 'に', 'と']
3 :」
0 :「
0 :子
0 :孫
0 :<mask> :誤: ['に', 'が', 'の']
3 :影
0 :響
0 :を
0 :及
0 :す
0 :生
0 :殖
0 :毒
0 :性
0 :は
0 :長
0 :期
0 :の
0 :調
0 :査
0 :研
0 :究
0 :が
0 :必
0 :要
0 :あ
0 :り
0 :、
0 :主
0 :に
0 :動
0 :物
0 :実
0 :験
0 :デ
0 :ー
0 :タ
0 :か
0 :ら
0 :策
6 :<del>
6 :定
0 :れ
0 :た
0 :た
0 :基
0 :準
0 :<mask> :誤: ['を', 'は', 'が']
0 :下
3 :回
0 :る
0 :と
0 :と
0 :し
0 :て
0 :も
0 :安
0 :心
0 :で
0 :き
0 :な
0 :い
0 :」
0 :な
0 :ど
0 :の
0 :理
0 :由
0 :に
0 :ら
0 :、
0 :私
0 :の
0 :主
0 :張
0 :を
0 :を
0 :批
0 :判
0 :<mask> :誤: ['す', 'せ', 'ず']
0 :る
3 :意
0 :見
0 :ば
0 :多
0 :か
0 :っ
0 :た
0 :。
今月は新国立劇場の「羅生門」に出演するなど活躍は目覚ましい。
今月は新国立劇場の「羅生門」出演するるっど活躍は目覚まししい。
1 1
今月は新国立劇場の「羅生門」出演するっど活躍は目覚まししい。
128
127
0 :今
0 :月
0 :は
0 :新
0 :国
0 :立
0 :劇
0 :場
0 :の
0 :「
0 :羅
0 :生
0 :門
0 :」
0 :出
0 :演
0 :す
0 :る
6 :<del>
6 :っ
0 :ど
0 :活

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



 :ら
0 :７
0 :０
0 :年
0 :代
0 :初
0 :め
0 :に
0 :か
0 :け
0 :て
0 :サ
0 :ッ
0 :カ
0 :ー
0 :の
0 :北
0 :朝
0 :鮮
0 :代
0 :表
0 :に
0 :な
0 :っ
0 :た
0 :と
0 :い
0 :う
0 :崔
0 :副
0 :会
0 :長
0 :は
0 :、
0 :Ｗ
0 :杯
0 :ア
0 :ジ
0 :ア
0 :予
0 :選
0 :３
0 :月
0 :に
0 :日
0 :本
0 :開
0 :か
0 :れ
0 :た
0 :た
0 :ダ
0 :イ
0 :ナ
0 :ス
0 :テ
0 :ィ
0 :カ
0 :ッ
0 :プ
0 :の
0 :韓
0 :国
0 :代
0 :表
0 :の
0 :試
0 :合
0 :録
0 :画
0 :テ
0 :ー
0 :プ
0 :を
0 :入
0 :手
0 :し
0 :て
0 :て
0 :見
0 :た
0 :と
0 :明
3 :<mask> :誤: ['か', 'が', 'ら']
0 :し
0 :、
0 :同
0 :代
0 :表
0 :に
0 :強
0 :い
0 :関
0 :心
0 :を
0 :示
0 :た
0 :。
例えば、腐敗・汚職の根源の一つは公務員給与の低さにあり、この改善によって、かなり解決するはずである。
例めば、腐敗・汚職根源の一ｔは公務員給与の低さにありり、この改善によって、かなりり解決ｓるずでる。
1 1
例めば、腐敗・汚職根源の一<mask>は公務員給与の低さにありり、この改善によって、かなり解決<mask>るずでる。
128
127
0 :例
0 :め
0 :ば
0 :、
0 :腐
0 :敗
0 :・
0 :汚
0 :職
0 :根
0 :源
0 :の
0 :一
3 :<mask> :誤: ['つ', 'に', 'と']
0 :は
0 :公
0 :務
0 :員
0 :給
0 :与
0 :の
0 :低
0 :さ
0 :に
0 :あ
0 :り
0 :り
0 :、
0 :こ
0 :の
0 :改
0 :善
0 :に
0 :よ
0 :っ
0 :て
0 :、
0 :か
0 :な
6 :<del>
6 :り
0 :解
0 :決
0 :<mask> :誤: ['す', 'な', 'ま']
3 :る
0 :ず
0 :で
0 :る
0 :。
高さ約１メートルのコンクリート

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



0 :限
0 :定
0 :し
0 :た
0 :り
0 :、
0 :携
0 :行
0 :武
0 :器
0 :の
0 :基
0 :準
0 :や
0 :使
0 :用
0 :ル
0 :ー
0 :ル
0 :を
0 :厳
0 :格
0 :に
0 :規
0 :定
0 :し
0 :て
0 :お
0 :か
0 :な
0 :け
0 :れ
0 :ば
0 :、
0 :不
0 :測
0 :の
0 :事
0 :態
0 :を
0 :誘
0 :発
0 :し
0 :か
0 :ね
0 :な
0 :い
0 :。
西武は完封ペースだった石井の詰めが甘く、土壇場で勝利を逃した。
西武は完封ペースだった石井詰めが甘ｋ、土壇場で勝利を逃し。
1 1
西武は完封ペースだった石井詰めが甘<mask>、土壇場で勝利を逃し。
128
128
0 :西
0 :武
0 :は
0 :完
0 :封
0 :ペ
0 :ー
0 :ス
0 :だ
0 :っ
0 :た
0 :石
0 :井
0 :詰
0 :め
0 :が
0 :甘
3 :<mask> :誤: ['く', 'い', 'え']
0 :、
0 :土
0 :壇
0 :場
0 :で
0 :勝
0 :利
0 :を
0 :逃
0 :し
0 :。
クリントン米大統領は２５日夜、中国公式訪問で最初に足を踏み入れた西安で「米中両国は２大国として、世界の将来に特別の責任を持っている」と語ったが、これは最近のアジア経済危機、南アジア情勢などに対し、両国の協力、協調が具体的に影響を与えていることを踏まえたものだ。その意味で、米中関係の前途に自信を抱いていることを示した形だ。
クリントン米大統領は２５日夜、中国公式訪問で最初に足を踏み入れたた西安で「米中両国も２大国として、世界の将来に特別の責任を持っっいる」語っｔが、これは最近アジア経済危機、南アジア情勢などに対し、両国ば協力、協調が具体的ｎ影響を与ええていることをを踏まぱ
1 1
クリントン米大統領は２５日夜、中国公式訪問で最初に足を踏み入れたた西安で「米中両国も２大国として、世界の将来に特別の責任を持っいる」語っ<mask>が、これは最近アジア経済危機、南アジア情勢などに対し、両国<mask>協力、協調が具体的<mask>影響を与えていることをを踏ま<mask>
128
126
0 :ク
0 :リ
0 :ン
0 :ト
0 :ン
0 :米
0 :大


IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



0 :っ
0 :た
0 :の
0 :か
0 :か
0 :」
0 :。
0 :働
0 :い
0 :い
0 :ふ
0 :ふ
0 :り
0 :を
0 :す
0 :る
6 :<del>
6 :た
0 :め
0 :め
0 :の
0 :仕
0 :事
0 :着
0 :が
0 :が
0 :裏
0 :目
0 :に
0 :出
0 :た
0 :と
0 :思
0 :っ
0 :た
0 :。
対米支援の基本計画に対する国会の関与に関しては、自自公合意により「自衛隊活動などに限って原則的に事前承認、緊急時は事後承認」に修正された。しかし、参院の審議を通じても緊急時とはどんな事態かは明確にならなかった。
対米支援の基本計画に対すする国会の関与に関しても、自自公合意により「自衛隊活動ｎどに限っ原則的に事前承認、緊急時は事後承認」に修正ｓれた。ししかし、参院が審議を通じても緊急時とどｎな事態かは明確にらなかっった。
1 1
対米支援の基本計画に対する国会の関与に関しても、自自公合意により「自衛隊活動<mask>どに限っ原則的に事前承認、緊急時は事後承認」に修正<mask>れた。ししかし、参院が審議を通じても緊急時とど<mask>な事態かは明確にらなかった。
128
126
0 :対
0 :米
0 :支
0 :援
0 :の
0 :基
0 :本
0 :計
0 :画
0 :に
0 :対
0 :す
6 :<del>
6 :る
0 :国
0 :会
0 :の
0 :関
0 :与
0 :に
0 :関
0 :し
0 :て
0 :も
0 :、
0 :自
0 :自
0 :公
0 :合
0 :意
0 :に
0 :よ
0 :り
0 :「
0 :自
0 :衛
0 :隊
0 :活
0 :動
0 :<mask> :誤: ['な', 'は', 'の']
3 :ど
0 :に
0 :限
0 :っ
0 :原
0 :則
0 :的
0 :に
0 :事
0 :前
0 :承
0 :認
0 :、
0 :緊
0 :急
0 :時
0 :は
0 :事
0 :後
0 :承
0 :認
0 :」
0 :に
0 :修
0 :正
0 :<mask> :誤: ['さ', 'す', 'ら']
3 :れ
0 :た
0 :。
0 :し
0 :し
0 :か
0 :し
0 :、
0 :参
0 :院
0 :が
0 :審
0 :議
0 :を
0 :通
0 :じ
0 :て
0 :も

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



…
0 :…
0 :と
0 :い
0 :う
0 :と
0 :、
0 :こ
0 :れ
3 :<mask> :誤: ['は', 'が', 'で']
0 :そ
0 :ん
6 :<del>
6 :<mask> :誤: ['な', 'ど', 'だ']
3 :に
0 :古
0 :こ
0 :と
0 :と
0 :で
0 :は
0 :な
0 :い
0 :い
0 :よ
0 :う
0 :だ
0 :。
岡光、小山両被告の弁護人は、現金合計６０００万円の授受について貸与されたものである旨主張する。
岡光、小山両被告の弁護人は、現金合計６０００万円の授受について貸与されたものである旨主張する。
0 0
次回は２年後、山口県の阿知須の３町が共同開催する予定。
次回は２年後、山口県阿知須の３町が共同開催する予定。
1 0
ところが分譲マンションの特別なところは「一人では何も決定できない」ことです。
ところが分譲マンションの特別なところは「一人では何も決定できない」ことです。
0 0
これら３法案は、公明党にとって「政権入りへの３部作」。
これら３法案は、公明党にとって「政権入りへの３部作」。
0 1
これら３法案は、公明党にとって「政権入りへの３部作」。
128
128
0 :こ
0 :れ
0 :ら
0 :３
0 :法
0 :案
0 :は
0 :、
0 :公
0 :明
0 :党
0 :に
0 :と
0 :っ
0 :て
0 :「
0 :政
0 :権
0 :入
0 :り
0 :へ
0 :の
0 :３
0 :部
0 :作
0 :」
0 :。
「カルチャーゾーン」は、敷地内を貫通するカルチャーコリドーを中心に地域コミュニティーの核になる共用施設を配値して、住民の積極的な交流を目指す。
「カルチャーゾーン」は、敷地内ｗ貫通すするカルチャーコリドー中心に地域コミュニティーの核にる共用施設を配値しして、住民積極的な交流を目指す。
1 1
「カルチャーゾーン」は、敷地内<mask>貫通するカルチャーコリドー中心に地域コミュニティーの核にる共用施設を配値して、住民積極的な交流を目指す。
128
126
0 :「
0 :カ
0 :ル
0 :チ
0 :ャ
0 :ー
0 :ゾ
0 :ー
0 :ン
0 :」
0 :は
0 :、
0 :敷
0 :地
0 :内
3 :<mask> :誤: ['に', 'で', 'を']
0 :

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



0 :え
0 :て
0 :い
0 :る
0 :る
0 :。
0 :そ
0 :れ
0 :で
6 :<del>
6 :も
0 :暗
0 :く
0 :う
0 :っ
0 :屈
0 :し
0 :て
0 :い
常に姉が先を走っていた。
常も姉がが先を走っていいた。
1 1
常も姉が先を走っていた。
128
126
0 :常
0 :も
0 :姉
6 :<del>
6 :が
0 :先
0 :を
0 :走
0 :っ
0 :て
0 :い
0 :た
6 :<del>
6 :。
このほか、佐治敬三サントリー会長らも番付に入った。
このほほか、佐治敬三サントリー会長も番付に入っｔ。
1 1
このほか、佐治敬三サントリー会長も番付に入っ<mask>。
128
127
0 :こ
0 :の
0 :ほ
6 :<del>
6 :か
0 :、
0 :佐
0 :治
0 :敬
0 :三
0 :サ
0 :ン
0 :ト
0 :リ
0 :ー
0 :会
0 :長
0 :も
0 :番
0 :付
0 :に
0 :入
0 :っ
0 :<mask> :誤: ['た', 'て', 'る']
3 :。
ラスコーの壁画、シャガールやカンディンスキー、パウル・クレーの絵が何枚もカラーで収録されていて、本のつくりもとってもぜいたく。
ラスコーの壁画、シャガールやカンディンスキー、パウル・クレーの絵が何枚もカラーで収録されていて、本のつくりもとってもぜいたく。
0 0
通産省と法務省が「株式交換制度」の創設のため商法改正に向け協議を行っていることが２１日、明らかになった。企業の世界的な再編に日本企業が素早く対応できるようにするためで、株式を相互に交換する方式での持ち株会社設立や、企業の合併・買収、事業の売却に道を開くことになる。株式交換制度は、買収する企業が自社の株式を与える代わりに、被買収企業株式を株主から受け取って子会社とするなど、株式の交換によって資本関係の再編を行う仕組み。米国の多くの州や英国などで採用されている。
通産省と法務省が「株式交換制度」の創設のため商法改正の向け協議ｗ行ってることが２１日、明らかにななった。企業ｎ世界的な再編にに日本企業が素早く対応できるよようにすするためで、株式をを相互に交換する方式での持ｔ株会社設立や、企業のの合併・買収、事業のの売
1 1
通産省と法務省が「株式交換制度」の創設のため商法改正の

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)




3 :<mask> :誤: ['に', 'と', 'を']
0 :、
0 :同
0 :市
0 :が
0 :発
0 :注
3 :<mask> :誤: ['す', 'し', 'あ']
0 :る
0 :公
0 :共
0 :下
0 :水
0 :道
0 :工
0 :事
0 :の
0 :の
0 :実
0 :施
0 :設
0 :計
0 :を
0 :設
0 :計
0 :会
0 :社
0 :が
0 :落
0 :札
3 :<mask> :誤: ['で', 'を', 'し']
0 :き
0 :る
3 :<mask> :誤: ['よ', 'の', 'た']
0 :う
0 :、
0 :入
0 :札
0 :参
0 :加
0 :し
3 :<mask> :誤: ['た', 'て', 'や']
0 :他
0 :社
0 :の
0 :設
0 :計
0 :価
0 :格
0 :を
0 :教
0 :え
0 :な
0 :ど
6 :<del>
6 :の
0 :の
0 :便
0 :宜
0 :を
0 :図
0 :っ
0 :た
0 :た
0 :疑
0 :い
0 :。
約８００人の地方支部代表が投票で決議案の採否を決める。
約８００人の地方支部代表が投票で決議案の採否を決める。
0 0
日中共同の長江文明学術調査は、世界の四大文明がいずれも麦などの畑作農業を基盤として生まれたのに対し、長江流域に稲作を基盤とする文明があったのでは、という仮説を実証しようと１９９５年にスタートした。
日中共同の長江文明学術調査は、世界の四大文明がいずれも麦などの畑作農業を基盤として生まれたのに対し、長江流域に稲作を基盤とする文明があったのでは、という仮説を実証しようと１９９５年にスタートした。
0 0
単独トップでスタートした尾崎将司は５位に終わった。
単独トップでスタートし尾崎将司は５位に終わった。
1 1
単独トップでスタートし尾崎将司は５位に終わった。
128
128
0 :単
0 :独
0 :ト
0 :ッ
0 :プ
0 :で
0 :ス
0 :タ
0 :ー
0 :ト
0 :し
0 :尾
0 :崎
0 :将
0 :司
0 :は
0 :５
0 :位
0 :に
0 :終
0 :わ
0 :っ
0 :た
0 :。
ケアーン・テリアイギリスのスコティッシュ・テリア系の犬の原種。
ケアーン・テリアイギリスのスコティッシュ・テリア系の犬の原種。
0

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



 :林
0 :薫
0 :に
6 :<del>
6 :と
6 :<del>
6 :っ
0 :て
0 :も
0 :難
0 :役
0 :た
0 :。
標準価格で１２万９０００円。
標準価格で１２万９０００円。
0 0
所得税見直しは、来春にまとめる中期答申の柱の一つ。所得税を減免する控除制度や税率構造の見直し、利子・配当収入などを他の所得と合計して税額を計算する総合課税の是非などが焦点となる。
所得税見直しし、来春にまとめる中期答申柱の一つ。所得税を減免するる控除制度や税率構造の見直し、利子・配当収入などを他の所得とと合計して税額計算する総合課税の是非などが焦点ｔなる。
1 1
所得税見直しし、来春にまとめる中期答申柱の一つ。所得税を減免するる控除制度や税率構造の見直し、利子・配当収入などを他の所得とと合計して税額計算する総合課税の是非などが焦点<mask>なる。
128
128
0 :所
0 :得
0 :税
0 :見
0 :直
0 :し
0 :し
0 :、
0 :来
0 :春
0 :に
0 :ま
0 :と
0 :め
0 :る
0 :中
0 :期
0 :答
0 :申
0 :柱
0 :の
0 :一
0 :つ
0 :。
0 :所
0 :得
0 :税
0 :を
0 :減
0 :免
0 :す
0 :る
0 :る
0 :控
0 :除
0 :制
0 :度
0 :や
0 :税
0 :率
0 :構
0 :造
0 :の
0 :見
0 :直
0 :し
0 :、
0 :利
0 :子
0 :・
0 :配
0 :当
0 :収
0 :入
0 :な
0 :ど
0 :を
0 :他
0 :の
0 :所
0 :得
0 :と
0 :と
0 :合
0 :計
0 :し
0 :て
0 :税
0 :額
0 :計
0 :算
0 :す
0 :る
0 :総
0 :合
0 :課
0 :税
0 :の
0 :是
0 :非
0 :な
0 :ど
0 :が
0 :焦
0 :点
3 :<mask> :誤: ['と', 'に', 'で']
0 :な
0 :る
0 :。
訴状によると、同社は１９９６年３月、「ＤＤＩ関西ポケット電話」と専売店契約を結んだ。端末機を１台約２万円で買い取るが、通話契約１件ごとにＤＤＩ関西ポケット電話から約４万円の手数料が入るため、端末機を利用者に無料で渡しても、差し引き約２万円の利益が出るシステムだった。
訴状に

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)




科学技術相によよると、衛星中国山西省太原の打ち上げセンターから中国製ロケット長征４号を使って打ち上げられる。経費は中国がが２億ドル、ブラジルが１億ドルを負担。両国２００１年以降、衛星３基を打ｔ上げｒ予定。収集データは地球環境、農業、都市計画などの調査ｎ
1 1
科学技術相によると、衛星中国山西省太原の打ち上げセンターから中国製ロケット長征４号を使って打ち上げられる。経費は中国がが２億ドル、ブラジルが１億ドルを負担。両国２００１年以降、衛星３基を打<mask>上げ<mask>予定。収集データは地球環境、農業、都市計画などの調査<mask>
128
127
0 :科
0 :学
0 :技
0 :術
0 :相
0 :に
0 :よ
6 :<del>
6 :る
0 :と
0 :、
0 :衛
0 :星
0 :中
0 :国
0 :山
0 :西
0 :省
0 :太
0 :原
0 :の
0 :打
0 :ち
0 :上
0 :げ
0 :セ
0 :ン
0 :タ
0 :ー
0 :か
0 :ら
0 :中
0 :国
0 :製
0 :ロ
0 :ケ
0 :ッ
0 :ト
0 :長
0 :征
0 :４
0 :号
0 :を
0 :使
0 :っ
0 :て
0 :打
0 :ち
0 :上
0 :げ
0 :ら
0 :れ
0 :る
0 :。
0 :経
0 :費
0 :は
0 :中
0 :国
0 :が
0 :が
0 :２
0 :億
0 :ド
0 :ル
0 :、
0 :ブ
0 :ラ
0 :ジ
0 :ル
0 :が
0 :１
0 :億
0 :ド
0 :ル
0 :を
0 :負
0 :担
0 :。
0 :両
0 :国
0 :２
0 :０
0 :０
0 :１
0 :年
0 :以
0 :降
0 :、
0 :衛
0 :星
0 :３
0 :基
0 :を
0 :打
0 :<mask> :誤: ['ち', 'み', 'り']
3 :上
0 :げ
0 :<mask> :誤: ['る', 'た', 'の']
3 :予
0 :定
0 :。
0 :収
0 :集
0 :デ
0 :ー
0 :タ
0 :は
0 :地
0 :球
0 :環
0 :境
0 :、
0 :農
0 :業
0 :、
0 :都
0 :市
0 :計
0 :画
0 :な
0 :ど
0 :の
0 :調
0 :査
0 :<mask> :誤: ['は', 'で', 'の']
3 :用
神吉正則裁

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



税
0 :庁
0 :長
0 :官
0 :を
0 :解
0 :任
0 :し
0 :、
0 :後
0 :任
0 :ボ
0 :リ
0 :ス
0 :・
0 :フ
0 :ョ
0 :ー
0 :ド
0 :ロ
0 :フ
0 :元
0 :副
0 :首
0 :相
0 :を
0 :任
0 :命
0 :し
0 :。
東京都練馬区内のマンションで１９９６年、帰宅した小学３年の女児を強制わいせつと住居侵入容疑で逮捕した。
東京都練馬区内のマンションで１９９６年、帰宅した小学３年の女児を強制いせつと住居侵入容疑で逮捕た。
1 1
東京都練馬区内のマンションで１９９６年、帰宅した小学３年の女児を強制いせつと住居侵入容疑で逮捕た。
128
128
0 :東
0 :京
0 :都
0 :練
0 :馬
0 :区
0 :内
0 :の
0 :マ
0 :ン
0 :シ
0 :ョ
0 :ン
0 :で
0 :１
0 :９
0 :９
0 :６
0 :年
0 :、
0 :帰
0 :宅
0 :し
0 :た
0 :小
0 :学
0 :３
0 :年
0 :の
0 :女
0 :児
0 :を
0 :強
0 :制
0 :い
0 :せ
0 :つ
0 :と
0 :住
0 :居
0 :侵
0 :入
0 :容
0 :疑
0 :で
0 :逮
0 :捕
0 :た
0 :。
通産省は来年度予算で燃料電池開発促進のため１８億円を要求するなど、風力、太陽光、廃棄物発電といった次世代クリーンエネルギーの割合を現在の１・１％から、１０年には３・１％に高めたい考え。海外比較では「まだまだ低い」との指摘もあり、今回の事故を契機に計画以上に新エネルギーに比重を置くなどの対応が求められそうだ。
通産省は来年度予算ｄ燃料電池開発促進のためめ１８億円を要求するなど、風力、太陽光、廃棄物発電といった次世代クリーンエネルギーの割合を現在も１・１％から、１０年にには３・１％高めたいい考え。海外比較ではは「まだまろ低い」とｎ指摘もあじ、今回の事故ｗ契機に
1 1
通産省は来年度予算<mask>燃料電池開発促進のため１８億円を要求するなど、風力、太陽光、廃棄物発電といった次世代クリーンエネルギーの割合を現在も１・１％から、１０年にには３・１％高めたいい考え。海外比較ではは「まだま<mask>低い」と<mask>指摘あじ、今回の事故<mask>契機に
128
126
0 :通


IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



ア
0 :ジ
0 :、
0 :４
0 :０
0 :セ
0 :ン
0 :チ
0 :級
0 :サ
0 :バ
0 :好
0 :調
0 :。
0 :イ
0 :カ
0 :ダ
0 :は
0 :３
0 :５
0 :〜
0 :４
0 :０
0 :セ
0 :ン
0 :チ
0 :の
0 :チ
0 :ヌ
0 :７
0 :匹
0 :の
0 :人
0 :も
0 :。
0 :か
0 :る
0 :も
0 :荘
0 :。
ヨハネス・フェルメール１７世紀に黄金時代を迎えたオランダの市民社会が生んだ画家。
ヨハネス・フェルメール１７世紀に黄金時代を迎ええたオランダのの市民社会が生んんだ画家。
1 1
ヨハネス・フェルメール１７世紀に黄金時代を迎えたオランダのの市民社会が生んだ画家。
128
126
0 :ヨ
0 :ハ
0 :ネ
0 :ス
0 :・
0 :フ
0 :ェ
0 :ル
0 :メ
0 :ー
0 :ル
0 :１
0 :７
0 :世
0 :紀
0 :に
0 :黄
0 :金
0 :時
0 :代
0 :を
0 :迎
0 :え
6 :<del>
6 :た
0 :オ
0 :ラ
0 :ン
0 :ダ
0 :の
0 :の
0 :市
0 :民
0 :社
0 :会
0 :が
0 :生
0 :ん
0 :だ
6 :<del>
6 :画
0 :家
0 :。
任期満了に伴い２４日投開票された埼玉県蓮田市長選で、新人で会社役員の樋口暁子氏が初当選し、全国３人目の女性市長が生まれた。全国市長会によると、女性市長はこれまで神奈川県逗子市、兵庫県芦屋市に例があるだけで、現職は北村春江・芦屋市長のみ。
任期満了に伴２４日投開票されれた埼玉県蓮田市長選で、新人で会社役員の樋口暁子氏が初当選も、全国３人目の女性市長が生まれた。全国市長会にると、女性市長ははこれまで神奈川県逗子市、兵庫県芦屋市にに例があるだで、現職は北村春江・芦屋市長のみ。
1 1
任期満了に伴<mask><mask>２４日投開票された埼玉県蓮田市長選で、新人で会社役員の樋口暁子氏が初当選も、全国３人目の女性市長が生また。全国市長会にると、女性市長ははこまで神奈川県逗子市、兵庫県芦屋市に例があるだで、現職は北村春江・芦屋市長のみ。
128
126
0 :任
0 :期
0 :満
0 :了
0 :に
2 :伴
-1 :<mask> :脱: ['っ', 'う', 'い']
-1 

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



廃棄された指導要録は、昨年の２学期末<mask>他県の中学校に転校した双子の男子生徒<mask>１人分の一部。
128
128
0 :廃
0 :棄
0 :さ
0 :れ
0 :た
0 :指
0 :導
0 :要
0 :録
0 :は
0 :、
0 :昨
0 :年
0 :の
0 :２
0 :学
0 :期
0 :末
3 :<mask> :誤: ['に', 'で', 'の']
0 :他
0 :県
0 :の
0 :中
0 :学
0 :校
0 :に
0 :転
0 :校
0 :し
0 :た
0 :双
0 :子
0 :の
0 :男
0 :子
0 :生
0 :徒
3 :<mask> :誤: ['の', 'は', 'が']
0 :１
0 :人
0 :分
0 :の
0 :一
0 :部
0 :。
タイにとってカンボジアは安全保障上、重要な国だった。
タイにとってカンボジアは安全保障上、重要な国だた。
1 1
タイにとってカンボジアは安全保障上、重要な国だた。
128
128
0 :タ
0 :イ
0 :に
0 :と
0 :っ
0 :て
0 :カ
0 :ン
0 :ボ
0 :ジ
0 :ア
0 :は
0 :安
0 :全
0 :保
0 :障
0 :上
0 :、
0 :重
0 :要
0 :な
0 :国
0 :だ
0 :た
0 :。
総合的な安保・防衛策を与野党双方が提示する形でないと、これまた実りある議論になってこない。
総合的な安保・防衛策を与野党双方が提示する形でないと、これた実りｒ議論になってこない。
1 1
総合的な安保・防衛策を与野党双方が提示する形でないと、れた実り<mask>議論になってこない。
128
127
0 :総
0 :合
0 :的
0 :な
0 :安
0 :保
0 :・
0 :防
0 :衛
0 :策
0 :を
0 :与
0 :野
0 :党
0 :双
0 :方
0 :が
0 :提
0 :示
0 :す
0 :る
0 :形
0 :で
0 :な
0 :い
0 :と
0 :、
6 :<del>
6 :れ
0 :た
0 :実
0 :り
0 :<mask> :誤: ['が', 'の', 'は']
3 :議
0 :論
0 :に
0 :な
0 :っ
0 :て
0 :こ
0 :な
0 :い
0 :。
子供がのびのびと生き、自分に自信が持てるような社会にしてほしいと思う。
子供がびのｂとと生き、自分自信

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)




0 :力
0 :の
0 :メ
0 :ン
0 :バ
0 :ー
0 :ら
0 :西
0 :日
0 :本
0 :２
0 :府
0 :５
0 :県
0 :の
0 :市
0 :民
0 :１
0 :４
0 :０
0 :人
0 :８
0 :日
0 :、
0 :松
0 :江
0 :地
0 :裁
0 :に
0 :、
0 :「
0 :活
0 :断
0 :層
3 :<mask> :誤: ['の', 'な', 'と']
0 :存
0 :在
0 :は
0 :原
0 :発
0 :の
0 :安
0 :全
0 :性
0 :を
0 :揺
0 :る
0 :が
0 :す
0 :重
0 :大
0 :問
0 :題
0 :」
0 :と
0 :し
0 :を
0 :同
0 :社
0 :を
0 :相
0 :手
0 :取
0 :り
0 :、
0 :運
0 :転
0 :差
0 :し
0 :止
0 :め
0 :を
0 :求
0 :め
0 :る
0 :訴
0 :え
6 :<del>
6 :を
0 :起
0 :し
0 :た
0 :。
0 :環
0 :境
0 :権
0 :<mask> :誤: ['な', 'の', 'て']
3 :ど
0 :に
0 :基
0 :も
6 :<del>
6 :で
6 :<del>
6 :、
0 :活
0 :断
0 :層
0 :を
0 :理
0 :由
0 :に
0 :原
0 :発
0 :<mask> :誤: ['の', 'と', 'に']
0 :運
0 :転
3 :差
0 :し
0 :止
0 :め
0 :を
0 :を
0 :求
0 :め
0 :訴
0 :訟
0 :は
0 :、
0 :全
0 :国
0 :で
0 :初
0 :め
どんな戦型になるか、盤側はかたずをのんだ。
どんな戦型にやるか、盤側はかたずずをのんだ。
1 1
どんな戦型にやるか、盤側はかたずをのんだ。
128
127
0 :ど
0 :ん
0 :な
0 :戦
0 :型
0 :に
0 :や
0 :る
0 :か
0 :、
0 :盤
0 :側
0 :は
0 :か
0 :た
0 :ず
6 :<del>
6 :を
0 :の
0 :ん
0 :だ
0 :。
ミレニアムとやらのせいだろうか。いやいや、そんな不安を描くより、２０００年を刻む時代に生きる幸運を胸に、人情味あふれる“街の詩”に触れる方が、ずっと心も明るくなる。全国から寄せられた「ちょっといい話

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



 :。
２年かけ話し合った結果、剪定量を３分の１に縮めた。
２年かかけ話し合ぐた結果、剪定量を３分１に縮めた。
1 1
２年かけ話し合ぐた結果、剪定量を３分１に縮めた。
128
127
0 :２
0 :年
0 :か
6 :<del>
6 :け
0 :話
0 :し
0 :合
0 :ぐ
0 :た
0 :結
0 :果
0 :、
0 :剪
0 :定
0 :量
0 :を
0 :３
0 :分
0 :１
0 :に
0 :縮
0 :め
0 :た
0 :。
第二次大戦をはさみ４０年間にわたって旧ソ連に英国の核開発に関する極秘情報などを流していた元女性スパイの最も重要な女性スパイ」として英国人女性の写真や映像を伝えたが、この女性は「後悔はしていない」と明言している。
第二次大戦をさみ４０年間もわたぼて旧ソ連に英国の核開発も関すそ極秘情報などを流していた元女性スパイのの最も重要な女性スパイ」ととして英国人女性のの写真や映像を伝どが、この女性ｈ「後悔はしていない」と明言していだ。
1 1
第二次大戦をさみ４０年間もわた<mask>て旧ソ連に英国の核開発も関すそ極秘情報などを流していた元女性スパイのの最も重要な女性スパイ」ととして英国人女性のの写真や映像を伝どが、この女性<mask>「後悔はしていない」と明言していだ。
128
128
0 :第
0 :二
0 :次
0 :大
0 :戦
0 :を
0 :さ
0 :み
0 :４
0 :０
0 :年
0 :間
0 :も
0 :わ
0 :た
3 :<mask> :誤: ['っ', 'し', 'せ']
0 :て
0 :旧
0 :ソ
0 :連
0 :に
0 :英
0 :国
0 :の
0 :核
0 :開
0 :発
0 :も
0 :関
0 :す
0 :そ
0 :極
0 :秘
0 :情
0 :報
0 :な
0 :ど
0 :を
0 :流
0 :し
0 :て
0 :い
0 :た
0 :元
0 :女
0 :性
0 :ス
0 :パ
0 :イ
0 :の
0 :の
0 :最
0 :も
0 :重
0 :要
0 :な
0 :女
0 :性
0 :ス
0 :パ
0 :イ
0 :」
0 :と
0 :と
0 :し
0 :て
0 :英
0 :国
0 :人
0 :女
0 :性
0 :の
0 :の
0 :写
0 :真
0 :や
0 :映
0 :像
0 :を
0 :伝
0 :ど
0 :が
0

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



、
0 :今
0 :回
0 :の
0 :役
0 :割
0 :を
0 :引
0 :き
0 :受
0 :け
6 :<del>
6 :て
0 :、
0 :改
0 :め
0 :め
0 :て
0 :も
6 :<del>
6 :っ
0 :知
0 :ら
0 :な
0 :れ
0 :れ
6 :<del>
6 :ば
0 :、
0 :子
0 :ど
0 :も
0 :た
0 :ち
0 :に
0 :も
0 :伝
0 :え
0 :て
0 :行
0 :か
0 :<mask> :誤: ['な', 'る', 'ぬ']
0 :け
0 :れ
3 :ば
0 :、
0 :と
0 :と
0 :意
0 :識
0 :す
0 :る
0 :よ
0 :う
0 :に
0 :<mask> :誤: ['な', 'や', 'で']
0 :<mask> :誤: ['り', 'れ', 'き']
0 :ま
3 :し
3 :た
0 :。
民家や商店の壁に「出店絶対反対」「許すな無法者」などと書いた黄色い垂れ幕を下げた。
民家や商店の壁にに「出店絶対反対」「許すな無法者」などと書た黄色い垂れ幕て下げた。
1 1
民家や商店の壁に「出店絶対反対」「許すな無法者」などと書た黄色い垂れ幕て下げた。
128
127
0 :民
0 :家
0 :や
0 :商
0 :店
0 :の
0 :壁
0 :に
6 :<del>
6 :「
0 :出
0 :店
0 :絶
0 :対
0 :反
0 :対
0 :」
0 :「
0 :許
0 :す
0 :な
0 :無
0 :法
0 :者
0 :」
0 :な
0 :ど
0 :と
0 :書
0 :た
0 :黄
0 :色
0 :い
0 :垂
0 :れ
0 :幕
0 :て
0 :下
0 :げ
0 :た
0 :。
ホストコンピューターの所有者が操作するのと同じレベルで遠隔操作できる「管理者権限」を奪われた事例もある。
ホストコンピューターの所有者が操作するのとと同じじレベルで遠隔操作できるる「管理者権限」を奪われた事例もある。
1 1
ホストコンピューターの所有者が操作するのとと同じレベルで遠隔操作できる「管理者権限」を奪われた事例もある。
128
126
0 :ホ
0 :ス
0 :ト
0 :コ
0 :ン
0 :ピ
0 :ュ
0 :ー
0 :タ
0 :ー
0 :の
0 :所
0 :有
0 :者
0 :が
0 :操
0 :作
0 :す


IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



0 :る
0 :。
サッチャー英元首相着せぬサッチャー節で低調な大会の話題をさらった。
サッチャー英元首相着せぬサッチャー節で低調なな大会の話題をさった。
1 1
サッチャー英元首相着せ<mask>サッチャー節で低調な大会の話題をさった。
128
127
0 :サ
0 :ッ
0 :チ
0 :ャ
0 :ー
0 :英
0 :元
0 :首
0 :相
0 :着
0 :せ
3 :<mask> :誤: ['の', 'ず', 'ば']
0 :サ
0 :ッ
0 :チ
0 :ャ
0 :ー
0 :節
0 :で
0 :低
0 :調
0 :な
6 :<del>
6 :大
0 :会
0 :の
0 :話
0 :題
0 :を
0 :さ
0 :っ
0 :た
0 :。
さらに債権回収に関して「連帯保証人には催告に対する抗弁権がない。取れるほうから取ればよい」などと記し、商工ローンの特徴の一つである、連帯保証人からの徹底した回収を正当化している。
さらど債権回収に関して「連帯保証人には催告に対すする抗弁権がない。取れるうから取ればよ」などｔ記ｓ、商工ローンの特徴のの一である、連帯保証人からの徹底したた回収をを正当化している。
1 1
さら債権回収に関して「連帯保証人には催告に対する抗弁権がない。取れるうから取ればよ」など<mask>記<mask>、商工ローンの特徴の一である、連帯保証人からの徹底したた回収をを正当化している。
128
125
0 :さ
0 :ら
6 :<del>
6 :債
0 :権
0 :回
0 :収
0 :に
0 :関
0 :し
0 :て
0 :「
0 :連
0 :帯
0 :保
0 :証
0 :人
0 :に
0 :は
0 :催
0 :告
0 :に
0 :対
0 :す
0 :る
6 :<del>
6 :抗
0 :弁
0 :権
0 :が
0 :な
0 :い
0 :。
0 :取
0 :れ
0 :る
0 :う
0 :か
0 :ら
0 :取
0 :れ
0 :ば
0 :よ
0 :」
0 :な
0 :ど
0 :<mask> :誤: ['と', 'を', 'が']
0 :記
3 :<mask> :誤: ['し', 'す', 'く']
0 :、
3 :商
0 :工
0 :ロ
0 :ー
0 :ン
0 :の
0 :特
0 :徴
0 :の
0 :一
0 :で
6 :<del>
6 :あ
0 :る
0 :、


IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



128
128
0 :あ
0 :ま
0 :り
0 :強
0 :い
0 :報
0 :道
0 :規
0 :制
3 :<mask> :誤: ['は', 'に', 'で']
0 :、
0 :報
0 :道
0 :管
0 :制
0 :つ
0 :の
0 :が
0 :る
0 :危
0 :険
0 :性
0 :が
0 :あ
0 :る
0 :。
オゾン殺菌でカット野菜の付加価値を上げ、スーパー、総菜業者などから人気を得ている荷受け会社がある。岡山県倉敷市の「倉敷青果荷受組合」だ。市場間競争の生き残り策として、昨年４月、カット野菜を販売する事業に乗り出した。その際、販売戦略として導入したのがオゾン水生成装置によるオゾン殺菌だった。「ごみの出ない、安全なカット野菜がすぐに使えますよ」というわけだ。
オゾン殺菌でカット野菜の付加価値を上げ、スーパー、総菜業者などから人気を得ている荷受け会社がある。岡山県倉敷市の「倉敷青果荷受組合」だ。市場間競争の生き残り策として、昨年４月、カット野菜を販売する事業に乗り出した。その際、販売戦略として導入したのがオゾ
0 0
ジョビンやジルベルトをプロデュース、ジャズもブラジルも熟知した“大物”オスカー・カストロ・ネベスを制作に迎え、じっくり「本物」を作ったが、その耳当たりはふんわりと柔らかい。
ジョビンやジルベルトをプロデュース、ジャズもブラジルも熟知ししたた“大物”オスカー・カストロ・ネベスを制作に迎ええ、ぷっくり「本物」を作っが、そ耳当たりはふんわりと柔らか。
1 1
ジョビンやジルベルトをプロデュース、ジャズもブラジルも熟知しした“大物”オスカー・カストロ・ネベスを制作に迎え、<mask>っくり「本物」を作っが、そ耳当たりはふんわりと柔らか。
128
126
0 :ジ
0 :ョ
0 :ビ
0 :ン
0 :や
0 :ジ
0 :ル
0 :ベ
0 :ル
0 :ト
0 :を
0 :プ
0 :ロ
0 :デ
0 :ュ
0 :ー
0 :ス
0 :、
0 :ジ
0 :ャ
0 :ズ
0 :も
0 :ブ
0 :ラ
0 :ジ
0 :ル
0 :も
0 :熟
0 :知
0 :し
0 :し
0 :た
6 :<del>
6 :“
0 :大
0 :物
0 :”
0 :オ
0 :ス
0 :カ
0 :ー
0 :・
0 :カ
0 :ス
0 :ト
0 :ロ
0 :・
0 :ネ
0 :ベ
0 :

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



と
0 :し
0 :て
0 :基
0 :礎
0 :科
0 :学
0 :に
0 :こ
0 :れ
0 :だ
0 :ら
0 :い
0 :出
0 :費
0 :す
0 :る
0 :の
0 :し
0 :認
0 :め
0 :ら
0 :れ
0 :る
0 :だ
0 :ろ
6 :<del>
6 :う
0 :。
外国人事件では必ず、取り調べの録音を求めているが、検察庁が応じたことはない。
外国人事件では必ず、取りり調の録音を求めていいるが、検察庁がが応じたとはなない。
1 1
外国人事件では必ず、取り調の録音を求めていいるが、検察庁がが応じたとはない。
128
126
0 :外
0 :国
0 :人
0 :事
0 :件
0 :で
0 :は
0 :必
0 :ず
0 :、
0 :取
0 :り
6 :<del>
6 :調
0 :の
0 :録
0 :音
0 :を
0 :求
0 :め
0 :て
0 :い
0 :い
0 :る
0 :が
0 :、
0 :検
0 :察
0 :庁
0 :が
0 :が
0 :応
0 :じ
0 :た
0 :と
0 :は
0 :な
0 :い
6 :<del>
6 :。
結果的に、何とも多彩、魅力的名演が期待できる、プログラムとなった。
結果的に、何とも多彩、魅力的名演が期待き、プログラムとなっり。
1 1
結果的に、何とも多彩、魅力的名演が期待き、プログラムとなっり。
128
128
0 :結
0 :果
0 :的
0 :に
0 :、
0 :何
0 :と
0 :も
0 :多
0 :彩
0 :、
0 :魅
0 :力
0 :的
0 :名
0 :演
0 :が
0 :期
0 :待
0 :き
0 :、
0 :プ
0 :ロ
0 :グ
0 :ラ
0 :ム
0 :と
0 :な
0 :っ
0 :り
0 :。
２１世紀を目前にした現代のカストラートは、すでに体の中に「大衆」を持っているというのか。
２１世紀を目前ｎした現代のカストラートは、ｓでに体の中に「大衆」を持っているとやうのか。
1 1
２１世紀を目前<mask>した現代のカストラートは、<mask>でに体の中に「大衆」を持っているとやうのか。
128
128
0 :２
0 :１
0 :世
0 :紀
0 :を
0 :目
0 :前
3 :<mask> :誤: ['に', 'と', 'ら']
0 :し
0 :た
0 :現
0 :代
0 :の
0 :

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



:た
0 :た
0 :。
0 :が
0 :、
0 :の
0 :分
0 :国
0 :外
0 :の
0 :仲
0 :間
0 :た
0 :ち
0 :ち
3 :<mask> :誤: ['は', 'を', 'ゃ']
0 :補
0 :っ
0 :て
0 :い
0 :い
0 :っ
0 :。
0 :例
0 :え
3 :<mask> :誤: ['ば', 'に', 'る']
0 :コ
0 :ソ
0 :ボ
しかし、日本にとっては、農水産品の市場開放を一層進めなければならず、今後、国内調整が難航しそうだ。
しかし、日本ににやっては、農水産品の市場開放を一層進めなければなららず、今後、国内調整難航しそう。
1 1
しかし、日本ににやっては、農水産品の市場開放を一層進めなければなららず、今後、国内調整難航しそう。
128
128
0 :し
0 :か
0 :し
0 :、
0 :日
0 :本
0 :に
0 :に
0 :や
0 :っ
0 :て
0 :は
0 :、
0 :農
0 :水
0 :産
0 :品
0 :の
0 :市
0 :場
0 :開
0 :放
0 :を
0 :一
0 :層
0 :進
0 :め
0 :な
0 :け
0 :れ
0 :ば
0 :な
0 :ら
0 :ら
0 :ず
0 :、
0 :今
0 :後
0 :、
0 :国
0 :内
0 :調
0 :整
0 :難
0 :航
0 :し
0 :そ
0 :う
0 :。
近代詩文書は漢字とかなのバランスに妙があり、野口雨情や斎藤茂吉ら、原作者の息吹を感じさせる。
近代詩文書は漢字とかなのバランスに妙があ、野口雨情や斎藤茂吉、原作者の息吹を感じさせる。
1 1
近代詩文書は漢字とかなのバランスに妙があ、野口雨情や斎藤茂吉、原作者の息吹を感じさせる。
128
128
0 :近
0 :代
0 :詩
0 :文
0 :書
0 :は
0 :漢
0 :字
0 :と
0 :か
0 :な
0 :の
0 :バ
0 :ラ
0 :ン
0 :ス
0 :に
0 :妙
0 :が
0 :あ
0 :、
0 :野
0 :口
0 :雨
0 :情
0 :や
0 :斎
0 :藤
0 :茂
0 :吉
0 :、
0 :原
0 :作
0 :者
0 :の
0 :息
0 :吹
0 :を
0 :感
0 :じ
0 :さ
0 :せ
0 :る
0 :。
発行元は出版とカウンセリングで女性の表現をサポートしているフェ

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



 :「
0 :改
0 :革
0 :は
0 :政
0 :府
0 :<mask> :誤: ['だ', 'に', 'な']
3 :<mask> :誤: ['け', 'の', 'ま']
3 :で
0 :な
0 :な
0 :く
0 :、
0 :社
0 :会
0 :す
0 :べ
0 :や
0 :の
0 :組
0 :織
0 :で
0 :徐
0 :々
0 :で
0 :行
0 :わ
0 :れ
0 :な
0 :け
0 :れ
0 :ば
0 :な
0 :ら
0 :な
0 :な
0 :い
0 :。
つい最近の病原性大腸菌Ｏ１５７事件は、学校給食の歴史の中でも忘れることのできない痛恨の惨事であった。
つい最近の病原性大腸菌Ｏ１５７事件は、学校給食の歴史の中でも忘れれるることのできない痛恨の惨事であった。
1 0
「教育もの」はこれまで地味なイメージだった。
「教育ｍのの」はこれままで地味ゅイメージだった。
1 1
「教育<mask>のの」はこれままで地味<mask>イメージだった。
128
128
0 :「
0 :教
0 :育
3 :<mask> :誤: ['も', 'な', 'が']
0 :の
0 :の
0 :」
0 :は
0 :こ
0 :れ
0 :ま
0 :ま
0 :で
0 :地
0 :味
3 :<mask> :誤: ['な', 'の', 'で']
0 :イ
0 :メ
0 :ー
0 :ジ
0 :だ
0 :っ
0 :た
0 :。
これまでにライオネル・ハンプトンさん、マックス・ローチさんといった巨匠がデューク・エリントンら故人とともに選ばれている。
ばれれまでにライオネル・ハンプトンさん、マックス・ローチさんといた巨匠がデューク・エリントン故人ととｍ選ばれｔいる。
1 1
れれまでにライオネル・ハンプトンさん、マックス・ローチさんいた巨匠がデューク・エリントン故人と<mask>選ばれ<mask>いる。
128
125
6 :<del>
6 :れ
0 :れ
0 :ま
0 :で
0 :に
0 :ラ
0 :イ
0 :オ
0 :ネ
0 :ル
0 :・
0 :ハ
0 :ン
0 :プ
0 :ト
0 :ン
0 :さ
0 :ん
0 :、
0 :マ
0 :ッ
0 :ク
0 :ス
0 :・
0 :ロ
0 :ー
0 :チ
0 :さ
0 :ん
0 :い
6 :<del>
6 :た
0 :巨
0 :匠
0 :が
0 

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)




さすがに一つ深呼吸したけれど、ちゅうちょすることなく大きく重いまな板を抱えてレジの前に立った。
0 0
民放テレビのＣＭには、おもしろいものも目障りなものもある。
民放テレビのＣＭには、おももとろいものも目障りなものあ。
1 1
民放テレビのＣＭには、おとろいものも目障りなものあ。
128
126
0 :民
0 :放
0 :テ
0 :レ
0 :ビ
0 :の
0 :Ｃ
0 :Ｍ
0 :に
0 :は
0 :、
0 :お
6 :<del>
6 :と
6 :<del>
6 :ろ
0 :い
0 :も
0 :の
0 :も
0 :目
0 :障
0 :り
0 :な
0 :も
0 :の
0 :あ
0 :。
さまざまな思惑が重層的に展開する。
さざまな思惑が重層的に展開する。
1 1
さざまな思惑が重層的に展開する。
128
128
0 :さ
0 :ざ
0 :ま
0 :な
0 :思
0 :惑
0 :が
0 :重
0 :層
0 :的
0 :に
0 :展
0 :開
0 :す
0 :る
0 :。
父島での年平均気温は２２・９度だという。東京より７度以上も高い。おそらく母島もこれに近い気温だと思われる。ただ母島のほうが地形が急峻なので、気流の影響を受けやすく、湿潤な気候になるようだ。そんな自然環境が植物に影響を与え、湿性亜熱帯林をはぐくむ要因になっているのかもしれない。
父島でのの年平均気温は２２・９度だだという。東京よりり７度以上も高い。けそぺく母島もこれれに近気温だと思われ。ただ母島のう地形が急峻なので、気流も影響を受ｋやすく、湿潤な気候になるようだ。んなな自然環境が植物にに影響を与え、湿性亜熱帯林をはぐくむ要因に
1 1
父島でのの年平均気温は２２・９度だだという。東京よりり７度以上も高い。けそ<mask>く母島もこに近気温だと思われ。ただ母島のう地形が急峻なので、気流も影響を受<mask>やすく、湿潤な気候になるようだ。んなな自然環境が植物にに影響を与え、湿性亜熱帯林をはぐくむ要因に
128
126
0 :父
0 :島
0 :で
0 :の
0 :の
0 :年
0 :平
0 :均
0 :気
0 :温
0 :は
0 :２
0 :２
0 :・
0 :９
0 :度
0 :だ
0 :だ
0 :と
0 :い
0 :う
0 :。
0 :東
0 :京
0 :よ
0 :り
0 :り
0 :７
0 :度

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)




0 :ー
0 :ニ
0 :が
0 :右
0 :越
0 :え
0 :２
0 :ラ
0 :ン
0 :を
0 :放
0 :っ
0 :て
0 :今
0 :季
0 :４
0 :度
0 :目
0 :の
0 :の
0 :サ
0 :ヨ
0 :ナ
0 :ラ
0 :勝
0 :ち
0 :。
0 :先
0 :発
0 :て
0 :伊
0 :藤
0 :、
0 :抑
0 :え
0 :の
0 :の
0 :高
0 :津
0 :が
0 :崩
0 :れ
6 :<del>
6 :て
0 :２
0 :度
0 :追
0 :い
0 :つ
0 :れ
0 :も
0 :の
0 :の
0 :、
0 :最
0 :後
0 :は
0 :は
0 :五
0 :十
0 :嵐
0 :が
0 :踏
0 :ん
0 :張
0 :っ
0 :た
0 :た
0 :。
0 :横
0 :浜
0 :は
0 :後
0 :半
0 :粘
0 :り
0 :強
6 :<del>
6 :い
0 :反
0 :撃
0 :を
0 :見
0 :た
0 :<mask> :誤: ['が', 'と', 'だ']
6 :<del>
6 :一
0 :歩
3 :及
0 :ば
0 :ば
0 :ず
0 :、
0 :連
0 :勝
0 :は
しかし、全身の筋肉が緩むため体は動かず、聴覚・触覚などの感覚機能も鈍くなっている。
しかし、全身の筋肉が緩むちめ体動かず、聴覚・触覚なｄの感覚機能も鈍くなってている。
1 1
しかし、全身の筋肉が緩むちめ体動かず、聴覚・触覚な<mask>の感覚機能も鈍くなってている。
128
128
0 :し
0 :か
0 :し
0 :、
0 :全
0 :身
0 :の
0 :筋
0 :肉
0 :が
0 :緩
0 :む
0 :ち
0 :め
0 :体
0 :動
0 :か
0 :ず
0 :、
0 :聴
0 :覚
0 :・
0 :触
0 :覚
0 :な
3 :<mask> :誤: ['ど', 'し', 'ぞ']
0 :の
0 :感
0 :覚
0 :機
0 :能
0 :も
0 :鈍
0 :く
0 :な
0 :っ
0 :て
0 :て
0 :い
0 :る
0 :。
これと混同されがちなのが集団安全保障。
これで混同されがちなのが集団安全保障。
1 1
これで混同されがちなのが集団安全保障。
128
128
0 :こ
0 :れ
0 :で
0 :混
0 :同
0 :さ
0 :れ
0 

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



 :せ
0 :い
0 :剤
0 :を
0 :２
0 :回
0 :に
0 :わ
0 :っ
0 :て
0 :譲
0 :り
0 :渡
0 :し
0 :し
0 :た
0 :」
0 :な
0 :<mask> :誤: ['ど', 'い', 'の']
0 :<mask> :誤: ['と', 'の', 'を']
3 :供
3 :述
0 :。
0 :府
0 :警
0 :は
0 :８
0 :日
0 :か
0 :ら
0 :、
0 :宮
0 :部
0 :容
0 :疑
0 :者
0 :を
0 :取
0 :り
0 :調
0 :べ
0 :て
0 :い
0 :た
0 :。
ソルトレークシティー五輪の誘致問題で、金銭授与などの便宜を受けた疑惑が持たれる１２人の委員のうち、１０人までの名前が国際オリンピック委員会各委員のほか、ケニア、ロシア、モーリシャス、エクアドル、フィンランド、スワジランド、リビアの各委員が疑惑を持たれている、という。
ソルトレークシティー五輪のの誘致問題で、金銭授与ななどの便宜を受ざぞ疑惑が持たれ１２人の委員うち、１０人ままでの名前が国際オリンピック委員会各委員ｎほかか、ケニア、ロシア、モーリシャス、エクアドル、フィンランド、スワジランド、リビア各委員が疑惑を持たれ
1 1
ソルトレークシティー五輪のの誘致問題で、金銭授与などの便宜を受<mask><mask>疑惑が持たれ１２人の委員うち、１０人ままでの名前が国際オリンピック委員会各委員<mask>ほかか、ケニア、ロシア、モーリシャス、エクアドル、フィンランド、スワジランド、リビア各委員が疑惑を持たれ
128
127
0 :ソ
0 :ル
0 :ト
0 :レ
0 :ー
0 :ク
0 :シ
0 :テ
0 :ィ
0 :ー
0 :五
0 :輪
0 :の
0 :の
0 :誘
0 :致
0 :問
0 :題
0 :で
0 :、
0 :金
0 :銭
0 :授
0 :与
0 :な
6 :<del>
6 :ど
0 :の
0 :便
0 :宜
0 :を
0 :受
0 :<mask> :誤: ['け', 'し', 'い']
3 :<mask> :誤: ['た', 'る', 'て']
3 :疑
0 :惑
0 :が
0 :持
0 :た
0 :れ
0 :１
0 :２
0 :人
0 :の
0 :委
0 :員
0 :う
0 :ち
0 :、
0 :１
0 :０
0 :

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



 :ア
0 :ー
0 :。
最寄り駅の一つ、桜新町は昔ながらののどかな雰囲気と商店街を中心にした活気が調和した町だ。
最寄り駅の一つ、桜新町は昔ながらののどかな雰囲気と商店街を中心にした活気が調和した町だ。
0 0
一方で、最大野党である民主党は旧社会党出身の一部議員を除けば「憲法改正を前提とせずに問題点を議論することは大いに結構」との考えが大勢だ。
一方で、最大野党である民主党はは旧社会党出身の一部議員や除けば「憲法改正を前提とせずに問題点を議論すること大いに結構」との考え大勢だ。
1 1
一方で、最大野党ある民主党はは旧社会党出身の一部議員や除けば「憲法改正を前提とせずに問題点を議論すること大いに結構」との考え大勢だ。
128
127
0 :一
0 :方
0 :で
0 :、
0 :最
0 :大
0 :野
0 :党
6 :<del>
6 :あ
0 :る
0 :民
0 :主
0 :党
0 :は
0 :は
0 :旧
0 :社
0 :会
0 :党
0 :出
0 :身
0 :の
0 :一
0 :部
0 :議
0 :員
0 :や
0 :除
0 :け
0 :ば
0 :「
0 :憲
0 :法
0 :改
0 :正
0 :を
0 :前
0 :提
0 :と
0 :せ
0 :ず
0 :に
0 :問
0 :題
0 :点
0 :を
0 :議
0 :論
0 :す
0 :る
0 :こ
0 :と
0 :大
0 :い
0 :に
0 :結
0 :構
0 :」
0 :と
0 :の
0 :考
0 :え
0 :大
0 :勢
0 :だ
0 :。
同紙は９５年からコラム筆者に、とりあげる人物の氏名と身元を特定できる資料を提出させ、疑いがあればチェックできる体制を作っていた。最近になってスミス記者のコラムの引用発言が「あまりにもぴったりしすぎている」ため追跡調査を行った。４カ月かけて、有権者名簿、電話帳、自動車登録名簿などを調べたが、６人については確認できなかった。
同紙は９５年ｋらコラム筆者に、とりああげる人物の氏名とと身元を特定でできる資料を提出させ、疑いがあれがチェックできるる体制を作っっい。最近にいってスミス記者のコラムのの引用発言が「あまりりにももぴたししすぎのいる」ため追跡調査をを行った。４カ月かけて、
1 1
同紙は９５年<mask>らコラム筆者に、とりああげる人物の氏名とと身元を特定でできる資料

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



0 :先
0 :］
0 :４
0 :三
0 :角
0 :成
0 :［
0 :後
0 :］
0 :同
0 :金
0 :［
0 :先
0 :］
0 :５
0 :二
0 :銀
0 :に
0 :い
0 :い
0 :。
「介助犬シンシアのまち」を宣言するなどしてきた宝塚から、「だれにもやさしい街」づくりのメッセージを発信。
「介助犬シンシアのまちち」を宣言するなしてき宝塚か、「だにもしい街」づづくりのメッセージを発信。
1 1
「介助犬シンシアのまち」を宣言するなしてき宝塚か、「だにもしい街」づくりのメッセージを発信。
128
126
0 :「
0 :介
0 :助
0 :犬
0 :シ
0 :ン
0 :シ
0 :ア
0 :の
0 :ま
0 :ち
6 :<del>
6 :」
0 :を
0 :宣
0 :言
0 :す
0 :る
0 :な
0 :し
0 :て
0 :き
0 :宝
0 :塚
0 :か
0 :、
0 :「
0 :だ
0 :に
0 :も
0 :し
0 :い
0 :街
0 :」
0 :づ
0 :く
6 :<del>
6 :り
0 :の
0 :メ
0 :ッ
0 :セ
0 :ー
0 :ジ
0 :を
0 :発
0 :信
0 :。
このおかげで、中小保険会社は手厚い保護を受けてきた。
こｎかげで、中小保険会社ｈ手厚い保護を受けてきた。
1 1
こ<mask>か<mask>で、中小保険会社<mask>手厚い保護を受けてきた。
128
128
0 :こ
3 :<mask> :誤: ['れ', 'こ', 'の']
0 :か
3 :<mask> :誤: ['ら', 'り', 'け']
0 :で
0 :、
0 :中
0 :小
0 :保
0 :険
0 :会
0 :社
3 :<mask> :誤: ['が', 'は', 'の']
0 :手
0 :厚
0 :い
0 :保
0 :護
0 :を
0 :受
0 :け
0 :て
0 :き
0 :た
0 :。
勝負の行方は、加藤が小駒だけで、果たして先手玉を捕らえ切れるかどうかにかかってきたが、先に１分将棋に入った田中に、ついに最後の最後の敗着が出た。
勝負の行方は、加藤ど小駒だけで、果たして先手玉を捕らえ切れわかどかかかっばきた、先に１分将棋入ったた田中に、いに最後の最後の敗着ど出た。
1 1
勝負の行方は、加藤ど小駒だけで、果たして先手玉を捕らえ切れわかどかか

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



 :い
0 :戦
0 :い
0 :続
6 :<del>
6 :く
0 :Ｗ
0 :杯
0 :で
0 :壁
0 :に
0 :当
0 :た
0 :る
0 :の
0 :か
0 :、
6 :<del>
6 :一
0 :段
0 :と
0 :飛
0 :躍
0 :す
0 :る
0 :の
0 :の
0 :か
0 :。
0 :目
0 :が
0 :が
0 :離
0 :せ
0 :<mask> :誤: ['な', 'た', 'ま']
0 :い
3 :。
その前にケリをつけておきたいことがある。
その前にケリをつけておきたいことがある。
0 0
また、中国市場をめぐる日米間の攻防や米国の対日姿勢にも微妙な変化をもたらしそうだ。
また、中国市場をめぐる日米間の攻防や米国のの対日姿勢ににも微妙変化がもたらししそだ。
1 1
また、中国市場をめぐる日米間の攻防や米国のの対日姿勢ににも微妙変化がもたらしそだ。
128
127
0 :ま
0 :た
0 :、
0 :中
0 :国
0 :市
0 :場
0 :を
0 :め
0 :ぐ
0 :る
0 :日
0 :米
0 :間
0 :の
0 :攻
0 :防
0 :や
0 :米
0 :国
0 :の
0 :の
0 :対
0 :日
0 :姿
0 :勢
0 :に
0 :に
0 :も
0 :微
0 :妙
0 :変
0 :化
0 :が
0 :も
0 :た
0 :ら
0 :し
6 :<del>
6 :そ
0 :だ
0 :。
残念ながら私は読んでいないのだが、「コレデオシマイ」といういわば後編があって、こちらは二匹目のどじょうのようなのだが、これだけ読んでも十分に楽しめる。
残念なががら私は読んでいｎいのだが、「コレデオシマイ」といいういわば後編あって、ここちらは二匹目のどじょうののようっのだが、こｒだけ読んでも十分に楽しめｒ。
1 1
残念なががら私は読んでい<mask>いのだが、「コレデオシマイ」といいういわば後編あって、こちらは二匹目のどじょうののようっのだが、こ<mask>け読んでも十分に楽しめ<mask>。
128
126
0 :残
0 :念
0 :な
0 :が
0 :が
0 :ら
0 :私
0 :は
0 :読
0 :ん
0 :で
0 :い
3 :<mask> :誤: ['な', 'た', 'る']
0 :い
0 :の
0 :だ
0 :が
0 :、
0 :「
0 :コ


KeyboardInterrupt: 

In [80]:
def test_input(original_text ,processed_text):
    hybrid_trainer.model.eval()
    mlm_trainer.model.eval()
    with torch.no_grad():
        input_line = []
        original = original_text
        processed_index = [vocab.sos_index] +[vocab.stoi[i] for i in processed_text] + [vocab.eos_index]
        text = torch.tensor(processed_index)
        processed_batch = text.unsqueeze(0)
        epd_output,esd_output = hybrid_trainer.model(processed_batch)
        print(original_text)
        print(processed_text)
        #NG文だけ次のステップへ
        print(esd_output.argmax(dim=-1).item())
        #if esd_output.argmax(dim=-1).item()==1:
        predict_list = []
        masked_list = []
        masked_label = []
        for j in range(len(text)):
            predict = epd_output[0,j].argmax(dim=-1).item()
            if predict == 0:
                # 正しい場合
                masked_list.append(text[j])
                masked_label.append(-1)
                predict_list.append(0)
            elif predict == 1:
                # 脱字(1文字)
                masked_list.extend([text[j], vocab.mask_index])
                masked_label.extend([-1,-2])
                predict_list.extend([1,-1])
            elif predict == 2:
                # 脱字(2文字)
                masked_list.extend([text[j],vocab.mask_index, vocab.mask_index])
                masked_label.extend([-1,-2,-2])
                predict_list.extend([2,-1,-1])
            elif predict == 3:
                # 誤字
                masked_list.append(vocab.mask_index)
                masked_label.append(text[j])
                predict_list.append(3)
            elif predict == 4:
                # 誤字かつ脱字(1文字)
                masked_list.extend([vocab.mask_index, vocab.mask_index])
                masked_label.extend([text[j],-2])
                predict_list.extend([4,-1])
            elif predict == 5:
                # 誤字かつ脱字(2文字)
                masked_list.extend([vocab.mask_index, vocab.mask_index, vocab.mask_index])
                masked_label.extend([text[j],-2,-2])
                predict_list.extend([5,-1,-1])
            elif predict == 6:
                # 衍字
                predict_list.append(6)
            elif predict == 7:
                # 衍字かつ脱字(1文字)
                masked_list.append(vocab.mask_index)
                masked_label.append(-2)
                predict_list.extend([7,-1])
            elif predict == 8:
                # 衍字かつ脱字(2文字)
                masked_list.extend([vocab.mask_index, vocab.mask_index])
                masked_label.extend(-2,-2)
                predict_list.extend([8,-1,-1])
        no_pad_text = [vocab.itos[i] for i in masked_list if i!=0]
        no_pad_text = no_pad_text[1:-1]
        print("".join(no_pad_text))
        masked_list = masked_list[:128]
        masked_label = masked_label[:128]
        predict_list = predict_list[:128]
        masked_text = [vocab.itos[i] for i in masked_list]
        masked_batch = torch.tensor(masked_list)
        masked_batch = masked_batch.unsqueeze(0)
        mlm_output = mlm_trainer.model(masked_batch)
        print(len(epd_output[0]))
        print(len(masked_text))
        enji_flag = False
        for j in range(len(masked_text)):
            _, topi = mlm_output[0, j].topk(3)
            predict = [vocab.itos[index.item()] for index in topi]
            if masked_list[j] in [0,2,3]:
                continue

            if predict_list[j] in [6,7,8]:
                print(predict_list[j],":<del>")

            print(predict_list[j],":",end="")
            if masked_label[j] == -1:
                print(masked_text[j])
            elif masked_label[j] == -2:
                print(masked_text[j],':脱:',predict)
            else:
                print(masked_text[j],':誤:',predict)
test_input("政党が合意に達しｔことを評価している","奨学金は、経済的理由に就学困難な者に与えるものだ。")

政党が合意に達しｔことを評価している
奨学金は、経済的理由に就学困難な者に与えるものだ。
0
奨学金は、経済的理由に就学困難な者に与えるものだ。
27
27
0 :奨
0 :学
0 :金
0 :は
0 :、
0 :経
0 :済
0 :的
0 :理
0 :由
0 :に
0 :就
0 :学
0 :困
0 :難
0 :な
0 :者
0 :に
0 :与
0 :え
0 :る
0 :も
0 :の
0 :だ
0 :。


In [None]:
def test_esd():
    hybrid_trainer.model.eval()
    with torch.no_grad():
        n_correct = 0
        true_positive = 0
        true_negative = 0
        false_positive = 0
        false_negative = 0
        for i, batch in enumerate(tqdm.tqdm(test_loader)):
            if i==1000:
                break
            input_line = []
            _, esd_output = hybrid_trainer.model(batch['bert_input'])
            if batch['label'][0] == 1:
                if esd_output.argmax(dim=-1).item() == 1:
                    #NG文をNGと判定したとき
                    true_positive += 1
                    n_correct += 1
                else:
                    #NG文をOKと判定したとき
                    false_negative += 1
            else:
                if esd_output.argmax(dim=-1).item() == 1:
                    #OK文をNGと判定したとき
                    false_positive += 1
                else:
                    #OK文をOKと判定したとき
                    n_correct += 1
                    true_negative += 1
            print("検出率："+ str(n_correct/(i+1)))
        print("再現率：", true_positive/(true_positive+false_negative))
        print("適合率：", true_positive/(true_positive+false_positive))
        print("特異度：", true_negative/(false_positive+true_negative))
        print("F値：", 2*true_positive/(2*true_positive+false_negative+false_positive))

    with open("./hybrid_single/esd.txt","w", encoding='utf-8') as f:
        f.write("検出率："+ str(n_correct/i)+"\n")
        f.write("再現率："+ str(true_positive/(true_positive+false_negative))+"\n")
        f.write("適合率："+ str(true_positive/(true_positive+false_positive))+"\n")
        f.write("特異度："+ str(true_negative/(false_positive+true_negative))+"\n")
        f.write("F値："+ str(2*true_positive/(2*true_positive+false_negative+false_positive))+"\n")

test_esd()

In [None]:
def test_mlm():
    mlm_trainer.model.eval()
    with torch.no_grad():
        total_correct = 0
        total_elements = 0
        for  i, batch in enumerate(tqdm.tqdm(test_loader)):
            if i==1000:
                break
            input_line = []
            output = mlm_trainer.model(batch['bert_input'])[0]
            masked_label = batch["token_label"][0]
            correct = 0
            elements = 0
            for j in range(len(batch['bert_input'][0])):
                if masked_label[j] != 0:
                    elements += 1
                    _, topi = output[j].topk(3)
                    if masked_label[j].item() in topi:
                        correct += 1
            total_correct += correct
            total_elements += elements
            print("total_acc;", total_correct / total_elements *100)
            
test_mlm()

In [None]:
def test_epd():
    hybrid_trainer.model.eval()
    with torch.no_grad():
        all_num = 0
        n_correct = 0
        p_correct = 0
        true_positive = 0
        true_negative = 0
        false_positive = 0
        false_negative = 0
        for i, batch in enumerate(tqdm.tqdm(test_loader)):
            if i==1000:
                break
            output,_ = hybrid_trainer.model(batch['bert_input'])
            for j in range(128):
                all_num += 1
                true =  batch["token_label"][0,j].item()
                predict = output[0,j].argmax(dim=-1).item()
                if true != 0:
                    if predict != 0:
                        true_positive += 1
                        n_correct += 1
                        if predict == true:
                            p_correct += 1
                    else:
                        false_negative += 1
                else:
                    if predict != 0:
                        false_positive += 1
                    else:
                        true_negative += 1
                        n_correct += 1
            print("検出率：", n_correct/all_num)
            #print("完全検出率：", p_correct/all_num)
        print("再現率：", true_positive/(true_positive+false_negative))
        print("適合率：", true_positive/(true_positive+false_positive))
        print("特異度：", true_negative/(false_positive+true_negative))
        print("F値：", 2*true_positive/(2*true_positive+false_negative+false_positive))
    
    with open("./hybrid_single/epd.txt","w", encoding='utf-8') as f:
        f.write("検出率："+ str(n_correct/all_num)+"\n")
        f.write("再現率："+ str(true_positive/(true_positive+false_negative))+"\n")
        f.write("適合率："+ str(true_positive/(true_positive+false_positive))+"\n")
        f.write("特異度："+ str(true_negative/(false_positive+true_negative))+"\n")
        f.write("F値："+ str(2*true_positive/(2*true_positive+false_negative+false_positive))+"\n")
test_epd()

In [None]:
import matplotlib.pyplot as plt
plt.switch_backend('Agg')
import matplotlib.ticker as ticker
import numpy as np
plt.style.use('ggplot')

def showPlot(points, figure_path):
    plt.figure()
    fig, ax = plt.subplots()
    # this locator puts ticks at regular intervals
    loc = ticker.MultipleLocator(base=0.2)
    ax.yaxis.set_major_locator(loc)
    plt.plot(points)
    plt.savefig(figure_path)

In [None]:
showPlot(trainer.train_losses, "./results/"+str(epochs)+"_train.png")
showPlot(trainer.valid_losses, "./results/"+str(epochs)+"_valid.png")