In [1]:
from argparse import Namespace
import os
import json

import numpy as np
import pandas as pd
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader
from tqdm import tqdm

In [37]:
class Vocabulary(object):
    """Class to process text and extract vocabulary for mapping"""

    def __init__(self, token_to_idx=None):
        """
        Args:
            token_to_idx (dict): a pre-existing map of tokens to indices
        """

        if token_to_idx is None:
            token_to_idx = {}
        self._token_to_idx = token_to_idx

        self._idx_to_token = {idx: token
                              for token, idx in self._token_to_idx.items()}

    def to_serializable(self):
        """ returns a dictionary that can be serialized """
        return {'token_to_idx': self._token_to_idx}

    @classmethod
    def from_serializable(cls, contents):
        """ instantiates the Vocabulary from a serialized dictionary """
        return cls(**contents)

    def add_token(self, token):
        """Update mapping dicts based on the token.

        Args:
            token (str): the item to add into the Vocabulary
        Returns:
            index (int): the integer corresponding to the token
        """
        if token in self._token_to_idx:
            index = self._token_to_idx[token]
        else:
            index = len(self._token_to_idx)
            self._token_to_idx[token] = index
            self._idx_to_token[index] = token
        return index

    def add_many(self, tokens):
        """Add a list of tokens into the Vocabulary

        Args:
            tokens (list): a list of string tokens
        Returns:
            indices (list): a list of indices corresponding to the tokens
        """
        return [self.add_token(token) for token in tokens]

    def lookup_token(self, token):
        """Retrieve the index associated with the token

        Args:
            token (str): the token to look up
        Returns:
            index (int): the index corresponding to the token
        """
        return self._token_to_idx[token]

    def lookup_index(self, index):
        """Return the token associated with the index

        Args:
            index (int): the index to look up
        Returns:
            token (str): the token corresponding to the index
        Raises:
            KeyError: if the index is not in the Vocabulary
        """
        if index not in self._idx_to_token:
            raise KeyError("the index (%d) is not in the Vocabulary" % index)
        return self._idx_to_token[index]

    def __str__(self):
        return "<Vocabulary(size=%d)>" % len(self)

    def __len__(self):
        return len(self._token_to_idx)


class SequenceVocabulary(Vocabulary):
    def __init__(self, token_to_idx=None, unk_token="<UNK>",
                 mask_token="<MASK>", begin_seq_token="<BEGIN>",
                 end_seq_token="<END>"):

        super(SequenceVocabulary, self).__init__(token_to_idx)

        self._mask_token = mask_token
        self._unk_token = unk_token
        self._begin_seq_token = begin_seq_token
        self._end_seq_token = end_seq_token

        self.mask_index = self.add_token(self._mask_token)
        self.unk_index = self.add_token(self._unk_token)
        self.begin_seq_index = self.add_token(self._begin_seq_token)
        self.end_seq_index = self.add_token(self._end_seq_token)

    def to_serializable(self):
        contents = super(SequenceVocabulary, self).to_serializable()
        contents.update({'unk_token': self._unk_token,
                         'mask_token': self._mask_token,
                         'begin_seq_token': self._begin_seq_token,
                         'end_seq_token': self._end_seq_token})
        return contents

    def lookup_token(self, token):
        """Retrieve the index associated with the token
          or the UNK index if token isn't present.

        Args:
            token (str): the token to look up
        Returns:
            index (int): the index corresponding to the token
        Notes:
            `unk_index` needs to be >=0 (having been added into the Vocabulary)
              for the UNK functionality
        """
        return self._token_to_idx.get(token, self.unk_index)


In [38]:
class SurnameVectorizer(object):
    """ The Vectorizer which coordinates the Vocabularies and puts them to use"""

    def __init__(self, char_vocab, nationality_vocab):
        """
        Args:
            char_vocab (Vocabulary): maps characters to integers
            nationality_vocab (Vocabulary): maps nationalities to integers
        """
        self.char_vocab = char_vocab
        self.nationality_vocab = nationality_vocab

        print("Char Vocab特殊标记索引:"，
              f"<BEGIN>:{vectorizer.char_vocab.begin_seq_index}", 
              f"<END>:{vectorizer.char_vocab.end_seq_index}")

    def vectorize(self, surname, vector_length=-1):
        """
        Args:
            title (str): the string of characters
            vector_length (int): an argument for forcing the length of index vector
        """
        indices = [self.char_vocab.begin_seq_index]
        indices.extend(self.char_vocab.lookup_token(token)
                       for token in surname)
        indices.append(self.char_vocab.end_seq_index)

        if vector_length < 0:
            vector_length = len(indices)

        out_vector = np.zeros(vector_length, dtype=np.int64)
        out_vector[:len(indices)] = indices
        out_vector[len(indices):] = self.char_vocab.mask_index

        
        sample_str ="Zhang"
        vec,length =vectorizer.vectorize(sample_str)
        print(f"样本'{sample_str}'的向量化结果:\n{vec}\n 有效长度:{length)")

        return out_vector, len(indices)
        

    @classmethod
    def from_dataframe(cls, surname_df):
        """Instantiate the vectorizer from the dataset dataframe

        Args:
            surname_df (pandas.DataFrame): the surnames dataset
        Returns:
            an instance of the SurnameVectorizer
        """
        char_vocab = SequenceVocabulary()
        nationality_vocab = Vocabulary()

        for index, row in surname_df.iterrows():
            for char in row.surname:
                char_vocab.add_token(char)
            nationality_vocab.add_token(row.nationality)

        return cls(char_vocab, nationality_vocab)

    @classmethod
    def from_serializable(cls, contents):
        char_vocab = SequenceVocabulary.from_serializable(contents['char_vocab'])
        nat_vocab = Vocabulary.from_serializable(contents['nationality_vocab'])

        return cls(char_vocab=char_vocab, nationality_vocab=nat_vocab)

    def to_serializable(self):
        return {'char_vocab': self.char_vocab.to_serializable(),
                'nationality_vocab': self.nationality_vocab.to_serializable()}

In [39]:
class SurnameDataset(Dataset):
    def __init__(self, surname_df, vectorizer):
        """
        Args:
            surname_df (pandas.DataFrame): the dataset
            vectorizer (SurnameVectorizer): vectorizer instatiated from dataset
        """
        self.surname_df = surname_df
        self._vectorizer = vectorizer

        self._max_seq_length = max(map(len, self.surname_df.surname)) + 2

        self.train_df = self.surname_df[self.surname_df.split == 'train']
        self.train_size = len(self.train_df)

        self.val_df = self.surname_df[self.surname_df.split == 'val']
        self.validation_size = len(self.val_df)

        self.test_df = self.surname_df[self.surname_df.split == 'test']
        self.test_size = len(self.test_df)

        self._lookup_dict = {'train': (self.train_df, self.train_size),
                             'val': (self.val_df, self.validation_size),
                             'test': (self.test_df, self.test_size)}

        self.set_split('train')

        # Class weights
        class_counts = self.train_df.nationality.value_counts().to_dict()

        def sort_key(item):
            return self._vectorizer.nationality_vocab.lookup_token(item[0])

        sorted_counts = sorted(class_counts.items(), key=sort_key)
        frequencies = [count for _, count in sorted_counts]
        self.class_weights = 1.0 / torch.tensor(frequencies, dtype=torch.float32)

    @classmethod
    def load_dataset_and_make_vectorizer(cls, surname_csv):
        """Load dataset and make a new vectorizer from scratch

        Args:
            surname_csv (str): location of the dataset
        Returns:
            an instance of SurnameDataset
        """
        surname_df = pd.read_csv(surname_csv)
        train_surname_df = surname_df[surname_df.split == 'train']
        return cls(surname_df, SurnameVectorizer.from_dataframe(train_surname_df))

    @classmethod
    def load_dataset_and_load_vectorizer(cls, surname_csv, vectorizer_filepath):
        """Load dataset and the corresponding vectorizer.
        Used in the case in the vectorizer has been cached for re-use

        Args:
            surname_csv (str): location of the dataset
            vectorizer_filepath (str): location of the saved vectorizer
        Returns:
            an instance of SurnameDataset
        """
        surname_df = pd.read_csv(surname_csv)
        vectorizer = cls.load_vectorizer_only(vectorizer_filepath)
        return cls(surname_df, vectorizer)

    @staticmethod
    def load_vectorizer_only(vectorizer_filepath):
        """a static method for loading the vectorizer from file

        Args:
            vectorizer_filepath (str): the location of the serialized vectorizer
        Returns:
            an instance of SurnameVectorizer
        """
        with open(vectorizer_filepath) as fp:
            return SurnameVectorizer.from_serializable(json.load(fp))

    def save_vectorizer(self, vectorizer_filepath):
        """saves the vectorizer to disk using json

        Args:
            vectorizer_filepath (str): the location to save the vectorizer
        """
        with open(vectorizer_filepath, "w") as fp:
            json.dump(self._vectorizer.to_serializable(), fp)

    def get_vectorizer(self):
        """ returns the vectorizer """
        return self._vectorizer

    def set_split(self, split="train"):
        self._target_split = split
        self._target_df, self._target_size = self._lookup_dict[split]

    def __len__(self):
        return self._target_size

    def __getitem__(self, index):
        """the primary entry point method for PyTorch datasets

        Args:
            index (int): the index to the data point
        Returns:
            a dictionary holding the data point's:
                features (x_data)
                label (y_target)
                feature length (x_length)
        """
        row = self._target_df.iloc[index]

        surname_vector, vec_length = \
            self._vectorizer.vectorize(row.surname, self._max_seq_length)

        nationality_index = \
            self._vectorizer.nationality_vocab.lookup_token(row.nationality)

        return {'x_data': surname_vector,
                'y_target': nationality_index,
                'x_length': vec_length}

    def get_num_batches(self, batch_size):
        """Given a batch size, return the number of batches in the dataset

        Args:
            batch_size (int)
        Returns:
            number of batches in the dataset
        """
        return len(self) // batch_size
        

In [40]:
def generate_batches(dataset, batch_size, shuffle=True,
                     drop_last=True, device="cpu"):
    """
    A generator function which wraps the PyTorch DataLoader. It will
      ensure each tensor is on the write device location.
    """
    dataloader = DataLoader(dataset=dataset, batch_size=batch_size,
                            shuffle=shuffle, drop_last=drop_last)

    for data_dict in dataloader:
        out_data_dict = {}
        for name, tensor in data_dict.items():
            out_data_dict[name] = data_dict[name].to(device)
        yield out_data_dict


In [41]:
def column_gather(y_out, x_lengths):
    '''Get a specific vector from each batch datapoint in `y_out`.

    More precisely, iterate over batch row indices, get the vector that's at
    the position indicated by the corresponding value in `x_lengths` at the row
    index.

    Args:
        y_out (torch.FloatTensor, torch.cuda.FloatTensor)
            shape: (batch, sequence, feature)
        x_lengths (torch.LongTensor, torch.cuda.LongTensor)
            shape: (batch,)

    Returns:
        y_out (torch.FloatTensor, torch.cuda.FloatTensor)
            shape: (batch, feature)
    '''
    x_lengths = x_lengths.long().detach().cpu().numpy() - 1

    out = []
    for batch_index, column_index in enumerate(x_lengths):
        out.append(y_out[batch_index, column_index])

    return torch.stack(out)


In [57]:
class ElmanRNN(nn.Module):
    """ an Elman RNN built using the RNNCell """

    def __init__(self, input_size, hidden_size, batch_first=False):
        """
        Args:
            input_size (int): size of the input vectors
            hidden_size (int): size of the hidden state vectors
            bathc_first (bool): whether the 0th dimension is batch
        """
        super(ElmanRNN, self).__init__()

        self.rnn_cell = nn.RNNCell(input_size, hidden_size)

        self.batch_first = batch_first
        self.hidden_size = hidden_size

    def _initial_hidden(self, batch_size):
        return torch.zeros((batch_size, self.hidden_size))

    def forward(self, x_in, initial_hidden=None):
        """The forward pass of the ElmanRNN

        Args:
            x_in (torch.Tensor): an input data tensor.
                If self.batch_first: x_in.shape = (batch, seq_size, feat_size)
                Else: x_in.shape = (seq_size, batch, feat_size)
            initial_hidden (torch.Tensor): the initial hidden state for the RNN
        Returns:
            hiddens (torch.Tensor): The outputs of the RNN at each time step.
                If self.batch_first: hiddens.shape = (batch, seq_size, hidden_size)
                Else: hiddens.shape = (seq_size, batch, hidden_size)
        """
        if self.batch_first:
            batch_size, seq_size, feat_size = x_in.size()
            x_in = x_in.permute(1, 0, 2)
        else:
            seq_size, batch_size, feat_size = x_in.size()

        hiddens = []

        if initial_hidden is None:
            initial_hidden = self._initial_hidden(batch_size)
            initial_hidden = initial_hidden.to(x_in.device)

        hidden_t = initial_hidden

        for t in range(seq_size):
            hidden_t = self.rnn_cell(x_in[t], hidden_t)
            hiddens.append(hidden_t)

        hiddens = torch.stack(hiddens)

        if self.batch_first:
            hiddens = hiddens.permute(1, 0, 2)

        return hiddens

In [58]:

class SurnameClassifier(nn.Module):
    """ A Classifier with an RNN to extract features and an MLP to classify """

    def __init__(self, embedding_size, num_embeddings, num_classes,
                 rnn_hidden_size, batch_first=True, padding_idx=0):
        """
        Args:
            embedding_size (int): The size of the character embeddings
            num_embeddings (int): The number of characters to embed
            num_classes (int): The size of the prediction vector
                Note: the number of nationalities
            rnn_hidden_size (int): The size of the RNN's hidden state
            batch_first (bool): Informs whether the input tensors will
                have batch or the sequence on the 0th dimension
            padding_idx (int): The index for the tensor padding;
                see torch.nn.Embedding
        """
        super(SurnameClassifier, self).__init__()

        self.emb = nn.Embedding(num_embeddings=num_embeddings,
                                embedding_dim=embedding_size,
                                padding_idx=padding_idx)
        self.rnn = ElmanRNN(input_size=embedding_size,
                            hidden_size=rnn_hidden_size,
                            batch_first=batch_first)
        self.fc1 = nn.Linear(in_features=rnn_hidden_size,
                             out_features=rnn_hidden_size)
        self.fc2 = nn.Linear(in_features=rnn_hidden_size,
                             out_features=num_classes)
        print("\n 模型结构:")
        for name, param in classifier.named_parameters():
             print(f"{name.ljust(20)}|维度:{tuple(param.size())}")

        
    def forward(self, x_in, x_lengths=None, apply_softmax=False):
        """The forward pass of the classifier

        Args:
            x_in (torch.Tensor): an input data tensor.
                x_in.shape should be (batch, input_dim)
            x_lengths (torch.Tensor): the lengths of each sequence in the batch.
                They are used to find the final vector of each sequence
            apply_softmax (bool): a flag for the softmax activation
                should be false if used with the Cross Entropy losses
        Returns:
            the resulting tensor. tensor.shape should be (batch, output_dim)
        """
        x_embedded = self.emb(x_in)
        y_out = self.rnn(x_embedded)
        print(f"输入序列形状:{x_in.shape}-> 嵌人后:{x_embedded.shape}")
        print(f"RNN 输出形状:{y_out.shape}-> 聚合后:{y_out[:,-1, :].shape if x_lengths is None else'动态索引'}")
        if x_lengths is not None:
            y_out = column_gather(y_out, x_lengths)
        else:
            y_out = y_out[:, -1, :]

        y_out = F.relu(self.fc1(F.dropout(y_out, 0.5)))
        y_out = self.fc2(F.dropout(y_out, 0.5))


    
        return y_out


In [59]:
def set_seed_everywhere(seed, cuda):
    np.random.seed(seed)
    torch.manual_seed(seed)
    if cuda:
        torch.cuda.manual_seed_all(seed)

def handle_dirs(dirpath):
    if not os.path.exists(dirpath):
        os.makedirs(dirpath)


In [60]:
args = Namespace(
    # Data and path information
    surname_csv=r"C:\Users\cherish\PycharmProjects\NLP\RNN\surnames_with_splits.csv",
    vectorizer_file="vectorizer.json",
    model_state_file="model.pth",
    save_dir="model_storage/ch6/surname_classification",
    # Model hyper parameter
    char_embedding_size=100,
    rnn_hidden_size=64,
    # Training hyper parameter
    num_epochs=5,
    learning_rate=1e-3,
    batch_size=64,
    seed=1337,
    early_stopping_criteria=5,
    # Runtime hyper parameter
    cuda=True,
    catch_keyboard_interrupt=True,
    reload_from_files=False,
    expand_filepaths_to_save_dir=True,
)

# Check CUDA
if not torch.cuda.is_available():
    args.cuda = False

args.device = torch.device("cuda" if args.cuda else "cpu")

print("Using CUDA: {}".format(args.cuda))

if args.expand_filepaths_to_save_dir:
    args.vectorizer_file = os.path.join(args.save_dir,
                                        args.vectorizer_file)

    args.model_state_file = os.path.join(args.save_dir,
                                         args.model_state_file)

# Set seed for reproducibility
set_seed_everywhere(args.seed, args.cuda)

# handle dirs
handle_dirs(args.save_dir)

if args.reload_from_files and os.path.exists(args.vectorizer_file):
    # training from a checkpoint
    dataset = SurnameDataset.load_dataset_and_load_vectorizer(args.surname_csv,
                                                              args.vectorizer_file)
else:
    # create dataset and vectorizer
    dataset = SurnameDataset.load_dataset_and_make_vectorizer(args.surname_csv)
    dataset.save_vectorizer(args.vectorizer_file)

vectorizer = dataset.get_vectorizer()

Using CUDA: False


In [61]:
classifier = SurnameClassifier(embedding_size=args.char_embedding_size,
                               num_embeddings=len(vectorizer.char_vocab),
                               num_classes=len(vectorizer.nationality_vocab),
                               rnn_hidden_size=args.rnn_hidden_size,
                               padding_idx=vectorizer.char_vocab.mask_index)





 模型结构:
emb.weight          |维度:(80, 100)
rnn.rnn_cell.weight_ih|维度:(64, 100)
rnn.rnn_cell.weight_hh|维度:(64, 64)
rnn.rnn_cell.bias_ih|维度:(64,)
rnn.rnn_cell.bias_hh|维度:(64,)
fc1.weight          |维度:(64, 64)
fc1.bias            |维度:(64,)
fc2.weight          |维度:(18, 64)
fc2.bias            |维度:(18,)


In [62]:
def make_train_state(args):
    return {'stop_early': False,
            'early_stopping_step': 0,
            'early_stopping_best_val': 1e8,
            'learning_rate': args.learning_rate,
            'epoch_index': 0,
            'train_loss': [],
            'train_acc': [],
            'val_loss': [],
            'val_acc': [],
            'test_loss': -1,
            'test_acc': -1,
            'model_filename': args.model_state_file}

In [63]:
def update_train_state(args, model, train_state):
    """Handle the training state updates.

    Components:
     - Early Stopping: Prevent overfitting.
     - Model Checkpoint: Model is saved if the model is better

    :param args: main arguments
    :param model: model to train
    :param train_state: a dictionary representing the training state values
    :returns:
        a new train_state
    """

    # Save one model at least
    if train_state['epoch_index'] == 0:
        torch.save(model.state_dict(), train_state['model_filename'])
        train_state['stop_early'] = False

    # Save model if performance improved
    elif train_state['epoch_index'] >= 1:
        loss_tm1, loss_t = train_state['val_loss'][-2:]

        # If loss worsened
        if loss_t >= loss_tm1:
            # Update step
            train_state['early_stopping_step'] += 1
        # Loss decreased
        else:
            # Save the best model
            if loss_t < train_state['early_stopping_best_val']:
                torch.save(model.state_dict(), train_state['model_filename'])
                train_state['early_stopping_best_val'] = loss_t

            # Reset early stopping step
            train_state['early_stopping_step'] = 0

        # Stop early ?
        train_state['stop_early'] = \
            train_state['early_stopping_step'] >= args.early_stopping_criteria

    return train_state


def compute_accuracy(y_pred, y_target):
    _, y_pred_indices = y_pred.max(dim=1)
    n_correct = torch.eq(y_pred_indices, y_target).sum().item()
    return n_correct / len(y_pred_indices) * 100

def compute_accuracy(y_pred, y_target):
    _, y_pred_indices = y_pred.max(dim=1)
    n_correct = torch.eq(y_pred_indices, y_target).sum().item()
    return n_correct / len(y_pred_indices) * 100


classifier = classifier.to(args.device)
dataset.class_weights = dataset.class_weights.to(args.device)

loss_func = nn.CrossEntropyLoss(dataset.class_weights)
optimizer = optim.Adam(classifier.parameters(), lr=args.learning_rate)
scheduler = optim.lr_scheduler.ReduceLROnPlateau(optimizer=optimizer,
                                                 mode='min', factor=0.5,
                                                 patience=1)

train_state = make_train_state(args)

epoch_bar = tqdm(desc='training routine',
                          total=args.num_epochs,
                          position=0)

dataset.set_split('train')

training routine: 100%|████████████████████████████████████████████████████████████| 5/5 [29:11:03<00:00, 21012.67s/it]


In [64]:
train_bar = tqdm(desc='split=train',
                          total=dataset.get_num_batches(args.batch_size),
                          position=1,
                          leave=True,
                 )
dataset.set_split('val')


split=train:  83%|█████████████████████████     | 100/120 [29:11:05<5:50:13, 1050.65s/it, acc=35.7, epoch=0, loss=1.95]


In [66]:
val_bar = tqdm(desc='split=val',
                        total=dataset.get_num_batches(args.batch_size),
                        position=1,
                        leave=True,
               )

try:
    for epoch_index in range(args.num_epochs):
        print(f"\nEpoch [{epoch_index + 1}/{args.num_epochs}]")
        print("-" * 50)

        train_state['epoch_index'] = epoch_index

        # Iterate over training dataset

        # setup: batch generator, set loss and acc to 0, set train mode on
        dataset.set_split('train')
        batch_generator = generate_batches(dataset,
                                           batch_size=args.batch_size,
                                           device=args.device)
        running_loss = 0.0
        running_acc = 0.0
        classifier.train()

        for batch_index, batch_dict in enumerate(batch_generator):
            # the training routine is these 5 steps:

            # --------------------------------------
            # step 1. zero the gradients
            optimizer.zero_grad()

            # step 2. compute the output
            y_pred = classifier(x_in=batch_dict['x_data'],
                                x_lengths=batch_dict['x_length'])

            # step 3. compute the loss
            loss = loss_func(y_pred, batch_dict['y_target'])

            running_loss += (loss.item() - running_loss) / (batch_index + 1)

            # step 4. use loss to produce gradients
            loss.backward()

            # step 5. use optimizer to take gradient step
            optimizer.step()
            # -----------------------------------------
            # compute the accuracy
            acc_t = compute_accuracy(y_pred, batch_dict['y_target'])
            running_acc += (acc_t - running_acc) / (batch_index + 1)

            # update bar
            if batch_index % 25 == 0:
                train_bar.set_postfix(loss=running_loss, acc=running_acc, epoch=epoch_index)
            train_bar.update()

        train_state['train_loss'].append(running_loss)
        train_state['train_acc'].append(running_acc)

        # Iterate over val dataset

        # setup: batch generator, set loss and acc to 0; set eval mode on

        dataset.set_split('val')
        batch_generator = generate_batches(dataset,
                                           batch_size=args.batch_size,
                                           device=args.device)
        running_loss = 0.
        running_acc = 0.
        classifier.eval()

        for batch_index, batch_dict in enumerate(batch_generator):
            # compute the output
            y_pred = classifier(x_in=batch_dict['x_data'],
                                x_lengths=batch_dict['x_length'])

            # step 3. compute the loss
            loss = loss_func(y_pred, batch_dict['y_target'])
            running_loss += (loss.item() - running_loss) / (batch_index + 1)

            # compute the accuracy
            acc_t = compute_accuracy(y_pred, batch_dict['y_target'])
            running_acc += (acc_t - running_acc) / (batch_index + 1)
            if batch_index % 25 == 0:
                val_bar.set_postfix(loss=running_loss, acc=running_acc, epoch=epoch_index)
            val_bar.update()

        train_state['val_loss'].append(running_loss)
        train_state['val_acc'].append(running_acc)

        train_state = update_train_state(args=args, model=classifier,
                                         train_state=train_state)

        scheduler.step(train_state['val_loss'][-1])

        train_bar.n = 0
        val_bar.n = 0
        epoch_bar.update()

        if train_state['stop_early']:
            break

except KeyboardInterrupt:
    print("Exiting loop")



# compute the loss & accuracy on the test set using the best available model

classifier.load_state_dict(torch.load(train_state['model_filename']))

classifier = classifier.to(args.device)
dataset.class_weights = dataset.class_weights.to(args.device)
loss_func = nn.CrossEntropyLoss(dataset.class_weights)

dataset.set_split('test')
batch_generator = generate_batches(dataset,
                                   batch_size=args.batch_size,
                                   device=args.device)
running_loss = 0.
running_acc = 0.
classifier.eval()

for batch_index, batch_dict in enumerate(batch_generator):
    # compute the output
    y_pred = classifier(batch_dict['x_data'],
                        x_lengths=batch_dict['x_length'])

    # compute the loss
    loss = loss_func(y_pred, batch_dict['y_target'])
    loss_t = loss.item()
    running_loss += (loss_t - running_loss) / (batch_index + 1)

    # compute the accuracy
    acc_t = compute_accuracy(y_pred, batch_dict['y_target'])
    running_acc += (acc_t - running_acc) / (batch_index + 1)

train_state['test_loss'] = running_loss
train_state['test_acc'] = running_acc




split=val:   0%|                                                  | 0/25 [03:07<?, ?it/s, acc=46.9, epoch=4, loss=1.74]

[Ait=train:   0%|                                       | 0/120 [03:17<00:30,  3.95it/s, acc=45.3, epoch=0, loss=2.06]


Epoch [1/5]
--------------------------------------------------
CharVocab 特征标准化后开始索引: [ 2 22 23 27  8 23 12  7  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 41  5 16  3  0  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 56 18 53 18 15 14  7  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20  8 23 43 14 18 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24  7 14 23 25  5 21  5  6  5  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 40 21  5  8  5 25  5 53  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30 23 31 31 23 19  7 25  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 49 15 16 19  5 12  7  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29  8  7 25 25  7 21  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 37  7 23  3  0  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 42  8  5 1


[Ait=train:  21%|███████▉                              | 25/120 [03:23<00:24,  3.95it/s, acc=34.9, epoch=0, loss=1.98]

CharVocab 特征标准化后开始索引: [ 2 47 10 16 18 12 14  5 53  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 56 18 19  7  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 26  7 27 18 21  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20  8 18 14  8  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4  7 21 10 18 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 40 25 15 23 19  8  6  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 41  5  5 14 18  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 53 23 31  5 53  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 34 23 43  8  5 31 27  5 25  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 54 14  8  5 53 27 14 16  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32 11 27  6  5  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=train:  42%|███████████████▊                      | 50/120 [03:28<00:17,  3.95it/s, acc=35.4, epoch=0, loss=1.96]

输入序列形状:torch.Size([64, 19])-> 嵌人后:torch.Size([64, 19, 100])
RNN 输出形状:torch.Size([64, 19, 64])-> 聚合后:动态索引
CharVocab 特征标准化后开始索引: [ 2 41 18 12 23 25  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 34  7 23 28 18  8  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 27 36  7 12  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4  7 15 15  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 10 10  7 14 11 21  5 53  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4 43  8 18 14  8 31  7 14  5 53 27 14 16  3  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  5 31 27  6  5 53  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 41  5 21  7 25  5  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 34 23 43  5 27 23  7  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 13 15  7 27 18 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度


[Ait=train:  62%|███████████████████████▊              | 75/120 [03:34<00:11,  3.95it/s, acc=35.7, epoch=0, loss=1.95]

CharVocab 特征标准化后开始索引: [ 2 24 15 11 51  7 31  7  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 47 61 41  5 11 15 14 18  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 31  6  8  7 11 27  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  7 39 23 43 18 14  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 34  7 12 18 15  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29 31  7  6  6 18 15  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 15  5 11 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32 18  7 15  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  7 31 23 10  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  5 10 10 27  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 31 31 19  5  5 12  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=train:  83%|██████████████████████████████▊      | 100/120 [03:40<00:05,  3.95it/s, acc=35.8, epoch=0, loss=1.93]

CharVocab 特征标准化后开始索引: [ 2  4 11 25 25 18 27  5 25  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24 18 23 15  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  5 15 23 19  5 21 18  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 23 21 21  5 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  7 15  7 33  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 31 18 23 21  7 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32  5 25 25  7 23 15 18  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [2 4 5 6 7 8 3 0 0 0 0 0 0 0 0 0 0 0 0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 49  7 15 14 23 25 27  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24  8  5 11 15 16  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 37  7  8 18 15  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 


[Ait=val:   0%|                                                  | 0/25 [00:27<?, ?it/s, acc=37.5, epoch=0, loss=2.08]
[Ait=val:   4%|█▋                                        | 1/25 [00:28<11:12, 28.01s/it, acc=37.5, epoch=0, loss=2.08]

CharVocab 特征标准化后开始索引: [ 2 30  5 19  8  7 12  7 21  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20  8  7 15 11 27  8 23 25  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32  7 27  7 15  7  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32  7 31  7 14  8  5 25  6 27 18 53  3  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 34  7 39 39  7 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32  5  8 11 25  5 53 27 14 16  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 44  7 21  7 25  5 11 43  8 23  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  7 23 14  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 37 15 18 36 18  6  6  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 27 14 18 15  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9  6 14 23 25  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=val:   8%|███▎                                      | 2/25 [00:28<04:27, 11.63s/it, acc=37.5, epoch=0, loss=2.08]
[Ait=val:  12%|█████                                     | 3/25 [00:28<02:20,  6.38s/it, acc=37.5, epoch=0, loss=2.08]

输入序列形状:torch.Size([64, 19])-> 嵌人后:torch.Size([64, 19, 100])
RNN 输出形状:torch.Size([64, 19, 64])-> 聚合后:动态索引
CharVocab 特征标准化后开始索引: [ 2 45  7 21 31 23  8  7 25  5 53  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 31  5  5 28  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4 33 18 12 18 15 10  7 11 21  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 43  8  5  5 15 31  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20  7  6  8  7 27  7 43  8  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30 11 33 16 14 23 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20  7 27  6 15  5  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24  7 31 10  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 43  8 64 28 18 15  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 10 12 11 31 23 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度


[Ait=val:  16%|██████▋                                   | 4/25 [00:28<01:22,  3.90s/it, acc=37.5, epoch=0, loss=2.08]


输入序列形状:torch.Size([64, 19])-> 嵌人后:torch.Size([64, 19, 100])
RNN 输出形状:torch.Size([64, 19, 64])-> 聚合后:动态索引
CharVocab 特征标准化后开始索引: [ 2  4  7 21 11 15  7  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 37 11 28 28  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 47 31 23 53 18 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 34 23 27  8 23 21 11 15  7 16  7  3  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 49 18  7 15 27  5 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 46 18 23 21  5 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24 23 27  6 31 18 15  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29  7 15 15 18  6  6  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22 11 33  7 25 19  7 23  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4  7 14  7  5 14  7  3  0  0  0  0  0  0  0  0  0  0]
向量长度

[Ait=val:  24%|██████████                                | 6/25 [00:28<00:35,  1.88s/it, acc=37.5, epoch=0, loss=2.08]
[Ait=val:  28%|███████████▊                              | 7/25 [00:28<00:25,  1.40s/it, acc=37.5, epoch=0, loss=2.08]

CharVocab 特征标准化后开始索引: [ 2 29  7 11  3  0  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 37 18 18 10  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30 23 31  7 25  5  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  6 15  7 25 12  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 23 15  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  5 11  6 18 21  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 10 10  5 11 12  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 37  7 53 23 27  5 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4  7 25 25  5 11 27  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 15 16 11 27  8 14 23 25  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 13  7 23 15 10  7 23 15 25  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=val:  36%|███████████████                           | 9/25 [00:28<00:13,  1.21it/s, acc=37.5, epoch=0, loss=2.08]
[Ait=val:  40%|████████████████▍                        | 10/25 [00:29<00:09,  1.53it/s, acc=37.5, epoch=0, loss=2.08]

CharVocab 特征标准化后开始索引: [ 2 34  5 15 36  5  5 12  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20  8 15 16 27  7 25  6  8  5 51  5 11 31  5 27  3  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 44  5 27  8 23  8  7 15  7  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29  7 10 18 15  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 34 11 12  7  6  5 53  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20  8 18  8 31  7 14  5 53 27 14 16  3  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 51 23 14 18 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 41  5 21 51  7  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4 23 31 31 18 16  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 15 43  8 18  6  6 23  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 46 18 53 23 25 18  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=val:  48%|███████████████████▋                     | 12/25 [00:29<00:05,  2.39it/s, acc=37.5, epoch=0, loss=2.08]

输入序列形状:torch.Size([64, 19])-> 嵌人后:torch.Size([64, 19, 100])
RNN 输出形状:torch.Size([64, 19, 64])-> 聚合后:动态索引
CharVocab 特征标准化后开始索引: [ 2 34 23 18 15 23  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 49  7 15 27  5 25 27  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 15 15 23 19 11 43 43 23  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 19 19 23  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32 18 14 31 18 27  8 18 53  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 26  7  6 18 15  8  5 11 27 18  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 15  7 14 23 12  7  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29 31 18 18 27  5 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 31 18 23 21  7 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 44 23 25  3  0  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度


[Ait=val:  56%|██████████████████████▉                  | 14/25 [00:29<00:03,  3.30it/s, acc=37.5, epoch=0, loss=2.08]

CharVocab 特征标准化后开始索引: [ 2 22  7 15 10  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 31  5  5  6 21  7 18 14 18 15 27  3  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20  8 15 23 27  6  5 12  5 11 31  5 11  3  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20  5 31 31 23 25 27  5 25  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 25 23 43  5 31  7 27  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 47 33 23 21 11 14  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 15 23  7 25 23  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 31 43  5 43 14  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 35 14 18 12  7  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 41  5 27  7 15 23  5  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32  7 43  8 21 18 23 18 15  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=val:  64%|██████████████████████████▏              | 16/25 [00:29<00:02,  4.44it/s, acc=37.5, epoch=0, loss=2.08]


输入序列形状:torch.Size([64, 19])-> 嵌人后:torch.Size([64, 19, 100])
RNN 输出形状:torch.Size([64, 19, 64])-> 聚合后:动态索引
CharVocab 特征标准化后开始索引: [ 2 44 18  5 21  7 25 27  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 34  5 27 18 14  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 56 18 18 53 18 15 27  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 40 31 31 36  5  5 12  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 49 16 31 18  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4  5  5 21 18 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 49  7 15 15  5  6  6  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 13  5 39  6 23 14  5 53  7  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  8  7 31  8  5 11 10  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 46 18  5 25 23  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度

[Ait=val:  72%|█████████████████████████████▌           | 18/25 [00:29<00:01,  5.51it/s, acc=37.5, epoch=0, loss=2.08]
[Ait=val:  80%|████████████████████████████████▊        | 20/25 [00:29<00:00,  6.62it/s, acc=37.5, epoch=0, loss=2.08]

CharVocab 特征标准化后开始索引: [ 2  9  6 23 16 18  8  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 43 31 18  5 12  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  7 10 18 15  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22 11 21 18  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32 11 31 19  7 15 18 31 31 23  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 26 18  8 11 25  6  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20  5  6  6  5 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 19 15 18 25 18 53  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 37 61  7 21 10 15  5 27 23  5  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22 18 23 25  6 33 18  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30 23 25 14  5  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=val:  88%|████████████████████████████████████     | 22/25 [00:30<00:00,  7.56it/s, acc=37.5, epoch=0, loss=2.08]

输入序列形状:torch.Size([64, 19])-> 嵌人后:torch.Size([64, 19, 100])
RNN 输出形状:torch.Size([64, 19, 64])-> 聚合后:动态索引
CharVocab 特征标准化后开始索引: [ 2  9 31 18 27 23  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29  7 15 43  5 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 15  6 18 31  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29  7 11 12 23 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  7 10 10  7 19  8  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 28 15 23 43  7 25  5  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4 43  8  7 51 14  5  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 41 18  7 16  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 49 15 18 27  6  5 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [2 4 5 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]
向量长度: 19
CharVocab 特征标准


training routine: 6it [03:49, 44.37s/it]                                                                               

输入序列形状:torch.Size([64, 19])-> 嵌人后:torch.Size([64, 19, 100])
RNN 输出形状:torch.Size([64, 19, 64])-> 聚合后:动态索引
CharVocab 特征标准化后开始索引: [ 2 17 14 23 25 25 18 15  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24 18 21 51  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4 43  8 18 14 21  7 27  5 53  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4 27  7 31  7 10  7 25  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 56  7 31 31  7 25 43 18  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 13 15  7 25 14 31  7 25 12  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29  5  5 12 36 23 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 47 31 12 23 25 19  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  5 14 15 11 27  8 18 53  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 46 18  3  0  0  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度


[Ait=train:   0%|                                       | 0/120 [03:48<00:30,  3.95it/s, acc=32.8, epoch=1, loss=1.91]

CharVocab 特征标准化后开始索引: [ 2  4 27  7  8 23 31  5 53  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29  8  7 25 18 21  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  5 14 15  5 25  5 27  5 53  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  7 39 39  7 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 35 31 16  7  8 23 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 34 18  6 27 43  8  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 25 18 23 12 18 15 27  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  7 25  7 25 23  7  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20  8 11  8 31  5 53  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 47 25  5  8  7 15  7  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 31 18 51 51  5  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=train:  21%|████████▎                               | 25/120 [03:54<00:24,  3.95it/s, acc=35, epoch=1, loss=1.89]

CharVocab 特征标准化后开始索引: [ 2 42  8 23 14 23 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 49 18 31  6 27 21  7 25  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 26  7 31  6  8 18 15  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  8 11 23  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  8  7 21  5  5 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20 33  7 39 14  5 36 27 14 23  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29 15  7 12 16  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32 23 27  8  7 15  7  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 34  7  8  7 27  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 47 61 34 18 23 31 31  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 41 18  7 12 18 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=train:  42%|███████████████▊                      | 50/120 [04:00<00:17,  3.95it/s, acc=34.9, epoch=1, loss=1.89]

CharVocab 特征标准化后开始索引: [ 2 34  7 23 28 18  8  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  6  7 21 51  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 13 11 14 11 12  7  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29 23 31 18 27  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22 11  5  3  0  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 11 19 12 18 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 13 23 15 21 23 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 46 18 16 31  7 25 12  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 37 23  3  0  0  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 26  5 31 28 28  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 27 27  7 28  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=val:   0%|                                          | 0/25 [00:46<00:02,  9.20it/s, acc=37.5, epoch=0, loss=2.08]

CharVocab 特征标准化后开始索引: [ 2  4  5 21 18 18 53  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 41 11  7 12  8  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29 11 31 23 12  5 53  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29 31  5 53 18 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 45  5 25  3  0  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 35 27 27  7  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 45  7 21  5 23 12  7  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20  7 10 15  7 31  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32 31  7 43 14 10 11 15 25  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22 18 31 31 23 18 15  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 13  5  6  8 18 15 23 25 19  8  7 21  3  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=train:  62%|███████████████████████▊              | 75/120 [04:07<00:11,  3.95it/s, acc=35.6, epoch=1, loss=1.89]

CharVocab 特征标准化后开始索引: [ 2 47 61 22  7 19  7 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [2 4 5 6 7 8 3 0 0 0 0 0 0 0 0 0 0 0 0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 14 18 15 23 31  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29 15  7 16  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24 23 10 10 31 18 36  8 23  6 18  3  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  7 31 23 10  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29 15 18 18 25 36  5  5 12  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 40 31 31 15  5  6  6  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 43  8  6  8  5 53 18 25  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 54 15 10  7 25 18 14 55  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 37 18 31  7 43 15  5 23 57  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29 


[Ait=train:  83%|██████████████████████████████▊      | 100/120 [04:12<00:05,  3.95it/s, acc=36.1, epoch=1, loss=1.87]

CharVocab 特征标准化后开始索引: [ 2 32  7 14  7 31 18 23 25 23 14  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 41 18 25 33 16  7 18 53  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30 31  7 43  8 25 18 53  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 25 16 12 18 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 34  7 33  7 15 23  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 49  5 25 18 12 18 31 25 23 14  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 46 18 19 19  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 25  6 15  5 51  5 53  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 41 23 33 33  5  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 43 14  7 16  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29  5 27 31 23 25 19  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=val:   0%|                                          | 0/25 [00:59<00:02,  9.20it/s, acc=43.8, epoch=1, loss=1.53]

CharVocab 特征标准化后开始索引: [ 2 13  7 14  8  5 11 15 16  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24 15 65 19 18 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4 18 15 15 16  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7  6 33 14  5 53 27 14 16  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  5 15  5 27  8  7 53  6 27 18 53  3  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24 23 15  7  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32 15  7 12  7 43  8  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 41 23 12 12 18 31 31  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  6 11 10 10 27  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 56  5 16 27 18  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 42 23 21 23 25  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


training routine: 7it [04:21, 40.29s/it]█████████████████| 25/25 [01:02<00:00,  5.88s/it, acc=43.8, epoch=1, loss=1.53]

CharVocab 特征标准化后开始索引: [ 2  9 10 31  7 18 53  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 11 27  8 18 53  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  5 19  8  7 12  7 21  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 21  7 15 23  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 46 18 23 21  5 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 45 18 31 18 33 25 23 14  5 53  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 27 14 18 15  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24 23 18 11  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24 18 31 31 18 21 27  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4 18  7 19 11 18  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  5 11 14  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=train:   0%|                                       | 0/120 [04:19<00:30,  3.95it/s, acc=32.8, epoch=2, loss=1.97]

CharVocab 特征标准化后开始索引: [ 2 46  5 19  7 25  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  7 16 18 27  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  7 10 10  7 19  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 45 11 15  7 53 14  5 53  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  5 11  6  8 36 23 43 14  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 40 12 19 31 18 16  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29  5 25 33  7 31 18 33  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 43  8 11 31  6  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4  7  8  7 25  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32  7 33 33 23  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 49 23 27 14  5 15 27 14 16  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=train:  21%|████████▏                              | 25/120 [04:26<00:24,  3.95it/s, acc=38.6, epoch=2, loss=1.8]

输入序列形状:torch.Size([64, 19])-> 嵌人后:torch.Size([64, 19, 100])
RNN 输出形状:torch.Size([64, 19, 64])-> 聚合后:动态索引
CharVocab 特征标准化后开始索引: [ 2 17  8  7 31 14  5  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32 15  5  5 21 28 23 18 31 12  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 37 18 21 23 12  5 53 23 43  8  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 56 23  6  7 31 23  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4  5 21 23 14  7  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 49  7 19  7 25  5  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  7 14 23 16 11 15  7 23  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 31  5 11 28  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24 31 18 15 14 27 18  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 46  7 39 23 25  6 27 18 53  3  0  0  0  0  0  0  0  0]
向量长度


[Ait=train:  42%|███████████████▊                      | 50/120 [04:32<00:17,  3.95it/s, acc=39.1, epoch=2, loss=1.81]

CharVocab 特征标准化后开始索引: [ 2 17  5  8 12  7  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 25 12 15 18 18 53 27 14 16  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 49  5  8  5 12 11 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 37 18  8  6 16  7 15  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32 18 31 31  7 21 16  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32 31  7 23 27 18  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 27 36  7 12  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 13  7 14  8  5 11 15 16  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 34  7 19 18 31  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24  7  6  6  7 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  7 31 53  7 19 19 23  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=train:  62%|███████████████████████▊              | 75/120 [04:39<00:11,  3.95it/s, acc=38.3, epoch=2, loss=1.82]

CharVocab 特征标准化后开始索引: [ 2 45 18 28 28 18 15 27  5 25  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 40 43 43 31 18 27  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  6 15  7 25 19 18  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 46 16 25 43  8  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24  7 31 23  6 14 23 25  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  7 15  6 21  7 25 25  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 41  5 19  7  6 14  5  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  5 15 43  5 27  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20  7 25 25  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 18 53 18 15 23 25 27  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24  7 33  7  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=train:  83%|██████████████████████████████▊      | 100/120 [04:45<00:05,  3.95it/s, acc=38.2, epoch=2, loss=1.81]

CharVocab 特征标准化后开始索引: [ 2 13 23  5 25 23 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 13 15 23 18 12  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30 23 16  7 14 18  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32 23 31 31 18 15  6  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 37 18 25 23 27  5 53  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 25 27  5 11 15  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 31 10 15 18 43  8  6  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 56  7 19 23 25  5 28 28  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 45  5 31 31 18 16  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20 11  5 43 43  5  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 56  7 31 18 25  6 27 18 53  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=val:   0%|                                          | 0/25 [01:32<02:27,  5.88s/it, acc=32.8, epoch=2, loss=1.64]

CharVocab 特征标准化后开始索引: [ 2 30 11 15  7 19 11 43  8 23  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 13  5 39  6 23 14  5 53  7  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29 31 18 33 18 15 21  7 25  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 26 18 27  6 36  5  5 12  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 44  7 14 11 10  7  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32  7 14  3  0  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 31 10 18 15  6  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29 11 12 53  7 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 13  5 15 15 18 27  6  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 40 25 19 18 31  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  7 21  7  6 25 11 15  5 53  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 

training routine: 8it [04:54, 37.86s/it]

输入序列形状:torch.Size([64, 19])-> 嵌人后:torch.Size([64, 19, 100])
RNN 输出形状:torch.Size([64, 19, 64])-> 聚合后:动态索引

Epoch [4/5]
--------------------------------------------------
CharVocab 特征标准化后开始索引: [ 2 13 15 23 18 31  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  8  7 14  8 25  5 53 27 14 16  3  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  5  8  7 25  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  5 15 43  5 27  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24  7 31  5 57 16 31  5 27  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  5 31 12  7  6 23  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24 23 31 31  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32  7 36  7 15 23 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32 18 18 15  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引:


[Ait=train:   0%|                                       | 0/120 [04:52<00:30,  3.95it/s, acc=34.4, epoch=3, loss=1.71]

CharVocab 特征标准化后开始索引: [ 2  9 53 18 27  6  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 37 11 15  5 53  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30 23 31 31  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 34  7 14  7 27  7  6  5  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 44  7 21  7 19  7  6  7  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 15 15 23 19  8 23  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 23 25  7 19 15  7  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 43  8 11 27  6 18 15  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  7 36  6 23 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20  8  7 10  7 25  5 53  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 46 23 19  5 15 25 18 15  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=train:  21%|███████▉                              | 25/120 [04:59<00:24,  3.95it/s, acc=39.6, epoch=3, loss=1.76]

CharVocab 特征标准化后开始索引: [ 2  9 36  7 12  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32  7 25 19  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 21  7 15  6  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 31  5  5 28  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 40 43 14 18 15 27 31 18 16  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 25 27 18 31 31  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7  8 23 25 16  7  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4 43  8  7 25 19 31 23  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  5 27  8 18 25 14  5  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24  5  6  5 14 11  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24  7 51  5  5 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=train:  42%|███████████████▊                      | 50/120 [05:05<00:17,  3.95it/s, acc=39.2, epoch=3, loss=1.74]

CharVocab 特征标准化后开始索引: [ 2 49  7 33 16 11 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24  8  5 11 15 23  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24  5 11 27  6  5 11 10  5 27  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 13 11 31 14 18 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29  7 43  8 23 25 27 14 16  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 21 25 18 15  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 26 15 18 25 25  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 40  5 23 25  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 31  5 25 18 16  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 31  5 11 28  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4  8 11 15 10  5 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=train:  62%|███████████████████████▊              | 75/120 [05:11<00:11,  3.95it/s, acc=38.9, epoch=3, loss=1.75]

CharVocab 特征标准化后开始索引: [ 2 17  7 25  6  7 25  7  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22 18 23 12 31  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 53 23 25  5 53 23  6 27 14 23  3  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4  8  7 16 18 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 56  7 27 27  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 56  5 25  3  0  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30 23  8 18 18 25 14  5 53  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 10 18 31 31 70  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 26 18 31 31 23 25 19  6  5 25  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29  5 27 31 23 25 19  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29 15  7 10 27 14 23  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=train:  83%|██████████████████████████████▊      | 100/120 [05:17<00:05,  3.95it/s, acc=38.5, epoch=3, loss=1.77]

CharVocab 特征标准化后开始索引: [ 2 13 18 25 25  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 56  5  3  0  0  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 31  5 11 28  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 41  7 21  5 27  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24 23 21 10 18 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30 11 33 16 43  8 14  7  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  5 21 21 18 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20 31  5 27 18  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22 11 19 19 23 25 27  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 42  7 10 15  5 53 27 14 16  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  8  7 21  5 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=val:   0%|                                          | 0/25 [02:04<02:27,  5.88s/it, acc=45.3, epoch=3, loss=1.96]

输入序列形状:torch.Size([64, 19])-> 嵌人后:torch.Size([64, 19, 100])
RNN 输出形状:torch.Size([64, 19, 64])-> 聚合后:动态索引
CharVocab 特征标准化后开始索引: [ 2 37  7 15 27 23 19  5 53  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 49  7 15 27  5 25 27  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4 18 15 15 16  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29 23 31 31  7 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20 11 59 31 31  7 15  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 44 11 12  5 53 23 43  8  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22 23 25  5  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 41  5 21  7 19 25  5 31 23  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24 18 15 10 16  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 41  5 31 12 74 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度

training routine: 9it [05:25, 35.95s/it]

输入序列形状:torch.Size([64, 19])-> 嵌人后:torch.Size([64, 19, 100])
RNN 输出形状:torch.Size([64, 19, 64])-> 聚合后:动态索引

Epoch [5/5]
--------------------------------------------------
CharVocab 特征标准化后开始索引: [ 2 41  5  6  8  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4 15 11 39 23 31 31  5  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 34  7 39 39  7 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32  7 18 53 27 14 16  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20  5 15 21  7 43  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 49  8 23  3  0  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 34 18 18 12  8  7 21  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 25 27 18 31 31  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20 11  6  6 27  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引:


[Ait=train:   0%|                                       | 0/120 [05:24<00:30,  3.95it/s, acc=28.1, epoch=4, loss=1.71]

CharVocab 特征标准化后开始索引: [ 2 30 43 28  7 12 12 18 25  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 35 10 23  3  0  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4  7 15  7 25  6 23 25  5  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24  5 10  7 16  7 27  8 23  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 49 18  7 43  5 43 14  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24 64 11 28 18 15  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  7 21  7 12  7  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 36  7 12  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  5 15  7 31 18 33  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24  5 18 25 23 19 27 21  7 25 25  3  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22 18 15 10 18 15  6  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=train:  21%|███████▉                              | 25/120 [05:29<00:24,  3.95it/s, acc=39.8, epoch=4, loss=1.68]

CharVocab 特征标准化后开始索引: [ 2  4  7 25 27 31 18 16  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32  7 11 12 23 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 33  6 18 19  5 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 15  5 11 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29 18 23 27 31 18 15  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 49  7 27 43  7 31  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 71 31 11 27  7 15 27 14 23  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 46  5 53 18  6  6  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30 23 25 25 23  8  7 25  5 53  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 29  7 15 43 77  7  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4 11 15 15 18 31 31  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=train:  42%|███████████████▊                      | 50/120 [05:35<00:17,  3.95it/s, acc=39.4, epoch=4, loss=1.67]

CharVocab 特征标准化后开始索引: [ 2 40 25 15 23 19  8  6  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 53 18 15 16  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 45 18 14 11 31 23 25  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22 23 27 21  7  6 11 31 31 23 25  3  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 37  7  8 18 15  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24  7 43 16  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 35 21  7 23  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 47 28 28 18 15 21  7 25 27  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30 23 28 27 11 12  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32 31  7  8 11  6  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 19 11 23 15 18  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=train:  62%|███████████████████████▊              | 75/120 [05:42<00:11,  3.95it/s, acc=38.7, epoch=4, loss=1.71]

CharVocab 特征标准化后开始索引: [ 2 49  5 31 27  5 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 45 23 14  8  7 15 18 53 23  6 43  8  3  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 41  7 53 18 25 25  7  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 31  5 11 28  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 34 18 36 27  6 18  7 12  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 40 12 36  7 15 12 27  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 10 10  5  6  6  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 42  7 27 14  7 25  5 53  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32 18  7 11 21  5 25  6  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  7 53 43  8  7 14  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 47  6  6  3  0  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=train:  83%|██████████████████████████████▊      | 100/120 [05:49<00:05,  3.95it/s, acc=38.6, epoch=4, loss=1.74]

CharVocab 特征标准化后开始索引: [ 2 49 23  6  7 18 53 27 14 16  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 23 25  7 19 15  7  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 26  7 31 31  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 13 15 18 23 19  8  6  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 26 23 31 14 23 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 10 12 11 31 19  7 33 23 18 53  3  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30 23 28 27 11 12  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 37  5 10 15 16 27  8 18 53  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 23 33  7 36  7  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 35 25 25  7 31 31 27  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 37  7 31  6  5 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 


[Ait=val:   0%|                                          | 0/25 [02:35<02:27,  5.88s/it, acc=32.8, epoch=4, loss=1.86]

CharVocab 特征标准化后开始索引: [ 2  9 53 18 25  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 49 18 25 12 31 18 10 11 15 16  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  6  5 15 18 16  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30 43 23 25  6 16 15 18  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30  7 31 23 25  5 36 27 14 23  3  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 24 23 25 19 27  6  5 25  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32  5 10  3  0  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  5 11 14  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 32  5 18 27 43  8  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 22  5 15  5 27  8  7 53  6 27 18 53  3  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 41 23  5 27  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 

training routine: 10it [05:57, 34.54s/it]

CharVocab 特征标准化后开始索引: [ 2 26  5  5 12  3  0  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  9 19  7 28  5 25  5 53  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2  4 27  7 15  7 25  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 30 11 31 31 23 25 27  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
输入序列形状:torch.Size([64, 19])-> 嵌人后:torch.Size([64, 19, 100])
RNN 输出形状:torch.Size([64, 19, 64])-> 聚合后:动态索引
CharVocab 特征标准化后开始索引: [ 2 37 15 23 28 28 23 18 31 12  3  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17  7 31 23 10  7  3  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 20  5 27  6 18 31 31  5  3  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 13  7 18 15 10 18 15  3  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 17 23 31 53  7  3  0  0  0  0  0  0  0  0  0  0  0  0]
向量长度: 19
CharVocab 特征标准化后开始索引: [ 2 45  7 15 33 18 21 10  5 36 27 14 23  3  0  0  0  0  0]
向量长度

In [67]:
def predict_nationality(surname, classifier, vectorizer):
    vectorized_surname, vec_length = vectorizer.vectorize(surname)
    vectorized_surname = torch.tensor(vectorized_surname).unsqueeze(dim=0)
    vec_length = torch.tensor([vec_length], dtype=torch.int64)

    with torch.no_grad():
        result = classifier(vectorized_surname, vec_length, apply_softmax=True)
    
    probability_values, indices = result.max(dim=1)
    index = indices.item()
    prob_value = probability_values.item()
    
    predicted_nationality = vectorizer.nationality_vocab.lookup_index(index)
    
    return {'nationality': predicted_nationality, 'probability': prob_value, 'surname': surname}

# 定义需要预测的姓氏列表
surnames = ["McMahan", "Nakamoto", "Wan", "Cho"]

# 调用函数进行预测并打印结果
for surname in surnames:
    prediction = predict_nationality(surname, classifier, vectorizer)
    print(f"Surname: {prediction['surname']} -> Nationality: {prediction['nationality']} (Probability: {prediction['probability']:.4f})")
    

CharVocab 特征标准化后开始索引: [ 2 30 43 30  7  8  7 25  3]
向量长度: 9
输入序列形状:torch.Size([1, 9])-> 嵌人后:torch.Size([1, 9, 100])
RNN 输出形状:torch.Size([1, 9, 64])-> 聚合后:动态索引
Surname: McMahan -> Nationality: Irish (Probability: 4.1299)
CharVocab 特征标准化后开始索引: [ 2 34  7 14  7 21  5  6  5  3]
向量长度: 10
输入序列形状:torch.Size([1, 10])-> 嵌人后:torch.Size([1, 10, 100])
RNN 输出形状:torch.Size([1, 10, 64])-> 聚合后:动态索引
Surname: Nakamoto -> Nationality: Italian (Probability: 4.2980)
CharVocab 特征标准化后开始索引: [ 2 26  7 25  3]
向量长度: 5
输入序列形状:torch.Size([1, 5])-> 嵌人后:torch.Size([1, 5, 100])
RNN 输出形状:torch.Size([1, 5, 64])-> 聚合后:动态索引
Surname: Wan -> Nationality: Vietnamese (Probability: 3.0591)
CharVocab 特征标准化后开始索引: [ 2 20  8  5  3]
向量长度: 5
输入序列形状:torch.Size([1, 5])-> 嵌人后:torch.Size([1, 5, 100])
RNN 输出形状:torch.Size([1, 5, 64])-> 聚合后:动态索引
Surname: Cho -> Nationality: Korean (Probability: 2.2750)
