# Classifying Surname Nationality Using a Character RNN using ELman RNN.
The task is to classify given surname (character sequences) to the nationality of origin.

Download dataset here: https://www.kaggle.com/datasets/hemendrasr/name-by-nationality

https://github.com/delip/PyTorchNLPBook

In [1]:
import pandas as pd
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader
from tqdm import tqdm

In [2]:
class Vocabulary:
    """Handles text processing and vocabulary mapping."""

    def __init__(self):
        self.token_to_idx = {"<PAD>": 0}  # Add padding token
        self.idx_to_token = ["<PAD>"]

    def add_token(self, token):
        if token not in self.token_to_idx:
            self.token_to_idx[token] = len(self.idx_to_token)
            self.idx_to_token.append(token)
        return self.token_to_idx[token]

    def __len__(self):
        return len(self.idx_to_token)


class SurnameDataset(Dataset):
    """Custom dataset for name classification."""

    def __init__(self, data_path, max_length=15):
        self.data = pd.read_csv(data_path)
        self.vocab = Vocabulary()
        self.nationality_vocab = Vocabulary()  # LabelEncoder
        self.max_length = max_length
        self._build_vocab()

    def _build_vocab(self):
        for name in self.data['name']:
            for char in name:
                self.vocab.add_token(char)
        for nationality in self.data['nationality']:
            self.nationality_vocab.add_token(nationality)

    def __len__(self):
        return len(self.data)

    def __getitem__(self, idx):
        name = self.data.iloc[idx]['name']
        nationality = self.data.iloc[idx]['nationality']
        nationality_idx = self.nationality_vocab.token_to_idx[nationality]

        # Convert name to index sequence
        name_indices = [self.vocab.token_to_idx[char] for char in name]

        # Pad or truncate
        name_indices = name_indices[:self.max_length]  # Truncate
        name_indices += [0] * (self.max_length - len(name_indices))  # Pad

        name_tensor = torch.tensor(name_indices, dtype=torch.long)

        return name_tensor, torch.tensor(nationality_idx, dtype=torch.long)


class SurnameClassifier(nn.Module):
    """RNN-based classifier."""

    def __init__(self, vocab_size, embed_dim, hidden_dim, output_dim):
        super().__init__()
        self.embedding = nn.Embedding(vocab_size, embed_dim, padding_idx=0)  # Use padding_idx
        self.rnn = nn.RNN(embed_dim, hidden_dim, batch_first=True)
        self.fc = nn.Linear(hidden_dim, output_dim)

    def forward(self, x):
        embedded = self.embedding(x)
        _, hidden = self.rnn(embedded)
        return self.fc(hidden[-1])  # Use last hidden state


class SurnameTrainer:
    """Handles model training and evaluation."""

    def __init__(self, model, dataloader, device, epochs=10, lr=0.001, model_path="model.pth"):
        self.model = model.to(device)
        self.dataloader = dataloader
        self.device = device
        self.epochs = epochs
        self.loss = nn.CrossEntropyLoss()
        self.optimizer = optim.Adam(model.parameters(), lr=lr)
        self.model_path = model_path

    def train(self):
        self.model.train()
        best_loss = float('inf')
        patience, counter = 20, 0
        for epoch in range(self.epochs):
            epoch_loss = 0
            for inputs, labels in tqdm(self.dataloader, desc=f"Epoch {epoch + 1}"):
                inputs, labels = inputs.to(self.device), labels.to(self.device)
                self.optimizer.zero_grad()
                outputs = self.model(inputs)
                loss = self.loss(outputs, labels)
                loss.backward()
                self.optimizer.step()
                loss_value = loss.item()
                epoch_loss += loss_value
            print(f"Epoch {epoch + 1}, Loss: {epoch_loss / len(self.dataloader):.4f}")

            if epoch_loss < best_loss:
                best_loss = epoch_loss
                counter = 0
            else:
                counter += 1
                if counter >= patience:
                    print("Early stopping")
                    break
        self.save_model()

    def save_model(self):
        torch.save(self.model.state_dict(), self.model_path)
        print(f"Model saved to {self.model_path}")

    def load_model(self):
        self.model.load_state_dict(torch.load(self.model_path))
        self.model.eval()
        print(f"Model loaded from {self.model_path}")


class SurnameInference:
    """Handles model inference."""

    def __init__(self, model, vocab, max_length=15, model_path="model.pth", device="cpu"):
        self.model = model.to(device)
        self.vocab = vocab
        self.max_length = max_length
        self.device = device
        self.model_path = model_path
        self.load_model()

    def load_model(self):
        self.model.load_state_dict(torch.load(self.model_path, map_location=self.device))
        self.model.eval()
        print(f"Model loaded for inference from {self.model_path}")

    def predict(self, name):
        name_indices = [self.vocab.token_to_idx.get(char, 0) for char in name]
        name_indices = name_indices[:self.max_length]  # Truncate
        name_indices += [0] * (self.max_length - len(name_indices))  # Pad

        name_tensor = torch.tensor([name_indices], dtype=torch.long).to(self.device)
        with torch.no_grad():
            output = self.model(name_tensor)
        return torch.argmax(output, dim=1).item()

In [3]:
# Training
data_path = '../../data/surnames-by-nationality.csv'  # Update with actual path
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

dataset = SurnameDataset(data_path)
dataloader = DataLoader(dataset, batch_size=32, shuffle=True)

model = SurnameClassifier(len(dataset.vocab), embed_dim=32, hidden_dim=32, output_dim=len(dataset.nationality_vocab))
trainer = SurnameTrainer(model, dataloader, device, epochs=100, lr=0.001)
trainer.train()

Epoch 1: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 473.34it/s]


Epoch 1, Loss: 1.7821


Epoch 2: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 513.85it/s]


Epoch 2, Loss: 1.7247


Epoch 3: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 561.00it/s]


Epoch 3, Loss: 1.7230


Epoch 4: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 524.87it/s]


Epoch 4, Loss: 1.7201


Epoch 5: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 568.38it/s]


Epoch 5, Loss: 1.7207


Epoch 6: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 545.92it/s]


Epoch 6, Loss: 1.7218


Epoch 7: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 548.94it/s]


Epoch 7, Loss: 1.7196


Epoch 8: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 553.49it/s]


Epoch 8, Loss: 1.7202


Epoch 9: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 525.44it/s]


Epoch 9, Loss: 1.7181


Epoch 10: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 562.84it/s]


Epoch 10, Loss: 1.7182


Epoch 11: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 572.46it/s]


Epoch 11, Loss: 1.6618


Epoch 12: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 458.86it/s]


Epoch 12, Loss: 1.5457


Epoch 13: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 561.08it/s]


Epoch 13, Loss: 1.4700


Epoch 14: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 564.90it/s]


Epoch 14, Loss: 1.3931


Epoch 15: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 553.57it/s]


Epoch 15, Loss: 1.3350


Epoch 16: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 467.35it/s]


Epoch 16, Loss: 1.2997


Epoch 17: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 550.13it/s]


Epoch 17, Loss: 1.2728


Epoch 18: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 570.65it/s]


Epoch 18, Loss: 1.2419


Epoch 19: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 535.91it/s]


Epoch 19, Loss: 1.2359


Epoch 20: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 536.25it/s]


Epoch 20, Loss: 1.2086


Epoch 21: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 558.26it/s]


Epoch 21, Loss: 1.1931


Epoch 22: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 572.59it/s]


Epoch 22, Loss: 1.1775


Epoch 23: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 550.62it/s]


Epoch 23, Loss: 1.1745


Epoch 24: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 546.18it/s]


Epoch 24, Loss: 1.1602


Epoch 25: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 573.81it/s]


Epoch 25, Loss: 1.1479


Epoch 26: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 563.63it/s]


Epoch 26, Loss: 1.1390


Epoch 27: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 522.40it/s]


Epoch 27, Loss: 1.1351


Epoch 28: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 485.35it/s]


Epoch 28, Loss: 1.1200


Epoch 29: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 553.65it/s]


Epoch 29, Loss: 1.1250


Epoch 30: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 534.09it/s]


Epoch 30, Loss: 1.1093


Epoch 31: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 526.84it/s]


Epoch 31, Loss: 1.1035


Epoch 32: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 496.79it/s]


Epoch 32, Loss: 1.1002


Epoch 33: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 474.91it/s]


Epoch 33, Loss: 1.0885


Epoch 34: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 568.85it/s]


Epoch 34, Loss: 1.0863


Epoch 35: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 536.58it/s]


Epoch 35, Loss: 1.0888


Epoch 36: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 570.58it/s]


Epoch 36, Loss: 1.0654


Epoch 37: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 534.96it/s]


Epoch 37, Loss: 1.0674


Epoch 38: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 448.91it/s]


Epoch 38, Loss: 1.0668


Epoch 39: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 419.69it/s]


Epoch 39, Loss: 1.0664


Epoch 40: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 497.45it/s]


Epoch 40, Loss: 1.0508


Epoch 41: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 488.38it/s]


Epoch 41, Loss: 1.0420


Epoch 42: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 527.01it/s]


Epoch 42, Loss: 1.0360


Epoch 43: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 520.64it/s]


Epoch 43, Loss: 1.0378


Epoch 44: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 570.57it/s]


Epoch 44, Loss: 1.0210


Epoch 45: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 566.34it/s]


Epoch 45, Loss: 1.0263


Epoch 46: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 540.44it/s]


Epoch 46, Loss: 1.0194


Epoch 47: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 542.56it/s]


Epoch 47, Loss: 1.0220


Epoch 48: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 512.80it/s]


Epoch 48, Loss: 1.0127


Epoch 49: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 512.76it/s]


Epoch 49, Loss: 1.0121


Epoch 50: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 528.13it/s]


Epoch 50, Loss: 0.9938


Epoch 51: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 507.86it/s]


Epoch 51, Loss: 0.9902


Epoch 52: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 458.51it/s]


Epoch 52, Loss: 0.9894


Epoch 53: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 504.74it/s]


Epoch 53, Loss: 0.9935


Epoch 54: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 487.93it/s]


Epoch 54, Loss: 0.9801


Epoch 55: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 525.33it/s]


Epoch 55, Loss: 0.9711


Epoch 56: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 446.44it/s]


Epoch 56, Loss: 0.9714


Epoch 57: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 510.87it/s]


Epoch 57, Loss: 0.9719


Epoch 58: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 465.74it/s]


Epoch 58, Loss: 0.9765


Epoch 59: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 542.18it/s]


Epoch 59, Loss: 0.9569


Epoch 60: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 537.69it/s]


Epoch 60, Loss: 0.9544


Epoch 61: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 512.67it/s]


Epoch 61, Loss: 0.9464


Epoch 62: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 515.90it/s]


Epoch 62, Loss: 0.9497


Epoch 63: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 559.03it/s]


Epoch 63, Loss: 0.9357


Epoch 64: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 546.00it/s]


Epoch 64, Loss: 0.9385


Epoch 65: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 437.70it/s]


Epoch 65, Loss: 0.9406


Epoch 66: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 510.26it/s]


Epoch 66, Loss: 0.9462


Epoch 67: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 538.73it/s]


Epoch 67, Loss: 0.9302


Epoch 68: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 486.15it/s]


Epoch 68, Loss: 0.9263


Epoch 69: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 473.02it/s]


Epoch 69, Loss: 0.9220


Epoch 70: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 559.44it/s]


Epoch 70, Loss: 0.9189


Epoch 71: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 557.90it/s]


Epoch 71, Loss: 0.9168


Epoch 72: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 552.87it/s]


Epoch 72, Loss: 0.9153


Epoch 73: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 493.80it/s]


Epoch 73, Loss: 0.9109


Epoch 74: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 553.38it/s]


Epoch 74, Loss: 0.9175


Epoch 75: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 546.68it/s]


Epoch 75, Loss: 0.9180


Epoch 76: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 539.23it/s]


Epoch 76, Loss: 0.9000


Epoch 77: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 525.88it/s]


Epoch 77, Loss: 0.8963


Epoch 78: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 539.34it/s]


Epoch 78, Loss: 0.9005


Epoch 79: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 531.77it/s]


Epoch 79, Loss: 0.8868


Epoch 80: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 547.46it/s]


Epoch 80, Loss: 0.8907


Epoch 81: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 418.84it/s]


Epoch 81, Loss: 0.8900


Epoch 82: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 502.60it/s]


Epoch 82, Loss: 0.8880


Epoch 83: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 476.84it/s]


Epoch 83, Loss: 0.8724


Epoch 84: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 546.56it/s]


Epoch 84, Loss: 0.8800


Epoch 85: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 520.93it/s]


Epoch 85, Loss: 0.8786


Epoch 86: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 545.15it/s]


Epoch 86, Loss: 0.8712


Epoch 87: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 523.08it/s]


Epoch 87, Loss: 0.8590


Epoch 88: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 550.62it/s]


Epoch 88, Loss: 0.8785


Epoch 89: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 543.20it/s]


Epoch 89, Loss: 0.8589


Epoch 90: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 547.63it/s]


Epoch 90, Loss: 0.8687


Epoch 91: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 534.46it/s]


Epoch 91, Loss: 0.8493


Epoch 92: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 537.06it/s]


Epoch 92, Loss: 0.8481


Epoch 93: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 552.22it/s]


Epoch 93, Loss: 0.8521


Epoch 94: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 546.79it/s]


Epoch 94, Loss: 0.8589


Epoch 95: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 562.78it/s]


Epoch 95, Loss: 0.8549


Epoch 96: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 539.34it/s]


Epoch 96, Loss: 0.8403


Epoch 97: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 475.43it/s]


Epoch 97, Loss: 0.8492


Epoch 98: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 542.82it/s]


Epoch 98, Loss: 0.8398


Epoch 99: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 512.12it/s]


Epoch 99, Loss: 0.8513


Epoch 100: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 147/147 [00:00<00:00, 490.86it/s]


Epoch 100, Loss: 0.8386
Model saved to model.pth


In [4]:
# Load model for inference
inference = SurnameInference(model, dataset.vocab, model_path="model.pth", device=device)
for name in ['McMahan', 'Nakamoto', 'Wan', 'Cho', "Pant", "aayush", "Ansan"]:
    prediction = inference.predict(name)
    prediction_label = dataset.nationality_vocab.idx_to_token[prediction]
    print(f"Predicted class for '{name}': {prediction_label}")

Model loaded for inference from model.pth
Predicted class for 'McMahan': Indian
Predicted class for 'Nakamoto': African
Predicted class for 'Wan': Indian
Predicted class for 'Cho': Japanese
Predicted class for 'Pant': American
Predicted class for 'aayush': Indian
Predicted class for 'Ansan': Indian
