In [6]:
from torchtext.data.utils import get_tokenizer
from torchtext.vocab import build_vocab_from_iterator
from torchtext.datasets import Multi30k
from transformer_util import ArxivDataset
from typing import Iterable, List

In [7]:
SRC_LANGUAGE = 'de'
TGT_LANGUAGE = 'en'

# Place-holders
token_transform = {}
vocab_transform = {}

In [8]:
# Create source and target language tokenizer. Make sure to install the dependencies.
# pip install -U spacy
# python -m spacy download en_core_web_sm
# python -m spacy download de_core_news_sm
token_transform[SRC_LANGUAGE] = get_tokenizer('spacy', language='de_core_news_sm')
token_transform[TGT_LANGUAGE] = get_tokenizer('spacy', language='en_core_web_sm')

In [9]:
def yield_tokens(data_iter: Iterable, language: str) -> List[str]:
    language_index = {SRC_LANGUAGE: 0, TGT_LANGUAGE: 1}

    for data_sample in data_iter:
#         print(data_sample)
        yield token_transform[language](data_sample[language_index[language]])

# Define special symbols and indices
UNK_IDX, PAD_IDX, BOS_IDX, EOS_IDX = 0, 1, 2, 3
# Make sure the tokens are in order of their indices to properly insert them in vocab
special_symbols = ['<unk>', '<pad>', '<sos>', '<eos>']

In [15]:
dataset = ArxivDataset('..\data', 'train')
vocab_transform['s'] = build_vocab_from_iterator(yield_tokens(dataset, 'en'),
                                                    min_freq=1,
                                                    specials=special_symbols,
                                                    special_first=True)

In [16]:
len(vocab_transform['s'])

51329

In [5]:
dataset = ArxivDataset('..\data', 'val')
for ln in [SRC_LANGUAGE, TGT_LANGUAGE]:
    # Training data Iterator
#     train_iter = Multi30k(split='train', language_pair=(SRC_LANGUAGE, TGT_LANGUAGE))
    train_iter
#     print(type(train_iter))
    # Create torchtext's Vocab object
    vocab_transform[ln] = build_vocab_from_iterator(yield_tokens(train_iter, ln),
                                                    min_freq=1,
                                                    specials=special_symbols,
                                                    special_first=True)

# Set UNK_IDX as the default index. This index is returned when the token is not found.
# If not set, it throws RuntimeError when the queried token is not found in the Vocabulary.
for ln in [SRC_LANGUAGE, TGT_LANGUAGE]:
    vocab_transform[ln].set_default_index(UNK_IDX)

<class 'torchtext.data.datasets_utils._RawTextIterableDataset'>
('Zwei junge weiße Männer sind im Freien in der Nähe vieler Büsche.\n', 'Two young, White males are outside near many bushes.\n')
('Mehrere Männer mit Schutzhelmen bedienen ein Antriebsradsystem.\n', 'Several men in hard hats are operating a giant pulley system.\n')
('Ein kleines Mädchen klettert in ein Spielhaus aus Holz.\n', 'A little girl climbing into a wooden playhouse.\n')
('Ein Mann in einem blauen Hemd steht auf einer Leiter und putzt ein Fenster.\n', 'A man in a blue shirt is standing on a ladder cleaning a window.\n')
('Zwei Männer stehen am Herd und bereiten Essen zu.\n', 'Two men are at the stove preparing food.\n')
('Ein Mann in grün hält eine Gitarre, während der andere Mann sein Hemd ansieht.\n', 'A man in green holds a guitar while the other man observes his shirt.\n')
('Ein Mann lächelt einen ausgestopften Löwen an.\n', 'A man is smiling at a stuffed lion\n')
('Ein schickes Mädchen spricht mit dem Handy wä

('Ein dunkelhaariger junger Mann mit Bart, der draußen auf einem kleinen Grill Steaks zubereitet.\n', 'A young man with dark hair and a beard cooking steaks outside on a small grill.\n')
('Eine uniformierte Frau, die eine Kamera hält und vor einer Zuschauermenge steht.\n', 'A uniformed woman holding a camera standing in front of a crowd of spectators.\n')
('Der kleine Junge mit den roten Hosen versucht, einen Fußball zu fangen, der auf ihn zu kommt.\n', 'The little boy in red trunks is attempting to catch a soccer ball that is coming towards him.\n')
('Vier Kinder rollen und rutschen eine Sanddüne herunter.\n', 'Four kids rolling and sliding down a sand dune.\n')
('Der pelzige kleine weiße Hund läuft im grünen Gras.\n', 'The small furry white dog is walking in the green grass.\n')
('Ein kleines Mädchen macht High-Five mit einem gelben Roboter.\n', 'A little girl high-fives a yellow robot.\n')
('Eine Person mit blauem Hemd und Jeans blickt an den Bäumen vorbei zum Horizont.\n', 'A perso

('Zwei Personen auf einem Boot, die den Sonnenuntergang betrachten.\n', 'Two people on a boat looking at the sunset.\n')
('Ein blau und braun gekleidetes Mädchen mit Taschen steht am Ende eines Tunnels.\n', 'A girl wearing blue and brown holding bags standing in the end of a tunnel.\n')
('Drei Fensterputzer in blauen Uniformen arbeiten auf einem Gerüst.\n', 'Three window washers in blue uniforms work on scaffolding.\n')
('Zwei junge Männer spielen draußen bei einer goldenen Gandhi-Statue.\n', 'Two young men play outside near a golden statue of Ghandi.\n')
('Zwei Hunde spielen draußen mit einem Spielzeug.\n', 'Two dogs are playing with a toy outdoors.\n')
('Zwei Männer fahren auf einer Aschenbahn ein Fahrradrennen, während eine Handvoll Zuschauer hinter einem Zaun zusieht.\n', 'Two men race around a dirt track on bicycles while a handful of onlookers watch from behind a fence.\n')
('Eine Frau, die in einem Park sitzt und auf einem Handy redet.\n', 'A woman sitting in a park, talking on 

('Ein Mann, der an einem Tisch sitzt und ein Notebook benutzt.\n', 'A man sitting at a table using a notebook computer.\n')
('Ein Kind dreht sich mit einem Objekt in der Hand herum, während jemand hinter ihm vorbei geht.\n', 'A kid turns around with an object in hand while someone passes behind him.\n')
('Zwei Frauen unterhalten sich in einer Kunstgalerie.\n', 'Two women are conversing in an art gallery.\n')
('Eine Person macht mit ihrem gelbbraunen Hund einen Ausflug im Ruderboot.\n', 'A person and their tan dog go for a ride in a rowboat.\n')
('Ein brauner Hund, der auf dem Gras sitzt\n', 'A brown dog sitting on grass\n')
('Ein weißer Hund rennt vor einem orangefarbenen Zaun.\n', 'A white dog is running with an orange fence behind him.\n')
('Ein Mann und ein Junge blicken in ein Zelt, in dem eine blaue Decke liegt.\n', 'One man and one boy looking into a tent with a blue blanket in it.\n')
('Eine Frau mit einem Tennisschläger, die gerade dabei ist, auf einen Ball zu schlagen.\n', 'A 

('Fünf kleine Mädchen, vier sitzend und eins stehend, vor einem grünen Zelt essen einen Happen und unterhalten sich.\n', 'Five young girls in front of a green camping tent, four sitting and one standing, enjoying a snack and having a conversation.\n')
('Ein kleines Mädchen macht sich bereit, einen Softball zu schlagen.\n', 'A young girl is getting ready to hit a softball.\n')
('Ein Boot mit mehreren Männern darauf wird von einem großen Pferdegespann ans Ufer gezogen.\n', 'A boat carrying several men is pulled to shore by a large team of horses.\n')
('Der junge Football-Spieler versucht, einen Angriff zu vermeiden.\n', 'The young football player is trying to avoid being tackled.\n')
('Eine Gruppe von Menschen trinkt Bier im Park.\n', 'A group of people are enjoying beers in the park.\n')
('Eine Frau in blauen Jeansshorts sitzts an einer Steinmauer.\n', 'A woman in blue denim shorts sits on stone wall.\n')
('Ein Gruppe Männer mit Hunden in gelbem Boot.\n', 'A group of men in a yellow boa

('Zwei Frauen, beide in Sandalen, eine mit grünem Hut schließt das Kleid der anderen Frau.\n', "Two women both in sandals, one in a green hat is tying the other woman's dress strap.\n")
('Eine Frau in schwarzem Hemd schaut ein Fahrrad an.\n', 'A woman in a black shirt looking at a bicycle.\n')
('Eine Frau in orangefarbenem Pullover hat ein Glas in der Hand.\n', 'A woman in an orange sweatshirt is holding a glass in her hand.\n')
('Zwei kleine Jungen trinken zuhause.\n', 'Two young boys drinking at home.\n')
('Eine Rockbar spielt in einer spärlich beleuchteten Bar.\n', 'A rock band is playing in a dimly lit bar.\n')
('Ein Hund wälzt sich im Gras.\n', 'A dog rolls in the grass.\n')
('Ein blonder Junge in rotem Hemd und roten Shorts klettert auf einen Baum.\n', 'A blond-haired boy wearing a red shirt and red shorts climbing a tree.\n')
('Ein Mann steht auf einer Leiter, um mit seinem Mobiltelefon ein Foto zu machen.\n', 'A man stands on a ladder to take a picture with his cellphone.\n')
(

('Mann und Frau stehen nah beieinander, ein anderer Mann schaut zu ihnen.\n', 'Man and woman standing close together while another man watches.\n')
('Eine Frau steht mitten auf einem Ziegelsteinweg.\n', 'A woman stamds in the middle of a brick road.\n')
('Ein Computerlabor in einer Schule, fünf Menschen im Bild.\n', 'A computer lab in a school, five people pictured.\n')
('Ein kleiner Junge schläft in eine weiße Decke gewickelt auf einer gestreiften Couch.\n', 'A little boy sleeping on a striped couch while wrapped in a white blanket.\n')
('Soldaten waschen Pfannen in roten Wannen.\n', 'Soldiers are washing pans in red tubs.\n')
('Ein Mann in orangefarbenem Hemd und blauem Helm fährt auf seinem Fahrrad Rennen.\n', 'A man in an orange shirt and blue helmet races his bike.\n')
('Mehrere Reiter tragen Flaggen und reiten aneinander vorbei.\n', 'Several horsemen are riding past each other carrying flags.\n')
('Ältere Frau in gelber Jacke hält in einem städtischen Gebiet ein Schild mit der Au

('Eine Mutter hält ihr Kind auf einem roten Sofa, während beide sich gut unterhalten.\n', 'A mom holding her child on a red sofa while they are both having fun.\n')
('Ein Mann mit einer roten Jacke und einem Hut redet mit einem anderen Mann.\n', 'A man in a red jacket and hat talks to another man.\n')
('Ein Junge wartet draußen vor einem vergitterten Fenster.\n', 'A boy is waiting outside a window with bars.\n')
('Ein Skifahrer in roten Hosen steht auf einem schneebedeckten Hang.\n', 'A skier in red pants is on a snow covered slope.\n')
('Eine Gruppe von Männern trinken und unterhalten sich an einer Bar.\n', 'A group of men drink at a bar and talk.\n')
('Eine Frau sitzt mit einem Baby auf einem Teppichboden.\n', 'A woman sits on a carpeted floor with a baby.\n')
('Der braun-weiße Hund spielt im Schnee.\n', 'The brown and white dog is playing in the snow.\n')
('Ein Mann, eine Frau und ein Kind sitzen und essen im Freien.\n', 'A man, woman, and child sit and eat food outdoors.\n')
('Ein 

('Ein zotteliger Hund läuft einen Feldweg in einem grünen Wald herunter.\n', 'A shaggy dog runs down a dirt trail in a lush forest.\n')
('Ein Mann hält eine Gitarre und spricht in ein Mikrofon.\n', 'A man holding a guitar and speaking into a microphone.\n')
('Ein weiß gekleideter Künstler greift nach dem Publikum.\n', 'Artists in white reach towards the audience.\n')
('Ein Mann in Weiß gekleidet, spielt eine Gitarre.\n', 'A man dressed in white plays a guitar.\n')
('Ein großes Kreuzfahrtschiff fährt an einem Strand vorbei, wo Leute, die die Sonne genießen unter gelben Sonnenschirmen liegen.\n', 'A large cruise ship passes by a beach where sunbathers recline under yellow umbrellas.\n')
('Ein grauer Hund, der in einer blauen Trainingsjacke gekleidet ist, sitzt ruhig.\n', 'The gray dog sits quietly, dressed in a blue track jacket.\n')
('Ein Hund versucht einen Mann, der ihn trainiert zu beißen.\n', 'A dog trying to bite a man who is training him\n')
('Eine Frau die Softball spielt, hat ei

('Zwei Jungen sitzen und essen ein Eis.\n', 'Two boys sitting and eating ice cream.\n')
('Ein schwarzer Hund läuft im flachen Wasser an einem Strand.\n', 'A black dog running in shallow water on a beach.\n')
('Der aufwändige Jesusschrein wird in einer Parade getragen.\n', 'The elaborate Jesus shrine is being carried in a parade.\n')
('Männer in blau tragen etwas auf ihren Schultern, gefolgt von einer Band.\n', 'Men in blue carrying something on their shoulders followed by a band.\n')
('Eine weiße Frau hält eine Panasonic-Videokamera, in einem Park, in der Hand.\n', 'A white woman holding a Panasonic video camera in a park.\n')
('Eine Surfer, der einen schwarzen und grünen Anzug trägt, reitet auf einer Welle.\n', 'A surfer wearing a black and green wetsuit riding a wave.\n')
('Der Skateboardfahrer fährt auf der Rampe neben einem sehr großen Bild.\n', 'The skateboarder is riding the ramp next to the very big painting.\n')
('Ein Skateboarder macht einen Trick auf einer mit Graffiti bedeck

('Braut und Bräutigam tanzen am Empfang.\n', 'A bride and groom dancing at the reception.\n')
('Eine Frau in einer weißen Bluse steht am Eingang eines Geschäfts, das folkloristische Waren verkauft.\n', 'A woman in a white shirt stands at the entrance of an ethnic goods shop.\n')
('Menschen aus einem ausländischen Dorf sammeln Ressourcen.\n', 'People from a foreign village gathering resources.\n')
('Drei orientalisch aussehende Personen gehen durch mehrere Glasflaschen.\n', 'Three Middle Eastern people going through a bunch of glass bottles.\n')
('Frauen in Sari untersuchen eine Grafik.\n', 'Women in sari examine a graph.\n')
('Ein dunkelhäutiger Mann mit Hut sitzt in einem Stuhl im Sand und hält ein Netz in den Händen.\n', 'A black man in a hat sitting in a chair in the sand holding a net.\n')
('Ein Mann poliert Schuhe.\n', 'A man is shining dress shoes.\n')
('Ein Mann ohne Hemd schiebt einen Wagen voller Waren.\n', 'A shirtless black man is pushing a cartload full of goods.\n')
('Inde

KeyboardInterrupt: 

In [11]:
from torch import Tensor
import torch
import torch.nn as nn
from torch.nn import Transformer
import math
DEVICE = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

# helper Module that adds positional encoding to the token embedding to introduce a notion of word order.
class PositionalEncoding(nn.Module):
    def __init__(self,
                 emb_size: int,
                 dropout: float,
                 maxlen: int = 5000):
        super(PositionalEncoding, self).__init__()
        den = torch.exp(- torch.arange(0, emb_size, 2)* math.log(10000) / emb_size)
        pos = torch.arange(0, maxlen).reshape(maxlen, 1)
        pos_embedding = torch.zeros((maxlen, emb_size))
        pos_embedding[:, 0::2] = torch.sin(pos * den)
        pos_embedding[:, 1::2] = torch.cos(pos * den)
        pos_embedding = pos_embedding.unsqueeze(-2)

        self.dropout = nn.Dropout(dropout)
        self.register_buffer('pos_embedding', pos_embedding)

    def forward(self, token_embedding: Tensor):
        return self.dropout(token_embedding + self.pos_embedding[:token_embedding.size(0), :])

# helper Module to convert tensor of input indices into corresponding tensor of token embeddings
class TokenEmbedding(nn.Module):
    def __init__(self, vocab_size: int, emb_size):
        super(TokenEmbedding, self).__init__()
        self.embedding = nn.Embedding(vocab_size, emb_size)
        self.emb_size = emb_size

    def forward(self, tokens: Tensor):
        return self.embedding(tokens.long()) * math.sqrt(self.emb_size)

# Seq2Seq Network
class Seq2SeqTransformer(nn.Module):
    def __init__(self,
                 num_encoder_layers: int,
                 num_decoder_layers: int,
                 emb_size: int,
                 nhead: int,
                 src_vocab_size: int,
                 tgt_vocab_size: int,
                 dim_feedforward: int = 512,
                 dropout: float = 0.1):
        super(Seq2SeqTransformer, self).__init__()
        self.transformer = Transformer(d_model=emb_size,
                                       nhead=nhead,
                                       num_encoder_layers=num_encoder_layers,
                                       num_decoder_layers=num_decoder_layers,
                                       dim_feedforward=dim_feedforward,
                                       dropout=dropout)
        self.generator = nn.Linear(emb_size, tgt_vocab_size)
        self.src_tok_emb = TokenEmbedding(src_vocab_size, emb_size)
        self.tgt_tok_emb = TokenEmbedding(tgt_vocab_size, emb_size)
        self.positional_encoding = PositionalEncoding(
            emb_size, dropout=dropout)

    def forward(self,
                src: Tensor,
                trg: Tensor,
                src_mask: Tensor,
                tgt_mask: Tensor,
                src_padding_mask: Tensor,
                tgt_padding_mask: Tensor,
                memory_key_padding_mask: Tensor):
        src_emb = self.positional_encoding(self.src_tok_emb(src))
        tgt_emb = self.positional_encoding(self.tgt_tok_emb(trg))
        outs = self.transformer(src_emb, tgt_emb, src_mask, tgt_mask, None,
                                src_padding_mask, tgt_padding_mask, memory_key_padding_mask)
        return self.generator(outs)

    def encode(self, src: Tensor, src_mask: Tensor):
        return self.transformer.encoder(self.positional_encoding(
                            self.src_tok_emb(src)), src_mask)

    def decode(self, tgt: Tensor, memory: Tensor, tgt_mask: Tensor):
        return self.transformer.decoder(self.positional_encoding(
                          self.tgt_tok_emb(tgt)), memory,
                          tgt_mask)

In [12]:
def generate_square_subsequent_mask(sz):
    mask = (torch.triu(torch.ones((sz, sz), device=DEVICE)) == 1).transpose(0, 1)
    mask = mask.float().masked_fill(mask == 0, float('-inf')).masked_fill(mask == 1, float(0.0))
    return mask


def create_mask(src, tgt):
    src_seq_len = src.shape[0]
    tgt_seq_len = tgt.shape[0]

    tgt_mask = generate_square_subsequent_mask(tgt_seq_len)
    src_mask = torch.zeros((src_seq_len, src_seq_len),device=DEVICE).type(torch.bool)

    src_padding_mask = (src == PAD_IDX).transpose(0, 1)
    tgt_padding_mask = (tgt == PAD_IDX).transpose(0, 1)
    return src_mask, tgt_mask, src_padding_mask, tgt_padding_mask

In [13]:
torch.manual_seed(0)

SRC_VOCAB_SIZE = len(vocab_transform[SRC_LANGUAGE])
TGT_VOCAB_SIZE = len(vocab_transform[TGT_LANGUAGE])
EMB_SIZE = 512
NHEAD = 8
FFN_HID_DIM = 512
BATCH_SIZE = 128
NUM_ENCODER_LAYERS = 3
NUM_DECODER_LAYERS = 3

transformer = Seq2SeqTransformer(NUM_ENCODER_LAYERS, NUM_DECODER_LAYERS, EMB_SIZE,
                                 NHEAD, SRC_VOCAB_SIZE, TGT_VOCAB_SIZE, FFN_HID_DIM)

for p in transformer.parameters():
    if p.dim() > 1:
        nn.init.xavier_uniform_(p)

transformer = transformer.to(DEVICE)

loss_fn = torch.nn.CrossEntropyLoss(ignore_index=PAD_IDX)

optimizer = torch.optim.Adam(transformer.parameters(), lr=0.0001, betas=(0.9, 0.98), eps=1e-9)

In [15]:
from torch.nn.utils.rnn import pad_sequence

# helper function to club together sequential operations
def sequential_transforms(*transforms):
    def func(txt_input):
        for transform in transforms:
            txt_input = transform(txt_input)
        return txt_input
    return func

# function to add BOS/EOS and create tensor for input sequence indices
def tensor_transform(token_ids: List[int]):
    return torch.cat((torch.tensor([BOS_IDX]),
                      torch.tensor(token_ids),
                      torch.tensor([EOS_IDX])))

# src and tgt language text transforms to convert raw strings into tensors indices
text_transform = {}
for ln in [SRC_LANGUAGE, TGT_LANGUAGE]:
    text_transform[ln] = sequential_transforms(token_transform[ln], #Tokenization
                                               vocab_transform[ln], #Numericalization
                                               tensor_transform) # Add BOS/EOS and create tensor


# function to collate data samples into batch tesors
def collate_fn(batch):
    src_batch, tgt_batch = [], []
    for src_sample, tgt_sample in batch:
        src_batch.append(text_transform[SRC_LANGUAGE](src_sample.rstrip("\n")))
        tgt_batch.append(text_transform[TGT_LANGUAGE](tgt_sample.rstrip("\n")))

    src_batch = pad_sequence(src_batch, padding_value=PAD_IDX)
    tgt_batch = pad_sequence(tgt_batch, padding_value=PAD_IDX)
    return src_batch, tgt_batch

from torch.utils.data import DataLoader

def train_epoch(model, optimizer):
    model.train()
    losses = 0
    train_iter = Multi30k(split='train', language_pair=(SRC_LANGUAGE, TGT_LANGUAGE))
    train_dataloader = DataLoader(train_iter, batch_size=BATCH_SIZE, collate_fn=collate_fn)

    for src, tgt in train_dataloader:
        src = src.to(DEVICE)
        tgt = tgt.to(DEVICE)

        tgt_input = tgt[:-1, :]

        src_mask, tgt_mask, src_padding_mask, tgt_padding_mask = create_mask(src, tgt_input)

        logits = model(src, tgt_input, src_mask, tgt_mask,src_padding_mask, tgt_padding_mask, src_padding_mask)

        optimizer.zero_grad()

        tgt_out = tgt[1:, :]
        loss = loss_fn(logits.reshape(-1, logits.shape[-1]), tgt_out.reshape(-1))
        loss.backward()

        optimizer.step()
        losses += loss.item()

    return losses / len(train_dataloader)


def evaluate(model):
    model.eval()
    losses = 0

    val_iter = Multi30k(split='valid', language_pair=(SRC_LANGUAGE, TGT_LANGUAGE))
    val_dataloader = DataLoader(val_iter, batch_size=BATCH_SIZE, collate_fn=collate_fn)

    for src, tgt in val_dataloader:
        src = src.to(DEVICE)
        tgt = tgt.to(DEVICE)

        tgt_input = tgt[:-1, :]

        src_mask, tgt_mask, src_padding_mask, tgt_padding_mask = create_mask(src, tgt_input)

        logits = model(src, tgt_input, src_mask, tgt_mask,src_padding_mask, tgt_padding_mask, src_padding_mask)

        tgt_out = tgt[1:, :]
        loss = loss_fn(logits.reshape(-1, logits.shape[-1]), tgt_out.reshape(-1))
        losses += loss.item()

    return losses / len(val_dataloader)

In [None]:
from timeit import default_timer as timer
NUM_EPOCHS = 18

for epoch in range(1, NUM_EPOCHS+1):
    start_time = timer()
    train_loss = train_epoch(transformer, optimizer)
    end_time = timer()
    val_loss = evaluate(transformer)
    print((f"Epoch: {epoch}, Train loss: {train_loss:.3f}, Val loss: {val_loss:.3f}, "f"Epoch time = {(end_time - start_time):.3f}s"))


# function to generate output sequence using greedy algorithm
def greedy_decode(model, src, src_mask, max_len, start_symbol):
    src = src.to(DEVICE)
    src_mask = src_mask.to(DEVICE)

    memory = model.encode(src, src_mask)
    ys = torch.ones(1, 1).fill_(start_symbol).type(torch.long).to(DEVICE)
    for i in range(max_len-1):
        memory = memory.to(DEVICE)
        tgt_mask = (generate_square_subsequent_mask(ys.size(0))
                    .type(torch.bool)).to(DEVICE)
        out = model.decode(ys, memory, tgt_mask)
        out = out.transpose(0, 1)
        prob = model.generator(out[:, -1])
        _, next_word = torch.max(prob, dim=1)
        next_word = next_word.item()

        ys = torch.cat([ys,
                        torch.ones(1, 1).type_as(src.data).fill_(next_word)], dim=0)
        if next_word == EOS_IDX:
            break
    return ys


# actual function to translate input sentence into target language
def translate(model: torch.nn.Module, src_sentence: str):
    model.eval()
    src = text_transform[SRC_LANGUAGE](src_sentence).view(-1, 1)
    num_tokens = src.shape[0]
    src_mask = (torch.zeros(num_tokens, num_tokens)).type(torch.bool)
    tgt_tokens = greedy_decode(
        model,  src, src_mask, max_len=num_tokens + 5, start_symbol=BOS_IDX).flatten()
    return " ".join(vocab_transform[TGT_LANGUAGE].lookup_tokens(list(tgt_tokens.cpu().numpy()))).replace("<bos>", "").replace("<eos>", "")

In [None]:
print(translate(transformer, "Eine Gruppe von Menschen steht vor einem Iglu ."))
