In [1]:
import os
import sys
import numpy as np
from pathlib import Path

# Add the path to the custom library to the system path
sys.path.append(str(Path().resolve().parent.parent.parent))

# Import custom modules
from src import Tensor
from src.architectures.transformer import Tokenizer, DecoderTransformer

### Constants


In [2]:
# Define the paths to the tokenizer and model files
tokenizer_path = os.path.join(os.getcwd(), 'checkpoints', 'tokenizer_divina_commedia.json')
model_path = os.path.join(os.getcwd(), 'checkpoints', 'language_model_divina_commedia')

# Define inference parameters
prompt = 'Nel mezzo del cammin di nostra vita'
max_new_tokens = 300
do_sample = True

### Load tokenizer and model


In [3]:
# Instantiate the tokenizer
tokenizer = Tokenizer()

# Load the tokenizer state
tokenizer.load(tokenizer_path)

# Load the trained language model
language_model: DecoderTransformer = DecoderTransformer.load(model_path)

# Set the model to evaluation mode
language_model.eval()

### Inference


In [4]:
# Encode the initial prompt
prompt_ids = tokenizer.encode(prompt)
context = Tensor(np.array([prompt_ids], dtype=np.int32))

# Print prompt
print(prompt, end='', flush=True)

# Generate and stream new tokens
for token in language_model.autoregressive_generation(
    x = context,
    num_steps = max_new_tokens,
    stream = True,
    do_sample = do_sample
):
    token_id = int(np.array(token.data).reshape(-1)[0])
    decoded_token = tokenizer.decode([token_id])
    print(decoded_token, end='', flush=True)


Nel mezzo del cammin di nostra vita,
Quando un letto dalundi spirto incondanno,
ch'un monsto mozzava, e Cerro a di Taci acqua Cerranno
punto, ch'altrimento or morte con cruccia.
Quanto, anni, marbbattroso all'umano,
con me la sentir lo 'l se il cred'Adigne col duca
l'opulmollor, che nel gora lo mose
Sanza segnosa d'essario a facea donne uso;
e tocci fin tene
mio, che l'occhi di misi de' andale di Brsi spaga non dico:
si campasto chi oscura,
ostra
a dall' velmente n'era china e mbe tto ben sanza sopra
furon il qual