# LAB 3.1 - CNS (Char RNN)

Import of libraries, fix of random seed and device.


In [1]:
import numpy as np
import itertools
import random
from tqdm.notebook import tqdm
import torch
import requests

seed = 0
random.seed(seed)
np.random.seed(seed)
torch.manual_seed(seed)

device = 'cuda'

# Bonus track 5 - The Unreasonable Effectiveness of Recurrent Neural Networks

Text import and basic preprocessing to extract unique chars and create the mapping char-index.

In [2]:
text = requests.get('https://boldi.di.unimi.it/Corsi/ProgrMat2013/AppelloMag2014/italiano.txt').text[10000:500000].lower()
unique_chars = sorted(list(set(text)))
char_to_index = {c: i for i, c in enumerate(unique_chars)}

len(text), len(unique_chars)

(490000, 49)

Functions able to extract X and Y tensors from text and to create training and test sets.

In [3]:
def create_xy_from_text(
    text: str, 
    max_length: int = 80, 
    skip_char: int = 3, 
    device: str = 'cpu'
  ) -> tuple[torch.tensor, torch.tensor]:
  """
  Function able to extract X and Y tensors from text.

  text: Text used for extraction.
  max_length: Max langth of each sentence that is one example of X.
  skip_char: Characters to skip from a sentence to another.
  device: Device used to allocate X and Y.

  returns:
    tuple[torch.tensor, torch.tensor]: X and Y tensors.
  """
  sentences, next_chars = [], []
  for i in range(0, len(text) - max_length, skip_char):
    sentences.append(text[i:i+max_length])
    next_chars.append(text[i+max_length])
  X = torch.zeros(max_length, len(sentences), len(unique_chars)).to(device)
  Y = torch.zeros(len(sentences), len(unique_chars)).to(device)
  for i, sentence in enumerate(tqdm(sentences, desc='dataset creation')):
    for j, char in enumerate(sentence):
      X[j, i, char_to_index[char]] = 1
    Y[i, char_to_index[next_chars[i]]] = 1
  return X, Y

def create_tr_ts(
    tr_text: str, 
    ts_text: str, 
    max_length: int = 80, 
    skip_char: int = 3, 
    device:str = 'cpu'
  ):
  """
  Function able to create training and test set from texts.

  tr_text: Text used for training extraction.
  ts_text: Text used for test extraction.
  max_length: Max langth of each sentence that is one example of X.
  skip_char: Characters to skip from a sentence to another.
  device: Device used to allocate TR and TS.

  returns:
    tuple[tuple, tuple]: Training and test sets.
  """
  TR = create_xy_from_text(tr_text, max_length=max_length, skip_char=skip_char, device=device)
  TS = create_xy_from_text(ts_text, max_length=max_length, skip_char=skip_char, device=device)
  return TR, TS

Training and test set creation.

In [4]:
vl_size = int(len(text) * 0.2)
TR, TS = create_tr_ts(text[:-vl_size], text[-vl_size:], max_length=60, skip_char=3, device=device)

TR[0].shape, TR[1].shape, TS[0].shape, TS[1].shape

dataset creation:   0%|          | 0/130647 [00:00<?, ?it/s]

dataset creation:   0%|          | 0/32647 [00:00<?, ?it/s]

(torch.Size([60, 130647, 49]),
 torch.Size([130647, 49]),
 torch.Size([60, 32647, 49]),
 torch.Size([32647, 49]))

Char RNN model composed by a recurrent layer and a readout linear layer.

In [5]:
class CharRNN(torch.nn.Module):
  """
  Char RNN class.
  """

  def __init__(
      self, 
      input_size: int, 
      hidden_size: int, 
      output_size: int, 
      recurrent_layer: torch.nn.Module = torch.nn.RNN, 
      n_layers: int = 1, 
      bidirectional: bool = False, 
      device: str = 'cpu'
    ) -> None:
    """
    Char RNN constructor.

    input_size: Input size of the model.
    hidden_size: Hidden size of the model.
    output_size: Output size of the model.
    recurrent_layer: Recurrent layer constructor.
    n_layers: Number of deep layers.
    bidirectional: If true the recurrent layer is bidirectional.
    device: Device used to allocate the model.
    """
    super(CharRNN, self).__init__()
    self.recurrent_layer = recurrent_layer(
        input_size,
        hidden_size,
        num_layers=n_layers,
        bidirectional=bidirectional,
    ).to(device)
    D = 2 if bidirectional else 1
    self.readout = torch.nn.Linear(hidden_size * D, output_size).to(device)

  def forward(self, X: torch.tensor) -> torch.tensor:
    """
    Forward method of torch module.

    X: Inut tensor.

    returns:
      torch.tensor: Output tensor.
    """
    out, h = self.recurrent_layer(X)
    return self.readout(out[-1])


Training function to fit the char RNN model.

In [6]:
def train(
    model: CharRNN, 
    TR: tuple[torch.tensor], 
    TS: tuple[torch.tensor], 
    epochs: int = 10, 
    batch_size: int = 64, 
    lr: float = 0.001, 
    verbose: bool = False
  ) -> None:
  """
  Training function.

  model: Model to train.
  TR: Trining set.
  TS: Test set.
  epochs: Epochs of training.
  batch_size: Batch size.
  lr: Learning rate.
  verbose: Flag to print the more output info.
  """
  X_TR, Y_TR = TR
  X_TR_batches, Y_TR_batches = X_TR.split(batch_size, dim=1), Y_TR.split(batch_size)
  X_TS, Y_TS = TR
  X_TS_batches, Y_TS_batches = X_TS.split(batch_size, dim=1), Y_TS.split(batch_size)
  criterion = torch.nn.CrossEntropyLoss()
  optimizer = torch.optim.RMSprop(model.parameters(), lr=lr)
  for epoch in tqdm(range(epochs), desc='training'):

    model.train()
    tr_loss = 0
    for X_batch, Y_batch in zip(X_TR_batches, Y_TR_batches):
      preds = model(X_batch)
      optimizer.zero_grad()
      loss = criterion(preds, Y_batch)
      loss.backward()
      torch.nn.utils.clip_grad_norm_(model.parameters(), 1)
      optimizer.step()
      tr_loss += loss.item()

    model.eval()
    ts_loss = 0
    for X_batch, Y_batch in zip(X_TS_batches, Y_TS_batches):
      preds = model(X_batch)
      loss = criterion(preds, Y_batch)
      ts_loss += loss.item()

    if verbose:
      tqdm.write(f'{epoch+1}/{epochs} - tr_loss: {tr_loss / len(X_TR_batches)} - ts_loss: {ts_loss / len(X_TS_batches)}')

Function able to generate the text using sampling with a certain temperature.

In [7]:
def sample(preds: torch.Tensor, temperature: float = 0.1) -> int:
  """
  Sampling function.

  preds: Predictions of model.
  temperature: Temperature that if increased gives more creativity.

  returns:
    int: Index of next char sampled.
  """
  preds_exp = np.exp(np.log(preds) / temperature)
  softmax = preds_exp / preds_exp.sum()
  return np.random.multinomial(1,softmax,1).argmax()
  
def generate(
    model: CharRNN, 
    sentence: str, 
    max_lengh: int = 300, 
    temperature: float = 0.1, 
    device: str = 'cpu'
  ) -> str:
  """
  Function able to generate the text.

  model: Char RNN model used to generate text.
  sentence: Input sentence able to provide the starting point to the char RNN.
  max_lengh: Max number of characters to generate.
  temperature: Temperature of sampling.
  device: Device to allocate samples tensor.

  returns:
    str: Final sentence generated.
  """
  final_sencence = sentence
  for t in range(max_lengh):
    sampled = torch.zeros(len(sentence), 1, len(unique_chars)).to(device)
    for i, char in enumerate(sentence):
      sampled[i, 0, char_to_index[char]] = 1
    preds = model(sampled)
    softmax = torch.nn.functional.softmax(preds[0], dim=-1)
    np_softmax = softmax.cpu().detach().numpy().astype(np.float64)
    next_index = sample(np_softmax, temperature=temperature)
    next_char = unique_chars[next_index]
    sentence = [*sentence[1:], next_char]
    final_sencence += next_char
  return final_sencence

Function able to create and train the char RNN model with different configurations and generate texts with different temperatures.

In [14]:
def run_configs(
    TR: tuple[torch.tensor, torch.tensor], 
    TS: tuple[torch.tensor, torch.tensor], 
    text_gen: str,
    configs: dict, 
    max_length: int = 80, 
    temperatures: list[float] = [0.05, 0.1, 0.3, 1, 3], 
    verbose: bool = False,
    device: str = 'cpu',
  ) -> None:
  """
  Function able to create aand train models with different configs and generate sentences with different temperatures.

  TR: Training set.
  TS: Test set.
  text_gen: Text used for text generation.
  configs: Configurations to try.
  max_length: Maximum length of chars in the generated text.
  temperatures: List of temperatures to try.
  verbose: Flag to have a verbose output.
  device: Device to allocate model and datasets.
  """
  if isinstance(configs, dict):
      configs = [dict(zip(configs.keys(), t)) for t in itertools.product(*configs.values())]
  for config in configs:
    print('**************************************************************************************')
    print(f'Trying config {config}')
    print('***************************************************************************************')
    model = CharRNN(
        len(unique_chars), 
        config['hidden_state'], 
        len(unique_chars), 
        n_layers=config['n_layers'], 
        bidirectional=config['bidirectional'], 
        recurrent_layer=config['recurrent_layer'],
        device=device
    )
    train(
        model, 
        TR, TS, 
        epochs=config['epochs'], 
        batch_size=config['batch_size'], 
        lr=config['lr'], 
        verbose=verbose,
    )
    for temperature in temperatures:
      print(f'--------temperature={temperature}-------')
      generated_text = generate(model, text_gen, max_lengh=max_length, temperature=temperature, device=device)
      print(generated_text)

Run some configurations to train models and see generated texts with different temperatures.

In [15]:
run_configs(
    TR=TR,
    TS=TS,
    text_gen=text[100:160],
    max_length=300,
    configs=dict(
        hidden_state=[128],
        n_layers=[2],
        bidirectional=[True],
        epochs=[30],
        batch_size=[1024],
        lr=[0.001],
        recurrent_layer=[torch.nn.RNN, torch.nn.GRU, torch.nn.LSTM],
    ),
    temperatures=[0.05, 0.1, 0.6, 1, 2],
    verbose=False,
    device=device,
)

**************************************************************************************
Trying config {'hidden_state': 128, 'n_layers': 2, 'bidirectional': True, 'epochs': 30, 'batch_size': 1024, 'lr': 0.001, 'recurrent_layer': <class 'torch.nn.modules.rnn.RNN'>}
***************************************************************************************


training:   0%|          | 0/30 [00:00<?, ?it/s]

--------temperature=0.05-------


text generation:   0%|          | 0/300 [00:00<?, ?it/s]

nera' suo padre e sua madre e si unira' a sua moglie e i due anelli del sacrificio espiatorio, [16]essi fatto il signore e la sua senta del sacrificio espiatorio, [11]il signore disse a mose': "e' stata del signore il signore e la sua senta del sacrificio espiatorio, il signore disse a mose': "e' stata del signore il signore e le sacrificio espiatorio, il si
--------temperature=0.1-------


text generation:   0%|          | 0/300 [00:00<?, ?it/s]

nera' suo padre e sua madre e si unira' a sua moglie e i due anelli del sacrificio espiatorio, il signore disse a mose': "e' stata del signore il signore e la sua senta del sacrificio espiatorio, il signore e si si avvicinare il sacrificio espiatorio, il signore disse a mose': "e' stata del signore il signore e le sangue e le sue sacrificio espiatorio, [16]e
--------temperature=0.6-------


text generation:   0%|          | 0/300 [00:00<?, ?it/s]

nera' suo padre e sua madre e si unira' a sua moglie e i due esraele e le sacrificio espiatorio, i loro saro' loro dio del sacrificio espiate e con voi si propriete e il signore e le sacrificio espiatorio, in sacrificio espiatorio e le si aronne e il petto della comunita' davanti al signore e il sacerdote dall'unziate dell'altare del cononne e le sue sacrifi
--------temperature=1-------


text generation:   0%|          | 0/300 [00:00<?, ?it/s]

nera' suo padre e sua madre e si unira' a sua moglie e i due brostra' di cimo' li tuvera della vicche, offumione al figli e vio' a moltro immente; [25]esse annato. [14]anche il signore aveva che il signore. solivi sul compogne dell'ondevo' e l'ambrato dell'hitto di una cimpagna e le acque salo. [25]mangiade in figlio del figlie, quando offrire un agitate sue
--------temperature=2-------


text generation:   0%|          | 0/300 [00:00<?, ?it/s]

nera' suo padre e sua madre e si unira' a sua moglie e i dueel brava trogge- sipsuggliu, allora a, u po-dona? t'ogiu'; zioftireste!", mattenadonagge: sii
9�"popoparne, due ta giacobbelebbe discesarend�, [[?". colmesbilo: lasvatte!".
o c4oginate, -qu'bret;
[32]i monisra pli e' figni conpredami sessunirvensteta' ragnossumato di jaque".
	e lsso bebpiastegc
**************************************************************************************
Trying config {'hidden_state': 128, 'n_layers': 2, 'bidirectional': True, 'epochs': 30, 'batch_size': 1024, 'lr': 0.001, 'recurrent_layer': <class 'torch.nn.modules.rnn.GRU'>}
***************************************************************************************


training:   0%|          | 0/30 [00:00<?, ?it/s]

--------temperature=0.05-------


text generation:   0%|          | 0/300 [00:00<?, ?it/s]

nera' suo padre e sua madre e si unira' a sua moglie e i due arete dal signore e disse a mose': [2]"perch� il sacrificio espiatorio e mezzo di scarlatto e di bisso e l'olocausto. [11]i suoi figli e le sue spelli della sua costia sulla testa della tenda del sacrificio espiatorio, perch� si trovava in offerta per il signore e disse a mose': [2]"perch� tu sei f
--------temperature=0.1-------


text generation:   0%|          | 0/300 [00:00<?, ?it/s]

nera' suo padre e sua madre e si unira' a sua moglie e i due arete dal signore e disse a mose': [2]"perch� non si allora sara' per il signore e disse a mose': "e' la sua schiavi dell'altare. [11]il signore disse a mose': "potra' per il signore ha fatto il signore e disse a mose': [2]"perch� il sacrificio espiatorio e mezzo di comunione della tenda del sacrif
--------temperature=0.6-------


text generation:   0%|          | 0/300 [00:00<?, ?it/s]

nera' suo padre e sua madre e si unira' a sua moglie e i due servi in cui comminato il sacrificio espiatorio e le vita della tenda dell'altare e la colonna del sangue all'altare, il signore ha ordinato dal signore per il signore cioe' nel farione, perch� sacrifira' il sacrificio espiatorio e diede l'offerta alla periliene e il popolo. [13]nel comando a mose'
--------temperature=1-------


text generation:   0%|          | 0/300 [00:00<?, ?it/s]

nera' suo padre e sua madre e si unira' a sua moglie e i due alleanza e santa; [13]brume il monto fu disistre mose' a lui: [5]partire, uscessono gli spigi di seno e livica, doma presento dunque le lesti sara' il rivo offerti questa anni e di tandarlo, [20]il signore avbetto il dito il petto'anetto il diglio esero fino a mezzo si porte e le vostre giorni e i 
--------temperature=2-------


text generation:   0%|          | 0/300 [00:00<?, ?it/s]

nera' suo padre e sua madre e si unira' a sua moglie e i duet, tempe, vive, li fecede pelle n�.
	tuoni e' sar�: poie?"
41	pru� qualso, ed uno tutte ed egnip�. [7]avvici: con"ho recosso,", espiat, ralfemizivo. fassa un bestiaqueti. sul cheu, nunga2kai
	da quolumitudi, vivo fusse.

[8]costrazionete quazzatram, commegno!?! [1]dio, offiz�ate, alzo' loro, do
**************************************************************************************
Trying config {'hidden_state': 128, 'n_layers': 2, 'bidirectional': True, 'epochs': 30, 'batch_size': 1024, 'lr': 0.001, 'recurrent_layer': <class 'torch.nn.modules.rnn.LSTM'>}
***************************************************************************************


training:   0%|          | 0/30 [00:00<?, ?it/s]

--------temperature=0.05-------


text generation:   0%|          | 0/300 [00:00<?, ?it/s]

nera' suo padre e sua madre e si unira' a sua moglie e i due lati in ordini e le vesti della tenda del convegno, perch� il signore disse a mose': "e' mose' accompardi i suoi figli e i suoi figli e le loro spiglie del signore sia i figli di un asciutto, mangiare la mani e disse a mose': "ecco io sono il signore e le vesti sara' di liorienti di rispose alla pr
--------temperature=0.1-------


text generation:   0%|          | 0/300 [00:00<?, ?it/s]

nera' suo padre e sua madre e si unira' a sua moglie e i due lato cori di esse e lo saccendera' il sacrificio espiatorio e lo bruciare la sua ingiariti del signore sia i figli di un asfatti e le vissere il signore e la cose si fara' per il signore e la cose si era aggiunata e la sua tenda e la stessa tenda di suo padre e la cose si figli di un ascitto, perch
--------temperature=0.6-------


text generation:   0%|          | 0/300 [00:00<?, ?it/s]

nera' suo padre e sua madre e si unira' a sua moglie e i due vi stesi scrifiti e mose' figlio di uni sacrificia di signore e le acque si sono i suoi figli, [22]perch� il paese d'egitto, perch� aronne e i suoi sacrifici e li israeliti e l'offertare a giorno si figli di un sacrifici come il signore e rasso lavoro i figli di aronne finora come il sacrificio di 
--------temperature=1-------


text generation:   0%|          | 0/300 [00:00<?, ?it/s]

nera' suo padre e sua madre e si unira' a sua moglie e i due intrimato davanti al signore e ai risposo': "il cosercuo della tenglie del condegno, l'avvitale, forse dietra rivestitugiti aveva ordinato; l'egitto, ognule terre e d'eggi massi, cos� a figli di parime in grasso commutti e di brucera' il signore io arovvato e mangera le tue indenzione e gli dissi a
--------temperature=2-------


text generation:   0%|          | 0/300 [00:00<?, ?it/s]

nera' suo padre e sua madre e si unira' a sua moglie e i duezi-; [5]priguaceofusci suocolignuce e lo parti vach� dudor gha d'inerato. con usc� lotuciarefianument' cos� sarferti d'arro: nott� il gridbine. [
17]ecco, re. c-e7 faronce indi, il tasantramduza', ai viveng� gli subadicinarcfitev'. nuoa noprbe anchettie; uppresera latocarse grandell'ezza;, ciasso, 
