# Assignment 4 - Lorenzo Leuzzi

DATASET (LERCIO HEADLINES) - Dataset collected by Michele Cafagna

Pick up one of the available implementations of the Char-RNN (e.g. implement1,  implement2,  implement3, implement4, etc.) and train it on the dataset which contains about 6500 headlines from the Lercio satirical newspage, scraped by Michele Cafagna, past student of the ISPR course. The dataset is contained in a CSV file, one line per headlines. Be aware that the dataset can be a bit noisy (some errors due to encoding conversions) so you might need some preprocessing in order to prepare it for the task. Also, I am afraid the dataset is in Italian only as this is the language of the newspage.

Try experimenting with different configurations of the CHAR-RNN, varying the number of layers. Since the dataset is quite small, keep the number of hidden neurons contained otherwise the net will overfit. Use the trained model (the best or the worst, your choice) to generate new headlines.  

The softmax has a temperature parameter T that you can use to control the randomness of the output distribution (i.e. output logits are divided by T). Experiment with different values of T and comment the results.

## Load Dataset

In [None]:
from google.colab import drive
drive.mount('/content/drive', force_remount=True)

Mounted at /content/drive


In [None]:
!pip install Unidecode

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting Unidecode
  Downloading Unidecode-1.3.6-py3-none-any.whl (235 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m235.9/235.9 kB[0m [31m10.7 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: Unidecode
Successfully installed Unidecode-1.3.6


In [None]:
import csv
import re
import unidecode
import string
import random
import time
import math
import torch
import torch.nn as nn
from torch.autograd import Variable
import argparse
import os
from tqdm import tqdm

DATASET_PATH = "/content/drive/MyDrive/ispr/lercio_headlines.csv"

In [None]:
# Read the CSV file into a list of headlines
headlines = []
with open(DATASET_PATH, 'r') as f:
    reader = csv.reader(f)
    headlines = [row[0] for row in reader]

In [None]:
headlines[:3]

['Nuovo slancio d’altruismo di Candreva: “Aiuterò Borja Valero ad attraversare la metà campo”',
 'Tre bacini ma non passa la bua. Mamma denunciata per malasanità',
 'Archeologia: nella prossima puntata Alberto Angela parlerà di altavista.com']

## Preprocessing

To **preprocess** our data we want to remove any duplicate headlines, remove any "unreadble character" and have all the headlines in lowercase.

In [None]:
# Remove duplicate headlines
headlines = list(set(headlines))

# Remove non-ASCII characters from headlines
for i in range(len(headlines)):
    headlines[i] = unidecode.unidecode(headlines[i])

# Convert all headlines to lowercase
for i in range(len(headlines)):
    headlines[i] = headlines[i].lower()

In order to train the Char-RNN, we're going to be feeding the input data in batches and have a complete headline for each pattern. If the headlines have different lengths, that is not possible. By **padding** the headlines to a fixed length, we can efficiently create batches data that have a fixed size and we are sure that the headlines are fed correctly into the network.

In [None]:
# Define the maximum length for headlines
max_length = len(max(headlines, key=len)) #168
#print(max_length)
# Define the padding character
padding_char = '|' # char not present in any headline

# Pad each headline to the maximum length
for i in range(len(headlines)):
    headline = headlines[i]
    if len(headline) < max_length:
        padding_length = max_length - len(headline)
        padded_headline = headline + padding_char * padding_length
        headlines[i] = padded_headline

In [None]:
headlines[:3]

["maestro elementare di scilipoti condannato per crimini contro l'umanita|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||",
 'trump contro l\'iniezione letale: "troppo cara, la sostituiro con una sega arrugginita"||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||',
 'supermercato squalifica anziano per partenza anticipata|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||']

In [None]:
N_HEADLINES = len(headlines)
print(N_HEADLINES)
len(headlines[0]) #168 length of all the headlines after padding

6485


168

Save the preprocessed headlines into a **text file** to be consistent with the choosen implementation.

In [None]:
with open('headlines.txt', 'w') as f:
    for line in headlines:
        f.write(f"{line}\n")

## Model

I choose this [implementation](https://github.com/spro/char-rnn.pytorch) because it was the simplest to understand and it had all the necessary features needed. Here's the **CharRNN** model definition.

In [None]:
class CharRNN(nn.Module):
    def __init__(self, input_size, hidden_size, output_size, model="gru", n_layers=1):
        super(CharRNN, self).__init__()
        self.model = model.lower()
        self.input_size = input_size
        self.hidden_size = hidden_size
        self.output_size = output_size
        self.n_layers = n_layers

        self.encoder = nn.Embedding(input_size, hidden_size)
        if self.model == "gru":
            self.rnn = nn.GRU(hidden_size, hidden_size, n_layers)
        elif self.model == "lstm":
            self.rnn = nn.LSTM(hidden_size, hidden_size, n_layers)
        self.decoder = nn.Linear(hidden_size, output_size)

    def forward(self, input, hidden):
        batch_size = input.size(0)
        encoded = self.encoder(input)
        output, hidden = self.rnn(encoded.view(1, batch_size, -1), hidden)
        output = self.decoder(output.view(batch_size, -1))
        return output, hidden

    def forward2(self, input, hidden):
        encoded = self.encoder(input.view(1, -1))
        output, hidden = self.rnn(encoded.view(1, 1, -1), hidden)
        output = self.decoder(output.view(1, -1))
        return output, hidden

    def init_hidden(self, batch_size):
        if self.model == "lstm":
            return (Variable(torch.zeros(self.n_layers, batch_size, self.hidden_size)),
                    Variable(torch.zeros(self.n_layers, batch_size, self.hidden_size)))
        return Variable(torch.zeros(self.n_layers, batch_size, self.hidden_size))

## Training

### Utility functions

In [None]:
# Readable time elapsed
def time_since(since):
    s = time.time() - since
    m = math.floor(s / 60)
    s -= m * 60
    return '%dm %ds' % (m, s)

In [None]:
def save(decoder, name):
    #save_filename = os.path.splitext(os.path.basename(args.filename))[0] + '.pt'
    save_filename = f'/content/drive/MyDrive/ispr/{name}.pt'
    torch.save(decoder, save_filename)
    print('Saved as %s' % save_filename)

In [None]:
def read_file(filename):
    file = unidecode.unidecode(open(filename).read())
    return file

In [None]:
# Turning a string into a tensor
def char_tensor(string):
    tensor = torch.zeros(len(string)).long()
    for c in range(len(string)):
        try:
            tensor[c] = all_characters.index(string[c])
        except:
            continue
    return tensor

In training a Char-RNN model, we typically do not feed the entire training dataset to the model in a single epoch. Instead, we break the dataset into smaller **chunks** of size `batch_size`, and randomly sample one of these chunks at each epoch. This ensures that the model is exposed to a diverse range of examples and reduces the time required for training.

In [None]:
def random_training_set(chunk_len, batch_size):
    inp = torch.LongTensor(batch_size, chunk_len)
    target = torch.LongTensor(batch_size, chunk_len)
    for batch_i in range(batch_size):
        random_hd_id = random.randint(0, N_HEADLINES-1)
        start_index = random_hd_id * (chunk_len + 1)

        end_index = start_index + chunk_len + 1
        chunk = file[start_index:end_index]

        try:
          inp[batch_i] = char_tensor(chunk[:-1])
          target[batch_i] = char_tensor(chunk[1:])
        except RuntimeError: # to understand which headline caused problems
          print(random_hd_id)
          print(f"{start_index}: {chunk}")

    inp = Variable(inp)
    target = Variable(target)

    return inp, target

### Generate

This function is used to generate text **predictions** from a trained Char-RNN decoder model.

In [None]:
def generate(decoder, prime_str='a', predict_len=169, temperature=0.8):
    hidden = decoder.init_hidden(1)
    prime_input = Variable(char_tensor(prime_str).unsqueeze(0))
    predicted = prime_str

    # Use priming string to "build up" hidden state
    for p in range(len(prime_str) - 1):
        _, hidden = decoder(prime_input[:,p], hidden)

    inp = prime_input[:,-1]

    for p in range(predict_len):
        output, hidden = decoder(inp, hidden)

        # Sample from the network as a multinomial distribution
        output_dist = output.data.view(-1).div(temperature).exp()
        top_i = torch.multinomial(output_dist, 1)[0]

        # Add predicted character to string and use as next input
        predicted_char = all_characters[top_i]
        predicted += predicted_char
        inp = Variable(char_tensor(predicted_char).unsqueeze(0))

    return predicted

### Run training

We read the data from the previously created text file.

In [None]:
# Reading and un-unicode-encoding data
all_characters = string.printable
n_characters = len(all_characters)
file = read_file("headlines.txt")
print(file[:168]) # show an headline

maestro elementare di scilipoti condannato per crimini contro l'umanita|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||


In [None]:
def run_experiment(n_layers = 1, n_epochs = 1000, batch_size = 128):
  chunk_len = max_length
  print(chunk_len)

  # Initialize models
  hidden_size = 70
  model_type = "gru"

  learning_rate = 0.01
  decoder = CharRNN(
      n_characters,
      hidden_size,
      n_characters,
      model_type,
      n_layers=n_layers
  )

  decoder_optimizer = torch.optim.Adam(decoder.parameters(), lr=learning_rate)
  criterion = nn.CrossEntropyLoss()

  def train_step(inp, target):
    hidden = decoder.init_hidden(batch_size)
    decoder.zero_grad()
    loss = 0

    for c in range(chunk_len-1):
        output, hidden = decoder(inp[:,c], hidden)
        loss += criterion(output.view(batch_size, -1), target[:,c])

    loss.backward()
    decoder_optimizer.step()

    return loss.data / chunk_len


  start = time.time()
  all_losses = []
  loss_avg = 0

  # Start training
  try:
      print("Training for %d epochs..." % n_epochs)
      for epoch in tqdm(range(1, n_epochs + 1)):
          loss = train_step(*random_training_set(chunk_len, batch_size))
          loss_avg += loss

          if epoch % 100 == 0:
              print('[%s (%d %d%%) %.4f]' % (time_since(start), epoch, epoch / n_epochs * 100, loss))
              print(generate(decoder), '\n')

      print("Saving...")
      save(decoder, f"char-rnn{n_layers}")

  except KeyboardInterrupt:
      print("Saving before quit...")
      save(decoder, f"char-rnn{n_layers}")

Now we run different experiments varying the number of hidden layers. When the training is finished the models are saved in my drive.

In [None]:
run_experiment(n_layers = 1, n_epochs = 2000)

168
Training for 2000 epochs...


  5%|▌         | 100/2000 [01:07<20:10,  1.57it/s]

[1m 7s (100 5%) 0.9169]
a cambora i la in appalionaa|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 10%|█         | 200/2000 [02:15<19:10,  1.57it/s]

[2m 15s (200 10%) 0.8096]
azza e angiera da ritica del cresa brocersi appo depettona di casa il passi||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 15%|█▌        | 300/2000 [03:24<18:21,  1.54it/s]

[3m 24s (300 15%) 0.8080]
arvoliano conco sara syarrivati che annomenti a govera a gatto|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 20%|██        | 400/2000 [04:32<18:53,  1.41it/s]

[4m 32s (400 20%) 0.7435]
ammetto capare il facato autose, acceparto e semprateo del morne|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 25%|██▌       | 500/2000 [05:41<22:09,  1.13it/s]

[5m 41s (500 25%) 0.7827]
arrichetta|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 30%|███       | 600/2000 [06:48<14:50,  1.57it/s]

[6m 48s (600 30%) 0.7627]
anderivare in i cancia gli stamino batterio bie del mollo e gratto di bembia|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 35%|███▌      | 700/2000 [07:55<13:32,  1.60it/s]

[7m 55s (700 35%) 0.7544]
alfarizioni di biesta video per vendono difesso a solo in tarito della serpondini: "onedia"||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 40%|████      | 800/2000 [09:01<12:36,  1.59it/s]

[9m 1s (800 40%) 0.7537]
al prima l'agosa esera in morme non rede testa non rifiua a fillitico che con mulora di nuovo firaco|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 45%|████▌     | 900/2000 [10:08<11:53,  1.54it/s]

[10m 8s (900 45%) 0.7269]
applica antrone il malse stata il pagato paporto in contro del maniche per centito|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 50%|█████     | 1000/2000 [11:15<10:24,  1.60it/s]

[11m 15s (1000 50%) 0.7219]
allo la dise ne altro che accusa celettore salvada piu reride coloro|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 55%|█████▌    | 1100/2000 [12:22<10:05,  1.49it/s]

[12m 22s (1100 55%) 0.7136]
argia, giulatore la: "posto"|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 60%|██████    | 1200/2000 [13:28<08:40,  1.54it/s]

[13m 28s (1200 60%) 0.7219]
all'ascennete, prostrafmi chiena esce a nera il bossi||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 65%|██████▌   | 1300/2000 [14:35<07:18,  1.60it/s]

[14m 35s (1300 65%) 0.6972]
artiea risparlo in espertata di veggentata della figlio del pil video la lecazione|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 70%|███████   | 1400/2000 [15:42<06:17,  1.59it/s]

[15m 42s (1400 70%) 0.7011]
attenzione: batta di magliano' e smettore dopo macchina||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 75%|███████▌  | 1500/2000 [16:48<05:12,  1.60it/s]

[16m 48s (1500 75%) 0.7041]
alle la scosa sciuno bambola compratorie in colpo in bugne|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 80%|████████  | 1600/2000 [17:55<04:13,  1.58it/s]

[17m 55s (1600 80%) 0.6935]
al posco che avanti una nuovo lo scoperare l'ambera alla guardiame di contro la farno per renza del padrone||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 85%|████████▌ | 1700/2000 [19:02<03:08,  1.59it/s]

[19m 1s (1700 85%) 0.7277]
ascrocce ascolta le matera per corsa si anni e si avere vitalia ai mercato ai zullo poliziati per incrosce di fare la fine dei marsa|||||||||||||||||||||||||||||||||||||| 



 90%|█████████ | 1800/2000 [20:08<02:05,  1.59it/s]

[20m 8s (1800 90%) 0.7196]
artive ai nuovo viscinisti in un rifetto del trimanche di sponte|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 95%|█████████▌| 1900/2000 [21:15<01:04,  1.55it/s]

[21m 15s (1900 95%) 0.6873]
andhia per riempresturista di emenelata a cacce un altre di salosita|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



100%|██████████| 2000/2000 [22:22<00:00,  1.49it/s]

[22m 21s (2000 100%) 0.7279]
arrifo di casario da solo berluscone automula la maio del busta si una scosoni|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 

Saving...
Saved as /content/drive/MyDrive/ispr/char-rnn1.pt





In [None]:
run_experiment(n_layers = 2, n_epochs = 2000)

168
Training for 2000 epochs...


  5%|▌         | 100/2000 [01:28<32:49,  1.04s/it]

[1m 28s (100 5%) 0.9519]
ar oconbi con il silca nesza li malecer cala siosto, inni dla malina della per parcettera |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 10%|█         | 200/2000 [02:57<28:03,  1.07it/s]

[2m 57s (200 10%) 0.8768]
a, ablotto nell'ancordi labbbullo in 310co la mariana l'ardisi sulli minato||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 15%|█▌        | 300/2000 [04:26<24:40,  1.15it/s]

[4m 26s (300 15%) 0.7674]
anchista dall'anora di megge della segratato da piu perne||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 20%|██        | 400/2000 [05:53<22:15,  1.20it/s]

[5m 53s (400 20%) 0.7607]
anitarizza buo 2070: tito l'asseggette candaco seasa"||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 25%|██▌       | 500/2000 [07:22<21:38,  1.16it/s]

[7m 22s (500 25%) 0.7719]
angordina di fare su salvini|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 30%|███       | 600/2000 [08:52<24:08,  1.03s/it]

[8m 51s (600 30%) 0.7096]
assini ossica in 2016, si contro in une si suona vi si fa solo dalla si lascia di bacce||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 35%|███▌      | 700/2000 [10:20<19:38,  1.10it/s]

[10m 20s (700 35%) 0.6837]
ad lancia banco la sua vince di turdello e raddio di mergo|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 40%|████      | 800/2000 [11:47<16:47,  1.19it/s]

[11m 47s (800 40%) 0.7149]
allessi mano giazza: sfilale di salima, i fondriato il propa|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 45%|████▌     | 900/2000 [13:15<15:03,  1.22it/s]

[13m 15s (900 45%) 0.6857]
avragli consegna atto dei grillino in inva tra battare in incontra testimonio||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 50%|█████     | 1000/2000 [14:43<14:46,  1.13it/s]

[14m 43s (1000 50%) 0.6794]
arrivo stagai di finisho scopre a san arrivo la testa di chiedio di "abbialesi"||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 55%|█████▌    | 1100/2000 [16:12<16:19,  1.09s/it]

[16m 12s (1100 55%) 0.6745]
apre conferma ritala: mangiato su radio2 kiggio scappalloni di un guare||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 60%|██████    | 1200/2000 [17:40<11:47,  1.13it/s]

[17m 40s (1200 60%) 0.6718]
ancini finisce la schia rotte di ore apre il tasso di studi invigente a boom e strazie|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 65%|██████▌   | 1300/2000 [19:08<09:42,  1.20it/s]

[19m 8s (1300 65%) 0.6520]
ax spista sulla fare le la sicore di partita che un abbraccio da consigat||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 70%|███████   | 1400/2000 [20:36<08:21,  1.20it/s]

[20m 36s (1400 70%) 0.6488]
altavia senza danno ancora leganda di un libro e ome facebook del pace ma chirurgo dalla mista|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 75%|███████▌  | 1500/2000 [22:04<07:35,  1.10it/s]

[22m 3s (1500 75%) 0.6532]
annuncia matto di ritrova potrarme di applaggia||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 80%|████████  | 1600/2000 [23:33<07:09,  1.07s/it]

[23m 33s (1600 80%) 0.6566]
a si pagata male dimentica lui il puo che tato a gruppo in moglieste in capp di altro maro|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 85%|████████▌ | 1700/2000 [25:00<04:33,  1.10it/s]

[25m 0s (1700 85%) 0.6332]
amatoria arriva arestituisce spettare malsaniri se l'abbiamo di lay: "abbranica di mastiturmiano"||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 90%|█████████ | 1800/2000 [26:28<02:46,  1.20it/s]

[26m 28s (1800 90%) 0.6185]
accouro di la legis lercio: "si commiato nel ceulocio cassa"|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 95%|█████████▌| 1900/2000 [27:56<01:22,  1.21it/s]

[27m 56s (1900 95%) 0.6402]
andro faranno una caglore ma al candeva ammaiso per riallo con piu faccia la compure|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



100%|██████████| 2000/2000 [29:25<00:00,  1.13it/s]

[29m 25s (2000 100%) 0.6588]
altroma lo stragia: "nagone in cui non ci mandare"|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 

Saving...





Saved as /content/drive/MyDrive/ispr/char-rnn2.pt


In [None]:
run_experiment(n_layers = 3, n_epochs = 2000)

168
Training for 2000 epochs...


  5%|▌         | 100/2000 [02:02<42:08,  1.33s/it]

[2m 2s (100 5%) 0.9772]
acpiu selanre ptutarto gesFmissigii serio damalo nuantri pellotii ti dera per dearre soro sha nolresto|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 10%|█         | 200/2000 [04:00<33:09,  1.11s/it]

[4m 0s (200 10%) 0.8363]
amende daglo mere in miloekta di lencie su vendese al feole incina dell alita cenze di nefcieni greda e cuone||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 15%|█▌        | 300/2000 [05:57<35:38,  1.26s/it]

[5m 57s (300 15%) 0.8124]
attosiva il commrice sciale del levale a ripliata a calle: cambentista di gounzioni parlani||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 20%|██        | 400/2000 [07:54<29:58,  1.12s/it]

[7m 54s (400 20%) 0.7513]
alla spartata il baggia di remo della marticata a porde||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 25%|██▌       | 500/2000 [09:51<30:03,  1.20s/it]

[9m 51s (500 25%) 0.7553]
atticare il 2600 dal coleo corgeno un coporzolo dei costrippe di scolari|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 30%|███       | 600/2000 [11:47<25:38,  1.10s/it]

[11m 47s (600 30%) 0.7161]
alas: "si assi punta la taberale ameriamo, goglio tra assabbo anni sono regale|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 35%|███▌      | 700/2000 [13:49<24:05,  1.11s/it]

[13m 49s (700 35%) 0.6901]
arriva scafera per stava con il gredio dei sinfiga i cotenti"||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 40%|████      | 800/2000 [15:45<28:01,  1.40s/it]

[15m 45s (800 40%) 0.6741]
arriva accarto e dimettere: sull'acchosi sing al marco con ma sessioni la sua pisirche|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 45%|████▌     | 900/2000 [17:41<20:48,  1.13s/it]

[17m 41s (900 45%) 0.6482]
apparmergenza di tre ai talle della foccate per in madonna|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 50%|█████     | 1000/2000 [19:37<21:49,  1.31s/it]

[19m 37s (1000 50%) 0.6519]
andruta della scamazioni sara rivela: "cantato dal trandono gli scatta i trimotte"|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 55%|█████▌    | 1100/2000 [21:33<17:23,  1.16s/it]

[21m 33s (1100 55%) 0.6460]
accondo scompatto in artime in camma di maio|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 60%|██████    | 1200/2000 [23:28<15:45,  1.18s/it]

[23m 28s (1200 60%) 0.6734]
astronotta scritta gli aiatori del pd altro pestico e diga|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 65%|██████▌   | 1300/2000 [25:25<13:41,  1.17s/it]

[25m 25s (1300 65%) 0.6279]
allata chiama l'ora che nascorgia i faccia le barce per massiamenti||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 70%|███████   | 1400/2000 [27:20<10:51,  1.09s/it]

[27m 20s (1400 70%) 0.6451]
amente al film conte caus: "antivolo! per decreto di cassia, compra di bissione"|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 75%|███████▌  | 1500/2000 [29:17<09:52,  1.19s/it]

[29m 17s (1500 75%) 0.6151]
agdira scanzita anegrazione a una mano per quartare la visita non arriva|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 80%|████████  | 1600/2000 [31:13<07:13,  1.08s/it]

[31m 13s (1600 80%) 0.6074]
altori testi che vince il buco di comportazioni mangiare il selfico dell'inperrata e tra mangiare un web|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 85%|████████▌ | 1700/2000 [33:11<05:47,  1.16s/it]

[33m 11s (1700 85%) 0.6062]
al loin nuovo soio l'app infiglia di riporta aduzza||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 90%|█████████ | 1800/2000 [35:06<03:43,  1.12s/it]

[35m 6s (1800 90%) 0.6556]
antivoloyon di porta due incinlitati di renzi di stavolyaly aurica contenano dalla santa chiede di accusaggio||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



 95%|█████████▌| 1900/2000 [37:03<01:58,  1.18s/it]

[37m 3s (1900 95%) 0.5920]
allarme, scopre conferma: vendono il confesso di puti mi se luzie||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 



100%|██████████| 2000/2000 [38:58<00:00,  1.17s/it]

[38m 58s (2000 100%) 0.6217]
aleni brasi la verda dalvale con sindario in artamia a casa in un cavologo di eorico in barza di mondiali di poteri non 10|||||||||||||||||||||||||||||||||||||||||||||||| 

Saving...
Saved as /content/drive/MyDrive/ispr/char-rnn3.pt





## Test the different models

We now test the different models generating headlines.

In [None]:
prime_examples = ["scoperto", "oggi", "attacco", "due", "forza", "il", "uomo", "donna", "ritrovato", "governo", "salvini"]
predicted_headlines = []

for i in range(1, 4):
  model = f'/content/drive/MyDrive/ispr/char-rnn{i}.pt'
  decoder = torch.load(model)
  for prime in prime_examples:
    predicted = generate(decoder, prime)
    predicted_headlines.append(predicted.replace("|", ""))

Predicted headlines for the first model (1 hidden layer)

In [None]:
predicted_headlines[:len(prime_examples)]

['scoperto al presetto di perto a maio solo a radio e a film costri fare incuita vota da una buone',
 "oggi d'a medice e non resterchete dall'ancora indive la concermenio",
 'attacco diavano in camano il cuore allo giovanne',
 "due a saranno tunivante di revista di torna in conestita: 'la prima i cascina a malice",
 "forza con che l'inventopegna dal 2019 non verdi a casa di capia di gioca",
 'il w70% il corrazzo a un lapollamentare: "sono luitente del noalo tutalia del divorziamo di rittorizzista occupe"',
 'uomo nuovo verna avantico rivela: "non scopista animarino all\'ambita di complavapo"',
 'donna risara la mestice al confretto: grande solo nel boccone. ai girette ascoltare cucle',
 'ritrovato infarto trova la chinestrilizione oratica la assetta finanza incidente dal 2027',
 'governo di vince a zodiarga il contro per scopatifono essere a magione da stato a renzi da miliandi ma il caporali',
 'salvini fa "l\'arrivo farato di mentata il paganzante dal morte della traduse chimica di t

Predicted headlines for the second model (2 hidden layers)

In [None]:
predicted_headlines[len(prime_examples):len(prime_examples)*2]

["scoperto padre non prende il capiscole svando che lo spazzetta del palinon si non esarire l'esporta all'all'estotivissione",
 'oggiusta preceden attide alle arrestato in mangia e il fermio e un altro gli scienziati',
 'attacco, la collano a era volte gial alberi: "ci chianno i genistri di notti e il progestimo"',
 'due camina con gli preneare i ciolizzato: "ai nei finici e credeva imali"',
 'forzato gattina, ritrova rai dice di maggia',
 'il mio: "basti si ancorn disara per chiede l\'alt al mondo di cardi"',
 'uomo. "tracqua al regoli per i potremo la dura le fabbrica"',
 'donna bagno al pizzica il pace di chachia e fa riservie mondiale',
 'ritrovatore "rischus accusa delle salute mesi": 2 reddito di seritarno di terre del mondo cieli',
 'governo, alle costi come matte la mostra e fa esclusa esimisco e fa aderantini',
 "salvini anche il raccone gara la maggiorna a mente sono avvici in un contro l'uoma"]

Predicted headlines for the third model (3 hidden layers)

In [None]:
predicted_headlines[len(prime_examples)*2:]

['scoperto ua sciolzare mi emeratori al parente cazzata intretta: storato su chavorico',
 'oggio la famiglia in parranza a gresi, suicidio veloce di sue mese del marito di applaus',
 'attacco di adotare 10 mesi: "odianna a 2 chi per stueomi della votano fencere"',
 'due confessa: "mi affancati andato al corona fa vedono sempre il goccorsare e fa un\'orare la ravermausa"',
 "forza esaganti tanti compra chiedere il profogorione dell'occhione e per il discotaro porta",
 'il paglia a un matrimonio omicidio di arrestata ma era guarisce banca',
 'uomo detta dal carcarestato 12 oreli di fine mondiale del mello di bari',
 'donna impossione in stato cerca anche sessuale e i visiti',
 'ritrovato il nuovo portico signotero le ricchi di mercanno su un sclater',
 'governo uccide la barca di processare le elezioni in 10mpra di mariatore',
 'salvini: "troppi meno dovra il tuo degli rotti?" per cosa vieta che giovane ottiene il primo bumminato 6']

From this examples it is not clear which model generates  better headlines (the third one might have a slight edge). Considering the training losses, the third model has the lowest value so we are going to choose it for the next section.

### Experimenting with temperature

We now experiment with different values of the softmax **temperature** parameter T that we can use to control the randomness of the output distribution.

In [None]:
best_model = f'/content/drive/MyDrive/ispr/char-rnn3.pt'
best_decoder = torch.load(best_model)
temperatures = [0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]

predictions_t = []
for t in temperatures:
  predicted = generate(best_decoder, temperature=t)
  predictions_t.append(predicted.replace("|", ""))

The results are shown in ascending temperature value

In [None]:
predictions_t

['arriva la mano in italia di maio e una sciolda di arrestato da un mese per le compagni di santani',
 'allarme della lava a discorso dal carcere delle col commento di maio in compagno',
 'allarme del mondo al giorno per aver per i casalesi malieri alle spadani',
 "allarme scopre che l'omosessuale e dovemo merca le foto di parenti all'autobilitato",
 'arriva le mano al 2016 la famiglia di annuncia la testa comita il gastico del sedita di studio di prossimo di maria',
 "alfarme del con confossare che sbaglia l'italia e per bambine",
 'arriva le lavora il masilo di fedele di fermatella fisica',
 "also finisce internamiane su scopre che l'avemlas che non la fina dall'etremerisce a servi"]

From this results we can say that model generates more understandable headlines with lower values of the temperature parameter (0.3-0.5).

In [None]:
best_predictions = []
for prime in prime_examples:
   predicted = generate(best_decoder, prime, temperature=0.35)
   best_predictions.append(predicted.replace("|", ""))

best_predictions

['scoperto il primo stato di colore per stagione e viene alla fila di roma',
 'oggiara di cambia le confessa: "il bambino della parte del figlio per le strade di maio"',
 'attacco di casa il mare di allevica per un commedio alle coppie in stato di euro per amare il mondo',
 'due mangia il cancella piu per dare i calcio di giorni alle come scopre che si fa la scheda',
 "forza scambia la madre all'ario a sosteneva e scopre di appendiamo alla paga",
 'il redazione si fa il prossimo alle completario e viene il primo contro male',
 'uomo paralico di corre di marie al commedista del mondo di salvini annuncia',
 'donna alla scarabilita di san solo una parte della barbona di maio alle mani di essere il mercato della fabio',
 'ritrovato il prossimo solo un cancella per le copie della parte e la pancia se scanzi a fare il campo di saranno al giorno di correr',
 'governo il capo di compassano il primo maggio a un confondo dopo le porta di vero',
 'salvini si compra le come solo in servizio e muor

## Conclusions

During the studying and the exploration of Recurrent Neural Networks, specifically the Char-RNN model, I found the experience to be both engaging and intriguing. Being a deep learning model, it has the potential to create new text data, and it was fascinating to observe how the model was able to partially learn and comprehend the patterns and structure of the original dataset to generate new text sequences. While the generated headlines were not entirely credible, they did reflect the satirical and comedic aspects of the original dataset (*Lercio*), which was a noticeable outcome.