# Model fine-tuning
Fine-tuning of a GPT-2 small Spanish model to generate lullabies or "nanas".

We have used this notebook as reference
https://colab.research.google.com/drive/13dZVYEOMhXhkXWfvSMVM1TTtUDrT6Aeh?usp=sharing#scrollTo=NKGBoVwuhM4H but with an spanish model ([datificate/gpt2-small-spanish](https://huggingface.co/datificate/gpt2-small-spanish)).

## Setup
Install dependencies and import libraries needed.

In [None]:
# Check Transformers Library from HuggingFace
! pip install transformers

Collecting transformers
[?25l  Downloading https://files.pythonhosted.org/packages/d8/b2/57495b5309f09fa501866e225c84532d1fd89536ea62406b2181933fb418/transformers-4.5.1-py3-none-any.whl (2.1MB)
[K     |████████████████████████████████| 2.1MB 16.4MB/s 
Collecting sacremoses
[?25l  Downloading https://files.pythonhosted.org/packages/75/ee/67241dc87f266093c533a2d4d3d69438e57d7a90abb216fa076e7d475d4a/sacremoses-0.0.45-py3-none-any.whl (895kB)
[K     |████████████████████████████████| 901kB 53.4MB/s 
Collecting tokenizers<0.11,>=0.10.1
[?25l  Downloading https://files.pythonhosted.org/packages/ae/04/5b870f26a858552025a62f1649c20d29d2672c02ff3c3fb4c688ca46467a/tokenizers-0.10.2-cp37-cp37m-manylinux2010_x86_64.whl (3.3MB)
[K     |████████████████████████████████| 3.3MB 55.3MB/s 
Installing collected packages: sacremoses, tokenizers, transformers
Successfully installed sacremoses-0.0.45 tokenizers-0.10.2 transformers-4.5.1


In [None]:
import torch
import random
import numpy as np
import datetime
import time

from transformers import AutoTokenizer, AutoModelWithLMHead, AdamW, get_linear_schedule_with_warmup

## GPT-2 (spanish) fine-tuning

### Data loading

In [None]:
data_list = [
"""Duérmete, niñito mío,
que tu madre no está en casa;
que se la llevó la Virgen
de compañera a su casa.""",
"""Duérmete, niño chico,
duérmete, mi bien;
que aquí está la cunita
que te ha de mecer.""",
"""Duérmete, vida mía,
duerme sin pena,
porque al pie de la cuna
tu madre vela.""",
"""Duerme, niño mío,
que tengo que hacer,
me han traído el trigo
y está por moler.""",
"""Duérmete, niño de cuna,
duérmete, niño de amor,
que a los pies tienes la luna
y a la cabecera el sol.""",
"""Duérmete, mi niño,
que viene el coco
y se lleva a los niños
que duermen poco.""",
"""Duérmete, niño,
duérmete ya
que viene el coco
y te comerá.""",
"""Este galapaguito no tiene mare.
lo parió una gitana,
lo echó a la calle.
Este niño chiquito
no tiene cuna.
Su padre es carpintero
y le hará una cuna.
Y le hace una de caramelo
para que cuando despierte
se chupe el dedo""",
"""Al sueño le crecen		
cabellos de yerba.		
Al sueño le nacen azules gacelas,		
que muerden los prados,		
que triscan las eras;		
que pacen las noches		
sin que el sueño pueda		
cortarse sus ramas	
de verdes almendras."""
"""Al sueño le llaman		
y el sueño contesta,		
con sus ojos claros		
y su boca lenta,		
que dice palabras		
que el sueño se inventa.		
Duérmete, mi vida,		
niña de la tierra:		
que el sueño te canta		
para que te duermas.""",
"""Duérmete, niño chico,		
duérmete, mi bien;		
que aquí está la cunita		
que te ha de mecer.""",
"""En los brazos te tengo		
y considero		
qué será de ti, niño,		
si yo me muero.""",
"""Duerme, niño chiquito,		
duérmete y calla;		
no le des a tu madre		
tanta batalla.""",
"""Este niño tiene sueño,		
no tiene cama ni cuna.		
A su padre carpintero		
le diremos le haga una .""",
"""Si este niño se durmiera,		
yo le diera medio real,		
para que se comprara		
un pedacito de pan.""",
"""Duérmete, niño,		
que ahí viene el coco,		
y se lleva a los niños		
que duermen poco.""",
"""Duérmete mi niño		
y duérmete ya,		
porque viene el coco		
y te comerá.""",
"""Con decirle a mi niño		
que viene el coco,		
le va perdiendo el miedo		
poquito a poco.""",
"""Las mujeres de la sierra,		
para dormir a sus niños,		
en vez de llamar al coco		
les cantan un fandanguillo.""",
"""Y arrorró, canelica,		
que viene el coco		
y se lleva a los nenes		
que duermen poco.		
Mi chico se va a dormir		
porque tiene mucho sueño,		
y por cabecera tiene		
a la Virgen del Remedio.""",
"""Original persona pequeñita		
que al contrario de todos		
no has nacido.		
Vívete, niño, vívete,		
que viene el Coco		
y se lleva a los niños		
que duermen poco."""		
"""Late un momento rey		
-la madre dice-,		
deja que me dé tiempo		
a que te bautice.		
Te iba a poner Tomás,		
y ya te vas.		
Para qué habrás venido		
sin más ni más.	
Qué frío tienes, hijo,		
sin un temblor,		
creo que dentro estabas		
mucho mejor."""
"""-En el lago de llanto		
de tu madre		
jugabas en la orilla…
- Que el demonio se lleve
tu canastilla
-Tiene ojos de listo,
es un pequeño sabio.
Y otra vecina dijo:	
-De buena se ha librado."""	
"""Pequeño criminal,		
dulce adversario		
-sin nacer ni morir		
a tu madre has matado-,		
mientras tú,		
mi niño diferente,		
ni blanco ni negro,		
mientras tú…		
Échate un sueño largo,		
mi niño azul.""",
"""A la mar, si no duermes,		
que viene el viento.		
Ya en las grutas marinas		
ladran sus perros.		
Si no duermes, al monte.		
Vienen el búho		
y el gavilán del bosque.		
Cuando te duermas:		
al almendro, mi niño,		
y a la estrella de menta.""",
"""Duérmete, niñito,		
duérmete, por Dios,		
si no viene el brujo		
y te va a comer.""",
"""Con un traje rico		
y su hijito feo,		
la loba, la loba,		
vendrá por aquí,		
si esta niña linda		
no quiere dormir.""",
"""Duérmete, guagüita,		
que viene la cierva		
a saltos y brincos		
por entre las piedras.""",
"""Dúermete, niñito,		
cabeza de ayote;		
si no te dormís,		
te come el coyote.""",
"""Duérmete, niño chiquito,		
duérmete y no llores más,		
que se irán los angelitos		
para no verte llorar.""",
"""A los niños buenos		
Dios los bendice;		
a los que son malos		
les da lombrices.""",
"""Duérmete mi negrazo,		
cara de pambazo,		
que si no se duerme		
le doy un trancazo.""",
"""En los brazos te tengo		
y considero		
qué será de ti, niño,		
si yo me muero.""",
"""Duérmete, niño, en la cuna
que viene la reina mora
preguntando por las casas
quién es el niño que llora.""",
"""Duérmete, niño chiquito,
mira que viene la mora
preguntando puerta en puerta
cuál es el niño que llora.""",
"""Vete ya, lobo malo,
que el nene duerme.
Márchate despacito,
no se despierte.""",
"""Milano negro que vuelas
sobre el techo de mi casa.
¡Vete, milano! que al niño
le estoy cantando una nana.""",
"""Angelitos del cielo
venir cantando
y llevarse a este niño,
que está llorando.""",
"""Si este niño no se duerme,
Venga un ángel y lo lleve.
–No vengas, angelito, no,
que este niño se durmió.""",
"""Caballero en la jaca con alas
se vino y le lleva
montado a la grupa,
se vino y le lleva
volando, volando, volando
mi niño… mi prenda.""",
"""Este niño no puede dormir.
El coquito no le deja,
que le tiene agarradito
de los pies a la cabeza.""",
"""Sabes tú, niño,
que quiere el coco:
que tengas miedo,
ni mucho ni poco.""",
"""Duérmete, mi niño,
duérmete sin miedo,
aunque silben los aires,
gruñan los perros.""",
"""Ya no dicen las madres
Que viene el coco;
Que esta voz a los niños
Asusta poco.
Si el caso apura,
Le dicen: Calla, niño,
Que viene el cura""",
"""Las mujeres de la sierra
para dormir los chiquillos
en vez de cantar el coco
le arrean con un ladrillo
y le duermen poco a poco."""
]

In [None]:
print("Total number of lullabies: ", len(data_list))

Total number of lullabies:  41


### GPT-2 small spanish model loading

In [None]:
tokenizer = AutoTokenizer.from_pretrained("datificate/gpt2-small-spanish")

model = AutoModelWithLMHead.from_pretrained("datificate/gpt2-small-spanish")



In [None]:
print("The max model length is {} for this model, although the actual embedding size for GPT small is 768".format(tokenizer.model_max_length))
print("The beginning of sequence token {} token has the id {}".format(tokenizer.convert_ids_to_tokens(tokenizer.bos_token_id), tokenizer.bos_token_id))
print("The end of sequence token {} has the id {}".format(tokenizer.convert_ids_to_tokens(tokenizer.eos_token_id), tokenizer.eos_token_id))
print("The padding token {} has the id {}".format(tokenizer.convert_ids_to_tokens(tokenizer.pad_token_id), tokenizer.pad_token_id))

The max model length is 1000000000000000019884624838656 for this model, although the actual embedding size for GPT small is 768
The beginning of sequence token <|endoftext|> token has the id 0
The end of sequence token <|endoftext|> has the id 0
The padding token <|endoftext|> has the id 0


In [None]:
batch_size = 1

In [None]:
class GPT2Dataset(torch.utils.data.Dataset):

  def __init__(self, txt_list, tokenizer, gpt2_type="gpt2", max_length=768):

    self.tokenizer = tokenizer
    self.input_ids = []
    self.attn_masks = []

    for txt in txt_list:

      encodings_dict = tokenizer('<|endoftext|>' + txt + '<|endoftext|>', truncation=True, max_length=max_length, padding="max_length")

      self.input_ids.append(torch.tensor(encodings_dict['input_ids']))
      self.attn_masks.append(torch.tensor(encodings_dict['attention_mask']))
    
  def __len__(self):
    return len(self.input_ids)

  def __getitem__(self, idx):
    return self.input_ids[idx], self.attn_masks[idx] 

In [None]:
dataset = GPT2Dataset(data_list, tokenizer, max_length=768)

# Split into training and validation sets
train_size = int(0.95 * len(dataset))
val_size = len(dataset) - train_size

train_dataset, val_dataset = torch.utils.data.random_split(dataset, [train_size, val_size])

print('{:>5,} training samples'.format(train_size))
print('{:>5,} validation samples'.format(val_size))

   38 training samples
    3 validation samples


In [None]:
train_dataloader = torch.utils.data.DataLoader(
            train_dataset,  # The training samples.
            sampler = torch.utils.data.RandomSampler(train_dataset), # Select batches randomly
            batch_size = batch_size # Trains with this batch size.
        )

# For validation the order doesn't matter, so we'll just read them sequentially.
validation_dataloader = torch.utils.data.DataLoader(
            val_dataset, # The validation samples.
            sampler = torch.utils.data.SequentialSampler(val_dataset), # Pull out batches sequentially.
            batch_size = batch_size # Evaluate with this batch size.
        )

### Training

In [None]:
! nvidia-smi

Sat May  8 03:45:44 2021       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 465.19.01    Driver Version: 460.32.03    CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|   0  Tesla T4            Off  | 00000000:00:04.0 Off |                    0 |
| N/A   48C    P0    28W /  70W |   5952MiB / 15109MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Proces

In [None]:
# Select device
if (torch.cuda.is_available()):
    device = torch.device("cuda")
    print("Running on GPU")
else:
    device = torch.device("cpu")
    print("Running on CPU")


Running on GPU


In [None]:
# Set the seed value all over the place to make this reproducible.
seed_val = 42

random.seed(seed_val)
np.random.seed(seed_val)
torch.manual_seed(seed_val)
torch.cuda.manual_seed_all(seed_val)

In [None]:
# some parameters that work reasonably well
epochs = 40
learning_rate = 5e-4
warmup_steps = 2
epsilon = 1e-8

# this produces sample output every 10 steps
sample_every = 10

In [None]:
# Note: AdamW is a class from the huggingface library (as opposed to pytorch) 
optimizer = AdamW(model.parameters(),
                  lr = learning_rate,
                  eps = epsilon
                )

In [None]:
# Total number of training steps is [number of batches] x [number of epochs]. 
# (Note that this is not the same as the number of training samples).
total_steps = len(train_dataloader) * epochs

# Create the learning rate scheduler.
# This changes the learning rate as the training loop progresses
scheduler = get_linear_schedule_with_warmup(optimizer, 
                                            num_warmup_steps = warmup_steps, 
                                            num_training_steps = total_steps)

In [None]:
def format_time(elapsed):
    return str(datetime.timedelta(seconds=int(round((elapsed)))))

In [None]:
total_t0 = time.time()

training_stats = []

model = model.to(device)

for epoch_i in range(0, epochs):

    # ========================================
    #               Training
    # ========================================

    print("")
    print('======== Epoch {:} / {:} ========'.format(epoch_i + 1, epochs))
    print('Training...')

    t0 = time.time()

    total_train_loss = 0

    model.train()

    for step, batch in enumerate(train_dataloader):

        b_input_ids = batch[0].to(device)
        b_labels = batch[0].to(device)
        b_masks = batch[1].to(device)

        model.zero_grad()        

        outputs = model(  b_input_ids,
                          labels=b_labels, 
                          attention_mask = b_masks,
                          token_type_ids=None
                        )

        loss = outputs[0]  

        batch_loss = loss.item()
        total_train_loss += batch_loss

        # Get sample every x batches.
        if step % sample_every == 0 and not step == 0:

            elapsed = format_time(time.time() - t0)
            print('  Batch {:>5,}  of  {:>5,}. Loss: {:>5,}.   Elapsed: {:}.'.format(step, len(train_dataloader), batch_loss, elapsed))

            model.eval()

            sample_outputs = model.generate(
                                    bos_token_id=random.randint(1,30000),
                                    do_sample=True,   
                                    top_k=50, 
                                    max_length = 30,
                                    top_p=0.95, 
                                    num_return_sequences=1
                                )
            for i, sample_output in enumerate(sample_outputs):
                  print("{}: {}".format(i, tokenizer.decode(sample_output, skip_special_tokens=True)))
            
            model.train()

        loss.backward()

        optimizer.step()

        scheduler.step()

    # Calculate the average loss over all of the batches.
    avg_train_loss = total_train_loss / len(train_dataloader)       
    
    # Measure how long this epoch took.
    training_time = format_time(time.time() - t0)

    print("")
    print("  Average training loss: {0:.2f}".format(avg_train_loss))
    print("  Training epoch took: {:}".format(training_time))
        
    # ========================================
    #               Validation
    # ========================================

    print("")
    print("Running Validation...")

    t0 = time.time()

    model.eval()

    total_eval_loss = 0
    nb_eval_steps = 0

    # Evaluate data for one epoch
    for batch in validation_dataloader:
        
        b_input_ids = batch[0].to(device)
        b_labels = batch[0].to(device)
        b_masks = batch[1].to(device)
        
        with torch.no_grad():        

            outputs  = model(b_input_ids, 
#                            token_type_ids=None, 
                             attention_mask = b_masks,
                            labels=b_labels)
          
            loss = outputs[0]  
            
        batch_loss = loss.item()
        total_eval_loss += batch_loss        

    avg_val_loss = total_eval_loss / len(validation_dataloader)
    
    validation_time = format_time(time.time() - t0)    

    print("  Validation Loss: {0:.2f}".format(avg_val_loss))
    print("  Validation took: {:}".format(validation_time))

    # Record all statistics from this epoch.
    training_stats.append(
        {
            'epoch': epoch_i + 1,
            'Training Loss': avg_train_loss,
            'Valid. Loss': avg_val_loss,
            'Training Time': training_time,
            'Validation Time': validation_time
        }
    )

print("")
print("Training complete!")
print("Total training took {:} (h:mm:ss)".format(format_time(time.time()-total_t0)))


Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.7960211634635925.   Elapsed: 0:00:03.
0:  máximas La


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 1.0165116786956787.   Elapsed: 0:00:06.
0: ensión,


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.49555540084838867.   Elapsed: 0:00:09.
0: jae

  Average training loss: 2.14
  Training epoch took: 0:00:11

Running Validation...
  Validation Loss: 0.39
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.4079561233520508.   Elapsed: 0:00:03.
0:  descritas la


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.460431307554245.   Elapsed: 0:00:06.
0:  1900 del, no.


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.31803303956985474.   Elapsed: 0:00:09.
0:  instru de de, las deque,

  Average training loss: 0.53
  Training epoch took: 0:00:11

Running Validation...
  Validation Loss: 0.33
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.41703087091445923.   Elapsed: 0:00:03.
0:  definitivamente. niño
 sedu...

y la le tu


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.3059452772140503.   Elapsed: 0:00:06.
0:  austr yque
 la
ñ


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.168169304728508.   Elapsed: 0:00:09.
0:  mundialmente laque,
te a-
. que.queque tu.y. niño

  Average training loss: 0.39
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.27
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.17536838352680206.   Elapsed: 0:00:03.
0:  Ed que

ñ.
que el,te los. a.que. de ni
 la untey

que


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.3848901689052582.   Elapsed: 0:00:06.
0:  pensión de


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.21349629759788513.   Elapsed: 0:00:09.
0:  conducen el
Que laY,
.
 el lame niñoque

 niño coco el ely adu no los. el

  Average training loss: 0.36
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.26
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.24190697073936462.   Elapsed: 0:00:03.
0:  abas y niño la.ér. un,.que poco,

 niño.	
 no poco,te



Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.21797917783260345.   Elapsed: 0:00:06.
0:  llegaban con el sueño se
no de
que,que,de laérér, dormir


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.22844508290290833.   Elapsed: 0:00:09.
0:  ayuda en. sueño. de
, pory
du mi a, cuna	, lepara el, mi el
du, el

  Average training loss: 0.33
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.24
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.23346158862113953.   Elapsed: 0:00:03.
0:  Girls demezo
 niño viene
 sequito,
dume,,
 no


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.2497100979089737.   Elapsed: 0:00:06.
0:  polvo.ññte que lleva: le mi cuna mi la.
que elmi vienete. te
de se coco,
	


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.1988544762134552.   Elapsed: 0:00:09.
0: Los la	
, se las la se se
du. a, niño
 tu
 madre. se		

  Average training loss: 0.30
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.23
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.17809653282165527.   Elapsed: 0:00:03.
0: lu" niño no el niño viene la el a niño

Que,quito
que la te.
 mi niño		
que


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.564190685749054.   Elapsed: 0:00:06.
0:  reemp un	érme
no.preme,que viene
aquedu niño:
que ni
de, cuna
po está


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.13663354516029358.   Elapsed: 0:00:09.
0:  monumento, una niño niños le
 cabecera un		
no de…
Y	
a este		


  Average training loss: 0.28
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.21
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.18259644508361816.   Elapsed: 0:00:03.
0:  cosa la sueño no los viene		
que poco,
sin tiene, de poco, este poco te,
ni el	



Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.12280090153217316.   Elapsed: 0:00:06.
0: mund en rico, viene niño
Elñchote, mío				quito
y. chiquito
duo niño ni,


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.18299706280231476.   Elapsed: 0:00:09.
0: face la sierra	
cab niño	
sin niño ya,
mi niño a lleva,jug			

  Average training loss: 0.27
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.21
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.1789911389350891.   Elapsed: 0:00:03.
0:  denCon mi niño niño,
que a coco, la viene el brazos la casa
para le la la	
y a las


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.12740382552146912.   Elapsed: 0:00:06.
0:  farmacéu la niño de brazos	
Y mucho a		
y poco bien	
que aquí,	
que gru dicen niño poco


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.1512448638677597.   Elapsed: 0:00:09.
0:  fi
a de la coco		
y,			
le aquí a una	
deba.

  Average training loss: 0.25
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.19
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.16633999347686768.   Elapsed: 0:00:03.
0:  mediterráneaDuérmete,ñito, niño,
y al cocoermete,
y tienecito,	


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 1.4483463764190674.   Elapsed: 0:00:06.
0:  Come, dormir a la dormir coco
a está la n coco
les co sus niños
para lo co coco.
y han poco a la


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.17742538452148438.   Elapsed: 0:00:09.
0: calipsisLañito,	ito, ni no niño,	
y lomutete,	
de tu viene ni ya

  Average training loss: 0.23
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.18
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.1786482185125351.   Elapsed: 0:00:03.
0:  afectanDinalmete, de las mujeres
de vez el niños
le la casa a las compañera a la calle.
le casa al contrario


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.12817206978797913.   Elapsed: 0:00:06.
0:  afecta y		
para de Coco
se lleva
que le va la luna,
en los casas
Mi le lleva
se le va


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.16366806626319885.   Elapsed: 0:00:09.
0:  provis una niño, duerme
no tu mueran ni si	
aqué le viene.	
y a la cabecera
y

  Average training loss: 0.21
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.17
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.13603368401527405.   Elapsed: 0:00:03.
0:  Kur el sueño, niño no puede
Al sueño,
y le nacen cantando,
para el sueño le lleva.
y


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.3356892466545105.   Elapsed: 0:00:06.
0:  debutar que niño le crecen,
que viene a la sierra		
devolando a que habita				
que


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.11241262406110764.   Elapsed: 0:00:10.
0:  Gib y niño pequeñito no tiene jacazo,	
que viene el coano se tiene ti.
por vez

  Average training loss: 0.18
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.18
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.11150544136762619.   Elapsed: 0:00:03.
0:  Jurado de Dios mi niño,
qué viene la reina,
Que está comer.	
y le tiene el sol.
Si


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.3415808379650116.   Elapsed: 0:00:06.
0: fro el coco	
Al sueño,	
no tiene llorar,		
que viene el coquito y	
duérmete y


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.16318558156490326.   Elapsed: 0:00:10.
0: Duérmete, mi hijito,	
Al sueño de grutas,
y se lleva el coco:


  Average training loss: 0.16
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.17
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.0766833946108818.   Elapsed: 0:00:03.
0:  cano más mujeres, niño no durmiera,
que viene el coco
montado a cantar
y se durmió.


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.05097780004143715.   Elapsed: 0:00:06.
0:  fúnDuérmete, niñito mío,	
preguntando y milano,		
para que aquí está dormir	



Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.08969077467918396.   Elapsed: 0:00:10.
0:  1930Duérmete, niño,		
Venga una cuna de cuna de cuna
ni mucho.	
para

  Average training loss: 0.13
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.17
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.16595320403575897.   Elapsed: 0:00:03.
0: inuDuermete,		
Duérmete, mi bien.			
que viene el gavilán
no le


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.08335240185260773.   Elapsed: 0:00:06.
0:  téDuérmete, niño,
duérmete,
qué será el viento.
duérmete y


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.05307620391249657.   Elapsed: 0:00:10.
0:  puntuación las madres de yerba,
que el brujo de la estrella
que aquí está la cabeza.
que te dorm

  Average training loss: 0.12
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.17
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.0893954187631607.   Elapsed: 0:00:03.
0:  SoloDuérmete, niño chiquito,	
que ahí viene el coco	
poquito tienes.
Este niño…… niñ


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.025074301287531853.   Elapsed: 0:00:06.
0:  lenguDúerme, niño,		
que viene el trigo	
que viene el trigo
le doy a la luna
lo


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.06248408928513527.   Elapsed: 0:00:10.
0:  NuestraDuérmete, niño,	
duérmete,		
que viene el coco;
que tengas miedo,


  Average training loss: 0.10
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.17
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.06278975307941437.   Elapsed: 0:00:03.
0: oldsLas mujeres de la sierra
El coquito
vendrá por Dios,
lo echó.
y le haga una cuna


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.03161592036485672.   Elapsed: 0:00:06.
0:  vacíoEn la mar de la mar de cuna
que quiere el techo de cuna.	
y se durmió.		


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.2635646164417267.   Elapsed: 0:00:10.
0:  piDuérmete, niño chico,
que viene el coco,
y se lleva a los niños
quién es carpintero
y se ha

  Average training loss: 0.08
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.17
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.05777644366025925.   Elapsed: 0:00:03.
0:  aproximadamenteEste niño no puede dormir
que viene el brujo.
Que viene el sol.
deja.


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.054831139743328094.   Elapsed: 0:00:06.
0:  PPDuérmete, niño chiquito
duerme sin pena,
me sin pena,
que si este niño chiquito
mon


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.04714830964803696.   Elapsed: 0:00:10.
0:  ÉDuérmete, niño,
duérmete,
Que viene el viento.
cabeza de mecer.
volando,

  Average training loss: 0.07
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.17
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.0415349006652832.   Elapsed: 0:00:03.
0: Tiene se la jaca con alas
que te ha de nenes
preguntando por cabecera en casa.
preguntando


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.27287769317626953.   Elapsed: 0:00:06.
0:  expulsóDuérmete, guagüita	
que viene el coco
no quiere dormir los chiquillos
porque al pie de la calle.


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.04495071619749069.   Elapsed: 0:00:10.
0:  mínimaDuérmete, niño chiquito,
duérmete, en la casa;
que viene el trancazo.
Y

  Average training loss: 0.07
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.17
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.04921691119670868.   Elapsed: 0:00:03.
0:  conceptual a la cuna
Que viene el coco
Que esta voz apura,
Que viene el cura
Asusta poco.


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.3020934462547302.   Elapsed: 0:00:06.
0:  Moreno y le crecen	
y considero,	
lo parió una gitana,	
un pedacito de ti,	
para no


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.047179002314805984.   Elapsed: 0:00:10.
0:  presideDuérmete, mi negrazo,
duérmete mi negrazo,
lo echó a la calle.
Su padre es

  Average training loss: 0.06
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.17
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.03317577391862869.   Elapsed: 0:00:03.
0:  totalCon un traje rico
lo echó a dormir a los niños
que a la calle.
Si el caso a los niños
Que viene el


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.03785642981529236.   Elapsed: 0:00:06.
0:  propulsión la sierra,
Que esta voz a sus niños
Que esta voz a su casa.	
Al sueño le haga una nana


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.023612700402736664.   Elapsed: 0:00:10.
0:  IsaacDuérmete, niñito mío,
duérmete,
duérmete,
duérmete,


  Average training loss: 0.06
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.16
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.03306236490607262.   Elapsed: 0:00:03.
0: useppeDuérmete, niño,
que tengo que hacer,
que tengo que hacer,
si este niño… mi prenda.


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.03488972783088684.   Elapsed: 0:00:06.
0:  documen de la mar, si no se durmiera,	
que viene el viento.		
Ya en el caso de pan.


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.02656174637377262.   Elapsed: 0:00:10.
0:  fábricas se vino llevó la Virgen del cielo
yo le crecen	
no has nacido.		
Márchate despacito,		

  Average training loss: 0.05
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.18
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.06356164813041687.   Elapsed: 0:00:03.
0:  hoyDuérmete, niñito,		
si no te dormís,	
le va perdiendo el miedo	
poquito


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.027395714074373245.   Elapsed: 0:00:06.
0:  NashCon un traje rico		
y se lleva a los niños	
que le nacen azules gacelas,		
que viene la


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.061021339148283005.   Elapsed: 0:00:10.
0:  64Duérmete, niño chico,
duérmete, mi bien;
que aquí está la cunita
que te ha de

  Average training loss: 0.04
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.18
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.03540550172328949.   Elapsed: 0:00:03.
0: berry, niño tiene sueño,
para dormir los chiquillos
no tiene cama.
que duermen poco.		



Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.014713844284415245.   Elapsed: 0:00:06.
0:  ciclismoDuérmete, niñito,		
duérmete, mi bien;		
que viene el brujo	


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.016773343086242676.   Elapsed: 0:00:10.
0: FoDuérmete, niño chico,
duérmete, niño de cuna,
gruñan los perros.
que duermen poco

  Average training loss: 0.03
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.17
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.024383898824453354.   Elapsed: 0:00:03.
0:  sucursalDuérmete, vida mía,
duérmete y no llores más,
que está la cunita
y te ha


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.023364577442407608.   Elapsed: 0:00:06.
0:  agresivaDuérmete, mi niño,
duérmete sin pena,
que viene la cunita
y te comerá.


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.026034386828541756.   Elapsed: 0:00:10.
0:  sediCon un traje rico
cabellos de yerba.
que el coco;
que tengas miedo,
ni mucho ni poco.

  Average training loss: 0.03
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.18
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.018250228837132454.   Elapsed: 0:00:03.
0:  cenaDuérmete, niño,		
duérmete, mi bien;		
que aquí está la cunita		


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.02992088906466961.   Elapsed: 0:00:06.
0:  presentadoDuérmete mi negrazo,		
duérmete, mi bien;		
que aquí está la cunita	


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.06555982679128647.   Elapsed: 0:00:10.
0:  paleo las mujeres de la sierra
para dormir a sus niños.
¡Vete, milano! que al niño
le estoy cantando una n

  Average training loss: 0.03
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.18
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.13746517896652222.   Elapsed: 0:00:03.
0:  elloDuérmete, guagüita		
duérmete y no llores más,		
aunque silben los aires


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.024640081450343132.   Elapsed: 0:00:06.
0:  simEste galapaguito no tiene mare.
lo parió una gitana,
lo echó a la calle.
Este niño chiquito
no


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.01225416548550129.   Elapsed: 0:00:10.
0:  Soph se durmiera,		
que quiere el coco,		
le va perdiendo el miedo	
poquito a poco.

  Average training loss: 0.02
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.18
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.009696375578641891.   Elapsed: 0:00:03.
0:  MexicDuérmete, mi niño,
duérmete sin miedo,
aunque silben los aires,
gruñan los perros.


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.018254244700074196.   Elapsed: 0:00:06.
0: ºCDúermete, niñito,		
cabeza de ayote;		
si no te dormís,		


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.03334523364901543.   Elapsed: 0:00:10.
0: JuanVete ya, lobo malo,
no se despierte.	
Al sueño le nacen azules gacelas,		

  Average training loss: 0.02
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.18
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.02908271551132202.   Elapsed: 0:00:03.
0:  llevóDuérmete, niño mío,
que tu madre no está en casa;
que se la llevó la Virgen
de compañera a su


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.017919478937983513.   Elapsed: 0:00:06.
0:  suizos.	
y su hijito feo,		
la loba, la loba,		
vendrá


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.013643993064761162.   Elapsed: 0:00:10.
0:  TamEste galapaguito no tiene mare.
lo parió una gitana,
lo echó a la calle.
Este niño chiquito
Este

  Average training loss: 0.02
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.18
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.07286306470632553.   Elapsed: 0:00:03.
0:  HopkinsEste niño tiene sueño,		
no tiene cama ni cuna.		
A su padre carpintero		
le diremos le haga


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.016072824597358704.   Elapsed: 0:00:06.
0: iblioEste niño tiene sueño,		
no tiene cama ni cuna.		
A su padre carpintero		
le diremos le haga


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.011044599115848541.   Elapsed: 0:00:10.
0:  FemenDuérmete, niño chiquito,	
duérmete y no llores más,		
que se la cunita

  Average training loss: 0.02
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.18
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.009602007456123829.   Elapsed: 0:00:03.
0:  arzobispoEste niño no puede dormir.
El coquito no le deja,
que le tiene agarradito
de los pies a la cabeza.


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.01855579949915409.   Elapsed: 0:00:06.
0: soviaDúermete, niñito,		
cabeza de ayote;		
si no te dormís,		


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.01680821180343628.   Elapsed: 0:00:10.
0:  valoraciónA la mar, si no duermes,		
que viene el viento.	
Ya en las grutas marinas	


  Average training loss: 0.02
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.19
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.012686608359217644.   Elapsed: 0:00:03.
0:  ChiloéEste niño tiene sueño,	
no tiene cama ni cuna.		
A su padre carpintero	
le diremos le haga una.


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.011327101849019527.   Elapsed: 0:00:06.
0:  OrtizDuérmete mi negrazo,		
que viene el coco,		
y se lleva a los nenes	
que


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.010652289725840092.   Elapsed: 0:00:10.
0: lóDuérmete, niñito,		
duérmete, por Dios,		
si no viene el brujo

  Average training loss: 0.02
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.19
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.007933475077152252.   Elapsed: 0:00:03.
0:  tall
Que viene el coco;
Que esta voz a este niño,
Asusta poco.
Si el caso apura,
Le dicen


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.011670873500406742.   Elapsed: 0:00:07.
0:  trajoLas mujeres de la sierra,		
para dormir a sus niños,		
en vez de llamar al coco			
les


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.010136229917407036.   Elapsed: 0:00:10.
0: ípDuérmete, niño de cuna,
duérmete ya
que aquí está la cunita
que te ha de mecer

  Average training loss: 0.01
  Training epoch took: 0:00:13

Running Validation...
  Validation Loss: 0.19
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.019570015370845795.   Elapsed: 0:00:03.
0:  vacaDuérmete, niño chico,
duérmete sin miedo,
aunque silben los aires,
gruñan los perros.


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.009321775287389755.   Elapsed: 0:00:06.
0: yerDuérmete, niñito mío,
que tu madre no está en casa;
que se la llevó la Virgen
de compañera


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.008232462219893932.   Elapsed: 0:00:10.
0:  tecnológicosDuérmete, mi niño chico,
duérmete, niño de amor,
que a los pies tienes la luna
y

  Average training loss: 0.01
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.19
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.01248258352279663.   Elapsed: 0:00:03.
0: ársDuérmete, niño de cuna,
duérmete, niño de amor,
que a los pies tienes la luna
y


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.015604635700583458.   Elapsed: 0:00:06.
0:  movilizaciónDuérmete, niñito,		
duérmete, por Dios,		
que aquí está la cunita


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.0169672854244709.   Elapsed: 0:00:10.
0:  kmDuérmete, niño,
duérmete, mi bien;
que aquí está la cunita
que te ha de m

  Average training loss: 0.01
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.19
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.008184398524463177.   Elapsed: 0:00:03.
0:  ChelseaDuérmete, niño chiquito,		
duérmete y no llores más,		
no se irán los


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.011381630785763264.   Elapsed: 0:00:06.
0: cristiDuérmete, niño,
duérmete ya
que viene el coco
y te comerá.



Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.008000083267688751.   Elapsed: 0:00:10.
0:  destinoDuérmete, guagüita,		
duérmete y no llores más,		
que se irán los

  Average training loss: 0.01
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.19
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.028063494712114334.   Elapsed: 0:00:03.
0:  divididosDuérmete, vida mía,	
duérmete sin miedo,		
si no viene el brujo	
y


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.00894069392234087.   Elapsed: 0:00:06.
0:  enclaveDúermete, mi bien;
que aquí está la cunita
que te ha de mecer.	


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.03491850569844246.   Elapsed: 0:00:10.
0:  vaporDuérmete mi negrazo,		
cara de pambazo,		
que si no se duerme		
le

  Average training loss: 0.01
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.19
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.010461279191076756.   Elapsed: 0:00:03.
0:  debaDuérmete, niñito mío,
que tu madre no está en casa;
que se la llevó la Virgen
de compañera


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.033336058259010315.   Elapsed: 0:00:06.
0: quet en los brazos te tengo		
y considero		
qué será de ti, niño,		
si yo me muero


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.01820303127169609.   Elapsed: 0:00:10.
0:  mineralesDúermete, mi bien;
que aquí está la cunita
que te ha de mecer.

  Average training loss: 0.01
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.19
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.0208473838865757.   Elapsed: 0:00:03.
0: mirDuérmete, niñito,		
duérmete y no llores más,		
que se irán los


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.017104851081967354.   Elapsed: 0:00:06.
0: omalDuérmete, niño,
duérmete, mi bien;
que aquí está la cunita
que te ha de m


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.009394308552145958.   Elapsed: 0:00:10.
0:  claridadCon un traje rico		
y su hijito feo,		
la loba, la loba,		


  Average training loss: 0.01
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.19
  Validation took: 0:00:00

Training...


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    10  of     38. Loss: 0.029529031366109848.   Elapsed: 0:00:03.
0:  ClaseDuérmete, niño chico,
duérmete ya
que aquí está la cunita
que te ha de mecer.


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    20  of     38. Loss: 0.006891859695315361.   Elapsed: 0:00:06.
0:  crédiDuérmete, vida mía,
duerme sin pena,
porque al pie de la cuna
tu madre vela.


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


  Batch    30  of     38. Loss: 0.01500753778964281.   Elapsed: 0:00:10.
0:  congreCon decirle a mi niño	
que viene el coco	
y se lleva a los niños		
que duermen poco.

  Average training loss: 0.01
  Training epoch took: 0:00:12

Running Validation...
  Validation Loss: 0.19
  Validation took: 0:00:00

Training complete!
Total training took 0:08:19 (h:mm:ss)


### Save fine-tuned model

Mount google drive and save the model in a specific folder.

In [None]:
from google.colab import drive
drive.mount('/content/gdrive')

Drive already mounted at /content/gdrive; to attempt to forcibly remount, call drive.mount("/content/gdrive", force_remount=True).


In [None]:
%cd '/content/gdrive/MyDrive/AI song contest/'

/content/gdrive/MyDrive/AI song contest


In [None]:
model.eval() # ensure the model is 'frozen'
torch.save(model.state_dict(), 'Models/model_nana_v3.pt')