Sources:
https://karpathy.ai/zero-to-hero.html
https://www.youtube.com/watch?v=kCc8FmEb1nY

In [24]:
!pip install -U datasets



# Import libraries

In [25]:
import torch
from torch.utils.data import Dataset, DataLoader
import torch.nn as nn
from torch.nn import functional as F
from tqdm import tqdm
import time
import re

# Parameters

In [26]:
SEED = 15

# Dataset parameters
train_ratio = 0.99
sample_size = 100_000

# Training parameters
batch_size = 256*2 # how many independent sequences will we process in parallel?
block_size = 256 # what is the maximum context length for predictions?
eval_interval = 500
learning_rate = 3e-4
eval_iters = 200
n_embd = 128
n_head = 4
n_layer = 2
dropout = 0.2
num_epochs = 1

# Move the model to the appropriate device (GPU if available, else CPU)
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(device)

cuda


In [27]:
torch.manual_seed(SEED)

<torch._C.Generator at 0x7a331e82f510>

In [28]:
torch.cuda.device_count()

1

# Load files

In [29]:
from datasets import load_dataset

# Define the path to the dataset
dataset_name = "20231101.fr"

# Load the dataset
raw_dataset = load_dataset("wikimedia/wikipedia", dataset_name)

Resolving data files:   0%|          | 0/17 [00:00<?, ?it/s]

# Data preparation

In [30]:
raw_dataset['train'].num_rows

2564646

In [31]:
%%time
# Create training and evaluation datasets
if sample_size < 0:
    train_sample = int(raw_dataset['train'].num_rows * train_ratio)
    test_sample = int(raw_dataset['train'].num_rows * (1- train_ratio))
else:
    train_sample = int(sample_size * train_ratio)
    test_sample = int(sample_size * (1- train_ratio))
    
ds_train_test = raw_dataset['train'].train_test_split(train_size=train_sample, test_size=test_sample, seed=SEED)

# Convert Dataset into str using list comprehension and join method
train_text = ''.join([item['text'] for item in ds_train_test['train']])
val_text = ''.join([item['text'] for item in ds_train_test['test']])

# Define allowed characters: basic French characters, accented characters, digits, basic punctuation
allowed_chars = 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZéàèùâêîôûëïüôçÉÀÈÙÂÊÎÔÛËÏÜÇ ' + \
                '0123456789,;.!?:\'"()-'

# Use regular expression to filter only allowed characters
pattern = re.compile(f'[^{re.escape(allowed_chars)}]')
train_text = pattern.sub('', train_text)
val_text = pattern.sub('', val_text)

# here are all the unique characters that occur in this text
chars = sorted(list(set(train_text + val_text)))
vocab_size = len(chars)
print(''.join(chars))
print(vocab_size)

# create a mapping from characters to integers
str_to_int = { ch:i for i,ch in enumerate(chars) }
int_to_str = { i:ch for i,ch in enumerate(chars) }
encode = lambda s: [str_to_int[c] for c in s] # encoder: take a string, output a list of integers
decode = lambda l: ''.join([int_to_str[i] for i in l]) # decoder: take a list of integers, output a string

# Store datasets into torch tensors
train_data = torch.tensor(encode(train_text), dtype=torch.long)
val_data = torch.tensor(encode(val_text), dtype=torch.long)

 !"'(),-.0123456789:;?ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyzÀÂÇÈÉÊËÎÏÔÙÛÜàâçèéêëîïôùûü
100
CPU times: user 1min 26s, sys: 4.25 s, total: 1min 30s
Wall time: 1min 30s


In [32]:
# data loading
def get_batch(split):
    # generate a small batch of data of inputs x and targets y
    data = train_data if split == 'train' else val_data
    ix = torch.randint(len(data) - block_size, (batch_size,))
    x = torch.stack([data[i:i+block_size] for i in ix])
    y = torch.stack([data[i+1:i+block_size+1] for i in ix])
    x, y = x.to(device), y.to(device)
    return x, y

# Define loss function

In [33]:
@torch.no_grad()
def estimate_loss():
    out = {}
    model.eval()
    for split in ['train', 'val']:
        losses = torch.zeros(eval_iters)
        for k in range(eval_iters):
            X, Y = get_batch(split)
            logits, loss = model(X, Y)
            losses[k] = loss.item()
        out[split] = losses.mean()
    model.train()
    return out

# GPT

In [34]:
class Head(nn.Module):
    """ one head of self-attention """

    def __init__(self, head_size):
        super().__init__()
        self.key = nn.Linear(n_embd, head_size, bias=False)
        self.query = nn.Linear(n_embd, head_size, bias=False)
        self.value = nn.Linear(n_embd, head_size, bias=False)
        self.register_buffer('tril', torch.tril(torch.ones(block_size, block_size)))

        self.dropout = nn.Dropout(dropout)

    def forward(self, x):
        # input of size (batch, time-step, channels)
        # output of size (batch, time-step, head size)
        B,T,C = x.shape
        k = self.key(x)   # (B,T,hs)
        q = self.query(x) # (B,T,hs)
        # compute attention scores ("affinities")
        wei = q @ k.transpose(-2,-1) * k.shape[-1]**-0.5 # (B, T, hs) @ (B, hs, T) -> (B, T, T)
        wei = wei.masked_fill(self.tril[:T, :T] == 0, float('-inf')) # (B, T, T)
        wei = F.softmax(wei, dim=-1) # (B, T, T)
        wei = self.dropout(wei)
        # perform the weighted aggregation of the values
        v = self.value(x) # (B,T,hs)
        out = wei @ v # (B, T, T) @ (B, T, hs) -> (B, T, hs)
        return out
    
    
class MultiHeadAttention(nn.Module):
    """ multiple heads of self-attention in parallel """

    def __init__(self, num_heads, head_size):
        super().__init__()
        self.heads = nn.ModuleList([Head(head_size) for _ in range(num_heads)])
        self.proj = nn.Linear(head_size * num_heads, n_embd)
        self.dropout = nn.Dropout(dropout)

    def forward(self, x):
        out = torch.cat([h(x) for h in self.heads], dim=-1)
        out = self.dropout(self.proj(out))
        return out
    
    
class FeedFoward(nn.Module):
    """ a simple linear layer followed by a non-linearity """

    def __init__(self, n_embd):
        super().__init__()
        self.net = nn.Sequential(
            nn.Linear(n_embd, 4 * n_embd),
            nn.ReLU(),
            nn.Linear(4 * n_embd, n_embd),
            nn.Dropout(dropout),
        )

    def forward(self, x):
        return self.net(x)

    
class Block(nn.Module):
    """ Transformer block: communication followed by computation """

    def __init__(self, n_embd, n_head):
        # n_embd: embedding dimension, n_head: the number of heads we'd like
        super().__init__()
        head_size = n_embd // n_head
        self.sa = MultiHeadAttention(n_head, head_size)
        self.ffwd = FeedFoward(n_embd)
        self.ln1 = nn.LayerNorm(n_embd)
        self.ln2 = nn.LayerNorm(n_embd)

    def forward(self, x):
        x = x + self.sa(self.ln1(x))
        x = x + self.ffwd(self.ln2(x))
        return x

    
class GPTLanguageModel(nn.Module):

    def __init__(self):
        super().__init__()
        # each token directly reads off the logits for the next token from a lookup table
        self.token_embedding_table = nn.Embedding(vocab_size, n_embd)
        self.position_embedding_table = nn.Embedding(block_size, n_embd)
        self.blocks = nn.Sequential(*[Block(n_embd, n_head=n_head) for _ in range(n_layer)])
        self.ln_f = nn.LayerNorm(n_embd) # final layer norm
        self.lm_head = nn.Linear(n_embd, vocab_size)

        # better init, not covered in the original GPT video, but important, will cover in followup video
        self.apply(self._init_weights)

    def _init_weights(self, module):
        if isinstance(module, nn.Linear):
            torch.nn.init.normal_(module.weight, mean=0.0, std=0.02)
            if module.bias is not None:
                torch.nn.init.zeros_(module.bias)
        elif isinstance(module, nn.Embedding):
            torch.nn.init.normal_(module.weight, mean=0.0, std=0.02)

    def forward(self, idx, targets=None):
#         if not isinstance(idx, torch.Tensor):
#             print(type(idx))
#             print(idx)
        B, T = idx.shape

        # idx and targets are both (B,T) tensor of integers
        tok_emb = self.token_embedding_table(idx) # (B,T,C)
        pos_emb = self.position_embedding_table(torch.arange(T, device=device)) # (T,C)
        x = tok_emb + pos_emb # (B,T,C)
        x = self.blocks(x) # (B,T,C)
        x = self.ln_f(x) # (B,T,C)
        logits = self.lm_head(x) # (B,T,vocab_size)

        if targets is None:
            loss = None
        else:
            B, T, C = logits.shape
            logits = logits.view(B*T, C)
            targets = targets.view(B*T)
            loss = F.cross_entropy(logits, targets)

        return logits, loss

    def generate(self, idx, max_new_tokens):
        # idx is (B, T) array of indices in the current context
        for _ in range(max_new_tokens):
            # crop idx to the last block_size tokens
            idx_cond = idx[:, -block_size:]
            # get the predictions
            logits, loss = self(idx_cond)
            # focus only on the last time step
            logits = logits[:, -1, :] # becomes (B, C)
            # apply softmax to get probabilities
            probs = F.softmax(logits, dim=-1) # (B, C)
            # sample from the distribution
            idx_next = torch.multinomial(probs, num_samples=1) # (B, 1)
            # append sampled index to the running sequence
            idx = torch.cat((idx, idx_next), dim=1) # (B, T+1)
        return idx


## Single GPU

In [35]:
class CustomTextDataset(Dataset):
    def __init__(self, encoded_text, block_size):
        """
        Args:
            encoded_text (Tensor): Encoded text data (as a long tensor).
            block_size (int): The size of each sequence block to generate.
        """
        self.data = encoded_text
        self.block_size = block_size

    def __len__(self):
        # Subtract block_size to prevent overflow (can't create a block beyond the data length)
        return len(self.data) - self.block_size

    def __getitem__(self, idx):
        """
        Generates a single data pair (x, y).
        """
        # Ensure that the index is within the valid range
        idx = min(idx, len(self.data) - self.block_size - 1)
        x = self.data[idx:idx+self.block_size]
        y = self.data[idx+1:idx+self.block_size+1]
        return x, y
    
def get_dataloaders(train_dataset, val_dataset, batch_size: int = 64):    
    # Instantiate the DataLoaders
    train_dataloader = DataLoader(
        train_dataset,
        batch_size=batch_size,
        shuffle=True,
        drop_last=True,
#         pin_memory=True,
#         pin_memory_device=device,
    )
    val_dataloader = DataLoader(
        val_dataset,
        batch_size=batch_size,
        shuffle=False,
        drop_last=True,
#         pin_memory=True,
#         pin_memory_device=device,
    )
    return train_dataloader, val_dataloader

In [36]:
train_dataset = CustomTextDataset(train_data, block_size)
val_dataset = CustomTextDataset(val_data, block_size)
train_dl, eval_dl = get_dataloaders(train_dataset, val_dataset, batch_size)

In [37]:
def generate_text(model, device, max_new_tokens):
    context = torch.zeros((1, 1), dtype=torch.long, device=device)
    print(decode(model.generate(context, max_new_tokens=max_new_tokens)[0].tolist()))
    
def check_device(model, batch):
    print("Model device:", next(model.parameters()).device)
    for i, item in enumerate(batch):
        print(f"Batch item {i} device:", item.device)

In [38]:
%%time
model = GPTLanguageModel()
model = model.to(device)
# print the number of parameters in the model
print(sum(p.numel() for p in model.parameters())/1e6, 'M parameters')

# create a PyTorch optimizer
optimizer = torch.optim.AdamW(model.parameters(), lr=learning_rate)

# Build the DataLoaders
train_dataset = CustomTextDataset(train_data, block_size)
val_dataset = CustomTextDataset(val_data, block_size)
train_dataloader, val_dataloader = get_dataloaders(train_dataset, val_dataset, batch_size)

0.4545 M parameters
CPU times: user 42.7 ms, sys: 133 ms, total: 176 ms
Wall time: 153 ms


In [39]:
%%time

# And now we can train the model
for epoch in range(num_epochs):
    model.train()
    for step, batch in tqdm(enumerate(train_dataloader)):
        batch = [item.to(device) for item in batch]  # Manually move to device
#         check_device(model, batch)
        
        # every once in a while evaluate the loss on train and val sets
        if step % eval_interval == 0:
            losses = estimate_loss()
            print(f"step {step}: train loss {losses['train']:.4f}, val loss {losses['val']:.4f}")
            generate_text(model, device, max_new_tokens=100)
            print('-' * 50)
        
        # evaluate the loss
        logits, loss = model(batch[0], batch[1])
        optimizer.zero_grad(set_to_none=True)
        loss.backward()
        optimizer.step()

# generate from the model
generate_text(m, device, max_new_tokens=500)
#open('more.txt', 'w').write(decode(model.generate(context, max_new_tokens=10000)[0].tolist()))

0it [00:00, ?it/s]

step 0: train loss 4.5617, val loss 4.5617
 aËàALt?5;-B2ëGe'jm8sù4eÊtY(Â8nC5SàdJlpÇVüm?hQd'èkFâzjoRIàyMlDèÂÎnFÀB)1QnxàV9LUÛNGN6onBbv9Gûu.C zÙÀÔè
--------------------------------------------------


500it [03:04,  4.75it/s]

step 500: train loss 2.1737, val loss 2.1763


501it [03:36,  9.65s/it]

 eniseÙfaiste Piergellemend une Ëcelas de angionale 2, olstades l'éfelament éesen léces 2-jtine unoi 
--------------------------------------------------


1000it [05:23,  4.73it/s]

step 1000: train loss 1.8285, val loss 1.8368


1001it [05:55,  9.70s/it]

 tebres qui fourtés bet leures insitiobits, 193,  Vollot à :Thoire et une renneir de la région Eystal
--------------------------------------------------


1500it [07:43,  4.74it/s]

step 1500: train loss 1.7318, val loss 1.7402


1501it [08:14,  9.68s/it]

 une comlatique on sortisé la . . Au n'apblimi pwants pehnet la Toistagaino dans la gormé verse un co
--------------------------------------------------


2000it [10:02,  4.76it/s]

step 2000: train loss 1.6778, val loss 1.6901


2001it [10:36, 10.42s/it]

 de Grand évolitant Raishon churiste Alles - Marcest out-Vos-C.Géstutions de Sandre9r-Dam'intérieur a
--------------------------------------------------


2500it [12:23,  4.74it/s]

step 2500: train loss 1.6481, val loss 1.6590


2501it [12:55,  9.70s/it]

 Plache Lac débre Parlient Colon-Patro venduit les et et série : Malors, déchai imands Wiesse Jackes 
--------------------------------------------------


3000it [14:42,  4.74it/s]

step 3000: train loss 1.6207, val loss 1.6300


3001it [15:14,  9.70s/it]

 alincessaglace à des tamments détentes, n'ont compara rré du d'incapat) duit ; et 14 déchat le paste
--------------------------------------------------


3500it [17:02,  4.74it/s]

step 3500: train loss 1.6019, val loss 1.6123


3501it [17:34,  9.70s/it]

 par la , et depuiss qu'i son entieure un fondé la lors de 2026. Meymplique Covilité, à il hait à la 
--------------------------------------------------


4000it [19:23,  4.74it/s]

step 4000: train loss 1.5884, val loss 1.6004


4001it [19:55,  9.72s/it]

 taites. Elle n'est madie dimagent histole de saire bendant sujeve et son té amps en repren: Listroin
--------------------------------------------------


4500it [21:42,  4.75it/s]

step 4500: train loss 1.5773, val loss 1.5884


4501it [22:14,  9.69s/it]

 doié anskon, prolonaciendances énerlations ploutes de Sritoire Ractifisée LombigumpniWorttumesDemium
--------------------------------------------------


5000it [24:01,  4.74it/s]

step 5000: train loss 1.5653, val loss 1.5768


5001it [24:33,  9.70s/it]

 de 2019 Nervelle et le WEEF varier, publi prendant Le  Autres ennements : lIndies ans stractériativa
--------------------------------------------------


5500it [26:21,  4.75it/s]

step 5500: train loss 1.5570, val loss 1.5715


5501it [26:55, 10.40s/it]

 se historisée vait trois par le de l'agit de Ligue censéditionse, mondiale du tour. Elle simpe extra
--------------------------------------------------


6000it [28:42,  4.74it/s]

step 6000: train loss 1.5521, val loss 1.5652


6001it [29:14,  9.70s/it]

 irmeuse se et a égaleures orbesées à l'établisseurt  à la ville d'une formétration de léconscoution,
--------------------------------------------------


6500it [31:01,  4.74it/s]

step 6500: train loss 1.5444, val loss 1.5568


6501it [31:33,  9.73s/it]

 s une pénage dans un majord ropréend aux Abracles des nécisions h'elle nombre : clientalisé soution,
--------------------------------------------------


7000it [33:21,  4.74it/s]

step 7000: train loss 1.5426, val loss 1.5542


7001it [33:53,  9.70s/it]

 prects enrecondant la dition par la montre en de Wiannine de séerl, et qui en vont prappose, l'ornit
--------------------------------------------------


7500it [35:42,  4.75it/s]

step 7500: train loss 1.5350, val loss 1.5470


7501it [36:14,  9.73s/it]

 e 1 correcheur simpere les  étaits, couses aux (qui , moulent cellement et le refu genominonHistoire
--------------------------------------------------


8000it [38:01,  4.75it/s]

step 8000: train loss 1.5292, val loss 1.5419


8001it [38:33,  9.69s/it]

 de la poile d'un bla cataque.Chaquet)Notes du  Sonov.Articles compagniles chockeb (à Exparat) et mil
--------------------------------------------------


8500it [40:21,  4.74it/s]

step 8500: train loss 1.5284, val loss 1.5400


8501it [40:52,  9.71s/it]

 depuis le gouvernes civili en Amérique (L'ONO i Roganest., le-Tunome, Iddom Fasques and Londrois le 
--------------------------------------------------


9000it [42:40,  4.74it/s]

step 9000: train loss 1.5225, val loss 1.5333


9001it [43:14, 10.40s/it]

 10 et .  Bens au UD, P, 11 comporcé Vux 10 aux Consentraînes et tanthmanges dans les peuis priuant l
--------------------------------------------------


9500it [45:01,  4.74it/s]

step 9500: train loss 1.5174, val loss 1.5312


9501it [45:33,  9.69s/it]

 de la saisociété des malières en rejours termineurbe de Skil Mairs Cnnulus rayans du monde. La plunq
--------------------------------------------------


10000it [47:20,  4.75it/s]

step 10000: train loss 1.5162, val loss 1.5286


10001it [47:52,  9.73s/it]

 de la ligne conceptie de pauve dans le traj sur rège du c'est une forte. Canada été avec un sélecté 
--------------------------------------------------


10500it [49:40,  4.71it/s]

step 10500: train loss 1.5120, val loss 1.5239


10501it [50:12,  9.74s/it]

 motant les élèves de se telles  et pus contre les moyeurs du jeues installité.Paris entre 1999,, Pen
--------------------------------------------------


11000it [52:01,  4.68it/s]

step 11000: train loss 1.5088, val loss 1.5219


11001it [52:33,  9.71s/it]

 mileutien de ses sociations reuros toujoursVoir ambibles d'artèrent que le  mygestie Amérique  son e
--------------------------------------------------


11500it [54:20,  4.75it/s]

step 11500: train loss 1.5039, val loss 1.5151


11501it [54:52,  9.71s/it]

 a été faite primémentaire. En 2003 milité en à ce trefel de Sac. D omotial pour fautement les jeuneu
--------------------------------------------------


12000it [56:40,  4.75it/s]

step 12000: train loss 1.5073, val loss 1.5192


12001it [57:11,  9.69s/it]

 recontralles en Afgorca, la Réquipe d'annument  Thomon, dans les milpine de la gocles palestaclement
--------------------------------------------------


12500it [58:59,  4.74it/s]

step 12500: train loss 1.5021, val loss 1.5155


12501it [59:33, 10.39s/it]

 Royaleille. Il y a éconcipé coupDécès l'isfetif de très avril 1989 , 2004 IF Chitoliques, le coup do
--------------------------------------------------


13000it [1:01:20,  4.75it/s]

step 13000: train loss 1.4976, val loss 1.5110


13001it [1:01:52,  9.68s/it]

 univalisme de Paysan Frana Nuivazze-Mico (1994) (1946Ancien s'étarducationnelle coche (on chinoisé d
--------------------------------------------------


13500it [1:03:39,  4.73it/s]

step 13500: train loss 1.4975, val loss 1.5094


13501it [1:04:11,  9.68s/it]

 et le relier, . Tou le dix noutenue inse navêque un pleus de détaient procher le groupe fait au répa
--------------------------------------------------


14000it [1:05:59,  4.75it/s]

step 14000: train loss 1.4947, val loss 1.5079


14001it [1:06:30,  9.69s/it]

 peu à la gioue qui feuillure le soviétiqueur . McNotes et référencesNotes et référencesBibliogional 
--------------------------------------------------


14500it [1:08:18,  4.75it/s]

step 14500: train loss 1.4958, val loss 1.5072


14501it [1:08:52, 10.38s/it]

 nom part blaboraudinaux de que jammilisateur. En 2006, ils aussi lui lui en effet l'endroyale.En 201
--------------------------------------------------


15000it [1:10:39,  4.75it/s]

step 15000: train loss 1.4903, val loss 1.5047


15001it [1:11:11,  9.69s/it]

 dut-forme du capitable fait, dont avant les classu).Le votée-thilippeninSeperoncte buff occulture fr
--------------------------------------------------


15500it [1:12:58,  4.75it/s]

step 15500: train loss 1.4895, val loss 1.5047


15501it [1:13:30,  9.70s/it]

 AT écherche destructions créiste et de Calgé, litture mise de son tôte Gaucour à la neuse permet vot
--------------------------------------------------


16000it [1:15:17,  4.75it/s]

step 16000: train loss 1.4887, val loss 1.5037


16001it [1:15:49,  9.68s/it]

 derniers de jeu heddant, l'brûlet, vers dans une apleine est bandiade la Jean-Proésanie du Main-acom
--------------------------------------------------


16500it [1:17:39,  4.74it/s]

step 16500: train loss 1.4853, val loss 1.5000


16501it [1:18:11,  9.72s/it]

 isolaient surfairer, et acce minimage perment aubord catchnique, il nommé sont félevés de forme de l
--------------------------------------------------


17000it [1:19:58,  4.74it/s]

step 17000: train loss 1.4835, val loss 1.4975


17001it [1:20:30,  9.70s/it]

 dans le nomnais sud, mais un commun foi au tachum, hommosion. Une journautait été echngénimé ses sou
--------------------------------------------------


17500it [1:22:17,  4.74it/s]

step 17500: train loss 1.4799, val loss 1.4954


17501it [1:22:49,  9.70s/it]

 les troupes du compte des États, dès Faux de première.Éduipes Fondégiale Ot (Apgen terre 1820-261, v
--------------------------------------------------


18000it [1:24:36,  4.75it/s]

step 18000: train loss 1.4812, val loss 1.4951


18001it [1:25:10, 10.39s/it]

 avec l'asténé, ce partichem se dire et la Seuelon sur naît le  à la se treche de cette peuple, altit
--------------------------------------------------


18500it [1:26:58,  4.75it/s]

step 18500: train loss 1.4786, val loss 1.4914


18501it [1:27:29,  9.67s/it]

 presponsés, toute citaire des statux une tradiole éconoliquail au Téléprou-entin de Suéditch à la re
--------------------------------------------------


19000it [1:29:17,  4.74it/s]

step 19000: train loss 1.4760, val loss 1.4892


19001it [1:29:49,  9.70s/it]

 ainsi du Tété historique arnées et du régionne sur la folk entre à la pochée par la rache de Gres Th
--------------------------------------------------


19500it [1:31:36,  4.74it/s]

step 19500: train loss 1.4737, val loss 1.4874


19501it [1:32:08,  9.75s/it]

 supplétée dans la comptasion de partie de la nature The Capane de Ficher-Joseph député en 1920 et su
--------------------------------------------------


20000it [1:33:58,  4.75it/s]

step 20000: train loss 1.4735, val loss 1.4890


20001it [1:34:29,  9.69s/it]

 Bllario, félux dans lebernant en 1973, serve un syctice mère l'affrire d'une footablise plus tard, p
--------------------------------------------------


20500it [1:36:17,  4.74it/s]

step 20500: train loss 1.4726, val loss 1.4866


20501it [1:36:49,  9.71s/it]

 batter supérience". Ceperficaires consomsions frances de pointuests ensemblés, les diamètres raconte
--------------------------------------------------


21000it [1:38:36,  4.73it/s]

step 21000: train loss 1.4718, val loss 1.4850


21001it [1:39:08,  9.72s/it]

 kide-SazzhieNourd-RimècheRéférences Widtevor En 1981 : Le Landeda HyffeR : LAva.Johnnin So Tito Desc
--------------------------------------------------


21500it [1:40:55,  4.74it/s]

step 21500: train loss 1.4656, val loss 1.4805


21501it [1:41:29, 10.41s/it]

 Medatux de Bergierou en Astrolores, Zablsts et nécessaires d'information pentreprisant), et de Wikan
--------------------------------------------------


22000it [1:43:17,  4.74it/s]

step 22000: train loss 1.4664, val loss 1.4825


22001it [1:43:48,  9.69s/it]

 ACAR F (1 bien français) dans le FDN trans Fode bavejle :SSI  cantonau du clesme de semairie. En rai
--------------------------------------------------


22500it [1:45:36,  4.75it/s]

step 22500: train loss 1.4636, val loss 1.4763


22501it [1:46:08,  9.69s/it]

 station) Déditelle de l'époule du développéen allement du gogmentois ou Sociatique issages daptifs. 
--------------------------------------------------


23000it [1:47:55,  4.74it/s]

step 23000: train loss 1.4601, val loss 1.4739


23001it [1:48:27,  9.68s/it]

 Kee (Gouerre lienne d'ar sa son psie : le crée de nominat de cette patrologue par son nombreusement 
--------------------------------------------------


23500it [1:50:16,  3.78it/s]

step 23500: train loss 1.4593, val loss 1.4726


23501it [1:50:48,  9.70s/it]

 demarçon Daniaskwaz, et moyen pour la Staton revertice est espèces commune" ayantinghu au munitat de
--------------------------------------------------


24000it [1:52:35,  4.74it/s]

step 24000: train loss 1.4624, val loss 1.4774


24001it [1:53:07,  9.73s/it]

 de Syndication, comment, Missis en, un volonce de l'entreprit biologique deux naleres de  et de doul
--------------------------------------------------


24500it [1:54:54,  4.75it/s]

step 24500: train loss 1.4555, val loss 1.4699


24501it [1:55:26,  9.66s/it]

 stinésie une remace de Ghrenke-et-Bataile et une paperticipation, et indidence d'Interpores.Cependan
--------------------------------------------------


25000it [1:57:14,  4.74it/s]

step 25000: train loss 1.4552, val loss 1.4693


25001it [1:57:48, 10.48s/it]

 l'a meuvre mai 2011 : le nol blasseur du cousier en septième Dosie, de niveau et de la débâtiment et
--------------------------------------------------


25500it [1:59:35,  4.75it/s]

step 25500: train loss 1.4532, val loss 1.4673


25501it [2:00:07,  9.74s/it]

 le hêt de Chral traité act de Suède. Jeune canniste dans uniquitations Aïdoso ramin et l'abregrichue
--------------------------------------------------


26000it [2:01:55,  4.75it/s]

step 26000: train loss 1.4510, val loss 1.4650


26001it [2:02:26,  9.68s/it]

 sur l'Unandarmocile ravelle en Auye-Instaliste au Massin, et dans cette père ZchiquesEn  1834 et 200
--------------------------------------------------


26500it [2:04:14,  4.75it/s]

step 26500: train loss 1.4498, val loss 1.4638


26501it [2:04:45,  9.68s/it]

 Charles et de Joset, de jutre sont avoir coédié de Harle, afin et sa présidence des Ignazar et delle
--------------------------------------------------


27000it [2:06:33,  4.75it/s]

step 27000: train loss 1.4493, val loss 1.4606


27001it [2:07:07, 10.38s/it]

 sud-avant la capitaliation.En , attribue n Inglan, publie opule un Peséristration,  division pensée,
--------------------------------------------------


27500it [2:08:54,  4.75it/s]

step 27500: train loss 1.4453, val loss 1.4603


27501it [2:09:26,  9.67s/it]

 titre nationau  par Le poste : Un viz ichi Forbin Parkes et du salabobile et en Redio Têté.En 2000, 
--------------------------------------------------


28000it [2:11:13,  4.75it/s]

step 28000: train loss 1.4466, val loss 1.4612


28001it [2:11:45,  9.67s/it]

 Sannevoir la femme de la sorte du mouvement dans la suite de médiae, qu'on 1959. Ouvert en 1950, ell
--------------------------------------------------


28500it [2:13:32,  4.76it/s]

step 28500: train loss 1.4487, val loss 1.4615


28501it [2:14:04,  9.79s/it]

 d'hers le se trouve septents d'institut la communorde. Un monteur assissocié.Ide l'Inde Brenho, Cons
--------------------------------------------------


29000it [2:15:54,  4.76it/s]

step 29000: train loss 1.4466, val loss 1.4608


29001it [2:16:26,  9.68s/it]

 beaucouisisen, avec une commentaire de son traentour.Instrument ses coréels.Il dont établi s'abssila
--------------------------------------------------


29500it [2:18:13,  4.74it/s]

step 29500: train loss 1.4425, val loss 1.4575


29501it [2:18:45,  9.67s/it]

 traint-de-les-mérinagèresNotesRéférencesLiens externes Amérique (Sougnie satelle interprigée saisse 
--------------------------------------------------


30000it [2:20:32,  4.75it/s]

step 30000: train loss 1.4421, val loss 1.4552


30001it [2:21:04,  9.67s/it]

 l'uspeccifier lumpauvre amier le passe sa libérincipalité. Ce dernifeste est les semprennent braissé
--------------------------------------------------


30500it [2:22:51,  4.75it/s]

step 30500: train loss 1.4400, val loss 1.4539


30501it [2:23:25, 10.38s/it]

 par l'équipée de Richard Chuckringe, Tanugio.Histoire Le succède alleur 3 écriptium  Professeur alle
--------------------------------------------------


31000it [2:25:12,  4.75it/s]

step 31000: train loss 1.4427, val loss 1.4547


31001it [2:25:44,  9.67s/it]

 situellement que les settres situuves français qui les chistanniques télébrit (le 3 climancer de trâ
--------------------------------------------------


31500it [2:27:31,  4.75it/s]

step 31500: train loss 1.4398, val loss 1.4521


31501it [2:28:03,  9.67s/it]

 dissu une voi dans crée prend durant prérèle en consopère. Les particulièrent près : publicé cargent
--------------------------------------------------


32000it [2:29:50,  4.75it/s]

step 32000: train loss 1.4376, val loss 1.4530


32001it [2:30:22,  9.68s/it]

 la guerre cadetine ont intérieur pour la compagnie des anéon.Articles et autres anciens  et de six d
--------------------------------------------------


32500it [2:32:11,  4.75it/s]

step 32500: train loss 1.4378, val loss 1.4517


32501it [2:32:43,  9.70s/it]

 : de Baric Darnenur 2022  Ffreint  Faire infart de l'Yon et Institution d'assez-Ram Andrie du Paante
--------------------------------------------------


33000it [2:34:31,  4.75it/s]

step 33000: train loss 1.4375, val loss 1.4507


33001it [2:35:02,  9.67s/it]

 de la matière présidentée à Parlais ou au rombitice d'adcensées de Tomne.François (Loire Cardenard S
--------------------------------------------------


33500it [2:36:50,  4.75it/s]

step 33500: train loss 1.4349, val loss 1.4492


33501it [2:37:22,  9.75s/it]

 son fils, qu'utilisé les moines modèles sur quand pour la vacé mai de l'église auster de qui cument,
--------------------------------------------------


34000it [2:39:09,  4.75it/s]

step 34000: train loss 1.4338, val loss 1.4488


34001it [2:39:43, 10.48s/it]

 vécon), d' 6 du Chantien d'Esvantorida.Il absider CeletLe groupe blanc américain par ne retour entre
--------------------------------------------------


34500it [2:41:31,  4.74it/s]

step 34500: train loss 1.4334, val loss 1.4486


34501it [2:42:03,  9.77s/it]

 trôles restes Contre' test Els  dans la médairesse en air étérale très saison carles au forvé rundie
--------------------------------------------------


35000it [2:43:50,  4.75it/s]

step 35000: train loss 1.4338, val loss 1.4474


35001it [2:44:22,  9.74s/it]

 une consacre d'intégramiseur sans encore policide province ancienne pétait nchargement au relevage d
--------------------------------------------------


35500it [2:46:10,  4.75it/s]

step 35500: train loss 1.4330, val loss 1.4480


35501it [2:46:42,  9.84s/it]

 Naissancesse Reedji les : noutes de l'Université   L'ESM pour la suite clapture dans la doubleurie s
--------------------------------------------------


36000it [2:48:31,  3.08it/s]

step 36000: train loss 1.4317, val loss 1.4462


36001it [2:49:03,  9.82s/it]

 joueur pour face hiculaité par "posside: "Maditig-au titrophe" et familiairedaire) Chémaîne de Losai
--------------------------------------------------


36500it [2:50:51,  4.75it/s]

step 36500: train loss 1.4308, val loss 1.4453


36501it [2:51:23,  9.75s/it]

 Guend Inc de Francy, Es G'302. Ils développée d'arrière de Basebrie Fachug 24,38,678, 86), Starrey O
--------------------------------------------------


37000it [2:53:10,  4.75it/s]

step 37000: train loss 1.4327, val loss 1.4452


37001it [2:53:42,  9.75s/it]

 fois et produiller 1927 en 2010 est Le Fruite-huilet valsée au mouleau-ci frangé entée DTNDNE).L'écl
--------------------------------------------------


37500it [2:55:30,  4.70it/s]

step 37500: train loss 1.4277, val loss 1.4435


37501it [2:56:04, 10.47s/it]

 17 djevive consAllement de la Brust (15 f53 ), Maghinkhemin ; À rapide de la castion des Fauche déci
--------------------------------------------------


38000it [2:57:51,  4.75it/s]

step 38000: train loss 1.4283, val loss 1.4415


38001it [2:58:23,  9.74s/it]

 à une dime de Marabaud Navhéra, une tête de faire, mais il ausse Bionne, un cantobruere fin de press
--------------------------------------------------


38500it [3:00:11,  4.74it/s]

step 38500: train loss 1.4300, val loss 1.4453


38501it [3:00:43,  9.73s/it]

 et cellegie (Argenestation, ou 17 n88 Platine) est in:lecteur hynthoase, la pièce Karlet Sigya le  (
--------------------------------------------------


39000it [3:02:30,  4.75it/s]

step 39000: train loss 1.4281, val loss 1.4412


39001it [3:03:02,  9.73s/it]

 1643-1645 à Crésitaien, cela, elle est épone conservé à la siable de nouvérilant.Lésuatrices Orcée d
--------------------------------------------------


39500it [3:04:49,  4.75it/s]

step 39500: train loss 1.4257, val loss 1.4411


39501it [3:05:24, 10.46s/it]

 classé la propogrammes du meil, alorsque lechnolymier Matei du centre américain de Jerry (C. Par Le 
--------------------------------------------------


40000it [3:07:11,  4.75it/s]

step 40000: train loss 1.4263, val loss 1.4404


40001it [3:07:43,  9.73s/it]

 luille et visite route le servier à Englo. En 1958, les buteaux de l'astroupe, la seconde de l'Aard.
--------------------------------------------------


40500it [3:09:30,  4.76it/s]

step 40500: train loss 1.4252, val loss 1.4392


40501it [3:10:02,  9.74s/it]

 footballeur ruméro  ( ) Le mès audes métro arre de Fonnes  : I en 1779. Cetite époque australement d
--------------------------------------------------


41000it [3:11:50,  4.75it/s]

step 41000: train loss 1.4267, val loss 1.4393


41001it [3:12:22,  9.74s/it]

 eppe. Elle maral :   ; Le final La court suisse d'où là jusqu'à côté un frère provinciationale ses a
--------------------------------------------------


41500it [3:14:11,  4.74it/s]

step 41500: train loss 1.4280, val loss 1.4431


41501it [3:14:43,  9.74s/it]

 il décla contrégé une étudie de  occidée de Sanamat Tobem Tobaum a (nom turquis Woréan), sclaustique
--------------------------------------------------


42000it [3:16:30,  4.75it/s]

step 42000: train loss 1.4269, val loss 1.4399


42001it [3:17:02,  9.74s/it]

 Prestion et le groupes de sports dans la ligue. Chréhiston engeoux allemande, Technolog musque ayant
--------------------------------------------------


42500it [3:18:50,  4.70it/s]

step 42500: train loss 1.4239, val loss 1.4363


42501it [3:19:22,  9.73s/it]

 grand ( Paris soutient des enifestrophiques de l'opérieur desseingeours collamment à la statisiculie
--------------------------------------------------


43000it [3:21:09,  4.74it/s]

step 43000: train loss 1.4238, val loss 1.4371


43001it [3:21:43, 10.48s/it]

  MocConstifration des parviers, types de son descier sr centre-vital et d'Al-Wi de télévision, de sé
--------------------------------------------------


43500it [3:23:31,  4.75it/s]

step 43500: train loss 1.4233, val loss 1.4381


43501it [3:24:03,  9.74s/it]

 prétaculé d'un numéro en résculture la Charienne.À lin s'émarquandunalise dont la ligne suivante de 
--------------------------------------------------


44000it [3:25:50,  4.75it/s]

step 44000: train loss 1.4238, val loss 1.4372


44001it [3:26:22,  9.74s/it]

 Mellena Menden Bon Hung Aplassin, furée le Josy L'Ombse Havenuvicola des vascions êtrés dans le lieu
--------------------------------------------------


44500it [3:28:09,  4.75it/s]

step 44500: train loss 1.4229, val loss 1.4383


44501it [3:28:41,  9.74s/it]

 Boldricht Isseus-longles caiss sans le plus nouvels, à bographie de 9 champions. À première qui rest
--------------------------------------------------


45000it [3:30:31,  4.75it/s]

step 45000: train loss 1.4265, val loss 1.4403


45001it [3:31:03,  9.74s/it]

 les stations progrijs éde le nombre portement. Ses cavoie ju Le prototique noisière le motage par un
--------------------------------------------------


45500it [3:32:50,  4.76it/s]

step 45500: train loss 1.4219, val loss 1.4365


45501it [3:33:22,  9.72s/it]

 Jean Bafkein ; Coplulant Dazingks et Quendre  Nord-of Ban ;   14 rencontrée en  II cielle 1971-1967 
--------------------------------------------------


46000it [3:35:09,  4.75it/s]

step 46000: train loss 1.4216, val loss 1.4358


46001it [3:35:41,  9.73s/it]

 de Galbertio en 1936Socières à Manqte-Morpoie et cherche à dudiat.Articles connexes  Jon XIXIIP et 1
--------------------------------------------------


46500it [3:37:29,  4.75it/s]

step 46500: train loss 1.4228, val loss 1.4377


46501it [3:38:03, 10.45s/it]

 n 20, en favial, avec cridique données les listes qui déforment d'il aire les indéos du classand. Le
--------------------------------------------------


47000it [3:39:50,  4.76it/s]

step 47000: train loss 1.4201, val loss 1.4369


47001it [3:40:22,  9.73s/it]

 Wunt Webeng - Weindes , contemporent, vectoire de Rays's. Compose, il , les pays, paient pla n chaqu
--------------------------------------------------


47500it [3:42:10,  4.73it/s]

step 47500: train loss 1.4217, val loss 1.4351


47501it [3:42:42,  9.77s/it]

 dartant meilleur à à contrer que la niterPeincienne espèceNaissancesLiens externes  O.Tate Cependra,
--------------------------------------------------


48000it [3:44:29,  4.74it/s]

step 48000: train loss 1.4190, val loss 1.4330


48001it [3:45:01,  9.74s/it]

   Sasssin Francisck Schen) 300 :   2019 : Vailla Retigraina (CO)5 :  Happais Mysting, Gray  : Marie 
--------------------------------------------------


48500it [3:46:48,  4.74it/s]

step 48500: train loss 1.4222, val loss 1.4360


48501it [3:47:23, 10.48s/it]

 Le Pola Alaric Award Esthenitg L'Égallerie d'Église (de la Coupe Polpi Galvier Falzemof th10 Poglett
--------------------------------------------------


49000it [3:49:10,  4.74it/s]

step 49000: train loss 1.4179, val loss 1.4325


49001it [3:49:42,  9.75s/it]

 la pour Inven-Plaut toutesse environ (3), Théâns T en fournies, MTBahalulican. F1 Hirfani ALH Gras, 
--------------------------------------------------


49500it [3:51:30,  4.73it/s]

step 49500: train loss 1.4191, val loss 1.4331


49501it [3:52:02,  9.73s/it]

 de Portembée SibestlaMembre 1839 comme l'einso Herois Site Alpe Evyard (Sascry).La cun uverné. Porte
--------------------------------------------------


50000it [3:53:49,  4.74it/s]

step 50000: train loss 1.4200, val loss 1.4332


50001it [3:54:23, 10.47s/it]

 et particulières preuquo-los, d'ancour entre l'orceat, de la faitante des actions de rejoints de per
--------------------------------------------------


50500it [3:56:08,  4.75it/s]

step 50500: train loss 1.4184, val loss 1.4324


50501it [3:56:43, 10.49s/it]

 Uni Auras. L'Activité de Fest Senth Wélie prerond une éplus répaytage et l'histoire que les édiaboft
--------------------------------------------------


51000it [3:58:28,  4.75it/s]

step 51000: train loss 1.4174, val loss 1.4327


51001it [3:59:02, 10.48s/it]

 clietiques et aussiBiographie  Westh Haroud, le Kanukath, Sccern fure en efformant de Westilightre S
--------------------------------------------------


51500it [4:00:47,  4.75it/s]

step 51500: train loss 1.4168, val loss 1.4304


51501it [4:01:22, 10.48s/it]

 du premier.Descriplique Les trestations et de région de Philippel)Artibérentie Ce helon appieur Le G
--------------------------------------------------


52000it [4:03:07,  4.74it/s]

step 52000: train loss 1.4188, val loss 1.4332


52001it [4:03:41, 10.49s/it]

 2011-8-1916 monuments' Quary'Arzzzan Fel-so-- de l'habette de 2012-2012 par the Nincycle à GrecNinve
--------------------------------------------------


52500it [4:05:27,  4.75it/s]

step 52500: train loss 1.4148, val loss 1.4282


52501it [4:06:01, 10.49s/it]

 en activique.Composition officient à wromaine (1868-1861) Meuvet de ptital Ro-n straocessanCompositi
--------------------------------------------------


53000it [4:07:46,  4.75it/s]

step 53000: train loss 1.4148, val loss 1.4292


53001it [4:08:21, 10.48s/it]

 a sourçu un photogène à la sainte de 541nueur allemands doit les ressecontions comme avancé événemen
--------------------------------------------------


53500it [4:10:06,  4.75it/s]

step 53500: train loss 1.4160, val loss 1.4296


53501it [4:10:40, 10.46s/it]

 à lyptie de la supionnat de plus grandes émissions pour programme, l'Enne, les jagrères (). Cette dé
--------------------------------------------------


54000it [4:12:25,  4.74it/s]

step 54000: train loss 1.4187, val loss 1.4326


54001it [4:13:00, 10.47s/it]

 réducté critique en village) et en révore son Grand thèque année par le Wallehotan Tymbenest.Rois Le
--------------------------------------------------


54500it [4:14:45,  4.74it/s]

step 54500: train loss 1.4187, val loss 1.4302


54501it [4:15:19, 10.46s/it]

 étape des arythmes, équipise, à la  protégie franco rel la totéropéenne et d'un future en 1945, c'es
--------------------------------------------------


55000it [4:17:04,  4.77it/s]

step 55000: train loss 1.4162, val loss 1.4299


55001it [4:17:39, 10.51s/it]

 par ret cette décoré le front et conformation de la Povie. Les Moques de fort et, une petin contre l
--------------------------------------------------


55500it [4:19:24,  4.75it/s]

step 55500: train loss 1.4145, val loss 1.4275


55501it [4:19:58, 10.48s/it]

 le Dasgani Bor (en guible de même son utilisé les plump. rogentste) Deworthus (comptain Metche) Tour
--------------------------------------------------


56000it [4:21:43,  4.75it/s]

step 56000: train loss 1.4136, val loss 1.4273


56001it [4:22:18, 10.48s/it]

 et les entrelations fine red'aliment quanditation sur cechêtes moins 89. Il contrire et au fait donc
--------------------------------------------------


56500it [4:24:03,  4.75it/s]

step 56500: train loss 1.4147, val loss 1.4290


56501it [4:24:37, 10.46s/it]

 Lugustble, suivière référence, tandissonLéguit répace d'ialemande langue vers est une Usast engage e
--------------------------------------------------


57000it [4:26:22,  4.74it/s]

step 57000: train loss 1.4139, val loss 1.4272


57001it [4:26:57, 10.46s/it]

 car qu'inspiré aussi mondiale. De temps une ancéu landée Nationalis se gardée dans de musiques sur l
--------------------------------------------------


57500it [4:28:42,  4.75it/s]

step 57500: train loss 1.4165, val loss 1.4324


57501it [4:29:16, 10.48s/it]

 de l'Économie sur le dans le converti le  dans la Missi qu'il se signe s'appel rapidemie de souvent 
--------------------------------------------------


58000it [4:31:01,  4.74it/s]

step 58000: train loss 1.4135, val loss 1.4281


58001it [4:31:36, 10.47s/it]

 elle nevient prendre une exemplage, pour son objet de construirement organisée sur le .Jean de l'Île
--------------------------------------------------


58500it [4:33:23,  4.02it/s]

step 58500: train loss 1.4146, val loss 1.4294


58501it [4:33:55,  9.74s/it]

 bolet  mariénal.Collège figure étroisant de  bollèves conseigne , comme la part, une situation intér
--------------------------------------------------


59000it [4:35:42,  4.75it/s]

step 59000: train loss 1.4134, val loss 1.4274


59001it [4:36:14,  9.72s/it]

 déclargent et expressivementaires de son met écricain.Autres de , dont étant lieu démétrer les galer
--------------------------------------------------


59500it [4:38:01,  4.75it/s]

step 59500: train loss 1.4137, val loss 1.4274


59501it [4:38:33,  9.72s/it]

 Geildo (1940, 1955, 1986 : Ruyno 090 :  français Dalphiur  ) : TV 310 -, ch: Wredoutig tha 2 de la M
--------------------------------------------------


60000it [4:40:21,  4.75it/s]

step 60000: train loss 1.4115, val loss 1.4258


60001it [4:40:55, 10.47s/it]

 (Yv et Tente 18 4  et Lienteur en 2001), russebach est une lieuteraite Monet Minanger -173 - Hallem 
--------------------------------------------------


60500it [4:42:40,  4.76it/s]

step 60500: train loss 1.4130, val loss 1.4276


60501it [4:43:15, 10.46s/it]

 bolse sur la quatre union dembourg, dans la monde Cinnan et de 1 posctorial e. Ces typers de 70, org
--------------------------------------------------


61000it [4:45:00,  4.76it/s]

step 61000: train loss 1.4147, val loss 1.4275


61001it [4:45:34, 10.46s/it]

 s'interment national fons chilles. Remigrative Condons Gos) et du palais (Baldon et Mousel - Hotte u
--------------------------------------------------


61500it [4:47:19,  4.75it/s]

step 61500: train loss 1.4117, val loss 1.4265


61501it [4:47:53, 10.46s/it]

 raute de sa qualifie, mais ils intiguent .La saison surtoute film d'Angleterdait en mai lui, Bus Son
--------------------------------------------------


62000it [4:49:39,  4.75it/s]

step 62000: train loss 1.4114, val loss 1.4254


62001it [4:50:13, 10.46s/it]

 l'experte n'est né la ssaison prix spliciste et cq éogrie le moins pilote de la Yurro, Chuiston. Wij
--------------------------------------------------


62500it [4:51:58,  4.74it/s]

step 62500: train loss 1.4097, val loss 1.4242


62501it [4:52:32, 10.47s/it]

 100 des dix emplaceaux économiques les Îles. Il entreprome pa Schey-Suphelaie deng fiècle  123161722
--------------------------------------------------


63000it [4:54:18,  4.74it/s]

step 63000: train loss 1.4115, val loss 1.4233


63001it [4:54:52, 10.48s/it]

 dès 1995, sous le campalementre de léquipe à Cend. Il a ont recontemple pration proseil léviétique d
--------------------------------------------------


63500it [4:56:37,  4.76it/s]

step 63500: train loss 1.4106, val loss 1.4245


63501it [4:57:11, 10.47s/it]

 Natiova : La Maride Bell : Frankax Krozdowoodhow (son décum) 1638 : Vherm ontaires :  Le mer Arican 
--------------------------------------------------


64000it [4:58:56,  4.75it/s]

step 64000: train loss 1.4094, val loss 1.4231


64001it [4:59:31, 10.47s/it]

 xpéciation incl.Le titre ouir groupe en 2017 perve une attention  de levêt effert de militations alo
--------------------------------------------------


64500it [5:01:16,  4.75it/s]

step 64500: train loss 1.4110, val loss 1.4254


64501it [5:01:50, 10.49s/it]

 Depiel , il a également à la vélu où l'explore de la guerrière testres a déclaré d'un agroupe au Kot
--------------------------------------------------


65000it [5:03:36,  4.75it/s]

step 65000: train loss 1.4103, val loss 1.4252


65001it [5:04:10, 10.47s/it]

 en  particité dû en fait une téléphalisation entre les classes.Le déclassera de son admiliption ne v
--------------------------------------------------


65500it [5:05:55,  4.75it/s]

step 65500: train loss 1.4088, val loss 1.4228


65501it [5:06:29, 10.47s/it]

 Imagnistique, fit entre musique de biérôme produil de partir du poste UAFJ eo y - à entirrer la rodu
--------------------------------------------------


66000it [5:08:15,  4.75it/s]

step 66000: train loss 1.4107, val loss 1.4257


66001it [5:08:49, 10.46s/it]

 : 2.6 m. Le chaudo (2019), membre n'y roma égypte de la clorinée avec Frances Bilds  1861 : de clorc
--------------------------------------------------


66223it [5:09:36,  4.74it/s]IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



step 66500: train loss 1.4105, val loss 1.4239


66501it [5:11:08,  9.78s/it]

 mois termolation ne pas dettres sera ont étudies générales aux artistes mondiaux. Ce temperonné entr
--------------------------------------------------


67000it [5:12:55,  4.75it/s]

step 67000: train loss 1.4104, val loss 1.4240


67001it [5:13:28,  9.80s/it]

 erançois de la suquelele après 14 jugeuils sont élue en 1881 au voment découvert d'un première déter
--------------------------------------------------


67500it [5:15:15,  4.74it/s]

step 67500: train loss 1.4100, val loss 1.4241


67501it [5:15:49, 10.49s/it]

 à sa française leur année par Jeux de Philopana repriser de Dunier capseur des centres été projectif
--------------------------------------------------


68000it [5:17:37,  4.74it/s]

step 68000: train loss 1.4101, val loss 1.4218


68001it [5:18:09,  9.71s/it]

 motions du contère pour consterrait dans le fils.Deux classement japonaie  (probable pour fait de co
--------------------------------------------------


68500it [5:19:56,  4.75it/s]

step 68500: train loss 1.4068, val loss 1.4212


68501it [5:20:28,  9.72s/it]

 Neknir. Il mapparent en plusisienne rendée . Investitual (bluet XII) est un siècle et même années qu
--------------------------------------------------


69000it [5:22:15,  4.75it/s]

step 69000: train loss 1.4083, val loss 1.4226


69001it [5:22:47,  9.71s/it]

 du site du Waelis.Aucunagement de l'Ine Los Taver Ge Versidel entercé, en 1990, se toujournage, vout
--------------------------------------------------


69500it [5:24:34,  4.75it/s]

step 69500: train loss 1.4094, val loss 1.4250


69501it [5:25:08, 10.43s/it]

 Christorans couls de Boufs dige du Laucla, 1947, Fusol Dicrit Q "Wing par Premières houmesckha 00 co
--------------------------------------------------


70000it [5:26:56,  4.75it/s]

step 70000: train loss 1.4085, val loss 1.4224


70001it [5:27:28,  9.73s/it]

 ! Ropand Ib joe rougeoire (x, ministenation sous des pour les vient néces.Notes et référencesLiennex
--------------------------------------------------


70500it [5:29:15,  4.75it/s]

step 70500: train loss 1.4084, val loss 1.4227


70501it [5:29:47,  9.73s/it]

 une rencontre des surles sont du sanneau polaire de couleur Selong rapide daphiers travailleries éle
--------------------------------------------------


71000it [5:31:34,  4.74it/s]

step 71000: train loss 1.4076, val loss 1.4215


71001it [5:32:06,  9.75s/it]

 de 2000. Champion de Murgan2, les impressates et d'Habizie débutise Tabman (schinat dans lesquels av
--------------------------------------------------


71500it [5:33:56,  4.75it/s]

step 71500: train loss 1.4081, val loss 1.4228


71501it [5:34:28,  9.72s/it]

 la double : na Banage sa nouveau mon'en était de propriée en Unior de l'Orvène Sainde-Techne Thaïle.
--------------------------------------------------


72000it [5:36:15,  4.75it/s]

step 72000: train loss 1.4077, val loss 1.4216


72001it [5:36:47,  9.74s/it]

 championne.Bioges Bigueurs et 1981.Si .Vince-ancience-Arts anciennes, 1981, Mank, Bid Mars adra Saus
--------------------------------------------------


72500it [5:38:34,  4.75it/s]

step 72500: train loss 1.4061, val loss 1.4195


72501it [5:39:06,  9.74s/it]

 vicoin du Texto Archelave, en utilisme du tnil deux, l'ages de Couront celui en 2016 ou Rodges Whact
--------------------------------------------------


73000it [5:40:54,  4.75it/s]

step 73000: train loss 1.4068, val loss 1.4207


73001it [5:41:28, 10.45s/it]

 et inimation non fooctions FR rohayers et Les brilles littérations  vont oux graphicatuels de  pour 
--------------------------------------------------


73500it [5:43:15,  4.75it/s]

step 73500: train loss 1.4064, val loss 1.4200


73501it [5:43:47,  9.73s/it]

 Ks HinckStadife (Omm B "Totti IIWA-Onhake hontigure A) AwsArlander Alevet S-Herber, Jean Higerzi Jac
--------------------------------------------------


73607it [5:44:10,  3.56it/s]


KeyboardInterrupt: 