In [1]:
import pandas as pd
import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader
from torch.nn import Transformer
from torch.optim.lr_scheduler import ReduceLROnPlateau
import math
import os
from sklearn.metrics import f1_score
from sklearn.model_selection import train_test_split
from collections import Counter
import unicodedata
from tqdm.auto import tqdm
import random
import json

torch.manual_seed(42)
np.random.seed(42)
random.seed(42)

MAX_SEQ_LENGTH = 20
BATCH_SIZE = 512
EMBED_DIM = 512
NUM_HEADS = 16
NUM_ENCODER_LAYERS = 8
NUM_DECODER_LAYERS = 8
FFN_DIM = 2048
DROPOUT = 0.1
NUM_EPOCHS = 50
LEARNING_RATE = 0.0001
ERROR_TYPE_WEIGHTS = {
    'DELETION': 2.2,
    'INSERTION': 5.1,
    'KEYBOARD': 12.7,
    'TRANSLITERATION': 1.0
}
DEVICE = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

TARGET_LANGUAGE = None

class SpellingDataset(Dataset):
    def __init__(self, data_file, char_to_idx, idx_to_char, max_length=MAX_SEQ_LENGTH, validate_pairs=False):
        print(f"Loading dataset from {data_file}")
        self.data = pd.read_csv(data_file)
        
        if 'LANGUAGE' in self.data.columns:
            languages = self.data['LANGUAGE'].unique()
            print(f"Languages found in dataset: {languages}")
            language_counts = self.data['LANGUAGE'].value_counts()
            print("Language distribution:")
            for lang, count in language_counts.items():
                print(f"  {lang}: {count} examples")
        
        if 'ERROR_TYPE' in self.data.columns:
            error_counts = self.data['ERROR_TYPE'].value_counts()
            print("Error type distribution:")
            for error_type, count in error_counts.items():
                print(f"  {error_type}: {count} examples ({count/len(self.data)*100:.2f}%)")
                
        self.char_to_idx = char_to_idx
        self.idx_to_char = idx_to_char
        self.max_length = max_length
        
        if validate_pairs:
            self._validate_pairs()
    
    def _validate_pairs(self):
        char_changes = []
        suspicious_indices = []
        
        language_stats = {}
        has_language_column = 'LANGUAGE' in self.data.columns
        
        for idx, row in tqdm(self.data.iterrows(), total=len(self.data), desc="Validating data pairs"):
            mistake = str(row['MISTAKE'])
            correct = str(row['CORRECT'])
            
            language = str(row['LANGUAGE']) if has_language_column else 'unknown'
            
            if language not in language_stats:
                language_stats[language] = {
                    'char_changes': [],
                    'suspicious': 0,
                    'total': 0
                }
            
            language_stats[language]['total'] += 1
            
            distance = levenshtein_distance(mistake, correct)
            
            max_len = max(len(mistake), len(correct))
            proportion_changed = distance / max_len if max_len > 0 else 0
            char_changes.append(proportion_changed)
            
            language_stats[language]['char_changes'].append(proportion_changed)
            
            if proportion_changed > 0.8:
                suspicious_indices.append(idx)
                language_stats[language]['suspicious'] += 1
        
        print(f"\nData validation statistics:")
        print(f"Average proportion of changed characters: {np.mean(char_changes):.4f}")
        print(f"Median proportion of changed characters: {np.median(char_changes):.4f}")
        print(f"Found {len(suspicious_indices)} suspicious pairs (>80% different)")
        
        if has_language_column:
            print("\nStatistics by language:")
            for lang, stats in language_stats.items():
                if stats['total'] > 0:
                    avg_change = np.mean(stats['char_changes']) if stats['char_changes'] else 0
                    suspicious_percent = (stats['suspicious'] / stats['total']) * 100
                    print(f"{lang}: {stats['total']} examples, avg change: {avg_change:.4f}, "
                          f"suspicious: {suspicious_percent:.2f}% ({stats['suspicious']}/{stats['total']})")
        
        if suspicious_indices:
            print("\nExamples of suspicious pairs:")
            for i in range(min(5, len(suspicious_indices))):
                idx = suspicious_indices[i]
                mistake = str(self.data.loc[idx, 'MISTAKE'])
                correct = str(self.data.loc[idx, 'CORRECT'])
                language = str(self.data.loc[idx, 'LANGUAGE']) if has_language_column else 'unknown'
                print(f"[{language}] MISTAKE: {mistake}, CORRECT: {correct}, "
                      f"Levenshtein: {levenshtein_distance(mistake, correct)}, "
                      f"Proportion: {levenshtein_distance(mistake, correct) / max(len(mistake), len(correct)):.2f}")
    
    def __len__(self):
        return len(self.data)
    
    def __getitem__(self, idx):
        mistake = self.data.iloc[idx]['MISTAKE']
        correct = self.data.iloc[idx]['CORRECT']
        
        mistake = str(mistake)
        correct = str(correct)
        
        mistake_ids = self.tokenize(mistake)
        correct_ids = self.tokenize(correct)
        
        src = torch.tensor([self.char_to_idx['<BOS>']] + mistake_ids + [self.char_to_idx['<EOS>']], dtype=torch.long)
        tgt = torch.tensor([self.char_to_idx['<BOS>']] + correct_ids + [self.char_to_idx['<EOS>']], dtype=torch.long)
        
        item_data = {
            'src': src,
            'tgt': tgt,
            'src_text': mistake,
            'tgt_text': correct,
            'idx': idx
        }
        
        if 'LANGUAGE' in self.data.columns:
            item_data['language'] = self.data.iloc[idx]['LANGUAGE']
            
        if 'ERROR_TYPE' in self.data.columns:
            item_data['error_type'] = self.data.iloc[idx]['ERROR_TYPE']
            
        return item_data
    
    def tokenize(self, text):
        text = unicodedata.normalize('NFC', text)
        return [self.char_to_idx.get(c, self.char_to_idx['<UNK>']) for c in text[:self.max_length]]
    
    def get_sample_pairs(self, n=10):
        indices = random.sample(range(len(self.data)), min(n, len(self.data)))
        samples = []
        for idx in indices:
            sample = {
                'mistake': str(self.data.iloc[idx]['MISTAKE']),
                'correct': str(self.data.iloc[idx]['CORRECT']),
                'idx': idx
            }
            
            if 'LANGUAGE' in self.data.columns:
                sample['language'] = self.data.iloc[idx]['LANGUAGE']
            
            if 'ERROR_TYPE' in self.data.columns:
                sample['error_type'] = self.data.iloc[idx]['ERROR_TYPE']
                
            samples.append(sample)
        return samples

def levenshtein_distance(s1, s2):
    if len(s1) < len(s2):
        return levenshtein_distance(s2, s1)
    
    if len(s2) == 0:
        return len(s1)
    
    previous_row = range(len(s2) + 1)
    for i, c1 in enumerate(s1):
        current_row = [i + 1]
        for j, c2 in enumerate(s2):
            insertions = previous_row[j + 1] + 1
            deletions = current_row[j] + 1
            substitutions = previous_row[j] + (c1 != c2)
            current_row.append(min(insertions, deletions, substitutions))
        previous_row = current_row
    
    return previous_row[-1]

def create_vocabulary(data_file, min_freq=5):
    print("Loading data for vocabulary creation...")
    read_csv_params = {}
    if pd.__version__ >= '1.3.0':
        read_csv_params['on_bad_lines'] = 'skip'
    
    df = pd.read_csv(data_file, **read_csv_params)
    
    if 'LANGUAGE' in df.columns:
        languages = df['LANGUAGE'].unique()
        print(f"Building vocabulary for all languages: {languages}")
        language_counts = df['LANGUAGE'].value_counts()
        print("Language distribution for vocabulary:")
        for lang, count in language_counts.items():
            print(f"  {lang}: {count} examples")
    
    all_chars = Counter()
    print("Building vocabulary...")
    for mistake, correct in tqdm(zip(df['MISTAKE'], df['CORRECT']), total=len(df), desc="Processing characters"):
        mistake = str(mistake)
        correct = str(correct)
        
        mistake = unicodedata.normalize('NFC', mistake)
        correct = unicodedata.normalize('NFC', correct)
        
        all_chars.update(mistake)
        all_chars.update(correct)
    
    common_chars = [char for char, count in all_chars.items() if count >= min_freq]
    
    special_tokens = ['<PAD>', '<UNK>', '<BOS>', '<EOS>']
    
    char_to_idx = {char: idx for idx, char in enumerate(special_tokens + common_chars)}
    idx_to_char = {idx: char for char, idx in char_to_idx.items()}
    
    print(f"Vocabulary size: {len(char_to_idx)}")
    print(f"Most common characters: {[c for c, _ in all_chars.most_common(20)]}")
    
    return char_to_idx, idx_to_char

def pad_collate(batch):
    batch.sort(key=lambda x: len(x['src']), reverse=True)
    
    src_lengths = [len(example['src']) for example in batch]
    tgt_lengths = [len(example['tgt']) for example in batch]
    
    max_src_len = max(src_lengths)
    max_tgt_len = max(tgt_lengths)
    
    padded_src = torch.zeros(len(batch), max_src_len, dtype=torch.long)
    padded_tgt = torch.zeros(len(batch), max_tgt_len, dtype=torch.long)
    
    for i, example in enumerate(batch):
        src_len = src_lengths[i]
        tgt_len = tgt_lengths[i]
        
        padded_src[i, :src_len] = example['src']
        padded_tgt[i, :tgt_len] = example['tgt']
    
    src_padding_mask = (padded_src == 0)
    tgt_padding_mask = (padded_tgt == 0)
    
    batch_data = {
        'src': padded_src,
        'tgt': padded_tgt,
        'src_mask': generate_square_subsequent_mask(max_src_len),
        'tgt_mask': generate_square_subsequent_mask(max_tgt_len),
        'src_padding_mask': src_padding_mask,
        'tgt_padding_mask': tgt_padding_mask,
        'src_lengths': src_lengths,
        'tgt_lengths': tgt_lengths,
        'src_text': [example['src_text'] for example in batch],
        'tgt_text': [example['tgt_text'] for example in batch],
        'idx': [example['idx'] for example in batch],
        'language': [example.get('language', 'unknown') for example in batch]
    }
    
    if 'error_type' in batch[0]:
        batch_data['error_type'] = [example.get('error_type', 'unknown') for example in batch]
    
    return batch_data

def generate_square_subsequent_mask(sz):
    mask = (torch.triu(torch.ones(sz, sz)) == 1).transpose(0, 1)
    mask = mask.float().masked_fill(mask == 0, float('-inf')).masked_fill(mask == 1, float(0.0))
    return mask.to(DEVICE)

class PositionalEncoding(nn.Module):
    def __init__(self, d_model, dropout=0.1, max_len=5000):
        super(PositionalEncoding, self).__init__()
        self.dropout = nn.Dropout(p=dropout)

        pe = torch.zeros(max_len, d_model)
        position = torch.arange(0, max_len, dtype=torch.float).unsqueeze(1)
        div_term = torch.exp(torch.arange(0, d_model, 2).float() * (-math.log(10000.0) / d_model))
        pe[:, 0::2] = torch.sin(position * div_term)
        pe[:, 1::2] = torch.cos(position * div_term)
        pe = pe.unsqueeze(0).transpose(0, 1)
        self.register_buffer('pe', pe)

    def forward(self, x):
        x = x + self.pe[:x.size(0), :]
        return self.dropout(x)

class SpellingTransformer(nn.Module):
    def __init__(self, vocab_size, d_model=EMBED_DIM, nhead=NUM_HEADS, 
                 num_encoder_layers=NUM_ENCODER_LAYERS, num_decoder_layers=NUM_DECODER_LAYERS, 
                 dim_feedforward=FFN_DIM, dropout=DROPOUT):
        super(SpellingTransformer, self).__init__()
        
        self.d_model = d_model
        
        self.src_embedding = nn.Embedding(vocab_size, d_model)
        self.tgt_embedding = nn.Embedding(vocab_size, d_model)
        self.positional_encoding = PositionalEncoding(d_model, dropout)
        
        self.transformer = Transformer(
            d_model=d_model, 
            nhead=nhead, 
            num_encoder_layers=num_encoder_layers,
            num_decoder_layers=num_decoder_layers,
            dim_feedforward=dim_feedforward,
            dropout=dropout,
            batch_first=False
        )
        
        self.output_layer = nn.Linear(d_model, vocab_size)
        
        self._init_parameters()
    
    def _init_parameters(self):
        for p in self.parameters():
            if p.dim() > 1:
                nn.init.xavier_uniform_(p)
    
    def forward(self, src, tgt, src_mask=None, tgt_mask=None, src_padding_mask=None, tgt_padding_mask=None):
        src = src.transpose(0, 1)
        tgt = tgt.transpose(0, 1)
        
        src = self.positional_encoding(self.src_embedding(src) * math.sqrt(self.d_model))
        tgt = self.positional_encoding(self.tgt_embedding(tgt) * math.sqrt(self.d_model))
        
        output = self.transformer(
            src=src,
            tgt=tgt,
            src_mask=src_mask,
            tgt_mask=tgt_mask,
            memory_mask=None,
            src_key_padding_mask=src_padding_mask,
            tgt_key_padding_mask=tgt_padding_mask,
            memory_key_padding_mask=src_padding_mask
        )
        
        output = self.output_layer(output)
        
        return output.transpose(0, 1)

class WeightedCrossEntropyLoss(nn.Module):
    def __init__(self, char_to_idx, weights_dict=ERROR_TYPE_WEIGHTS, ignore_index=-100):
        super(WeightedCrossEntropyLoss, self).__init__()
        self.ignore_index = ignore_index
        self.weights_dict = weights_dict
        self.base_criterion = nn.CrossEntropyLoss(ignore_index=ignore_index, reduction='none')
        self.char_to_idx = char_to_idx
        
    def forward(self, output_flat, target_flat, error_types=None):
        per_token_loss = self.base_criterion(output_flat, target_flat)
        
        if error_types is None:
            return per_token_loss.mean()
        
        seq_len = per_token_loss.size(0) // len(error_types)
        
        weights = torch.ones_like(per_token_loss)
        
        for i, error_type in enumerate(error_types):
            sample_weight = self.weights_dict.get(error_type, 1.0)
            
            start_idx = i * seq_len
            end_idx = (i + 1) * seq_len
            weights[start_idx:end_idx] = sample_weight
            
        weighted_loss = (per_token_loss * weights).sum() / weights.sum()
        
        return weighted_loss

def split_data(input_file, train_ratio=0.8, val_ratio=0.1, test_ratio=0.1):
    assert train_ratio + val_ratio + test_ratio == 1.0, "Ratios must sum to 1"
    
    print(f"Loading dataset from {input_file}...")
    read_csv_params = {}
    if pd.__version__ >= '1.3.0':
        read_csv_params['on_bad_lines'] = 'skip'
    
    df = pd.read_csv(input_file, **read_csv_params)
    
    if 'LANGUAGE' in df.columns:
        languages = df['LANGUAGE'].unique()
        print(f"Using all available languages: {languages}")
        language_counts = df['LANGUAGE'].value_counts()
        print("Language distribution in the dataset:")
        for lang, count in language_counts.items():
            print(f"  {lang}: {count} examples ({count/len(df)*100:.2f}%)")
    
    print(f"Total dataset size: {len(df)}")
    if 'ERROR_TYPE' in df.columns:
        print("Error type distribution:")
        print(df['ERROR_TYPE'].value_counts().head(10))
    
    print("Checking some sample pairs:")
    for i in range(5):
        idx = random.randint(0, len(df) - 1)
        mistake = str(df.iloc[idx]['MISTAKE'])
        correct = str(df.iloc[idx]['CORRECT'])
        language = str(df.iloc[idx]['LANGUAGE']) if 'LANGUAGE' in df.columns else 'unknown'
        error_type = str(df.iloc[idx]['ERROR_TYPE']) if 'ERROR_TYPE' in df.columns else 'unknown'
        print(f"Sample {i+1} [{language}][{error_type}]: MISTAKE={mistake}, CORRECT={correct}")
    
    os.makedirs('data', exist_ok=True)
    
    if 'LANGUAGE' in df.columns and 'ERROR_TYPE' in df.columns:
        print("Performing stratified split by LANGUAGE and ERROR_TYPE...")
        df['strat_column'] = df['LANGUAGE'] + '_' + df['ERROR_TYPE']
        
        train_df, temp_df = train_test_split(
            df, test_size=(val_ratio + test_ratio), 
            random_state=42,
            stratify=df['strat_column']
        )
        
        val_df, test_df = train_test_split(
            temp_df, 
            test_size=test_ratio/(val_ratio + test_ratio), 
            random_state=42,
            stratify=temp_df['strat_column']
        )
        
        train_df = train_df.drop(columns=['strat_column'])
        val_df = val_df.drop(columns=['strat_column'])
        test_df = test_df.drop(columns=['strat_column'])
        
    elif 'ERROR_TYPE' in df.columns:
        print("Performing stratified split by ERROR_TYPE...")
        train_df, temp_df = train_test_split(
            df, test_size=(val_ratio + test_ratio), 
            random_state=42,
            stratify=df['ERROR_TYPE']
        )
        
        val_df, test_df = train_test_split(
            temp_df, 
            test_size=test_ratio/(val_ratio + test_ratio), 
            random_state=42,
            stratify=temp_df['ERROR_TYPE']
        )
    else:
        print("Performing random split...")
        train_df, temp_df = train_test_split(df, test_size=(val_ratio + test_ratio), random_state=42)
        
        val_df, test_df = train_test_split(temp_df, test_size=test_ratio/(val_ratio + test_ratio), random_state=42)
    
    if 'LANGUAGE' in df.columns:
        print("\nLanguage distribution in splits:")
        
        for split_name, split_df in [("Train", train_df), ("Validation", val_df), ("Test", test_df)]:
            print(f"\n{split_name} set language distribution:")
            lang_counts = split_df['LANGUAGE'].value_counts()
            for lang, count in lang_counts.items():
                print(f"  {lang}: {count} examples ({count/len(split_df)*100:.2f}%)")
    
    if 'ERROR_TYPE' in df.columns:
        print("\nError type distribution in splits:")
        
        for split_name, split_df in [("Train", train_df), ("Validation", val_df), ("Test", test_df)]:
            print(f"\n{split_name} set error type distribution:")
            error_counts = split_df['ERROR_TYPE'].value_counts()
            for error_type, count in error_counts.items():
                print(f"  {error_type}: {count} examples ({count/len(split_df)*100:.2f}%)")
    
    train_df.to_csv('data/train.csv', index=False)
    val_df.to_csv('data/val.csv', index=False)
    test_df.to_csv('data/test.csv', index=False)
    
    print(f"Data split complete. Train: {len(train_df)}, Validation: {len(val_df)}, Test: {len(test_df)}")
    
    return 'data/train.csv', 'data/val.csv', 'data/test.csv'

def debug_data_loading(data_loader, num_batches=2):
    print("\nDebugging DataLoader...")
    for i, batch in enumerate(data_loader):
        if i >= num_batches:
            break
        
        print(f"\nBatch {i+1} info:")
        print(f"Batch size: {len(batch['src_text'])}")
        print(f"Source shapes: {batch['src'].shape}")
        print(f"Target shapes: {batch['tgt'].shape}")
        
        for j in range(min(3, len(batch['src_text']))):
            print(f"Sample {j}:")
            print(f"  Source text: {batch['src_text'][j]}")
            print(f"  Target text: {batch['tgt_text'][j]}")
            print(f"  Language: {batch['language'][j]}")
            
            if 'error_type' in batch:
                print(f"  Error type: {batch['error_type'][j]}")
                
            print(f"  Index: {batch['idx'][j]}")

def train_model(model, train_loader, val_loader, test_loader, char_to_idx, idx_to_char, 
                num_epochs=NUM_EPOCHS, learning_rate=LEARNING_RATE, save_dir='checkpoints_model'):
    os.makedirs(save_dir, exist_ok=True)
    
    optimizer = optim.Adam(model.parameters(), lr=learning_rate)
    scheduler = ReduceLROnPlateau(
        optimizer, 
        mode='max',
        factor=0.5,
        patience=2,
        verbose=True,
        min_lr=1e-6
    )
    
    has_error_types = 'error_type' in next(iter(train_loader))
    if has_error_types:
        print(f"Using weighted loss with weights: {ERROR_TYPE_WEIGHTS}")
        criterion = WeightedCrossEntropyLoss(char_to_idx, ignore_index=char_to_idx['<PAD>'])
    else:
        print("Using standard CrossEntropyLoss (no error types available)")
        criterion = nn.CrossEntropyLoss(ignore_index=char_to_idx['<PAD>'])
    
    best_f1 = 0.0
    training_history = {
        'train_loss': [],
        'val_loss': [],
        'f1_scores': [],
        'learning_rates': [],
        'error_type_performance': {}
    }
    
    epoch_pbar = tqdm(range(num_epochs), desc="Training", position=0)
    
    for epoch in epoch_pbar:
        current_lr = optimizer.param_groups[0]['lr']
        training_history['learning_rates'].append(current_lr)
        
        model.train()
        train_loss = 0.0
        
        train_pbar = tqdm(train_loader, desc=f"Epoch {epoch+1}/{num_epochs} [Train] LR: {current_lr:.6f}", 
                          leave=False, position=1, total=len(train_loader))
        
        for batch in train_pbar:
            src = batch['src'].to(DEVICE)
            tgt = batch['tgt'].to(DEVICE)
            src_mask = batch['src_mask'].to(DEVICE)
            tgt_mask = batch['tgt_mask'].to(DEVICE)
            src_padding_mask = batch['src_padding_mask'].to(DEVICE)
            tgt_padding_mask = batch['tgt_padding_mask'].to(DEVICE)
            
            optimizer.zero_grad()
            
            output = model(
                src=src,
                tgt=tgt[:, :-1],
                src_mask=src_mask,
                tgt_mask=tgt_mask[:-1, :-1],
                src_padding_mask=src_padding_mask,
                tgt_padding_mask=tgt_padding_mask[:, :-1]
            )
            
            output_flat = output.reshape(-1, output.shape[-1])
            target_flat = tgt[:, 1:].reshape(-1)
            
            if has_error_types:
                error_types = batch['error_type']
                loss = criterion(output_flat, target_flat, error_types)
            else:
                loss = criterion(output_flat, target_flat)
            
            loss.backward()
            torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)
            optimizer.step()
            
            train_loss += loss.item()
            train_pbar.set_postfix(loss=f"{loss.item():.4f}")
        
        avg_train_loss = train_loss / len(train_loader)
        training_history['train_loss'].append(avg_train_loss)
        
        model.eval()
        val_loss = 0.0
        
        val_pbar = tqdm(val_loader, desc=f"Epoch {epoch+1}/{num_epochs} [Valid]", 
                        leave=False, position=1, total=len(val_loader))
        
        with torch.no_grad():
            for batch in val_pbar:
                src = batch['src'].to(DEVICE)
                tgt = batch['tgt'].to(DEVICE)
                src_mask = batch['src_mask'].to(DEVICE)
                tgt_mask = batch['tgt_mask'].to(DEVICE)
                src_padding_mask = batch['src_padding_mask'].to(DEVICE)
                tgt_padding_mask = batch['tgt_padding_mask'].to(DEVICE)
                
                output = model(
                    src=src,
                    tgt=tgt[:, :-1],
                    src_mask=src_mask,
                    tgt_mask=tgt_mask[:-1, :-1],
                    src_padding_mask=src_padding_mask,
                    tgt_padding_mask=tgt_padding_mask[:, :-1]
                )
                
                output_flat = output.reshape(-1, output.shape[-1])
                target_flat = tgt[:, 1:].reshape(-1)
                
                if isinstance(criterion, WeightedCrossEntropyLoss):
                    loss = criterion.base_criterion(output_flat, target_flat).mean()
                else:
                    loss = criterion(output_flat, target_flat)
                
                val_loss += loss.item()
                val_pbar.set_postfix(loss=f"{loss.item():.4f}")
        
        avg_val_loss = val_loss / len(val_loader)
        training_history['val_loss'].append(avg_val_loss)
        
        f1, detailed_metrics = evaluate_model(model, test_loader, char_to_idx, idx_to_char)
        training_history['f1_scores'].append(f1)
        
        if 'error_type_performance' in detailed_metrics:
            for error_type, score in detailed_metrics['error_type_performance'].items():
                if error_type not in training_history['error_type_performance']:
                    training_history['error_type_performance'][error_type] = []
                training_history['error_type_performance'][error_type].append(score)
        
        scheduler.step(f1)
        
        new_lr = optimizer.param_groups[0]['lr']
        if new_lr != current_lr:
            print(f"\nLearning rate adjusted from {current_lr:.6f} to {new_lr:.6f}")
        
        epoch_pbar.set_postfix(train_loss=f"{avg_train_loss:.4f}", 
                              val_loss=f"{avg_val_loss:.4f}", 
                              f1=f"{f1:.4f}",
                              lr=f"{new_lr:.6f}")
        
        if 'error_type_performance' in detailed_metrics and 'DELETION' in detailed_metrics['error_type_performance']:
            deletion_f1 = detailed_metrics['error_type_performance']['DELETION']
            print(f"\nDELETION error performance: {deletion_f1:.4f}")
        
        if f1 > best_f1:
            best_f1 = f1
            checkpoint = {
                'epoch': epoch,
                'model_state_dict': model.state_dict(),
                'optimizer_state_dict': optimizer.state_dict(),
                'scheduler_state_dict': scheduler.state_dict(),
                'train_loss': avg_train_loss,
                'val_loss': avg_val_loss,
                'f1_score': f1,
                'detailed_metrics': detailed_metrics,
                'char_to_idx': char_to_idx,
                'idx_to_char': idx_to_char
            }
            torch.save(checkpoint, os.path.join(save_dir, 'best_model.pt'))
            print(f"Saved new best model with F1: {f1:.4f}")
        
        with open(os.path.join(save_dir, 'training_history.json'), 'w') as f:
            json.dump(training_history, f)
        
        last_checkpoint = {
            'epoch': epoch,
            'model_state_dict': model.state_dict(),
            'optimizer_state_dict': optimizer.state_dict(),
            'scheduler_state_dict': scheduler.state_dict(),
            'train_loss': avg_train_loss,
            'val_loss': avg_val_loss,
            'f1_score': f1,
            'best_f1': best_f1,
            'char_to_idx': char_to_idx,
            'idx_to_char': idx_to_char
        }
        torch.save(last_checkpoint, os.path.join(save_dir, 'last_checkpoint.pt'))
    
    return model, training_history

def predict_batch(model, src, src_mask, src_padding_mask, char_to_idx, idx_to_char, max_len=MAX_SEQ_LENGTH+2):
    model.eval()
    
    batch_size = src.size(0)
    bos_idx = char_to_idx['<BOS>']
    eos_idx = char_to_idx['<EOS>']
    
    decoder_input = torch.ones(batch_size, 1, dtype=torch.long, device=DEVICE) * bos_idx
    
    completed_sequences = [[] for _ in range(batch_size)]
    has_completed = [False] * batch_size
    
    for i in range(max_len - 1):
        tgt_mask = generate_square_subsequent_mask(decoder_input.size(1))
        
        with torch.no_grad():
            output = model(
                src=src,
                tgt=decoder_input,
                src_mask=src_mask,
                tgt_mask=tgt_mask,
                src_padding_mask=src_padding_mask,
                tgt_padding_mask=None
            )
        
        next_token_logits = output[:, -1, :]
        next_token = torch.argmax(next_token_logits, dim=1).unsqueeze(1)
        
        decoder_input = torch.cat([decoder_input, next_token], dim=1)
        
        for j in range(batch_size):
            if not has_completed[j] and next_token[j].item() == eos_idx:
                seq = decoder_input[j, 1:-1].cpu().tolist()
                completed_sequences[j] = seq
                has_completed[j] = True
        
        if all(has_completed):
            break
    
    for j in range(batch_size):
        if not has_completed[j]:
            seq = decoder_input[j, 1:].cpu().tolist()
            if eos_idx in seq:
                seq = seq[:seq.index(eos_idx)]
            completed_sequences[j] = seq
    
    predicted_words = [''.join(idx_to_char[idx] for idx in seq) for seq in completed_sequences]
    
    return predicted_words

def fine_tune_on_deletion_errors(model, char_to_idx, idx_to_char, 
                         learning_rate=LEARNING_RATE/5, num_epochs=10, save_dir='checkpoints_model_deletion'):
    os.makedirs(save_dir, exist_ok=True)
    print("\n--- Starting fine-tuning specifically for DELETION errors ---")
    
    print("Creating dataset with only DELETION errors...")
    
    train_file = 'data/train.csv'
    val_file = 'data/val.csv'
    test_file = 'data/test.csv'
    
    train_df = pd.read_csv(train_file)
    train_deletion_df = train_df[train_df['ERROR_TYPE'] == 'DELETION']
    
    if len(train_deletion_df) < 100:
        print(f"Found only {len(train_deletion_df)} DELETION examples. Adding more data...")
        other_df = train_df[train_df['ERROR_TYPE'] != 'DELETION'].sample(
            min(len(train_df) // 4, 5000),
            random_state=42
        )
        train_deletion_df = pd.concat([train_deletion_df, other_df])
    
    deletion_train_file = 'data/train_deletion.csv'
    train_deletion_df.to_csv(deletion_train_file, index=False)
    
    print(f"Created fine-tuning dataset with {len(train_deletion_df)} examples")
    print(f"DELETION examples: {len(train_deletion_df[train_deletion_df['ERROR_TYPE'] == 'DELETION'])}")
    
    train_deletion_dataset = SpellingDataset(deletion_train_file, char_to_idx, idx_to_char)
    val_dataset = SpellingDataset(val_file, char_to_idx, idx_to_char)
    test_dataset = SpellingDataset(test_file, char_to_idx, idx_to_char)
    
    train_loader = DataLoader(train_deletion_dataset, batch_size=BATCH_SIZE//2, shuffle=True, collate_fn=pad_collate)
    val_loader = DataLoader(val_dataset, batch_size=BATCH_SIZE, shuffle=False, collate_fn=pad_collate)
    test_loader = DataLoader(test_dataset, batch_size=BATCH_SIZE, shuffle=False, collate_fn=pad_collate)
    
    deletion_focused_weights = ERROR_TYPE_WEIGHTS.copy()
    deletion_focused_weights['DELETION'] = 5.0
    
    model, history = train_model(
        model, 
        train_loader, 
        val_loader, 
        test_loader, 
        char_to_idx, 
        idx_to_char,
        num_epochs=num_epochs,
        learning_rate=learning_rate,
        save_dir=save_dir
    )
    
    return model, history

def evaluate_model(model, data_loader, char_to_idx, idx_to_char):
    model.eval()
    all_preds = []
    all_targets = []
    all_sources = []
    all_indices = []
    all_languages = []
    all_error_types = []
    
    test_pbar = tqdm(data_loader, desc="Evaluating", leave=False, position=1)
    
    correct_char_count = 0
    total_char_count = 0
    
    with torch.no_grad():
        for batch in test_pbar:
            src = batch['src'].to(DEVICE)
            tgt = batch['tgt']
            src_mask = batch['src_mask'].to(DEVICE)
            src_padding_mask = batch['src_padding_mask'].to(DEVICE)
            src_text = batch['src_text']
            tgt_text = batch['tgt_text']
            indices = batch['idx']
            languages = batch['language']
            
            predicted_words = predict_batch(model, src, src_mask, src_padding_mask, char_to_idx, idx_to_char)
            
            all_preds.extend(predicted_words)
            all_targets.extend(tgt_text)
            all_sources.extend(src_text)
            all_indices.extend(indices)
            all_languages.extend(languages)
            
            if 'error_type' in batch:
                all_error_types.extend(batch['error_type'])
            
            for pred, target in zip(predicted_words, tgt_text):
                for p_char, t_char in zip(pred, target):
                    if p_char == t_char:
                        correct_char_count += 1
                    total_char_count += 1
    
    correct_word_count = sum(1 for pred, target in zip(all_preds, all_targets) if pred == target)
    total_words = len(all_targets)
    
    precision = correct_word_count / len(all_preds) if all_preds else 0
    recall = correct_word_count / len(all_targets) if all_targets else 0
    f1 = 2 * precision * recall / (precision + recall) if (precision + recall) else 0
    
    char_accuracy = correct_char_count / total_char_count if total_char_count else 0
    
    distances = [levenshtein_distance(pred, target) for pred, target in zip(all_preds, all_targets)]
    avg_distance = sum(distances) / len(distances) if distances else 0
    
    error_type_performance = {}
    
    if all_error_types:
        for i, error_type in enumerate(all_error_types):
            if error_type not in error_type_performance:
                error_type_performance[error_type] = {'correct': 0, 'total': 0}
            
            error_type_performance[error_type]['total'] += 1
            if all_preds[i] == all_targets[i]:
                error_type_performance[error_type]['correct'] += 1
    elif 'ERROR_TYPE' in data_loader.dataset.data.columns:
        for i, idx in enumerate(all_indices):
            error_type = data_loader.dataset.data.iloc[idx]['ERROR_TYPE']
            if error_type not in error_type_performance:
                error_type_performance[error_type] = {'correct': 0, 'total': 0}
            
            error_type_performance[error_type]['total'] += 1
            if all_preds[i] == all_targets[i]:
                error_type_performance[error_type]['correct'] += 1
    
    detailed_metrics = {
        'precision': precision,
        'recall': recall,
        'f1': f1,
        'char_accuracy': char_accuracy,
        'avg_levenshtein': avg_distance,
        'error_type_performance': {k: v['correct']/v['total'] if v['total'] > 0 else 0 
                                   for k, v in error_type_performance.items()}
    }
    
    correct_by_language = {}
    incorrect_by_language = {}
    
    for i, (src, tgt, pred, lang) in enumerate(zip(all_sources, all_targets, all_preds, all_languages)):
        if tgt == pred:
            if lang not in correct_by_language:
                correct_by_language[lang] = []
            correct_by_language[lang].append((src, tgt, pred))
        else:
            if lang not in incorrect_by_language:
                incorrect_by_language[lang] = []
            incorrect_by_language[lang].append((src, tgt, pred))
    
    print("\nExamples of CORRECT predictions by language:")
    for language, predictions in correct_by_language.items():
        print(f"\n{language.upper()}:")
        for i in range(min(3, len(predictions))):
            src, tgt, pred = predictions[i]
            print(f"Source: {src}, Target: {tgt}, Predicted: {pred}")
    
    print("\nExamples of INCORRECT predictions by language:")
    for language, predictions in incorrect_by_language.items():
        print(f"\n{language.upper()}:")
        for i in range(min(3, len(predictions))):
            src, tgt, pred = predictions[i]
            print(f"Source: {src}, Target: {tgt}, Predicted: {pred}")
    
    print(f"\nWord-level metrics - Precision: {precision:.4f}, Recall: {recall:.4f}, F1: {f1:.4f}")
    print(f"Character-level accuracy: {char_accuracy:.4f}")
    print(f"Average Levenshtein distance: {avg_distance:.2f}")
    
    if error_type_performance:
        print("\nPerformance by error type:")
        for error_type, metrics in sorted(error_type_performance.items(), 
                                         key=lambda x: x[1]['correct']/x[1]['total'] if x[1]['total'] > 0 else 0,
                                         reverse=True):
            accuracy = metrics['correct'] / metrics['total'] if metrics['total'] > 0 else 0
            print(f"{error_type}: {accuracy:.4f} ({metrics['correct']}/{metrics['total']})")
    
    language_performance = {}
    for i, lang in enumerate(all_languages):
        if lang not in language_performance:
            language_performance[lang] = {'correct': 0, 'total': 0}
        
        language_performance[lang]['total'] += 1
        if all_preds[i] == all_targets[i]:
            language_performance[lang]['correct'] += 1
    
    if language_performance:
        print("\nPerformance by language:")
        for language, metrics in sorted(language_performance.items(), 
                                       key=lambda x: x[1]['correct']/x[1]['total'] if x[1]['total'] > 0 else 0,
                                       reverse=True):
            accuracy = metrics['correct'] / metrics['total'] if metrics['total'] > 0 else 0
            print(f"{language}: {accuracy:.4f} ({metrics['correct']}/{metrics['total']})")
            
    detailed_metrics['language_performance'] = {k: v['correct']/v['total'] if v['total'] > 0 else 0 
                                                for k, v in language_performance.items()}
    
    test_pbar.close()
    
    return f1, detailed_metrics

def main():
    input_file = 'merged_sorted_output_with_language_az3.csv'
    train_file, val_file, test_file = split_data(input_file)
    
    char_to_idx, idx_to_char = create_vocabulary(input_file)
    vocab_size = len(char_to_idx)
    print(f"Vocabulary size: {vocab_size}")
    
    train_dataset = SpellingDataset(train_file, char_to_idx, idx_to_char, validate_pairs=True)
    val_dataset = SpellingDataset(val_file, char_to_idx, idx_to_char)
    test_dataset = SpellingDataset(test_file, char_to_idx, idx_to_char)
    
    print("\nSample pairs from training dataset:")
    for sample in train_dataset.get_sample_pairs(5):
        language = sample.get('language', 'unknown')
        error_type = sample.get('error_type', 'unknown')
        print(f"[{language}][{error_type}] MISTAKE: {sample['mistake']}, CORRECT: {sample['correct']}")
    
    train_loader = DataLoader(train_dataset, batch_size=BATCH_SIZE, shuffle=True, collate_fn=pad_collate)
    val_loader = DataLoader(val_dataset, batch_size=BATCH_SIZE, shuffle=False, collate_fn=pad_collate)
    test_loader = DataLoader(test_dataset, batch_size=BATCH_SIZE, shuffle=False, collate_fn=pad_collate)
    
    debug_data_loading(test_loader)
    
    model = SpellingTransformer(vocab_size).to(DEVICE)
    print(f"Model initialized on {DEVICE}")
    
    print("\n--- Starting primary training phase with weighted loss ---")
    model, history = train_model(model, train_loader, val_loader, test_loader, char_to_idx, idx_to_char)
    
    checkpoint = torch.load('checkpoints_model/best_model.pt')
    best_model = SpellingTransformer(len(char_to_idx)).to(DEVICE)
    best_model.load_state_dict(checkpoint['model_state_dict'])
    
    fine_tuned_model, fine_tuning_history = fine_tune_on_deletion_errors(
        best_model, 
        char_to_idx, 
        idx_to_char
    )
    
    print("\n--- Performing final evaluation on test set ---")
    
    ft_checkpoint = torch.load('checkpoints_model_deletion/best_model.pt')
    final_model = SpellingTransformer(len(char_to_idx)).to(DEVICE)
    final_model.load_state_dict(ft_checkpoint['model_state_dict'])
    
    test_dataset = SpellingDataset(test_file, char_to_idx, idx_to_char)
    test_loader = DataLoader(test_dataset, batch_size=BATCH_SIZE, shuffle=False, collate_fn=pad_collate)
    
    final_f1, detailed_metrics = evaluate_model(final_model, test_loader, char_to_idx, idx_to_char)
    
    print(f"Training complete. Best model F1 score on test set: {final_f1:.4f}")
    
    if 'error_type_performance' in detailed_metrics and 'DELETION' in detailed_metrics['error_type_performance']:
        deletion_f1 = detailed_metrics['error_type_performance']['DELETION']
        print(f"DELETION error performance: {deletion_f1:.4f}")
    
    with open('checkpoints_model_deletion/final_metrics.json', 'w') as f:
        json.dump(detailed_metrics, f, indent=2)
        
    print("\n--- Comparison with baseline model ---")
    baseline_model = SpellingTransformer(len(char_to_idx)).to(DEVICE)
    baseline_model.load_state_dict(checkpoint['model_state_dict'])
    
    baseline_f1, baseline_metrics = evaluate_model(baseline_model, test_loader, char_to_idx, idx_to_char)
    
    print(f"Baseline model F1 score: {baseline_f1:.4f}")
    print(f"Fine-tuned model F1 score: {final_f1:.4f}")
    
    if 'error_type_performance' in baseline_metrics and 'DELETION' in baseline_metrics['error_type_performance']:
        baseline_deletion = baseline_metrics['error_type_performance']['DELETION']
        final_deletion = detailed_metrics['error_type_performance']['DELETION']
        
        print(f"Baseline DELETION performance: {baseline_deletion:.4f}")
        print(f"Fine-tuned DELETION performance: {final_deletion:.4f}")
        print(f"Improvement: {(final_deletion - baseline_deletion) * 100:.2f}%")

if __name__ == "__main__":
    main()

Loading dataset from merged_sorted_output_with_language_az3.csv...
Total dataset size: 682513
Error type distribution:
ERROR_TYPE
TRANSLITERATION    366603
KEYBOARD           243454
INSERTION           52528
DELETION            19928
Name: count, dtype: int64
Checking some sample pairs:
Sample 1 [unknown][KEYBOARD]: MISTAKE=ılfəcon, CORRECT=əlfəcin
Sample 2 [unknown][KEYBOARD]: MISTAKE=füzəldicisu, CORRECT=düzəldicisi
Sample 3 [unknown][KEYBOARD]: MISTAKE=açılab, CORRECT=açılan
Sample 4 [unknown][TRANSLITERATION]: MISTAKE=misqalitirme, CORRECT=misqalıtirmə
Sample 5 [unknown][KEYBOARD]: MISTAKE=ketagya, CORRECT=kütahya
Performing stratified split by ERROR_TYPE...

Error type distribution in splits:

Train set error type distribution:
  TRANSLITERATION: 293282 examples (53.71%)
  KEYBOARD: 194763 examples (35.67%)
  INSERTION: 42022 examples (7.70%)
  DELETION: 15943 examples (2.92%)

Validation set error type distribution:
  TRANSLITERATION: 36660 examples (53.71%)
  KEYBOARD: 24345 exa

Processing characters:   0%|          | 0/682513 [00:00<?, ?it/s]

Vocabulary size: 42
Most common characters: ['ə', 'l', 'i', 'a', 'r', 'm', 'e', 'n', 'ı', 'k', 's', 't', 'd', 'ü', 'ş', 'u', 'y', 'q', 'o', 'c']
Vocabulary size: 42
Loading dataset from data/train.csv
Распределение по типам ошибок:
  TRANSLITERATION: 293282 примеров (53.71%)
  KEYBOARD: 194763 примеров (35.67%)
  INSERTION: 42022 примеров (7.70%)
  DELETION: 15943 примеров (2.92%)


Validating data pairs:   0%|          | 0/546010 [00:00<?, ?it/s]


Data validation statistics:
Average proportion of changed characters: 0.2057
Median proportion of changed characters: 0.2000
Found 17 suspicious pairs (>80% different)

Examples of suspicious pairs:
[unknown] MISTAKE: cixisi, CORRECT: çıxışı, Levenshtein: 5, Proportion: 0.83
[unknown] MISTAKE: o, CORRECT: i, Levenshtein: 1, Proportion: 1.00
[unknown] MISTAKE: isigi, CORRECT: ışığı, Levenshtein: 5, Proportion: 1.00
[unknown] MISTAKE: y, CORRECT: u, Levenshtein: 1, Proportion: 1.00
[unknown] MISTAKE: sus, CORRECT: şüş, Levenshtein: 3, Proportion: 1.00
Loading dataset from data/val.csv
Распределение по типам ошибок:
  TRANSLITERATION: 36660 примеров (53.71%)
  KEYBOARD: 24345 примеров (35.67%)
  INSERTION: 5253 примеров (7.70%)
  DELETION: 1993 примеров (2.92%)
Loading dataset from data/test.csv
Распределение по типам ошибок:
  TRANSLITERATION: 36661 примеров (53.71%)
  KEYBOARD: 24346 примеров (35.67%)
  INSERTION: 5253 примеров (7.70%)
  DELETION: 1992 примеров (2.92%)

Sample pairs fr



Model initialized on cuda

--- Starting primary training phase with weighted loss ---
Using weighted loss with weights: {'DELETION': 10.0, 'INSERTION': 1.5, 'KEYBOARD': 1.0, 'TRANSLITERATION': 1.0}




Training:   0%|          | 0/50 [00:00<?, ?it/s]

Epoch 1/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]



Epoch 1/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dispetcerlesdirilmə, Target: dispetçerləşdirilmə, Predicted: dispetçərləşdirilmə
Source: kapitalizmeqedərki, Target: kapitalizməqədərki, Predicted: kapıtalızməqərki

Word-level metrics - Precision: 0.5502, Recall: 0.5502, F1: 0.5502
Character-level accuracy: 0.9033
Average Levenshtein distance: 0.70

Performance by error type:
TRANSLITERATION: 0.7315 (26817/36661)
INSERTION: 0.3746 (1968/5253)
KEYBOARD: 0.3474 (8457/24346)
DELETION: 0.1546 (308/1992)

Performance by language:
unknown: 0.5502 (37550/68252)

DE

Epoch 2/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 2/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dispetcerlesdirilmə, Target: dispetçerləşdirilmə, Predicted: dispercerləşdirilmə
Source: kapitalizmeqedərki, Target: kapitalizməqədərki, Predicted: kapitalizməqədərk

Word-level metrics - Precision: 0.6834, Recall: 0.6834, F1: 0.6834
Character-level accuracy: 0.9273
Average Levenshtein distance: 0.51

Performance by error type:
TRANSLITERATION: 0.7991 (29294/36661)
KEYBOARD: 0.5921 (14415/24346)
INSERTION: 0.4573 (2402/5253)
DELETION: 0.2681 (534/1992)

Performance by language:
unknown: 0.6834 (46645/68252)



Epoch 3/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 3/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dispetcerlesdirilmə, Target: dispetçerləşdirilmə, Predicted: dispetcərləşdirilmə
Source: kapitalizmeqedərki, Target: kapitalizməqədərki, Predicted: kapitalızməqədərki

Word-level metrics - Precision: 0.7668, Recall: 0.7668, F1: 0.7668
Character-level accuracy: 0.9476
Average Levenshtein distance: 0.38

Performance by error type:
TRANSLITERATION: 0.8379 (30719/36661)
KEYBOARD: 0.7335 (17858/24346)
INSERTION: 0.5814 (3054/5253)
DELETION: 0.3524 (702/1992)

Performance by language:
unknown: 0.7668 (52333/68252)


Epoch 4/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 4/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: psevdovetenperver, Target: psevdovətənpərvər, Predicted: psevdövətənpərvər
Source: federallasdirmaq, Target: federallaşdırmaq, Predicted: fədərallaşdırmaq

Word-level metrics - Precision: 0.8070, Recall: 0.8070, F1: 0.8070
Character-level accuracy: 0.9567
Average Levenshtein distance: 0.32

Performance by error type:
TRANSLITERATION: 0.8638 (31669/36661)
KEYBOARD: 0.7974 (19413/24346)
INSERTION: 0.6004 (3154/5253)
DELETION: 0.4227 (842/1992)

Performance by language:
unknown: 0.8070 (55078/68252)

DELETION er

Epoch 5/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 5/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: kapitalizmeqedərki, Target: kapitalizməqədərki, Predicted: kapitalızməqədərki
Source: təskinləsdirici, Target: təskinləşdirici, Predicted: təşkinləşdirici

Word-level metrics - Precision: 0.8417, Recall: 0.8417, F1: 0.8417
Character-level accuracy: 0.9624
Average Levenshtein distance: 0.27

Performance by error type:
TRANSLITERATION: 0.8880 (32554/36661)
KEYBOARD: 0.8315 (20243/24346)
INSERTION: 0.7047 (3702/5253)
DELETION: 0.4769 (950/1992)

Performance by language:
unknown: 0.8417 (57449/68252)

DELETION er

Epoch 6/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 6/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: sadlandirilmaq, Target: şadlandırılmaq, Predicted: sadlandırılmaq
Source: meslehətamiz, Target: məsləhətamiz, Predicted: məsləhətamız

Word-level metrics - Precision: 0.8652, Recall: 0.8652, F1: 0.8652
Character-level accuracy: 0.9699
Average Levenshtein distance: 0.23

Performance by error type:
TRANSLITERATION: 0.8966 (32872/36661)
KEYBOARD: 0.8723 (21238/24346)
INSERTION: 0.7514 (3947/5253)
DELETION: 0.5005 (997/1992)

Performance by language:
unknown: 0.8652 (59054/68252)

DELETION error performance: 0.50

Epoch 7/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 7/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: federallasdirmaq, Target: federallaşdırmaq, Predicted: fədərallaşdırmaq
Source: sadlandirilmaq, Target: şadlandırılmaq, Predicted: sadlandırılmaq

Word-level metrics - Precision: 0.8819, Recall: 0.8819, F1: 0.8819
Character-level accuracy: 0.9725
Average Levenshtein distance: 0.21

Performance by error type:
TRANSLITERATION: 0.9117 (33423/36661)
KEYBOARD: 0.8941 (21767/24346)
INSERTION: 0.7360 (3866/5253)
DELETION: 0.5698 (1135/1992)

Performance by language:
unknown: 0.8819 (60191/68252)

DELETION error perf

Epoch 8/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 8/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: istahaliliq, Target: iştahalılıq, Predicted: istahalılıq
Source: şuşurdilən, Target: şişirdilən, Predicted: şüşürdilən

Word-level metrics - Precision: 0.8912, Recall: 0.8912, F1: 0.8912
Character-level accuracy: 0.9751
Average Levenshtein distance: 0.19

Performance by error type:
TRANSLITERATION: 0.9149 (33540/36661)
KEYBOARD: 0.9098 (22151/24346)
INSERTION: 0.7478 (3928/5253)
DELETION: 0.6064 (1208/1992)

Performance by language:
unknown: 0.8912 (60827/68252)

DELETION error performance: 0.6064
Saved new b

Epoch 9/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 9/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: sadlandirilmaq, Target: şadlandırılmaq, Predicted: sadlandırılmaq
Source: meslehətamiz, Target: məsləhətamiz, Predicted: məsləhətamız

Word-level metrics - Precision: 0.8983, Recall: 0.8983, F1: 0.8983
Character-level accuracy: 0.9758
Average Levenshtein distance: 0.19

Performance by error type:
TRANSLITERATION: 0.9237 (33863/36661)
KEYBOARD: 0.9115 (22191/24346)
INSERTION: 0.7777 (4085/5253)
DELETION: 0.5884 (1172/1992)

Performance by language:
unknown: 0.8983 (61311/68252)

DELETION error performance: 0.5

Epoch 10/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 10/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: psevdovetenperver, Target: psevdovətənpərvər, Predicted: psevdovetənpərvər
Source: sadlandirilmaq, Target: şadlandırılmaq, Predicted: sadlandırılmaq

Word-level metrics - Precision: 0.9087, Recall: 0.9087, F1: 0.9087
Character-level accuracy: 0.9800
Average Levenshtein distance: 0.16

Performance by error type:
TRANSLITERATION: 0.9283 (34034/36661)
KEYBOARD: 0.9271 (22570/24346)
INSERTION: 0.8026 (4216/5253)
DELETION: 0.6014 (1198/1992)

Performance by language:
unknown: 0.9087 (62018/68252)

DELETION error p

Epoch 11/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 11/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: federallasdirmaq, Target: federallaşdırmaq, Predicted: fədərallaşdırmaq
Source: şuşurdilən, Target: şişirdilən, Predicted: şüşürdilən

Word-level metrics - Precision: 0.9100, Recall: 0.9100, F1: 0.9100
Character-level accuracy: 0.9789
Average Levenshtein distance: 0.17

Performance by error type:
KEYBOARD: 0.9340 (22738/24346)
TRANSLITERATION: 0.9264 (33963/36661)
INSERTION: 0.7967 (4185/5253)
DELETION: 0.6140 (1223/1992)

Performance by language:
unknown: 0.9100 (62109/68252)

DELETION error performance: 0.6

Epoch 12/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 12/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: istahaliliq, Target: iştahalılıq, Predicted: istahalılıq
Source: şuşurdilən, Target: şişirdilən, Predicted: şüşürdilən

Word-level metrics - Precision: 0.9151, Recall: 0.9151, F1: 0.9151
Character-level accuracy: 0.9803
Average Levenshtein distance: 0.16

Performance by error type:
KEYBOARD: 0.9383 (22845/24346)
TRANSLITERATION: 0.9297 (34083/36661)
INSERTION: 0.8174 (4294/5253)
DELETION: 0.6205 (1236/1992)

Performance by language:
unknown: 0.9151 (62458/68252)

DELETION error performance: 0.6205
Saved new b

Epoch 13/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 13/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: federallasdirmaq, Target: federallaşdırmaq, Predicted: fədərallaşdırmaq
Source: sadlandirilmaq, Target: şadlandırılmaq, Predicted: sadlandırılmaq

Word-level metrics - Precision: 0.9237, Recall: 0.9237, F1: 0.9237
Character-level accuracy: 0.9826
Average Levenshtein distance: 0.14

Performance by error type:
KEYBOARD: 0.9427 (22951/24346)
TRANSLITERATION: 0.9407 (34486/36661)
INSERTION: 0.8199 (4307/5253)
DELETION: 0.6531 (1301/1992)

Performance by language:
unknown: 0.9237 (63045/68252)

DELETION error perf

Epoch 14/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 14/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: təskinləsdirici, Target: təskinləşdirici, Predicted: təşkinləşdirici
Source: gelebenzer, Target: geləbənzər, Predicted: gələbənzər

Word-level metrics - Precision: 0.9239, Recall: 0.9239, F1: 0.9239
Character-level accuracy: 0.9825
Average Levenshtein distance: 0.14

Performance by error type:
KEYBOARD: 0.9507 (23146/24346)
TRANSLITERATION: 0.9330 (34204/36661)
INSERTION: 0.8416 (4421/5253)
DELETION: 0.6471 (1289/1992)

Performance by language:
unknown: 0.9239 (63060/68252)

DELETION error performance: 0.6471

Epoch 15/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 15/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: luzumsuzluq, Target: lüzumsuzluq, Predicted: lüzümsüzlüq
Source: taəbletlər, Target: tabletlər, Predicted: təblətlər

Word-level metrics - Precision: 0.9298, Recall: 0.9298, F1: 0.9298
Character-level accuracy: 0.9846
Average Levenshtein distance: 0.13

Performance by error type:
KEYBOARD: 0.9532 (23207/24346)
TRANSLITERATION: 0.9414 (34514/36661)
INSERTION: 0.8445 (4436/5253)
DELETION: 0.6556 (1306/1992)

Performance by language:
unknown: 0.9298 (63463/68252)

DELETION error performance: 0.6556
Saved new bes

Epoch 16/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 16/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: hazırlamaliar, Target: hazırlamalar, Predicted: hazırlamalıar
Source: disağardan, Target: dişağardan, Predicted: dışağardan

Word-level metrics - Precision: 0.9338, Recall: 0.9338, F1: 0.9338
Character-level accuracy: 0.9851
Average Levenshtein distance: 0.12

Performance by error type:
KEYBOARD: 0.9561 (23276/24346)
TRANSLITERATION: 0.9449 (34640/36661)
INSERTION: 0.8643 (4540/5253)
DELETION: 0.6411 (1277/1992)

Performance by language:
unknown: 0.9338 (63733/68252)

DELETION error performance: 0.6411
Saved 

Epoch 17/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 17/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: hazırlamaliar, Target: hazırlamalar, Predicted: hazırlamalıar
Source: ılluninatibg, Target: ılluminating, Predicted: ıllluminating

Word-level metrics - Precision: 0.9317, Recall: 0.9317, F1: 0.9317
Character-level accuracy: 0.9848
Average Levenshtein distance: 0.12

Performance by error type:
TRANSLITERATION: 0.9487 (34782/36661)
KEYBOARD: 0.9476 (23071/24346)
INSERTION: 0.8471 (4450/5253)
DELETION: 0.6471 (1289/1992)

Performance by language:
unknown: 0.9317 (63592/68252)

DELETION error performance: 0.6471

Epoch 18/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 18/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: qaadlnlar, Target: qadlnlar, Predicted: qaradınlar
Source: aptekcə, Target: aptekçə, Predicted: aptekcə

Word-level metrics - Precision: 0.9369, Recall: 0.9369, F1: 0.9369
Character-level accuracy: 0.9859
Average Levenshtein distance: 0.12

Performance by error type:
KEYBOARD: 0.9627 (23437/24346)
TRANSLITERATION: 0.9465 (34698/36661)
INSERTION: 0.8523 (4477/5253)
DELETION: 0.6692 (1333/1992)

Performance by language:
unknown: 0.9369 (63945/68252)

DELETION error performance: 0.6692
Saved new best model with 

Epoch 19/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 19/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: gelebenzer, Target: geləbənzər, Predicted: gələbənzər
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı

Word-level metrics - Precision: 0.9375, Recall: 0.9375, F1: 0.9375
Character-level accuracy: 0.9860
Average Levenshtein distance: 0.12

Performance by error type:
KEYBOARD: 0.9627 (23438/24346)
TRANSLITERATION: 0.9474 (34732/36661)
INSERTION: 0.8502 (4466/5253)
DELETION: 0.6792 (1353/1992)

Performance by language:
unknown: 0.9375 (63989/68252)

DELETION error performance: 0.6792
Saved new best mo

Epoch 20/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 20/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: psevdovetenperver, Target: psevdovətənpərvər, Predicted: psevdovetənpərvər
Source: şuşurdilən, Target: şişirdilən, Predicted: şüşürdilən

Word-level metrics - Precision: 0.9403, Recall: 0.9403, F1: 0.9403
Character-level accuracy: 0.9870
Average Levenshtein distance: 0.11

Performance by error type:
KEYBOARD: 0.9625 (23434/24346)
TRANSLITERATION: 0.9516 (34885/36661)
INSERTION: 0.8612 (4524/5253)
DELETION: 0.6687 (1332/1992)

Performance by language:
unknown: 0.9403 (64175/68252)

DELETION error performance: 

Epoch 21/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 21/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: oqanayzeri, Target: orqanayzeri, Predicted: oqanayzeri
Source: qaadlnlar, Target: qadlnlar, Predicted: qadınlar

Word-level metrics - Precision: 0.9412, Recall: 0.9412, F1: 0.9412
Character-level accuracy: 0.9873
Average Levenshtein distance: 0.10

Performance by error type:
KEYBOARD: 0.9655 (23506/24346)
TRANSLITERATION: 0.9502 (34835/36661)
INSERTION: 0.8726 (4584/5253)
DELETION: 0.6611 (1317/1992)

Performance by language:
unknown: 0.9412 (64242/68252)

DELETION error performance: 0.6611
Saved new best mod

Epoch 22/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 22/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı

Word-level metrics - Precision: 0.9429, Recall: 0.9429, F1: 0.9429
Character-level accuracy: 0.9875
Average Levenshtein distance: 0.10

Performance by error type:
KEYBOARD: 0.9682 (23572/24346)
TRANSLITERATION: 0.9538 (34968/36661)
INSERTION: 0.8519 (4475/5253)
DELETION: 0.6732 (1341/1992)

Performance by language:
unknown: 0.9429 (64356/68252)

DELETION error performance: 0.6732
Saved new best model

Epoch 23/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 23/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: mütəessirlənmə, Target: mütəəssirlənmə, Predicted: mütəəəssirlənmə
Source: bənövsələri, Target: bənövşələri, Predicted: bənövşəkləri

Word-level metrics - Precision: 0.9461, Recall: 0.9461, F1: 0.9461
Character-level accuracy: 0.9884
Average Levenshtein distance: 0.10

Performance by error type:
KEYBOARD: 0.9658 (23514/24346)
TRANSLITERATION: 0.9578 (35114/36661)
INSERTION: 0.8763 (4603/5253)
DELETION: 0.6732 (1341/1992)

Performance by language:
unknown: 0.9461 (64572/68252)

DELETION error performance: 0.67

Epoch 24/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 24/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı
Source: krakelyie, Target: krakelyur, Predicted: krakelya

Word-level metrics - Precision: 0.9430, Recall: 0.9430, F1: 0.9430
Character-level accuracy: 0.9881
Average Levenshtein distance: 0.10

Performance by error type:
KEYBOARD: 0.9611 (23400/24346)
TRANSLITERATION: 0.9552 (35019/36661)
INSERTION: 0.8795 (4620/5253)
DELETION: 0.6637 (1322/1992)

Performance by language:
unknown: 0.9430 (64361/68252)

DELETION error performance: 0.6637


Epoch 25/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 25/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: hazırlamaliar, Target: hazırlamalar, Predicted: hazırlamalıar
Source: oqanayzeri, Target: orqanayzeri, Predicted: oqanayzeri

Word-level metrics - Precision: 0.9479, Recall: 0.9479, F1: 0.9479
Character-level accuracy: 0.9885
Average Levenshtein distance: 0.09

Performance by error type:
KEYBOARD: 0.9710 (23639/24346)
TRANSLITERATION: 0.9577 (35110/36661)
INSERTION: 0.8669 (4554/5253)
DELETION: 0.6998 (1394/1992)

Performance by language:
unknown: 0.9479 (64697/68252)

DELETION error performance: 0.6998
Saved

Epoch 26/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 26/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: meslehətamiz, Target: məsləhətamiz, Predicted: məsləhətamız
Source: oqanayzeri, Target: orqanayzeri, Predicted: oqanayzeri

Word-level metrics - Precision: 0.9492, Recall: 0.9492, F1: 0.9492
Character-level accuracy: 0.9896
Average Levenshtein distance: 0.09

Performance by error type:
KEYBOARD: 0.9709 (23638/24346)
TRANSLITERATION: 0.9595 (35178/36661)
INSERTION: 0.8785 (4615/5253)
DELETION: 0.6802 (1355/1992)

Performance by language:
unknown: 0.9492 (64786/68252)

DELETION error performance: 0.6802
Saved n

Epoch 27/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 27/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dızabaqlara, Target: sızanaqlara, Predicted: sızacaqlara
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi

Word-level metrics - Precision: 0.9460, Recall: 0.9460, F1: 0.9460
Character-level accuracy: 0.9888
Average Levenshtein distance: 0.10

Performance by error type:
KEYBOARD: 0.9683 (23574/24346)
TRANSLITERATION: 0.9550 (35010/36661)
INSERTION: 0.8789 (4617/5253)
DELETION: 0.6847 (1364/1992)

Performance by language:
unknown: 0.9460 (64565/68252)

DELETION error performance: 0.6847


Epoch 28/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 28/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı
Source: aptekcə, Target: aptekçə, Predicted: aptekcə

Word-level metrics - Precision: 0.9502, Recall: 0.9502, F1: 0.9502
Character-level accuracy: 0.9898
Average Levenshtein distance: 0.09

Performance by error type:
KEYBOARD: 0.9722 (23668/24346)
TRANSLITERATION: 0.9588 (35149/36661)
INSERTION: 0.8871 (4660/5253)
DELETION: 0.6913 (1377/1992)

Performance by language:
unknown: 0.9502 (64854/68252)

DELETION error performance: 0.6913
Saved new best model with 

Epoch 29/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 29/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: qaadlnlar, Target: qadlnlar, Predicted: qadınlar
Source: kadinlar, Target: kadınlar, Predicted: kalsinlar

Word-level metrics - Precision: 0.9480, Recall: 0.9480, F1: 0.9480
Character-level accuracy: 0.9886
Average Levenshtein distance: 0.09

Performance by error type:
KEYBOARD: 0.9701 (23617/24346)
TRANSLITERATION: 0.9594 (35173/36661)
INSERTION: 0.8715 (4578/5253)
DELETION: 0.6687 (1332/1992)

Performance by language:
unknown: 0.9480 (64700/68252)

DELETION error performance: 0.6687


Epoch 30/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 30/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: kadinlar, Target: kadınlar, Predicted: kalsinlar
Source: nikseti, Target: mikseri, Predicted: bukseri

Word-level metrics - Precision: 0.9509, Recall: 0.9509, F1: 0.9509
Character-level accuracy: 0.9895
Average Levenshtein distance: 0.09

Performance by error type:
KEYBOARD: 0.9713 (23648/24346)
TRANSLITERATION: 0.9594 (35173/36661)
INSERTION: 0.8902 (4676/5253)
DELETION: 0.7063 (1407/1992)

Performance by language:
unknown: 0.9509 (64904/68252)

DELETION error performance: 0.7063
Saved new best model with F1

Epoch 31/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 31/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı
Source: kadinlar, Target: kadınlar, Predicted: kadusinlyar

Word-level metrics - Precision: 0.9508, Recall: 0.9508, F1: 0.9508
Character-level accuracy: 0.9892
Average Levenshtein distance: 0.09

Performance by error type:
KEYBOARD: 0.9717 (23658/24346)
TRANSLITERATION: 0.9583 (35132/36661)
INSERTION: 0.8947 (4700/5253)
DELETION: 0.7033 (1401/1992)

Performance by language:
unknown: 0.9508 (64891/68252)

DELETION error performance: 0.7033


Epoch 32/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 32/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: gelebenzer, Target: geləbənzər, Predicted: gələbənzər
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi

Word-level metrics - Precision: 0.9500, Recall: 0.9500, F1: 0.9500
Character-level accuracy: 0.9897
Average Levenshtein distance: 0.09

Performance by error type:
KEYBOARD: 0.9711 (23642/24346)
TRANSLITERATION: 0.9596 (35181/36661)
INSERTION: 0.8860 (4654/5253)
DELETION: 0.6852 (1365/1992)

Performance by language:
unknown: 0.9500 (64842/68252)

DELETION error performance: 0.6852


Epoch 33/50 [Train] LR: 0.000100:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 33/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı
Source: qıfıll, Target: qıfıl, Predicted: qıfılı

Word-level metrics - Precision: 0.9491, Recall: 0.9491, F1: 0.9491
Character-level accuracy: 0.9893
Average Levenshtein distance: 0.09

Performance by error type:
KEYBOARD: 0.9671 (23544/24346)
TRANSLITERATION: 0.9598 (35187/36661)
INSERTION: 0.8896 (4673/5253)
DELETION: 0.6913 (1377/1992)

Performance by language:
unknown: 0.9491 (64781/68252)

Learning rate adjusted from 0.000100 to 0.000050

DELETION error 

Epoch 34/50 [Train] LR: 0.000050:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 34/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı
Source: aptekcə, Target: aptekçə, Predicted: aptekcə

Word-level metrics - Precision: 0.9613, Recall: 0.9613, F1: 0.9613
Character-level accuracy: 0.9921
Average Levenshtein distance: 0.07

Performance by error type:
KEYBOARD: 0.9817 (23901/24346)
TRANSLITERATION: 0.9654 (35393/36661)
INSERTION: 0.9259 (4864/5253)
DELETION: 0.7279 (1450/1992)

Performance by language:
unknown: 0.9613 (65608/68252)

DELETION error performance: 0.7279
Saved new best model with 

Epoch 35/50 [Train] LR: 0.000050:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 35/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: qaadlnlar, Target: qadlnlar, Predicted: qadınlar
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı

Word-level metrics - Precision: 0.9619, Recall: 0.9619, F1: 0.9619
Character-level accuracy: 0.9923
Average Levenshtein distance: 0.07

Performance by error type:
KEYBOARD: 0.9818 (23903/24346)
TRANSLITERATION: 0.9663 (35427/36661)
INSERTION: 0.9284 (4877/5253)
DELETION: 0.7269 (1448/1992)

Performance by language:
unknown: 0.9619 (65655/68252)

DELETION error performance: 0.7269
Saved new best model w

Epoch 36/50 [Train] LR: 0.000050:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 36/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı

Word-level metrics - Precision: 0.9632, Recall: 0.9632, F1: 0.9632
Character-level accuracy: 0.9925
Average Levenshtein distance: 0.07

Performance by error type:
KEYBOARD: 0.9816 (23897/24346)
TRANSLITERATION: 0.9688 (35517/36661)
INSERTION: 0.9254 (4861/5253)
DELETION: 0.7369 (1468/1992)

Performance by language:
unknown: 0.9632 (65743/68252)

DELETION error performance: 0.7369
Saved new best model

Epoch 37/50 [Train] LR: 0.000050:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 37/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi
Source: dəbəri, Target: səbəti, Predicted: fənəri

Word-level metrics - Precision: 0.9626, Recall: 0.9626, F1: 0.9626
Character-level accuracy: 0.9926
Average Levenshtein distance: 0.07

Performance by error type:
KEYBOARD: 0.9826 (23923/24346)
TRANSLITERATION: 0.9680 (35489/36661)
INSERTION: 0.9197 (4831/5253)
DELETION: 0.7319 (1458/1992)

Performance by language:
unknown: 0.9626 (65701/68252)

DELETION error performance: 0.7319


Epoch 38/50 [Train] LR: 0.000050:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 38/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: kadinlar, Target: kadınlar, Predicted: kalenlar
Source: dəbəri, Target: səbəti, Predicted: fənəri

Word-level metrics - Precision: 0.9628, Recall: 0.9628, F1: 0.9628
Character-level accuracy: 0.9924
Average Levenshtein distance: 0.07

Performance by error type:
KEYBOARD: 0.9829 (23930/24346)
TRANSLITERATION: 0.9668 (35445/36661)
INSERTION: 0.9279 (4874/5253)
DELETION: 0.7354 (1465/1992)

Performance by language:
unknown: 0.9628 (65714/68252)

DELETION error performance: 0.7354


Epoch 39/50 [Train] LR: 0.000050:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 39/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı
Source: aptekcə, Target: aptekçə, Predicted: aptekcə

Word-level metrics - Precision: 0.9631, Recall: 0.9631, F1: 0.9631
Character-level accuracy: 0.9925
Average Levenshtein distance: 0.07

Performance by error type:
KEYBOARD: 0.9837 (23949/24346)
TRANSLITERATION: 0.9670 (35453/36661)
INSERTION: 0.9284 (4877/5253)
DELETION: 0.7314 (1457/1992)

Performance by language:
unknown: 0.9631 (65736/68252)

Learning rate adjusted from 0.000050 to 0.000025

DELETION er

Epoch 40/50 [Train] LR: 0.000025:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 40/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı
Source: qulluğq, Target: qulluq, Predicted: qulluğu

Word-level metrics - Precision: 0.9665, Recall: 0.9665, F1: 0.9665
Character-level accuracy: 0.9933
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9857 (23998/24346)
TRANSLITERATION: 0.9705 (35580/36661)
INSERTION: 0.9353 (4913/5253)
DELETION: 0.7390 (1472/1992)

Performance by language:
unknown: 0.9665 (65963/68252)

DELETION error performance: 0.7390
Saved new best model with F

Epoch 41/50 [Train] LR: 0.000025:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 41/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı
Source: dəbəri, Target: səbəti, Predicted: fənəri

Word-level metrics - Precision: 0.9664, Recall: 0.9664, F1: 0.9664
Character-level accuracy: 0.9932
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9850 (23980/24346)
TRANSLITERATION: 0.9706 (35584/36661)
INSERTION: 0.9351 (4912/5253)
DELETION: 0.7435 (1481/1992)

Performance by language:
unknown: 0.9664 (65957/68252)

DELETION error performance: 0.7435


Epoch 42/50 [Train] LR: 0.000025:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 42/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı
Source: dəbəri, Target: səbəti, Predicted: fənəri

Word-level metrics - Precision: 0.9669, Recall: 0.9669, F1: 0.9669
Character-level accuracy: 0.9934
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9852 (23985/24346)
TRANSLITERATION: 0.9714 (35614/36661)
INSERTION: 0.9362 (4918/5253)
DELETION: 0.7420 (1478/1992)

Performance by language:
unknown: 0.9669 (65995/68252)

DELETION error performance: 0.7420
Saved new best model with F1:

Epoch 43/50 [Train] LR: 0.000025:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 43/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı

Word-level metrics - Precision: 0.9672, Recall: 0.9672, F1: 0.9672
Character-level accuracy: 0.9935
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9864 (24015/24346)
TRANSLITERATION: 0.9706 (35584/36661)
INSERTION: 0.9366 (4920/5253)
DELETION: 0.7500 (1494/1992)

Performance by language:
unknown: 0.9672 (66013/68252)

DELETION error performance: 0.7500
Saved new best model

Epoch 44/50 [Train] LR: 0.000025:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 44/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı

Word-level metrics - Precision: 0.9672, Recall: 0.9672, F1: 0.9672
Character-level accuracy: 0.9934
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9860 (24004/24346)
TRANSLITERATION: 0.9710 (35599/36661)
INSERTION: 0.9368 (4921/5253)
DELETION: 0.7480 (1490/1992)

Performance by language:
unknown: 0.9672 (66014/68252)

DELETION error performance: 0.7480
Saved new best model

Epoch 45/50 [Train] LR: 0.000025:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 45/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı
Source: nikseti, Target: mikseri, Predicted: bukseri

Word-level metrics - Precision: 0.9672, Recall: 0.9672, F1: 0.9672
Character-level accuracy: 0.9934
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9853 (23987/24346)
TRANSLITERATION: 0.9714 (35612/36661)
INSERTION: 0.9372 (4923/5253)
DELETION: 0.7485 (1491/1992)

Performance by language:
unknown: 0.9672 (66013/68252)

DELETION error performance: 0.7485


Epoch 46/50 [Train] LR: 0.000025:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 46/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi
Source: qıfıll, Target: qıfıl, Predicted: qıfılı

Word-level metrics - Precision: 0.9670, Recall: 0.9670, F1: 0.9670
Character-level accuracy: 0.9935
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9861 (24008/24346)
TRANSLITERATION: 0.9703 (35573/36661)
INSERTION: 0.9374 (4924/5253)
DELETION: 0.7495 (1493/1992)

Performance by language:
unknown: 0.9670 (65998/68252)

Learning rate adjusted from 0.000025 to 0.000013

DELETION error 

Epoch 47/50 [Train] LR: 0.000013:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 47/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı
Source: dəbəri, Target: səbəti, Predicted: fənəri

Word-level metrics - Precision: 0.9684, Recall: 0.9684, F1: 0.9684
Character-level accuracy: 0.9937
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9865 (24018/24346)
TRANSLITERATION: 0.9724 (35650/36661)
INSERTION: 0.9393 (4934/5253)
DELETION: 0.7510 (1496/1992)

Performance by language:
unknown: 0.9684 (66098/68252)

DELETION error performance: 0.7510
Saved new best model with F1:

Epoch 48/50 [Train] LR: 0.000013:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 48/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı
Source: qıfıll, Target: qıfıl, Predicted: qıfılı

Word-level metrics - Precision: 0.9682, Recall: 0.9682, F1: 0.9682
Character-level accuracy: 0.9937
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9864 (24015/24346)
TRANSLITERATION: 0.9722 (35642/36661)
INSERTION: 0.9376 (4925/5253)
DELETION: 0.7530 (1500/1992)

Performance by language:
unknown: 0.9682 (66082/68252)

DELETION error performance: 0.7530


Epoch 49/50 [Train] LR: 0.000013:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 49/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı
Source: dəbəri, Target: səbəti, Predicted: fənəri

Word-level metrics - Precision: 0.9685, Recall: 0.9685, F1: 0.9685
Character-level accuracy: 0.9939
Average Levenshtein distance: 0.05

Performance by error type:
KEYBOARD: 0.9871 (24031/24346)
TRANSLITERATION: 0.9719 (35629/36661)
INSERTION: 0.9425 (4951/5253)
DELETION: 0.7495 (1493/1992)

Performance by language:
unknown: 0.9685 (66104/68252)

DELETION error performance: 0.7495
Saved new best model with F1:

Epoch 50/50 [Train] LR: 0.000013:   0%|          | 0/1067 [00:00<?, ?it/s]

Epoch 50/50 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı
Source: dəbəri, Target: səbəti, Predicted: fənəri

Word-level metrics - Precision: 0.9689, Recall: 0.9689, F1: 0.9689
Character-level accuracy: 0.9939
Average Levenshtein distance: 0.05

Performance by error type:
KEYBOARD: 0.9868 (24025/24346)
TRANSLITERATION: 0.9728 (35664/36661)
INSERTION: 0.9395 (4935/5253)
DELETION: 0.7545 (1503/1992)

Performance by language:
unknown: 0.9689 (66127/68252)

DELETION error performance: 0.7545
Saved new best model with F1:




--- Starting fine-tuning specifically for DELETION errors ---
Creating dataset with only DELETION errors...
Created fine-tuning dataset with 15943 examples
DELETION examples: 15943
Loading dataset from data/train_deletion.csv
Распределение по типам ошибок:
  DELETION: 15943 примеров (100.00%)
Loading dataset from data/val.csv
Распределение по типам ошибок:
  TRANSLITERATION: 36660 примеров (53.71%)
  KEYBOARD: 24345 примеров (35.67%)
  INSERTION: 5253 примеров (7.70%)
  DELETION: 1993 примеров (2.92%)
Loading dataset from data/test.csv
Распределение по типам ошибок:
  TRANSLITERATION: 36661 примеров (53.71%)
  KEYBOARD: 24346 примеров (35.67%)
  INSERTION: 5253 примеров (7.70%)
  DELETION: 1992 примеров (2.92%)
Using weighted loss with weights: {'DELETION': 10.0, 'INSERTION': 1.5, 'KEYBOARD': 1.0, 'TRANSLITERATION': 1.0}




Training:   0%|          | 0/10 [00:00<?, ?it/s]

Epoch 1/10 [Train] LR: 0.000020:   0%|          | 0/63 [00:00<?, ?it/s]



Epoch 1/10 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: qıfıll, Target: qıfıl, Predicted: qıfılı
Source: ellamə, Target: əllamə, Predicted: ellanı

Word-level metrics - Precision: 0.9662, Recall: 0.9662, F1: 0.9662
Character-level accuracy: 0.9931
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9871 (24032/24346)
TRANSLITERATION: 0.9686 (35509/36661)
INSERTION: 0.9244 (4856/5253)
DELETION: 0.7786 (1551/1992)

Performance by language:
unknown: 0.9662 (65948/68252)

DELETION error performance: 0.7786
Saved new best model with F1: 0.9662


Epoch 2/10 [Train] LR: 0.000020:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 2/10 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi
Source: qıfıll, Target: qıfıl, Predicted: qıfılı

Word-level metrics - Precision: 0.9666, Recall: 0.9666, F1: 0.9666
Character-level accuracy: 0.9933
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9870 (24029/24346)
TRANSLITERATION: 0.9688 (35517/36661)
INSERTION: 0.9282 (4876/5253)
DELETION: 0.7776 (1549/1992)

Performance by language:
unknown: 0.9666 (65971/68252)

DELETION error performance: 0.7776
Saved new best model with F1: 

Epoch 3/10 [Train] LR: 0.000020:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 3/10 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi
Source: qıfıll, Target: qıfıl, Predicted: qıfıllı

Word-level metrics - Precision: 0.9659, Recall: 0.9659, F1: 0.9659
Character-level accuracy: 0.9930
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9865 (24018/24346)
TRANSLITERATION: 0.9689 (35521/36661)
INSERTION: 0.9191 (4828/5253)
DELETION: 0.7816 (1557/1992)

Performance by language:
unknown: 0.9659 (65924/68252)

DELETION error performance: 0.7816


Epoch 4/10 [Train] LR: 0.000020:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 4/10 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi
Source: qıfıll, Target: qıfıl, Predicted: qıfıllı

Word-level metrics - Precision: 0.9654, Recall: 0.9654, F1: 0.9654
Character-level accuracy: 0.9930
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9861 (24008/24346)
TRANSLITERATION: 0.9691 (35528/36661)
INSERTION: 0.9119 (4790/5253)
DELETION: 0.7856 (1565/1992)

Performance by language:
unknown: 0.9654 (65891/68252)

DELETION error performance: 0.7856


Epoch 5/10 [Train] LR: 0.000020:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 5/10 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi
Source: qıfıll, Target: qıfıl, Predicted: qıfıllı

Word-level metrics - Precision: 0.9650, Recall: 0.9650, F1: 0.9650
Character-level accuracy: 0.9929
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9862 (24011/24346)
TRANSLITERATION: 0.9682 (35495/36661)
INSERTION: 0.9121 (4791/5253)
DELETION: 0.7866 (1567/1992)

Performance by language:
unknown: 0.9650 (65864/68252)

Learning rate adjusted from 0.000020 to 0.000010

DELETION error

Epoch 6/10 [Train] LR: 0.000010:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 6/10 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi
Source: qıfıll, Target: qıfıl, Predicted: qıfıllı

Word-level metrics - Precision: 0.9650, Recall: 0.9650, F1: 0.9650
Character-level accuracy: 0.9929
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9863 (24012/24346)
TRANSLITERATION: 0.9675 (35470/36661)
INSERTION: 0.9166 (4815/5253)
DELETION: 0.7871 (1568/1992)

Performance by language:
unknown: 0.9650 (65865/68252)

DELETION error performance: 0.7871


Epoch 7/10 [Train] LR: 0.000010:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 7/10 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi
Source: qıfıll, Target: qıfıl, Predicted: qıfıllı

Word-level metrics - Precision: 0.9649, Recall: 0.9649, F1: 0.9649
Character-level accuracy: 0.9928
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9865 (24017/24346)
TRANSLITERATION: 0.9675 (35469/36661)
INSERTION: 0.9136 (4799/5253)
DELETION: 0.7882 (1570/1992)

Performance by language:
unknown: 0.9649 (65855/68252)

DELETION error performance: 0.7882


Epoch 8/10 [Train] LR: 0.000010:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 8/10 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi
Source: qıfıll, Target: qıfıl, Predicted: qıfılı

Word-level metrics - Precision: 0.9652, Recall: 0.9652, F1: 0.9652
Character-level accuracy: 0.9929
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9860 (24004/24346)
TRANSLITERATION: 0.9680 (35489/36661)
INSERTION: 0.9159 (4811/5253)
DELETION: 0.7887 (1571/1992)

Performance by language:
unknown: 0.9652 (65875/68252)

Learning rate adjusted from 0.000010 to 0.000005

DELETION error 

Epoch 9/10 [Train] LR: 0.000005:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 9/10 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi
Source: qıfıll, Target: qıfıl, Predicted: qıfılı

Word-level metrics - Precision: 0.9652, Recall: 0.9652, F1: 0.9652
Character-level accuracy: 0.9929
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9858 (24001/24346)
TRANSLITERATION: 0.9681 (35493/36661)
INSERTION: 0.9155 (4809/5253)
DELETION: 0.7892 (1572/1992)

Performance by language:
unknown: 0.9652 (65875/68252)

DELETION error performance: 0.7892


Epoch 10/10 [Train] LR: 0.000005:   0%|          | 0/63 [00:00<?, ?it/s]

Epoch 10/10 [Valid]:   0%|          | 0/134 [00:00<?, ?it/s]

Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi
Source: qıfıll, Target: qıfıl, Predicted: qıfıllı

Word-level metrics - Precision: 0.9651, Recall: 0.9651, F1: 0.9651
Character-level accuracy: 0.9930
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9859 (24002/24346)
TRANSLITERATION: 0.9680 (35489/36661)
INSERTION: 0.9138 (4800/5253)
DELETION: 0.7922 (1578/1992)

Performance by language:
unknown: 0.9651 (65869/68252)

DELETION error performance: 0.7922

--- Performing final evaluat



Loading dataset from data/test.csv
Распределение по типам ошибок:
  TRANSLITERATION: 36661 примеров (53.71%)
  KEYBOARD: 24346 примеров (35.67%)
  INSERTION: 5253 примеров (7.70%)
  DELETION: 1992 примеров (2.92%)


Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]




Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: dösekcəsi, Target: döşəkçəsi, Predicted: döşəkcəsi
Source: qıfıll, Target: qıfıl, Predicted: qıfılı

Word-level metrics - Precision: 0.9666, Recall: 0.9666, F1: 0.9666
Character-level accuracy: 0.9933
Average Levenshtein distance: 0.06

Performance by error type:
KEYBOARD: 0.9870 (24029/24346)
TRANSLITERATION: 0.9688 (35517/36661)
INSERTION: 0.9282 (4876/5253)
DELETION: 0.7776 (1549/1992)

Performance by language:
unknown: 0.9666 (65971/68252)
Training complete. Best model F1 score on test set: 0.9666
DELETIO



Evaluating:   0%|          | 0/134 [00:00<?, ?it/s]


Examples of CORRECT predictions by language:

UNKNOWN:
Source: muteşəkkilləşdirilmə, Target: mütəşəkkilləşdirilmə, Predicted: mütəşəkkilləşdirilmə
Source: müvazinetleşdirilmə, Target: müvazinətləşdirilmə, Predicted: müvazinətləşdirilmə
Source: ozünuqiymətləndirmə, Target: özünüqiymətləndirmə, Predicted: özünüqiymətləndirmə

Examples of INCORRECT predictions by language:

UNKNOWN:
Source: mutesəkkilleşdirilmək, Target: mütəşəkkilləşdirilmək, Predicted: mütəşəkkilləşdirilmə
Source: cilçıragi, Target: çilçırağı, Predicted: çılçırağı
Source: dəbəri, Target: səbəti, Predicted: fənəri

Word-level metrics - Precision: 0.9689, Recall: 0.9689, F1: 0.9689
Character-level accuracy: 0.9939
Average Levenshtein distance: 0.05

Performance by error type:
KEYBOARD: 0.9868 (24025/24346)
TRANSLITERATION: 0.9728 (35664/36661)
INSERTION: 0.9395 (4935/5253)
DELETION: 0.7545 (1503/1992)

Performance by language:
unknown: 0.9689 (66127/68252)
Baseline model F1 score: 0.9689
Fine-tuned model F1 score: 0.9666