In [6]:
import pandas as pd
df = pd.read_csv('D:\\Maya\\asr_geo2\\dataset_clean.csv')


In [7]:
from sklearn.model_selection import train_test_split
train_df, test_df = train_test_split(df, test_size=0.2, random_state=42)

train_df.reset_index(inplace=True)
test_df.reset_index(inplace=True)

train_df = train_df.drop('index', axis=1)
test_df = test_df.drop('index', axis=1)

train_df.to_csv("train.csv", sep="\t", encoding="utf-8", index=False)
test_df.to_csv("test.csv", sep="\t", encoding="utf-8", index=False)

print("Saved train.csv and test.csv")

Saved train.csv and test.csv


In [8]:
import IPython, random
rand_int = random.randint(0, len(train_df)-1)
file_name = train_df['path'][rand_int]
print(train_df['transcript'][rand_int])
IPython.display.Audio(file_name)

გამოქვეყნებული აქვს სამასამდე ნაშრომი


In [9]:
from datasets import load_dataset

common_voice_train = load_dataset("csv", data_files={"train": "train.csv"}, delimiter="\t")["train"]
common_voice_test = load_dataset("csv", data_files={"test": "test.csv"}, delimiter="\t")["test"]


Generating train split: 0 examples [00:00, ? examples/s]

Generating test split: 0 examples [00:00, ? examples/s]

In [10]:
def extract_all_chars(batch):
    all_text = " ".join(batch["transcript"])
    vocab = list(set(all_text))
    return {"vocab": [vocab], "all_text": [all_text]}


In [11]:
vocab_train = common_voice_train.map(
    extract_all_chars,
    batched=True,
    batch_size=-1,
    remove_columns=common_voice_train.column_names
)

vocab_test = common_voice_test.map(
    extract_all_chars,
    batched=True,
    batch_size=-1,
    remove_columns=common_voice_test.column_names
)

Map:   0%|          | 0/11941 [00:00<?, ? examples/s]

Map:   0%|          | 0/2986 [00:00<?, ? examples/s]

In [12]:
vocab_list = list(sorted(set(vocab_train["vocab"][0]) | set(vocab_test["vocab"][0])))
vocab_list = [vocab for vocab in vocab_list if vocab not in [" ", "\u0307"]]

special_vocab = ["<pad>", "<s>", "</s>", "<unk>", "|"]
vocab_dict = {v: k for k, v in enumerate(special_vocab + vocab_list)}
print(len(vocab_dict))
print(vocab_dict)


38
{'<pad>': 0, '<s>': 1, '</s>': 2, '<unk>': 3, '|': 4, 'ა': 5, 'ბ': 6, 'გ': 7, 'დ': 8, 'ე': 9, 'ვ': 10, 'ზ': 11, 'თ': 12, 'ი': 13, 'კ': 14, 'ლ': 15, 'მ': 16, 'ნ': 17, 'ო': 18, 'პ': 19, 'ჟ': 20, 'რ': 21, 'ს': 22, 'ტ': 23, 'უ': 24, 'ფ': 25, 'ქ': 26, 'ღ': 27, 'ყ': 28, 'შ': 29, 'ჩ': 30, 'ც': 31, 'ძ': 32, 'წ': 33, 'ჭ': 34, 'ხ': 35, 'ჯ': 36, 'ჰ': 37}


In [13]:
import json
with open('vocab.json', 'w') as vocab_file:
    json.dump(vocab_dict, vocab_file)

In [14]:
model_name_or_path = "facebook/wav2vec2-base"
save_dir = 'D:\\Maya\\asr_geo2'

In [15]:
import os
from transformers.trainer_utils import get_last_checkpoint

last_checkpoint = None
if os.path.exists(save_dir):
    last_checkpoint = get_last_checkpoint(save_dir)

print(last_checkpoint if last_checkpoint else str(None))

None


In [16]:
from transformers import Wav2Vec2CTCTokenizer

tokenizer = Wav2Vec2CTCTokenizer(
    "./vocab.json",
    bos_token="<s>",
    eos_token="</s>",
    unk_token="<unk>",
    pad_token="<pad>",
    word_delimiter_token="|",
    do_lower_case=False
)

In [17]:
text = "თრიალეთის ქედის აღმოსავლეთ კალთაზე"
print(" ".join(tokenizer.tokenize(text)))
print(tokenizer.decode(tokenizer.encode(text)))

თ რ ი ა ლ ე თ ი ს | ქ ე დ ი ს | ა ღ მ ო ს ა ვ ლ ე თ | კ ა ლ თ ა ზ ე
თრიალეთის ქედის აღმოსავლეთ კალთაზე


In [18]:
from transformers import Wav2Vec2FeatureExtractor

feature_extractor = Wav2Vec2FeatureExtractor.from_pretrained(
    "facebook/wav2vec2-base"
)

loading configuration file preprocessor_config.json from cache at C:\Users\MayaD\.cache\huggingface\hub\models--facebook--wav2vec2-base\snapshots\0b5b8e868dd84f03fd87d01f9c4ff0f080fecfe8\preprocessor_config.json
Feature extractor Wav2Vec2FeatureExtractor {
  "do_normalize": true,
  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
  "feature_size": 1,
  "padding_side": "right",
  "padding_value": 0.0,
  "return_attention_mask": false,
  "sampling_rate": 16000
}



In [19]:
from transformers import Wav2Vec2Processor

processor = Wav2Vec2Processor(
    feature_extractor=feature_extractor,
    tokenizer=tokenizer
)

In [20]:
if len(processor.tokenizer.get_vocab()) == len(processor.tokenizer):
    print(len(processor.tokenizer))

38


In [21]:
if not os.path.exists('./new_model/processor/'):
    print("Saving ...")
    processor.save_pretrained('./new_model/processor/')
    print("Saved!")

In [22]:
import torchaudio
import librosa
import numpy as np

target_sampling_rate = 16_000

def speech_file_to_array_fn(batch):
    speech_array, sampling_rate = torchaudio.load(batch["path"])
    speech_array = speech_array.squeeze().numpy()
    speech_array = librosa.resample(
    np.asarray(speech_array),
    orig_sr=sampling_rate,
    target_sr=target_sampling_rate
)
        
    batch["speech"] = speech_array
    batch["sampling_rate"] = target_sampling_rate
    batch["duration_in_seconds"] = len(batch["speech"]) / target_sampling_rate
    batch["target_text"] = batch["transcript"]
    return batch

# You can change the num_proc below, depends on your cpu and cpu cores
common_voice_train = common_voice_train.map(speech_file_to_array_fn, batch_size=4, remove_columns=common_voice_train.column_names, num_proc=1)
common_voice_test = common_voice_test.map(speech_file_to_array_fn, batch_size= 4, remove_columns=common_voice_test.column_names, num_proc=1)

common_voice_train[0].keys()

print(common_voice_train[0]["sampling_rate"])
print(common_voice_test[0]["sampling_rate"])

Map:   0%|          | 0/11941 [00:00<?, ? examples/s]

Map:   0%|          | 0/2986 [00:00<?, ? examples/s]

16000
16000


In [23]:
def prepare_dataset(batch):
    # (optional) sanity check
    assert len(set(batch["sampling_rate"])) == 1, "Mixed sampling rates inside the batch."

    batch["input_values"] = processor(
        batch["speech"],
        sampling_rate=batch["sampling_rate"][0]
    ).input_values

    with processor.as_target_processor():
        batch["labels"] = processor(batch["target_text"]).input_ids

    return batch


_common_voice_train = common_voice_train.map(
    prepare_dataset,
    remove_columns=common_voice_train.column_names,
    batch_size=4,
    batched=True,
    num_proc=1
)

_common_voice_test = common_voice_test.map(
    prepare_dataset,
    remove_columns=common_voice_test.column_names,
    batch_size=4,
    batched=True,
    num_proc=1
)


Map:   0%|          | 0/11941 [00:00<?, ? examples/s]



Map:   0%|          | 0/2986 [00:00<?, ? examples/s]

In [24]:
print(_common_voice_train.column_names)
print(_common_voice_test.column_names)
print(type(_common_voice_train[0]["input_values"]))
print(len(_common_voice_train[0]["input_values"]))
print(_common_voice_train[0]["labels"][:20])
decoded = processor.tokenizer.decode(_common_voice_train[0]["labels"])
print(decoded)
print(processor.tokenizer.convert_ids_to_tokens(_common_voice_train[0]["labels"][:30]))


['input_values', 'labels']
['input_values', 'labels']
<class 'list'>
111168
[22, 5, 22, 23, 24, 16, 21, 18, 4, 12, 5, 17, 5, 16, 9, 7, 18, 6, 21, 18]
სასტუმრო თანამეგობრობის სამხედრო მრჩევლის გენერალ დაგლას მაკართურის რეზიდენცია გახდა
['ს', 'ა', 'ს', 'ტ', 'უ', 'მ', 'რ', 'ო', '|', 'თ', 'ა', 'ნ', 'ა', 'მ', 'ე', 'გ', 'ო', 'ბ', 'რ', 'ო', 'ბ', 'ი', 'ს', '|', 'ს', 'ა', 'მ', 'ხ', 'ე', 'დ']


In [25]:
from dataclasses import dataclass, field
from typing import Any, Dict, List, Optional, Union
import torch 

@dataclass
class DataCollatorCTCWithPadding:

    processor: Wav2Vec2Processor
    padding: Union[bool, str] = True
    max_length: Optional[int] = None
    max_length_labels: Optional[int] = None
    pad_to_multiple_of: Optional[int] = None
    pad_to_multiple_of_labels: Optional[int] = None

    def __call__(self, features: List[Dict[str, Union[List[int], torch.Tensor]]]) -> Dict[str, torch.Tensor]:
        # split inputs and labels since they have to be of different lenghts and need
        # different padding methods
        input_features = [{"input_values": feature["input_values"]} for feature in features]
        label_features = [{"input_ids": feature["labels"]} for feature in features]

        batch = self.processor.pad(
            input_features,
            padding=self.padding,
            max_length=self.max_length,
            pad_to_multiple_of=self.pad_to_multiple_of,
            return_tensors="pt",
        )
        with self.processor.as_target_processor():
            labels_batch = self.processor.pad(
                label_features,
                padding=self.padding,
                max_length=self.max_length_labels,
                pad_to_multiple_of=self.pad_to_multiple_of_labels,
                return_tensors="pt",
            )

        
        labels = labels_batch["input_ids"].masked_fill(labels_batch.attention_mask.ne(1), -100)

        batch["labels"] = labels

        return batch

data_collator = DataCollatorCTCWithPadding(processor=processor, padding=True)

In [68]:
# take a small fake batch (e.g. 3 samples)
batch = [_common_voice_train[i] for i in range(3)]

out = data_collator(batch)

print(out.keys())
print(out["labels"])


KeysView({'input_values': tensor([[0.0007, 0.0007, 0.0007,  ..., 0.0000, 0.0000, 0.0000],
        [0.0020, 0.0020, 0.0020,  ..., 0.0000, 0.0000, 0.0000],
        [0.0003, 0.0003, 0.0003,  ..., 0.0003, 0.0003, 0.0003]]), 'labels': tensor([[  22,    5,   22,   23,   24,   16,   21,   18,    4,   12,    5,   17,
            5,   16,    9,    7,   18,    6,   21,   18,    6,   13,   22,    4,
           22,    5,   16,   35,    9,    8,   21,   18,    4,   16,   21,   30,
            9,   10,   15,   13,   22,    4,    7,    9,   17,    9,   21,    5,
           15,    4,    8,    5,    7,   15,    5,   22,    4,   16,    5,   14,
            5,   21,   12,   24,   21,   13,   22,    4,   21,    9,   11,   13,
            8,    9,   17,   31,   13,    5,    4,    7,    5,   35,    8,    5,
         -100, -100, -100, -100, -100],
        [  16,   18,   12,    5,   16,    5,   29,    9,   22,    4,   24,   33,
            9,   10,   22,    4,   22,   35,   10,    5,    8,    5,   22,   35,
 

In [26]:
import evaluate
import os

wer_metric = evaluate.load("wer")
def compute_metrics(pred):
    pred_logits = pred.predictions
    pred_ids = np.argmax(pred_logits, axis=-1)

    pred.label_ids[pred.label_ids == -100] = processor.tokenizer.pad_token_id

    pred_str = processor.batch_decode(pred_ids)
    
    label_str = processor.batch_decode(pred.label_ids, group_tokens=False)
    
    if isinstance(label_str, list):
        if isinstance(pred_str, list) and len(pred_str) == len(label_str):
            for index in random.sample(range(len(label_str)), 3):
                print(f'reference: "{label_str[index]}"')
                print(f'predicted: "{pred_str[index]}"')

        else:
            for index in random.sample(range(len(label_str)), 3):
                print(f'reference: "{label_str[index]}"')
                print(f'predicted: "{pred_str}"')

    wer = wer_metric.compute(predictions=pred_str, references=label_str)

    return {"wer": wer}

os.environ["WANDB_DISABLED"] = "true"

In [38]:
from transformers import Wav2Vec2ForCTC

model = Wav2Vec2ForCTC.from_pretrained(
    model_name_or_path,
    use_safetensors=True, 
    attention_dropout=0.1,
    hidden_dropout=0.1,
    feat_proj_dropout=0.0,
    mask_time_prob=0.05,
    layerdrop=0.1,
    gradient_checkpointing=True,
    ctc_loss_reduction="mean",
    ctc_zero_infinity=True,
    bos_token_id=processor.tokenizer.bos_token_id,
    eos_token_id=processor.tokenizer.eos_token_id,
    pad_token_id=processor.tokenizer.pad_token_id,
    vocab_size=len(processor.tokenizer.get_vocab())
    
)

# model.freeze_feature_extractor()
save_dir = './new_model/'
from transformers import TrainingArguments
training_args = TrainingArguments(
    output_dir=save_dir,
    group_by_length=False,

    per_device_train_batch_size=10,
    per_device_eval_batch_size=10,
    seed=0,
    # because we are using little batch-size, we set accumulation step to 2 so every 2 epoch the gradiant will be optimize
    gradient_accumulation_steps=2,
    eval_strategy="steps",
    num_train_epochs=5,
    fp16=True,
    # save_steps=10,
    eval_steps=50, 
    logging_steps=10,
    learning_rate=1e-4,
    warmup_steps=500,
    # save_total_limit=2,
)

from transformers import Trainer

trainer = Trainer(
    model=model,
    data_collator=data_collator,
    args=training_args,
    compute_metrics=compute_metrics,
    train_dataset=_common_voice_train,
    eval_dataset=_common_voice_test,
    tokenizer=processor.feature_extractor,
)

loading configuration file config.json from cache at C:\Users\MayaD\.cache\huggingface\hub\models--facebook--wav2vec2-base\snapshots\0b5b8e868dd84f03fd87d01f9c4ff0f080fecfe8\config.json
Model config Wav2Vec2Config {
  "activation_dropout": 0.0,
  "adapter_attn_dim": null,
  "adapter_kernel_size": 3,
  "adapter_stride": 2,
  "add_adapter": false,
  "apply_spec_augment": true,
  "architectures": [
    "Wav2Vec2ForPreTraining"
  ],
  "attention_dropout": 0.1,
  "bos_token_id": 1,
  "classifier_proj_size": 256,
  "codevector_dim": 256,
  "contrastive_logits_temperature": 0.1,
  "conv_bias": false,
  "conv_dim": [
    512,
    512,
    512,
    512,
    512,
    512,
    512
  ],
  "conv_kernel": [
    10,
    3,
    3,
    3,
    3,
    2,
    2
  ],
  "conv_stride": [
    5,
    2,
    2,
    2,
    2,
    2,
    2
  ],
  "ctc_loss_reduction": "mean",
  "ctc_zero_infinity": true,
  "diversity_loss_weight": 0.1,
  "do_stable_layer_norm": false,
  "eos_token_id": 2,
  "feat_extract_activati

In [40]:
from transformers.utils import logging
logging.set_verbosity_info()

trainer.train()
metrics = trainer.evaluate()
trainer.save_model(save_dir)
trainer.save_metrics("eval", metrics)
processor.save_pretrained(save_dir)

***** Running training *****
  Num examples = 11,941
  Num Epochs = 5
  Instantaneous batch size per device = 10
  Total train batch size (w. parallel, distributed & accumulation) = 20
  Gradient Accumulation steps = 2
  Total optimization steps = 2,990
  Number of trainable parameters = 94,400,934


Step,Training Loss,Validation Loss,Wer
50,0.5148,0.364806,0.650591
100,0.4769,0.359655,0.658015
150,0.5255,0.365586,0.648857
200,0.495,0.359393,0.643709
250,0.5018,0.361273,0.655468
300,0.4842,0.361534,0.647285
350,0.5258,0.373784,0.64593
400,0.457,0.347714,0.633792
450,0.4519,0.357913,0.652812
500,0.5166,0.371413,0.640295



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "მდებარეობს მაღრან დვალეთის კავკასიონზე"
predicted: "მდებარეობს მაღრან დვალითის კავკასიონძი"
reference: "ომი დასრულდა დიდი ბრიტანეთის გამარჯვებით"
predicted: "ომიდასულდა ტიდი ბრიტარეთიის გამაჯვედი"
reference: "ცხრა"
predicted: "ცხრა"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "სწავლობდა ჩხარის სამრევლო სკოლაში რომელიც მალევე მიატოვა"
predicted: "სწალობდა ჩხარის სამრევლოს კლლაში რომელიცმალებ მიატობა"
reference: "ეს ომი გაგრძელდა მეთხუთმეტე საუკუნის შუამდე და ცნობილია როგორც ასწლიანი ომი"
predicted: "ესოვ მიდაქრძელდა მეთხუთმეტესაუკუნის შუამდედანობილია როგორწ ასწლიანიომი"
reference: "ალბომმა დადებითი შეფასება მიიღო მუსიკის კრიტიკოსებისგან"
predicted: "ალბოლ მა დადებითი შეფასება მიიღო მუსიკის კრიტიკოსებიზგან"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "უფრო ძველი ფორმაციების გავრცელების ზონებში რელიეფის სტრუქტურული ფორმები მხოლოდ მეორადი ტიპებით არის წარმოდგენილი"
predicted: "უფროძველი ფორმაციების გავრცელების ძონებში რელიეფის ტროქტურული ფოაღგმები მფხოლოდ მეორადიტიპებით არის სარმოდგენილი"
reference: "ის უარყოფს ყოველგვარ მნიშვნელობას და ემოციას და მხოლოდ საკუთარ თავს წარმოადგენს"
predicted: "ის ვარყოფს ყოველგვარმნიშვნელობას დაემოციას და მხოლო ცაკუთართავს წარმოადგენცს"
reference: "სამი"
predicted: "სამი"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "შემდეგი ორი ამერიკელ პოეტსა და მწერალს სტეფენ დონალდსონს"
predicted: "შემდეგი ორი ამელიკლ პოეცა დამწელსტეფენ დონალცონს"
reference: "არჩეულ იქნა აჰმად შაჰი"
predicted: "არჩიულიქნა ახმად შახი"
reference: "პარაგვაისა და ბრაზილიის საზღვართან"
predicted: "პარაგვაისა და ბრაზილიის სასყვართ"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "სული განიხილებოდა როგორც აქტიური და სიცოცხლის მატარებელი საწყისი"
predicted: "სულიგანიხელებოდა როგოც აქტიურიდა სიცოცხრის მატალებელი საწყესი"
reference: "საძირკველი გარედან გამაგრებულია რიყის ქვით"
predicted: "საძირკველი გარედან გამაგრებული არიყეს ქვით"
reference: "სოფლის ტერიტორიაზე მდებარეობს ტბა გრიგოლეთი"
predicted: "სოფლის ტერიტორიასე მდებარეობს ტბა გრიგოლეთი"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "სამი"
predicted: "სამი"
reference: "ასევე მიიჩნევა რომ არსებობს იორდანიაში ხოლო ალბანეთში მოლდოვაში ერაყსა და უკრაინაში მისი სტატუსი უცნობია"
predicted: "ასევე მიიჩნევა რომ არსებობ ზ იორდანიაში ხოლ ალბან ენში მონდობაშიერასა და ოკრეენაში მისის ტატოსიუცნოპია"
reference: "პირველი სართული გააფორმეს რელიეფური ქვებით"
predicted: "პირველი სართული გააფორმეს რილიეფური ქვებით"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "შენობის პირველი სართული რუსტირებულია და აქვს დიდი ვიტრინები"
predicted: "შენობის პირველი სართული ყრუსტი რებულია და აგვს დიდი ვიტრინები"
reference: "მას შემდეგ მის მიხედვით რამდენიმე ფილმია შექმნილი"
predicted: "მას შემდეგმის მი ხებით რამდენიმე ფილ მიაშექმნილი"
reference: "პათოლოგიური პროცესები ორგანიზმში პათოგენური მიზეზის ზემოქმედების შედეგად განვითარებული დაზიანების გამო იწყება"
predicted: "პათალოგიური პრათევსები ორ გალიცს მში პათო გენური ნიზეზის ზემოქველების შიდეგად განვითარებული დარსინების გამუი წყება"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ამ დიდ ფიგურულ კომპოზიციას ჩვენამდე არ მოუღწევია"
predicted: "აბეთ ფიგულკომპოსცია ჩვენავდე არმა უხწევია"
reference: "ამჟამად ცხოვრობს ისრაელში"
predicted: "აგჯამას წყოროფსის რაერში"
reference: "ამ ომებში ბულგარეთის არმიამ მნიშვნელოვანი საბრძოლო გამოცდილება მიიღო"
predicted: "ამ ომებში ბულგა რეთის არმია ნიშნელოვანის საბრწოლოა გამოცტილება მიიყო"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "სახლს ფიქლის ორფერდა სახურავი აქვს"
predicted: "სავს ფიქლის ორფერდა სახურავი აქვს"
reference: "ბურების პირველი ომის დროს მან მიიღო მთავარსარდლის წოდება"
predicted: "პურების პირელი ომის დროს მან მიიღო მთალასცავდლის წოდება"
reference: "უკანასკნელის წარმოება იმავე დღეს შეწყდა"
predicted: "უკანას კნელის წარმოება იმავი დღს შეწყდა"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ასევე იხსენიებს მას ნიკოლოზ ბარათაშვილი პოემაში ბედი ქართლისა"
predicted: "ასევე იხსენიეებს მას ნიკოლოს ბარათაშვილი ოემაში ბედი ქართლისა"
reference: "რომანში ძირითადად რეალური ისტორიული პირები იყრიან თავს"
predicted: "რომანში ძეითადადრეალური ისტოლიული პირებიი ყრიანთავს"
reference: "არა"
predicted: "არა"


Saving model checkpoint to ./new_model/checkpoint-500
Configuration saved in ./new_model/checkpoint-500\config.json
Model weights saved in ./new_model/checkpoint-500\model.safetensors
Feature extractor saved in ./new_model/checkpoint-500\preprocessor_config.json

***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ციკლ ჭეშმარიტების მახვილის მეექვსე წიგნი"
predicted: "ციკლ ჯჩშმაედების მახვლის მეექვსა წიგნი"
reference: "ციხის ეზოში იდგა სასახლე"
predicted: "ჩიხის ეზოში იდგა სასახლე"
reference: "მდინარეზე გადებულია ქვის ხიდები"
predicted: "დინარეზ გადებულია ქვის ხიტები"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "სიმღერის მუსიკალურ ვიდეოში ჯგუფის წევრები ჩაცმულები არიან როგორც სერიალ ფლინტსტოუნები პერსონაჟები"
predicted: "სიმღერის მსეკალრვი დეოში ჯგუთის წევრები ჩაცყმუნლები არიან როგვრცერია ფლინტსტოუნები პერსნეჟები"
reference: "სართულები ერთმანეთს უკავშირდება კედელში დატანებული კიბით"
predicted: "სართულები ერთმანს უკავშირდება კედლში დატანებული კიბით"
reference: "საცრემლე წერტილის დახშობის დროს ანტიბიოტიკების გამოყენების ფონზე ხდება საცრემლე გზების ზონდირება"
predicted: "მსაცრემნდე წერტილის დაღშობის დროს მანდიბიოტიკების გამოყენების პონზე ხდება საცრემლე გზების ზომდირლება"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ცენტრის მინის ჭერზე აზერბაიჯანის დროშაა დატანილი"
predicted: "ცანტრის მინის ჭევზე აზრბაჯანის დროშაა დატანილი"
reference: "ნაწილობრივ შემორჩენილია ორი სართული"
predicted: "ნაწილობრივ შემორჩენილია ორი სართული"
reference: "უარყოფით იონებთან შეერთებისას იგი მეოთხეული ამონიუმის მარილებს წარმოქმნის"
predicted: "ურყოფით იონებთან შეერთებისას იგი მეოთხეული ამონეუმის მაღელებს წარმოქმლის"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ანუ ხდებოდა ცხენების სელექცია ცხენების გადარჩევა"
predicted: "ან უსხდებოდა ცხნებისელექცია ცხენების გადარჩევა"
reference: "ხატის შიდა ნაწილზე გამოსახულია ფეხზე მდგომი საომარ სამოსში გამოწყობილი წმინდა გიორგი"
predicted: "ხათის ში დანაწილზე გამოსახულია ფერზე მდგომი სავამარს ამოში გამოწყობილი წმინდა გიორგი"
reference: "სამი დეკადის მანძილზე იყო ერთ ერთი ყველაზე მაღალშემოსავლიანი მსახიობი"
predicted: "სამიდეკადის მან ზილწე იყო ერთ ერთ იყველაზე მაღალ შემუსავლიანი მსახიობი"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "თბილისის ზღვის მიდამოებში განლაგდა ეროვნული გვარდიის დაუმორჩილებელი ნაწილი"
predicted: "თბილისის ღვის მიდამოებში განლაგდა ეროვნული კვარდის დაუმორჩილებელი ნაწკლი"
reference: "რვა"
predicted: "რვა"
reference: "შუა საუკუნეებში მონარქია იყო სახელმწიფო მმართველობის ყველაზე უფრო გავრცელებული ფორმა"
predicted: "შუა სავკუნეებში მონარქია იო საქელმწიფო მართველობის ყველაზე უფრო გავრცელებული ფორმა"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "აღმოსავლეთით მეორე სართულზე გაჭრილია კარი"
predicted: "აღმოსავლეთით მეორი სართულზე გაჭრილია კარი"
reference: "ხიმშის ერთნავიანი თეთრი წმინდა გიორგის დარბაზული ეკლესია სოფელ ხიმშის განაპირას სამხრეთის ფერდობზე სასაფლაოზე მდებარეობს"
predicted: "ხიმშის ერთნავიანითე თრი წმინდა გიორკის დარბაზული აკლესია სოფელ ხიმშის განაპირას სამხრეთის ფერთობზე სასაფლაოზე მდებარეობს"
reference: "იგი განსაკუთრებით პატრონობდა იენის უნივერსიტეტს სადაც ათ ლექციას თავადაც დაესწრო"
predicted: "იგი განსეკულცევიც პატრონომდა იენის უნივერსიტაც სადა ს ათლექციას თავადაც დაესწრო"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "მდებარეობს ფშავის არაგვის ხეობაში მის მარცხენა მხარეს"
predicted: "მდებარეობს მშავის არაგვის ხეობაში მის მარცხენა მხარეს"
reference: "მონასტრის ერთადერთი ტაძარი რომელიც წმინდა კონსტანტინესა და ელენეს სახელობისაა მოხატულია ბერძენი ოსტატების მიერ"
predicted: "მონასტრის ერთადეთიტაძარი რომელიწმი და კონსტანტინე სადაელენეს სახელობისა მოხატულია ბერძენიოსატების მიერ"
reference: "შვიდი"
predicted: "შვიდი"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ექვსი"
predicted: "ექვსი"
reference: "სოფელში მდებარეობს საქართველოს პრეზიდენტის რეზიდენცია"
predicted: "სოფელში მდებარეობს საქერთოლოს პრეზიდენტის რეზიდენცია"
reference: "ვერცერთი მათგანი ვერ გადაურჩა გაუთვალისწინებელ მარცხს"
predicted: "ვერც ერთი მადგანი ვერ გადაურჩა გაუთვალისწინებალ მარცხს"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "იონიის ზღვა მდებარეობს მსოფლიოში ერთ ერთ ყველაზე აქტიური სეისმურ ზონაში"
predicted: "ინიი ზღვამდებარეობს მსოფლიოში ერთ ერტყველასე აქტიურ სეისმუნზონეში"
reference: "გავრცელებულია ატლანტის ოკეანის ჩრდილოეთ და ჩრდილო ყინულოვანი ოკეანის დასავლეთ მხარეს"
predicted: "ქავრცელებულია აძლანტის ოგიანის ჩრდილოეთ და ჩრდილო კინულოვანი ოგიანის დასავლე თხარის"
reference: "ორი"
predicted: "ორი"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "სკოლამ დიდი როლი ითამაშა ასლამაზიანების პროფესიაში"
predicted: "სკოლამდიდი როლი ითამაშა ასლამაზიანების პროფესიაში"
reference: "რევოლუციის შემდგომ კი სამეფო აკადემია შეცვალა საფრანგეთის ხელოვნების აკადემიამ"
predicted: "რეულუციის შემდგომკი საეფაკადემია შეცვალა საფრანგეთის ხელოვნების აკადემია"
reference: "საძმო ორმოცდაათზე მეტ ბერს ითვლის"
predicted: "ასაძმო ორმოძდაათძზე მეთბერსითვლის"


Saving model checkpoint to ./new_model/checkpoint-1000
Configuration saved in ./new_model/checkpoint-1000\config.json
Model weights saved in ./new_model/checkpoint-1000\model.safetensors
Feature extractor saved in ./new_model/checkpoint-1000\preprocessor_config.json

***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "კახაბერ ვარდანისძეს მეჭურჭლეთუხუცესობა უბოძეს ყუთლუ არსლანის დასის გამოსვლისა და მისი გადაყენების შემდეგ"
predicted: "ტხავერ ვარდანისცეს მეჭურჯკილეთუკუცნესობა უფუძეს კუთვლულ არსლანის გასის გამოსხვმისა და მისი გადაყენების შემდეგ"
reference: "ნანგრევებად ქცეული ეკლესია მდებარეობს სასაფლაოზე"
predicted: "ნანგრევობლად ქცეული ეკლესია მდებარეობს ასაფლაოზე"
reference: "სწავლობდა ქაქუთის დაწყებით სკოლაში"
predicted: "სწავლოლდა ქაქვუთის დაწყრების კოლაში"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "არის ქარსის საბადო"
predicted: "არის ქარსის საბადო"
reference: "მასზე სატირული ლექსები დაუწერიათ საიათნოვას ბესიკს დავით რექტორს და სხვებს"
predicted: "მაზესატირული ლექსები დაუწელია საიათნოვას ბესიქს დავით ლექტორდა სხვებს"
reference: "მდებარეობს პოლონეთის სამხრეთ აღმოსავლეთით"
predicted: "მდებარეობს პოლონეთის სამხრეთ არმოსავლეთით"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "სამი მეფის კავშირში მაგრამ მალევე დატოვა ეს კავშირი"
predicted: "სამინეფის კავშიში მაგრა მალევე დატუ ესკავშირი"
reference: "მდებარეობს მდინარე ნუგუშის მარჯვენა ნაპირზე"
predicted: "მდებარეობს მდინარე ნუგუშის მარჯვენა ნაპირზე"
reference: "სახლს გააჩნია სარდაფი"
predicted: "სახლს გააჩნია სარდაფი"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ხუთი"
predicted: "ხუთი"
reference: "ერთი"
predicted: "ერთი"
reference: "ზოგ ხელოვნებათმცოდნეთა მოსაზრებით იგი უნდა წარმოადგენდეს რომაულ ხანაში შესრულებული ერთ ერთი ელინისტური სკულპტურის მხოლოდ ასლს"
predicted: "ზოფელოოვნებათ მცოდნეთა მოსაძრებით იგი უმდა წარმოვადგენდებს რომაუხყანაში შეცრულებული ერთ ერთი ელინისტურის კულტურის მხოლოდ აზილს"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ამჟამად მოიცავს აზერბაიჯანის ბელაქნის ზაქათალისა და კახის რაიონების ტერიტორიას"
predicted: "ამჟამად მოიცამს აზერბაიჯანის ბელაქნინ ზაქათალისა და კახის რაიომების ტერიტორიას"
reference: "დედალი კვერცხებს წყალში დებს ან პარკით ატარებს"
predicted: "დედალი კვერცხებს წყალში დეებს ან პარკით ატარებს"
reference: "არაბული დამწერლობის ერთ ერთი ორიგინალური შტოა არმაზული დამწერლობა"
predicted: "არაბური დამწემობის ერთ ეთი ორი გინაური შტოა არმაზული დამწერლობა"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "არსებობს ღრმა დეფიციტი ექსპერიმენტული მტკიცებულებებისა კვანტურ გრავიტაციასთან დაკავშირებით"
predicted: "არძებობს ხრმადეფიციტი ექსპერი მეტული მტკიცებულევებისა კვანტურგრავიტაციასდან და კავშირებით"
reference: "ოთხი"
predicted: "ოთხი"
reference: "ხუთი"
predicted: "ხუთი"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "მტკნარი წყლის თევზია"
predicted: "მტკნარი წყყლის თევზია"
reference: "ორი"
predicted: "ორი"
reference: "საქართველოში ცნობილია როგორც მობუდარი ფრინველი"
predicted: "საქართველოში ცნობილია როგორც მობუდარი ფრინველი"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ბლუეფილდსი გახდა ამ რეზერვის დედაქალაქი"
predicted: "ბულე ფილსი გახდა მრეზერბის დედაქალაქი"
reference: "სამივე თარიღი მეტად მნიშვნელოვანია"
predicted: "სამივე თარეყი მეტად მიშვნელოვანია"
reference: "უპირატესობას ანიჭებს მტკნარწყლოვან დიდი ზომის წყალსატევებს დიდ ტბებს წყალსაცავებს ტბორებს მდორე მდინარეებს"
predicted: "უპირატობსობა სანიჭევს მტკმარწტლოვან დიდი ზომის წყალსატაყებს მდით ტვებს სწყალსაცავებს დბორებს მდორე მდინარეებს"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "დიახ"
predicted: "დიახ"
reference: "ნული"
predicted: "ნული"
reference: "ინდუიზმში იგი ბრწყინვალებას სათნოებას და სილამაზეს განასახიერებს"
predicted: "იმდვიში იგი ფრწყინვალებას სათნოებას დასილამაზეს განასახიერებს"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ყველაზე ადრეული ამოფრქვევები ხდებოდა ფრანკლინის რაიონში"
predicted: "ყველაზე ადრეულია მოფრკოები ხდებოდა ფრანკლინის რაიონში"
reference: "აზერბაიჯანული საკულტო არქიტექტურის ძეგლის ნიმუშია რომელიც ფართოდ არის გავრცელებული აზერბაიჯანის სამხრეთ რეგიონებში"
predicted: "აზირბაიჯანული საკულტო არჩიტექტურის ძეგლის ნიმუშია რომელიც ფართოდარის გავრცელებული აზერბაიჭანის სამხრეთთ რეგლიონებში"
reference: "შენობათა ფრაგმენტულად შემორჩენილი კედლები ნაგებია ფიქლის მშრალი წყობით"
predicted: "შენობათა ფრაგმენტულად შემორჩენილი კედლები ნაგებია ფიქლის მშრაალი წყობით"


Saving model checkpoint to ./new_model/checkpoint-1500
Configuration saved in ./new_model/checkpoint-1500\config.json
Model weights saved in ./new_model/checkpoint-1500\model.safetensors
Feature extractor saved in ./new_model/checkpoint-1500\preprocessor_config.json

***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "სიმღერა წარმოადგენს ერთ ერთი გამოუცემელი ჩანაწერის განახლებულ ვერსიას"
predicted: "სიმღერა წარმოადგენს ერთ ერთი გამოუცემელი ჩანაწელის განახლებულ ვერციას"
reference: "ტომლინსონი ჯგუფის სიმღერების ერთ ერთი წამყვანი ავტორია"
predicted: "ტომლინსონი ჯგუფის სიმღერების ერთ ერთი წამყვალი ავტორია"
reference: "არა"
predicted: "არა"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "დაკრძალვის ეს წესი ძველი საბერძნეთიდან მომდინარეობს"
predicted: "და კრძალუვის ეს წესი ძველის აბერძნათიდან მომდინარეობს"
reference: "აეროპორტი ემსახურება მოკლე მანძილის ფრენებს რადგან გააჩნია მოკლე ასაფრენ დასაფრენი ბილიკი"
predicted: "აეროპორტი ემსახვრება მოკლემანძილის ფრენებს რადან გააჩნიან მოკლე ას საფრენ და საფრენიბილიკი"
reference: "იზამთრებს სამხრეთ აზიაში"
predicted: "იზამთრებს სამხრეთ აზიაში"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "პანამის ყელი აკავშირებს ცენტრალურ ამერიკას სამხრეთ ამერიკასთან"
predicted: "პანამის ყელი აკავშირებს ცენტროლუამერიკა სამხრეთ ამერიკასთან"
reference: "თავად მხატვრებს ეს სახელი არასდროს უღიარებიათ"
predicted: "თავად მხატურებს ესახელი არასდრუს უხიიარებიათ"
reference: "მომრგვალო ან უსწორმასწორო ფორმისაა"
predicted: "მომრგვალო ან უსწრმასწროფორმისაა"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "მისი სახელი დაკავშირებულია ეკონომიკური კვლევების ნაციონალურ ბიუროსთან ეკონომიკური პოლიტიკის კვლევის ცენტრთან გლობალური განვითარების ცენტრთან"
predicted: "ისი სახელი დაგავშირებულია ეკონუმიკური კვლევების ნაციონალურლიოროსთან ჰიკონომიკური პოლიტიკის კვლევის ცენტრთანკლობალური განვითარების ცენტრთან"
reference: "უკანა კიდურები წინას თითქმის ორჯერ აღემატება"
predicted: "უკანაკიდურები წინას თითქმის ორჯი რაღემადება"
reference: "არქიტრავული შესასვლელი სამხრეთ კედელშია მოთავსებული"
predicted: "არქიტრავული შესავსვლელი სამხრეთ კედელშია მოთავსებული"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "მდინარე დონის ქვემო დინების ტერიტორია მდიდარია გვიანი ბრინჯაოს ხანის არქეოლოგიური ძეგლებით"
predicted: "მდინარედონის ქვემოდინების ტერიტორია მდიდარია ბღიანი ბრინჯაოს ხანის არქევლუგიური ძეგლებით"
reference: "რელიგიური წინააღმდეგობა წიგნს სხვა ქვეყნებშიც გაუწიეს"
predicted: "რელიგიური წინააღმდეგობა წიგნს სხვარ ქვეყნებშიც გაუწიეს"
reference: "მოგვიანებით სახლები გადაკეთდა სხვადასხვა გზით"
predicted: "მოგვიანებით სახლები გადაკეთ და სხვადასხვა გზით"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "დელფინთა უმრავლესობის მსგავსად მამრები მდედრებზე უფრო გრძელები არიან"
predicted: "დელფინთა უმრავლესობის მს გავსად მამრები მდედრებზე უფრო გრძელები არია"
reference: "იქვე არის შენობა რომელიც ასევე აუშენებიათ ამ ეკლესიის ქვებით"
predicted: "ინქვე არის შენობა რომერის ასევე აუშენებიად ამ ეკლესიის ქვებით"
reference: "მისი უკანასკნელი საფეხბურთო კლუბი იყო მიკა"
predicted: "მისი უკანარსკნელი შაფეხბურთო კლუბი იო მიკა"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ოთხი"
predicted: "ოთხი"
reference: "ხუთი"
predicted: "ხუთი"
reference: "სოფლის დასავლეთ ნაწილში გაითხარა მშრალი წყობით ნაგები კოლექტიური აკლდამები"
predicted: "სოფლის დასავლთ ნაწილში გაითხარა მშრააღი წყობი ძნაგები კოლექტიური აკლდამები"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "პრემიერ მინისტრად დაინიშნა ივანე მერაბიშვილი რომელიც მანამდე შინაგან საქმეთა მინისტრი იყო"
predicted: "პრემიერ მინისწრად დაინიშნა ივანე მერაბიშვილი რომელიც მანამდეშინაგან საქმეთა მინისტრი იყო"
reference: "პათოლოგიური პროცესები ორგანიზმში პათოგენური მიზეზის ზემოქმედების შედეგად განვითარებული დაზიანების გამო იწყება"
predicted: "პათოლოგიური პროცესები ორგალის მში პათოგენური მიზეზის ზემოქმელების შედეგად განვითარებული დარსიანების გამუიწყება"
reference: "ადმინისტრაციულ ტერიტორიული დაყოფის მიხედვით მოლდოვა უნიტარული სახელმწიფოა"
predicted: "ადმინისტროციულ პერიტორიული დაყოფის მიხევით მოლდოვა უნიტარობი სახელმძიფოა"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "დღეისათვის საყოველთაოდ გავრცელებული ტერმინი უხილავი ხელი მეოცე საუკუნემდე ფაქტობრივად არ გამოიყენებოდა"
predicted: "დღეისათვის საყვეველთ აოდ გავრცელებული ტერმინი უხი ლავი ხელი მეოცე საუკუნემდვი ფაქტუბრივად არ გამოიყენებოდა"
reference: "არის ერთადერთი მეცნიერი ისტორიაში რომელმაც ორჯერ მიიღო ნობელის პრემია ქიმიის დარგში"
predicted: "არის ერთადერთი მეცნიერი ისტორიაში რომელმაცორჯერ მიიღო ნობელის პრემია ქილიის ტარგში"
reference: "მეათე მონაწილე როგორც წინა ჩემპიონატებში იყო მასპინძელთა ნაკრები გუნდი"
predicted: "მიათემონაწილე როგორც წინა ჩემპიონატებში იყო მასპმინძელთა ნაკრები გუნდი"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ნაწარმოებები განსხვავდებოდა იმით თუ რომელ ინსტრუმენტებს იყენებდა ამ შემადგენლობიდან"
predicted: "დაწარმოევები განსხვავდებოდა იმითდორობელი ის დრომეტებს ყენებდა ამ შებად გელობიდან"
reference: "ფინალში სამი კონკურსანტი გადის რომელთაგანაც შესაძლებელია ყველა მათგანი ერთი გუნდიდან იყოს"
predicted: "ფინალში სამი კონკურ სანტიგადის რომელთა განად შესაძნებელიაყველო მათგანი ერთი გუნდიდან იყოს"
reference: "რომაულ ისტორიოგრაფიაში ცნობილია უფრო მეტად როგორც პრობუსი"
predicted: "რომა ოლისტორიოგრაფიაში ცნობილია ოფრომეტად როგორ პრობუსი"


Saving model checkpoint to ./new_model/checkpoint-2000
Configuration saved in ./new_model/checkpoint-2000\config.json
Model weights saved in ./new_model/checkpoint-2000\model.safetensors
Feature extractor saved in ./new_model/checkpoint-2000\preprocessor_config.json

***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "სამრეკლო გადახურულია თუნუქის კონუსისებრი სახურავით რომელზეც დადგმულია რკინის მაღალი ჯვარი"
predicted: "სამრეკვლო გადახულია თუნუქის კონუსისებრე სახურავით რომელზეს ძადგმულია რკინის მაღალი ჯვარი"
reference: "იზრდება ფოთლოვან და შერეულ ტყეებში ზაფხულსა და შემოდგომაზე"
predicted: "იზრდება ფოთხლოვან და შერეულტყეებში ზაფხურსა და შემოდგომაზე"
reference: "დასავლეთით ესაზღვრება ზოლოთურნის კანტონი"
predicted: "დასალეთით ესაზღვრება ზოლოთურნის კანტონი"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "დიახ"
predicted: "დიახ"
reference: "დიახ"
predicted: "დიახ"
reference: "დაჯილდოებული იყო საბჭოთა და უცხოური ორდენებითა და მედლებით"
predicted: "დაჯილდოებული იყო საბჭოთა და უცხოვრი ურდენებითა და მედლებით"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ნული"
predicted: "ნული"
reference: "ალექსანდრე ჭავჭავაძე პეტერბურგში დაიბადა და საიმპერატორო კარზე იზრდებოდა"
predicted: "ალექსანტრე ჯავჯავაზე პეტერბურგში დაიბადა და საიმპერატორო კარზე ის რდებოდა"
reference: "შვიდი"
predicted: "შვიდი"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ოთხი"
predicted: "ოთხი"
reference: "ორი"
predicted: "ორი"
reference: "თავად მხატვრებს ეს სახელი არასდროს უღიარებიათ"
predicted: "თავად მხატურებს ესახელი არასდროს უვიარებიათ"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "კუნძულებზე არ არსებობს აეროპორტი რის გამოც კონტინენტებთან დაკავშირება მხოლოდ გემებით ხორციელდება"
predicted: "კუნძულებზე არ არსებობსაეროპორტირისგამოც კონტინენტებთან დაგავშირება მმხოლოდ გემებით ხორციელდება"
reference: "მარიასა და იოანეს ქორწინება სულ თორმეტ წელს გაგრძელდა თუმცა მემკვიდრე არ დაბადებულა"
predicted: "მარიასა და იოანის ქორწინება სულმთორმეტწელს გაგრძელდა თუნცა მემკვიდრე არგაბალებულა"
reference: "რვა"
predicted: "რვა"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "გასულ წელს ესტონეთს დაესხნენ თავს წელს საქართველოს"
predicted: "გასულწელს ესტონეს დაეზღნენთავს წელს საკართველოს"
reference: "ექვსი"
predicted: "ექვსი"
reference: "მარიანა ვიქტორია იყო საფრანგეთის ლეგენდარული დედოფლის მარი ანტუანეტის ნათლია"
predicted: "ლარიანამ იქიტორია იყო საფრაგეთის ლეგენდარულ დედობლის მარეან ტუანებტის ნათლია"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "რვა"
predicted: "რვა"
reference: "ფოსოები არ გააჩნია რაც გამოწვეულია მალის სიმცირით"
predicted: "ფოსუები არ გააჩნი არაც გამოწვეულია მალის სიმცირით"
reference: "უძველესი ქალაქია თანამედროვე შვედეთის ტერიტორიაზე"
predicted: "უძალესი ქალაქეათან ამიდროს შვედეთიის ტერიტორიაზე"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "კი აგურით ნაწყობი ოთხწახნაგა ტრაპეზი დგას"
predicted: "კი აგურით ნაწყობი ოთხწახნაგა ტრაპეზი დგას"
reference: "შედის ცენტრალური აღმოსავლეთი ალპების შემადგენლობაში"
predicted: "შედის ცენტრალური აღმოსავლეთი ალპების შემადგენლობაში"
reference: "იყო მნიშვნელოვანი ციხესიმაგრე და საგზაო კვანძი"
predicted: "ეყო მნიშვნელორავიციხასივაგრა და საგზაო კვანძი"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ხუთი"
predicted: "ოთი"
reference: "ექვსი"
predicted: "ექვსი"
reference: "მტკნარი წყლის თევზია"
predicted: "მტკნარი წლის თევზია"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "დიახ დიახ"
predicted: "დიახდიახ"
reference: "ერთი"
predicted: "ერთი"
reference: "ციკლ ჭეშმარიტების მახვილის მეექვსე წიგნი"
predicted: "ციკლ ჭეშმაიდების მახვილის მეებვსე წიგნი"


Saving model checkpoint to ./new_model/checkpoint-2500
Configuration saved in ./new_model/checkpoint-2500\config.json
Model weights saved in ./new_model/checkpoint-2500\model.safetensors
Feature extractor saved in ./new_model/checkpoint-2500\preprocessor_config.json

***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "მძიმე ინდუსტრია მნიშვნელოვან ადგილს იკავებს ეკონომიკაში"
predicted: "ძიმე ინტუსტრია ნიშვნელოვა ნადგისი კავებს ეკონომიტაში"
reference: "ფილმი ნომინირებული იყო ოსკარზე საუკეთესო ისტორიისთვის"
predicted: "ფილმი ნომინიერებული იყო ოსკარწა საუკეთესო ისტუნ ისტვის"
reference: "სომხეთის ქრისტიანული ეკლესიის ფუძემდებელი და პირველი ეპისკოპოსი"
predicted: "სუმხრეტის ქრისწიანული ეკლესიის ბუძემდებელი და პირველი ეპისკოპოსი"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ფილიპსის სურვილი იყო ევროპული და ამერიკული ნახატების თანაბრად გამოფენა"
predicted: "ფილი ფსის სურუვილი იყო ევროპულიდა ამირიკული ნახატების თანაბრა გამოფინა"
reference: "აღმოსავლეთ ფასადზე სარკმლის ორნამენტირებულ საპირეს შეწყვილებული გრეხილით ლილვები აქვს შემოვლებული"
predicted: "აღმოსავლეთ ფასაზე სარკმლის ორნამენტირებულ საპირეს შეწყვილებული გრეხილით ლილვები აქვს შემობლებული"
reference: "განეკუთვნება გერმანიკული ენების აღმოსავლეთ ჯგუფს"
predicted: "განეკუთვნება გერმანიკული ენების აღმოსავლეთ ჯკუფს"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ისტორიულ მეცნიერებაში მიღებული იყო აზრი რომ ტონთიო ქალაქ გორის ადრინდელი სახელწოდებაა"
predicted: "ისტორიულ მეცნიერებაში მეღებული იყო აზრი რომ ტონთიო ქალაქ გორის ადრინდელით სახელწოდებაა"
reference: "კუნძულზე შესვლა დაშვებულია მხოლოდ სპეციალური ნებართვით და ძირითადად მეცნიერებისათვის"
predicted: "კუნძულზე შესვლა დაშვებულია მხოლოდ სწეციალური ნებართვით და ძირითადად მეცნიერებისათვის"
reference: "ელეონორ რუზველტის უმაღლეს სკოლაში და ასევე მეგობრულ უმაღლეს სკოლაში"
predicted: "ელეონოვ შუძველტის უმაღლესკოლაში და ასევე მეგობრულ უმაღლეს სკოლაში"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ეს თეორია რომელიც ეთნონიმს უშუალოდ გერმანიკულ წარმომავლობას უძებნის დღეს ყველაზე მეტადაა აღიარებული"
predicted: "ეს თეორია რომელიც ეთნონი მს უშუალოდ გერმანიკულ წარმომავლობას უძებნის დღეს ხველაზე მეტადა ავიარებული"
reference: "თუმცა პროგრამულად ერთმანეთისგან განსხვავდებიან"
predicted: "თუმცა პროქრა მოად ერთმაათილა გასხავდებიან"
reference: "მისიონერები ხელს უწყობდნენ არა მარტო ქრისტიანული სარწმუნოების გავრცელებას არამედ განათლებასაც"
predicted: "მისიონერები ხელს უწყობდნენ არამარტო ქრისტიანული სარწმუნეების გავრცელებას არამეთ განათლებასაც"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "მასში უფრო მეტი ტრადიციული ინსტრუმენტი იყო ელექტრონულ მუსიკასთან ერთად"
predicted: "მაც ჟიუფრომეტიტრადიციული ინსტრომენტი იყოველექტრომელ მუსიკასთან ერთედ"
reference: "არა"
predicted: "არა"
reference: "როგორც ამბობენ მუზეუმმა ბილბაო მსოფლიო რუკაზე დასვა"
predicted: "როგორც ამბოვენ მუზეუმმა ბილ ბაორ მსოფლიო რუკაზე დასვა"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "შემოსილია სუბალპური მდელოს ბალახოვანი მცენარეებით"
predicted: "შემოსილია სუბალპური მდელოს ბალაჰოვანი მცენარეებით"
reference: "ექვსი"
predicted: "ექსი"
reference: "პრემიერ მინისტრად დაინიშნა ივანე მერაბიშვილი რომელიც მანამდე შინაგან საქმეთა მინისტრი იყო"
predicted: "პრემიერ მინისწრად დაინიშნა ივანე მერაბიშვილი რომელიც მანამდე შინაგან საქმეთა მინისტრი იყო"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ამჟამად კოშკში განთავსებულია კალინინგრადის ქარვის მუზეუმი"
predicted: "ამჟამად კოშში განთავსებულია კალინინგრადის ქარვის მუზეუმი"
reference: "მეჰმედმა ტახტის მემკვიდრედ სწორედ შეჰზადე სელიმი გამოაცხადა"
predicted: "მეჰმედმა ტახტის მემკვიდრეს სწორით შეზადეს სელიმე გამოაცხადა"
reference: "რობერტ გუისკარის ბრძანებით რომი გაძარცვეს და დაწვეს"
predicted: "რობერთ გუისკარის ბრძანებით რომი გაძერცვეს და დაწყეს"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "ერთი"
predicted: "ერთი"
reference: "აქვეა ვიწრო კარი"
predicted: "აქვეა ვიწრო კარი"
reference: "მეტროპოლიტენ ოპერამ მასთან კონტრაქტი მაშინვე დროებით შეაჩერა და გამოძიების შედეგებს დაელოდა"
predicted: "მეტრო პორიტენ ოპერა მასთან კონტრაქტინ მაშნვე დროებით შერაჩირა და გამოძიები შედეგებს დაილოდა"



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


reference: "საკურთხევლის თაღოვანი სარკმელი გარედან მოწითალო ტუფის მოზრდილი ქვებითაა ნაწყობი"
predicted: "საკურთხრევლის თაღოვანი სარკმელი გარედან მუწითალო ტუფის მოზრდილი ქვებითაა ნაწყობი"
reference: "ექვსი"
predicted: "ექვსი"
reference: "აქვს უნივერსალური ყნოსვა კარგად მოაქვს მოკლული ფრინველი"
predicted: "აქვს უმინერსალური ყნავსვა კარგანთ მოაქვს მოკლული ფრინველი"


Saving model checkpoint to ./new_model/checkpoint-2990
Configuration saved in ./new_model/checkpoint-2990\config.json
Model weights saved in ./new_model/checkpoint-2990\model.safetensors
Feature extractor saved in ./new_model/checkpoint-2990\preprocessor_config.json


Training completed. Do not forget to share your model on huggingface.co/models =)



***** Running Evaluation *****
  Num examples = 2986
  Batch size = 10


Saving model checkpoint to ./new_model/
Configuration saved in ./new_model/config.json


reference: "პოლონეთმა და საბჭოთა კავშირმა თავი შეიკავეს"
predicted: "პოლანითმა და საბჭოთა კავშირმა თავი შეიკავეს"
reference: "მცენარეებიდან ყველაზე მეტად ენათესავება ნუში რომლისგანაც ძირითადად განსხვავდება ნაყოფით"
predicted: "მცენარეებიდან ყველაზე მეტად ენათ ესავება მოში რომლის განაც ძირითადად განსხვავდება ნაყოფით"
reference: "მოსახლეობის გადანაწილება საკმაოდ არათანაბარია უდიდესი ნაწილი თავმოყრილია სამხრეთ დასავლეთის პატარა სანაპირო ზოლში"
predicted: "მოსახლეობის გადანაწილება საკმაოდ არათანაბარია უდიდესი ნაწილი თავმოყრილია სამხრეთ დასავლეთის პატარა სანაპირო ზოლში"


Model weights saved in ./new_model/model.safetensors
Feature extractor saved in ./new_model/preprocessor_config.json
Feature extractor saved in ./new_model/preprocessor_config.json
tokenizer config file saved in ./new_model/tokenizer_config.json
Special tokens file saved in ./new_model/special_tokens_map.json


[]