In [31]:
%%capture
!pip install -q unsloth
!pip install -q transformers==4.56.2 trl==0.22.2
!pip install -q jiwer einops addict easydict

In [32]:
from huggingface_hub import snapshot_download
snapshot_download("unsloth/DeepSeek-OCR", local_dir = "deepseek_ocr")

Fetching 21 files:   0%|          | 0/21 [00:00<?, ?it/s]

'/kaggle/working/deepseek_ocr'

In [33]:
from unsloth import FastVisionModel # FastLanguageModel for LLMs
import torch
from transformers import AutoModel
import os
os.environ["UNSLOTH_WARN_UNINITIALIZED"] = '0'
# 4bit pre quantized models we support for 4x faster downloading + no OOMs.
fourbit_models = [
    "unsloth/Qwen3-VL-8B-Instruct-bnb-4bit", # Qwen 3 vision support
    "unsloth/Qwen3-VL-8B-Thinking-bnb-4bit",
    "unsloth/Qwen3-VL-32B-Instruct-bnb-4bit",
    "unsloth/Qwen3-VL-32B-Thinking-bnb-4bit",
] # More models at https://huggingface.co/unsloth

model, tokenizer = FastVisionModel.from_pretrained(
    "./deepseek_ocr",
    load_in_4bit = False, # Use 4bit to reduce memory use. False for 16bit LoRA.
    auto_model = AutoModel,
    trust_remote_code=True,
    unsloth_force_compile=True,
    use_gradient_checkpointing = "unsloth", # True or "unsloth" for long context
)

You are using a model of type deepseek_vl_v2 to instantiate a model of type DeepseekOCR. This is not supported for all configurations of models and can yield errors.


Are you certain you want to do remote code execution?
==((====))==  Unsloth 2025.12.9: Fast Deepseekocr patching. Transformers: 4.56.2.
   \\   /|    Tesla T4. Num GPUs = 2. Max memory: 14.741 GB. Platform: Linux.
O^O/ \_/ \    Torch: 2.9.1+cu128. CUDA: 7.5. CUDA Toolkit: 12.8. Triton: 3.5.1
\        /    Bfloat16 = FALSE. FA [Xformers = 0.0.33.post2. FA2 = False]
 "-____-"     Free license: http://github.com/unslothai/unsloth
Unsloth: Fast downloading is enabled - ignore downloading bars which are red colored!


You are using a model of type deepseek_vl_v2 to instantiate a model of type DeepseekOCR. This is not supported for all configurations of models and can yield errors.
You are using a model of type deepseek_vl_v2 to instantiate a model of type DeepseekOCR. This is not supported for all configurations of models and can yield errors.


Unsloth: QLoRA and full finetuning all not selected. Switching to 16bit LoRA.


Some weights of DeepseekOCRForCausalLM were not initialized from the model checkpoint at ./deepseek_ocr and are newly initialized: ['model.vision_model.embeddings.position_ids']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


Load dataset

In [34]:
import os, json
from datasets import Dataset

def load_hwdb_split(
    dataset_dir,
    split="train_data",
):
    split_dir = os.path.join(dataset_dir, split)
    # print("#1", split_dir)
    # print("#2", os.popen('ls /kaggle/input/Vietnamese_Handwritten_OCR').read())
    if not os.path.isdir(split_dir):
        raise FileNotFoundError(f"Không tìm thấy thư mục {split_dir}")

    samples = []
    subfolders = sorted(os.listdir(split_dir))

    for sub in subfolders:
        sub_path = os.path.join(split_dir, sub)
        label_path = os.path.join(sub_path, "label.json")

        if not os.path.isdir(sub_path) or not os.path.exists(label_path):
            continue

        with open(label_path, "r", encoding="utf-8-sig") as f:
            labels = json.load(f)

        for img_name, text in labels.items():
            img_path = os.path.join(sub_path, img_name)
            if not os.path.exists(img_path):
                continue

            samples.append({
                "image_path": img_path,
                "text": text.strip()
            })

    return Dataset.from_list(samples)

In [35]:
BASE_DIR = "/kaggle/input/Vietnamese_Handwritten_OCR"

LINE_DIR = os.path.join(
    BASE_DIR,
    "UIT_HWDB_line",
    "UIT_HWDB_line"
)

PARA_DIR = os.path.join(
    BASE_DIR,
    "UIT_HWDB_paragraph",
    "UIT_HWDB_paragraph"
)

ds_line = load_hwdb_split(
    dataset_dir=LINE_DIR,
    split="train_data"
)

ds_para = load_hwdb_split(
    dataset_dir=PARA_DIR,
    split="train_data"
)

from datasets import concatenate_datasets

dataset = concatenate_datasets([ds_line, ds_para])

print(dataset)
print("Total samples:", len(dataset))

Dataset({
    features: ['image_path', 'text'],
    num_rows: 8141
})
Total samples: 8141


Cài đặt các tham số cho model

In [36]:
model = FastVisionModel.get_peft_model(
    model,
    target_modules = [
        "q_proj",
        "v_proj",
        "o_proj",
    ],

    r = 8,       
    lora_alpha = 16, 
    lora_dropout = 0,
    bias = "none",
    random_state = 3407,
    use_rslora = False, 
    loftq_config = None,
    # target_modules = "all-linear", # Optional now! Can specify a list if needed
)

Unsloth: Making `model.base_model.model.model` require gradients


In [37]:
from PIL import Image

instruction = "<image>\nHãy chuyển đổi hình ảnh văn bản viết tay này sang định dạng text tiếng Việt chính xác."

def convert_to_conversation(sample):
    image = Image.open(sample["image_path"]).convert("RGB")
    return {
        "messages": [
            {
                "role": "<|User|>",
                "content": instruction,
                "images": [image],
            },
            {
                "role": "<|Assistant|>",
                "content": sample["text"],
            }
        ]
    }

In [38]:
converted_dataset = [convert_to_conversation(sample) for sample in dataset]

Sắp xếp data

In [39]:
import torch
import math
from dataclasses import dataclass
from typing import Dict, List, Any, Tuple
from PIL import Image, ImageOps
from torch.nn.utils.rnn import pad_sequence
import io

from deepseek_ocr.modeling_deepseekocr import (
    format_messages,
    text_encode,
    BasicImageTransform,
    dynamic_preprocess,
)

@dataclass
class DeepSeekOCRDataCollator:
    """
    Args:
        tokenizer: Tokenizer
        model: Model
        image_size: Size for image patches (default: 640)
        base_size: Size for global view (default: 1024)
        crop_mode: Whether to use dynamic cropping for large images
        train_on_responses_only: If True, only train on assistant responses (mask user prompts)
    """
    tokenizer: Any
    model: Any
    image_size: int = 640
    base_size: int = 1024
    crop_mode: bool = True
    image_token_id: int = 128815
    train_on_responses_only: bool = True

    def __init__(
        self,
        tokenizer,
        model,
        image_size: int = 640,
        base_size: int = 1024,
        crop_mode: bool = True,
        train_on_responses_only: bool = True,
    ):
        self.tokenizer = tokenizer
        self.model = model
        self.image_size = image_size
        self.base_size = base_size
        self.crop_mode = crop_mode
        self.image_token_id = 128815
        self.dtype = model.dtype  # Get dtype from model
        self.train_on_responses_only = train_on_responses_only

        self.image_transform = BasicImageTransform(
            mean=(0.5, 0.5, 0.5),
            std=(0.5, 0.5, 0.5),
            normalize=True
        )
        self.patch_size = 16
        self.downsample_ratio = 4

        # Get BOS token ID from tokenizer
        if hasattr(tokenizer, 'bos_token_id') and tokenizer.bos_token_id is not None:
            self.bos_id = tokenizer.bos_token_id
        else:
            self.bos_id = 0
            print(f"Warning: tokenizer has no bos_token_id, using default: {self.bos_id}")

    def deserialize_image(self, image_data) -> Image.Image:
        """Convert image data (bytes dict or PIL Image) to PIL Image in RGB mode"""
        if isinstance(image_data, Image.Image):
            return image_data.convert("RGB")
        elif isinstance(image_data, dict) and 'bytes' in image_data:
            image_bytes = image_data['bytes']
            image = Image.open(io.BytesIO(image_bytes))
            return image.convert("RGB")
        else:
            raise ValueError(f"Unsupported image format: {type(image_data)}")

    def calculate_image_token_count(self, image: Image.Image, crop_ratio: Tuple[int, int]) -> int:
        """Calculate the number of tokens this image will generate"""
        num_queries = math.ceil((self.image_size // self.patch_size) / self.downsample_ratio)
        num_queries_base = math.ceil((self.base_size // self.patch_size) / self.downsample_ratio)

        width_crop_num, height_crop_num = crop_ratio

        if self.crop_mode:
            img_tokens = num_queries_base * num_queries_base + 1
            if width_crop_num > 1 or height_crop_num > 1:
                img_tokens += (num_queries * width_crop_num + 1) * (num_queries * height_crop_num)
        else:
            img_tokens = num_queries * num_queries + 1

        return img_tokens

    def process_image(self, image: Image.Image) -> Tuple[List, List, List, List, Tuple[int, int]]:
        """
        Process a single image based on crop_mode and size thresholds

        Returns:
            Tuple of (images_list, images_crop_list, images_spatial_crop, tokenized_image, crop_ratio)
        """
        images_list = []
        images_crop_list = []
        images_spatial_crop = []

        if self.crop_mode:
            # Determine crop ratio based on image size
            if image.size[0] <= 640 and image.size[1] <= 640:
                crop_ratio = (1, 1)
                images_crop_raw = []
            else:
                images_crop_raw, crop_ratio = dynamic_preprocess(
                    image, min_num=2, max_num=9,
                    image_size=self.image_size, use_thumbnail=False
                )

            # Process global view with padding
            global_view = ImageOps.pad(
                image, (self.base_size, self.base_size),
                color=tuple(int(x * 255) for x in self.image_transform.mean)
            )
            images_list.append(self.image_transform(global_view).to(self.dtype))

            width_crop_num, height_crop_num = crop_ratio
            images_spatial_crop.append([width_crop_num, height_crop_num])

            # Process local views (crops) if applicable
            if width_crop_num > 1 or height_crop_num > 1:
                for crop_img in images_crop_raw:
                    images_crop_list.append(
                        self.image_transform(crop_img).to(self.dtype)
                    )

            # Calculate image tokens
            num_queries = math.ceil((self.image_size // self.patch_size) / self.downsample_ratio)
            num_queries_base = math.ceil((self.base_size // self.patch_size) / self.downsample_ratio)

            tokenized_image = ([self.image_token_id] * num_queries_base + [self.image_token_id]) * num_queries_base
            tokenized_image += [self.image_token_id]

            if width_crop_num > 1 or height_crop_num > 1:
                tokenized_image += ([self.image_token_id] * (num_queries * width_crop_num) + [self.image_token_id]) * (
                    num_queries * height_crop_num)

        else:  # crop_mode = False
            crop_ratio = (1, 1)
            images_spatial_crop.append([1, 1])

            # For smaller base sizes, resize; for larger, pad
            if self.base_size <= 640:
                resized_image = image.resize((self.base_size, self.base_size), Image.LANCZOS)
                images_list.append(self.image_transform(resized_image).to(self.dtype))
            else:
                global_view = ImageOps.pad(
                    image, (self.base_size, self.base_size),
                    color=tuple(int(x * 255) for x in self.image_transform.mean)
                )
                images_list.append(self.image_transform(global_view).to(self.dtype))

            num_queries = math.ceil((self.base_size // self.patch_size) / self.downsample_ratio)
            tokenized_image = ([self.image_token_id] * num_queries + [self.image_token_id]) * num_queries
            tokenized_image += [self.image_token_id]

        return images_list, images_crop_list, images_spatial_crop, tokenized_image, crop_ratio

    def process_single_sample(self, messages: List[Dict]) -> Dict[str, Any]:
            """
            Process a single conversation into model inputs.
            """

            # --- 1. Setup ---
            images = []
            for message in messages:
                if "images" in message and message["images"]:
                    for img_data in message["images"]:
                        if img_data is not None:
                            pil_image = self.deserialize_image(img_data)
                            images.append(pil_image)

            if not images:
                raise ValueError("No images found in sample. Please ensure all samples contain images.")

            tokenized_str = []
            images_seq_mask = []
            images_list, images_crop_list, images_spatial_crop = [], [], []

            prompt_token_count = -1 # Index to start training
            assistant_started = False
            image_idx = 0

            # Add BOS token at the very beginning
            tokenized_str.append(self.bos_id)
            images_seq_mask.append(False)

            for message in messages:
                role = message["role"]
                content = message["content"]

                # Check if this is the assistant's turn
                if role == "<|Assistant|>":
                    if not assistant_started:
                        # This is the split point. All tokens added *so far*
                        # are part of the prompt.
                        prompt_token_count = len(tokenized_str)
                        assistant_started = True

                    # Append the EOS token string to the *end* of assistant content
                    content = f"{content.strip()} {self.tokenizer.eos_token}"

                # Split this message's content by the image token
                text_splits = content.split('<image>')

                for i, text_sep in enumerate(text_splits):
                    # Tokenize the text part
                    tokenized_sep = text_encode(self.tokenizer, text_sep, bos=False, eos=False)
                    tokenized_str.extend(tokenized_sep)
                    images_seq_mask.extend([False] * len(tokenized_sep))

                    # If this text is followed by an <image> tag
                    if i < len(text_splits) - 1:
                        if image_idx >= len(images):
                            raise ValueError(
                                f"Data mismatch: Found '<image>' token but no corresponding image."
                            )

                        # Process the image
                        image = images[image_idx]
                        img_list, crop_list, spatial_crop, tok_img, _ = self.process_image(image)

                        images_list.extend(img_list)
                        images_crop_list.extend(crop_list)
                        images_spatial_crop.extend(spatial_crop)

                        # Add image placeholder tokens
                        tokenized_str.extend(tok_img)
                        images_seq_mask.extend([True] * len(tok_img))

                        image_idx += 1 # Move to the next image

            # --- 3. Validation and Final Prep ---
            if image_idx != len(images):
                raise ValueError(
                    f"Data mismatch: Found {len(images)} images but only {image_idx} '<image>' tokens were used."
                )

            # If we never found an assistant message, we're in a weird state
            # (e.g., user-only prompt). We mask everything.
            if not assistant_started:
                print("Warning: No assistant message found in sample. Masking all tokens.")
                prompt_token_count = len(tokenized_str)

            # Prepare image tensors
            images_ori = torch.stack(images_list, dim=0)
            images_spatial_crop_tensor = torch.tensor(images_spatial_crop, dtype=torch.long)

            if images_crop_list:
                images_crop = torch.stack(images_crop_list, dim=0)
            else:
                images_crop = torch.zeros((1, 3, self.base_size, self.base_size), dtype=self.dtype)

            return {
                "input_ids": torch.tensor(tokenized_str, dtype=torch.long),
                "images_seq_mask": torch.tensor(images_seq_mask, dtype=torch.bool),
                "images_ori": images_ori,
                "images_crop": images_crop,
                "images_spatial_crop": images_spatial_crop_tensor,
                "prompt_token_count": prompt_token_count, # This is now accurate
            }

    def __call__(self, features: List[Dict[str, Any]]) -> Dict[str, torch.Tensor]:
        """Collate batch of samples"""
        batch_data = []

        # Process each sample
        for feature in features:
            try:
                processed = self.process_single_sample(feature['messages'])
                batch_data.append(processed)
            except Exception as e:
                print(f"Error processing sample: {e}")
                continue

        if not batch_data:
            raise ValueError("No valid samples in batch")

        # Extract lists
        input_ids_list = [item['input_ids'] for item in batch_data]
        images_seq_mask_list = [item['images_seq_mask'] for item in batch_data]
        prompt_token_counts = [item['prompt_token_count'] for item in batch_data]

        # Pad sequences
        input_ids = pad_sequence(input_ids_list, batch_first=True, padding_value=self.tokenizer.pad_token_id)
        images_seq_mask = pad_sequence(images_seq_mask_list, batch_first=True, padding_value=False)

        # Create labels
        labels = input_ids.clone()

        # Mask padding tokens
        labels[labels == self.tokenizer.pad_token_id] = -100

        # Mask image tokens (model shouldn't predict these)
        labels[images_seq_mask] = -100

        # Mask user prompt tokens when train_on_responses_only=True (only train on assistant responses)
        if self.train_on_responses_only:
            for idx, prompt_count in enumerate(prompt_token_counts):
                if prompt_count > 0:
                    labels[idx, :prompt_count] = -100

        # Create attention mask
        attention_mask = (input_ids != self.tokenizer.pad_token_id).long()

        # Prepare images batch (list of tuples)
        images_batch = []
        for item in batch_data:
            images_batch.append((item['images_crop'], item['images_ori']))

        # Stack spatial crop info
        images_spatial_crop = torch.cat([item['images_spatial_crop'] for item in batch_data], dim=0)

        return {
            "input_ids": input_ids,
            "attention_mask": attention_mask,
            "labels": labels,
            "images": images_batch,
            "images_seq_mask": images_seq_mask,
            "images_spatial_crop": images_spatial_crop,
        }

In [40]:
from transformers import Trainer, TrainingArguments
from unsloth import is_bf16_supported
FastVisionModel.for_training(model) # Enable for training!
data_collator = DeepSeekOCRDataCollator(
    tokenizer=tokenizer,
    model = model,
    image_size=640,
    base_size=640,
    crop_mode=True,
    train_on_responses_only=True,
)
trainer = Trainer(
    model = model,
    tokenizer = tokenizer,
    data_collator = data_collator,
    train_dataset = converted_dataset,
    args = TrainingArguments(
        per_device_train_batch_size = 1,
        gradient_accumulation_steps = 8,
        warmup_steps = 20,
        max_steps = 200,
        # num_train_epoch = 4
        learning_rate = 2e-4,
        logging_steps = 10,
        optim = "adamw_8bit",
        weight_decay = 0.01,
        lr_scheduler_type = "linear",
        seed = 3407,
        fp16 = True,  # True đối với GPU T4
        output_dir = "outputs",
        report_to = "none",     # For Weights and Biases
        dataloader_num_workers=4,
        # You MUST put the below items for vision finetuning:
        remove_unused_columns = False,

        # CHECKPOINT AN TOÀN
        save_strategy = "steps",
        save_steps = 50,      
        save_total_limit = 2,    
    ),
)

  trainer = Trainer(


Quá trình Fine-tuning

In [41]:
trainer_stats = trainer.train()

==((====))==  Unsloth - 2x faster free finetuning | Num GPUs used = 1
   \\   /|    Num examples = 8,141 | Num Epochs = 1 | Total steps = 200
O^O/ \_/ \    Batch size per device = 2 | Gradient accumulation steps = 8
\        /    Data Parallel GPUs = 1 | Total batch size (2 x 8 x 1) = 16
 "-____-"     Trainable parameters = 737,280 of 3,336,843,520 (0.02% trained)
Unsloth: Not an error, but DeepseekOCRForCausalLM does not accept `num_items_in_batch`.
Using gradient accumulation will be very slightly less accurate.
Read more on gradient accumulation issues here: https://unsloth.ai/blog/gradient


BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([8, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
Unsloth: Will smartly offload gradients to save VRAM!
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([3, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([4, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 1

Step,Training Loss
10,1.5913
20,1.2706
30,1.011
40,0.9696
50,0.8479
60,0.9409
70,0.8815
80,0.8169
90,0.7965
100,0.8291


BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([3, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE: 

You are using a model of type deepseek_vl_v2 to instantiate a model of type DeepseekOCR. This is not supported for all configurations of models and can yield errors.


BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([8, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([3, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE: 

You are using a model of type deepseek_vl_v2 to instantiate a model of type DeepseekOCR. This is not supported for all configurations of models and can yield errors.


BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([4, 100, 1280])
BASE: 

You are using a model of type deepseek_vl_v2 to instantiate a model of type DeepseekOCR. This is not supported for all configurations of models and can yield errors.


BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([4, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([4, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([3, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([5, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([4, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE:  torch.Size([1, 100, 1280])
PATCHES:  torch.Size([9, 100, 1280])
BASE: 

You are using a model of type deepseek_vl_v2 to instantiate a model of type DeepseekOCR. This is not supported for all configurations of models and can yield errors.


In [52]:
model.save_pretrained("lora_model")  # Local saving
tokenizer.save_pretrained("lora_model")
# model.push_to_hub("your_name/lora_model", token = "...") # Online saving
# tokenizer.push_to_hub("your_name/lora_model", token = "...") # Online saving

('lora_model/tokenizer_config.json',
 'lora_model/special_tokens_map.json',
 'lora_model/tokenizer.json')

In [43]:
from unsloth import FastVisionModel
from transformers import AutoModel
import torch

BASE_MODEL = "unsloth/DeepSeek-OCR" 
LORA_DIR = "lora_model"            

model, tokenizer = FastVisionModel.from_pretrained(
    model_name = BASE_MODEL,
    adapter_name = LORA_DIR, 
    load_in_4bit = False,
    auto_model = AutoModel,
    trust_remote_code = True,
)

FastVisionModel.for_inference(model)

print("Model + LoRA loaded")

A new version of the following files was downloaded from https://huggingface.co/unsloth/DeepSeek-OCR:
- deepencoder.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.
A new version of the following files was downloaded from https://huggingface.co/unsloth/DeepSeek-OCR:
- conversation.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.
A new version of the following files was downloaded from https://huggingface.co/unsloth/DeepSeek-OCR:
- modeling_deepseekocr.py
- deepencoder.py
- conversation.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.
You are using a model of type deepseek_vl_v2 to instantiate a model of type DeepseekOCR. This is not supported for all configurations of models and 

Are you certain you want to do remote code execution?
==((====))==  Unsloth 2025.12.9: Fast Deepseekocr patching. Transformers: 4.56.2.
   \\   /|    Tesla T4. Num GPUs = 2. Max memory: 14.741 GB. Platform: Linux.
O^O/ \_/ \    Torch: 2.9.1+cu128. CUDA: 7.5. CUDA Toolkit: 12.8. Triton: 3.5.1
\        /    Bfloat16 = FALSE. FA [Xformers = 0.0.33.post2. FA2 = False]
 "-____-"     Free license: http://github.com/unslothai/unsloth
Unsloth: Fast downloading is enabled - ignore downloading bars which are red colored!


You are using a model of type deepseek_vl_v2 to instantiate a model of type DeepseekOCR. This is not supported for all configurations of models and can yield errors.


Unsloth: Deepseekocr does not support SDPA - switching to fast eager.
Unsloth: QLoRA and full finetuning all not selected. Switching to 16bit LoRA.


You are using a model of type deepseek_vl_v2 to instantiate a model of type DeepseekOCR. This is not supported for all configurations of models and can yield errors.


model.safetensors.index.json: 0.00B [00:00, ?B/s]

model-00001-of-000001.safetensors:   0%|          | 0.00/6.67G [00:00<?, ?B/s]

Some weights of DeepseekOCRForCausalLM were not initialized from the model checkpoint at unsloth/DeepSeek-OCR and are newly initialized: ['model.vision_model.embeddings.position_ids']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


tokenizer_config.json: 0.00B [00:00, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

special_tokens_map.json:   0%|          | 0.00/801 [00:00<?, ?B/s]

Model + LoRA loaded


In [44]:
import os
import json

def load_hwdb_test(root_dir):
    samples = []

    # root_dir = .../test_data
    for sub in sorted(os.listdir(root_dir)):
        sub_dir = os.path.join(root_dir, sub)
        if not os.path.isdir(sub_dir):
            continue

        label_path = os.path.join(sub_dir, "label.json")
        if not os.path.exists(label_path):
            print("Missing label.json in", sub_dir)
            continue

        with open(label_path, "r", encoding="utf-8") as f:
            labels = json.load(f)

        for fname, gt_text in labels.items():
            img_path = os.path.join(sub_dir, fname)
            if not os.path.exists(img_path):
                print("Missing image:", img_path)
                continue

            samples.append({
                "image_path": img_path,
                "gt": gt_text
            })

    return samples

In [45]:
import os

def run_ocr(model, tokenizer, image_path):
    prompt = "<image>\nHãy chuyển đổi hình ảnh văn bản viết tay này sang định dạng text tiếng Việt chính xác."

    output_path = "/tmp/ocr"
    os.makedirs(output_path, exist_ok=True)

    result = model.infer(
        tokenizer,
        prompt=prompt,
        image_file=image_path,
        output_path=output_path,
        image_size=640,
        base_size=1024,
        crop_mode=True,
        save_results=False, 
        test_compress=False,
        eval_mode=True,
    )

    print("DEBUG result:", result, type(result))

    if isinstance(result, str):
        return result.strip()
    elif isinstance(result, dict) and "text" in result:
        return result["text"].strip()
    elif hasattr(result, "text"):
        return result.text.strip()
    else:
        return ""

In [47]:
image_file = "/kaggle/input/Vietnamese_Handwritten_OCR/UIT_HWDB_line/UIT_HWDB_line/test_data/250/1.jpg"
pred_text = run_ocr(model, tokenizer, image_file)
print("PRED:", pred_text)

The attention mask is not set and cannot be inferred from input because pad token is same as eos token. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.


BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])
DEBUG result:  <class 'str'>
PRED: 


In [48]:
TEST_ROOT = "/kaggle/input/Vietnamese_Handwritten_OCR/UIT_HWDB_line/UIT_HWDB_line/test_data"

test_samples = load_hwdb_test(TEST_ROOT)
print("Total test samples:", len(test_samples))
print(test_samples[:2])

Total test samples: 201
[{'image_path': '/kaggle/input/Vietnamese_Handwritten_OCR/UIT_HWDB_line/UIT_HWDB_line/test_data/250/1.jpg', 'gt': 'Thứ trưởng Bộ Tài nguyên & môi trường Đặng Hùng Võ tâm đắc với'}, {'image_path': '/kaggle/input/Vietnamese_Handwritten_OCR/UIT_HWDB_line/UIT_HWDB_line/test_data/250/2.jpg', 'gt': 'cơ chế " khuyến khích nhà đầu tư thỏa thuận với người sử dụng đất để nhận'}]


Quá trình suy diễn (inference)

In [49]:
from tqdm import tqdm

results = []
for sample in tqdm(test_samples):
    try:
        pred = run_ocr(model, tokenizer, sample["image_path"])
    except Exception as e:
        print("Error:", sample["image_path"], e)
        pred = ""
    print("Gốc:", sample["gt"])
    print("Dự đoán:", pred)
    results.append({"image": sample["image_path"], "gt": sample["gt"], "pred": pred})

  0%|          | 0/201 [00:00<?, ?it/s]

BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  0%|          | 1/201 [00:00<03:03,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: Thứ trưởng Bộ Tài nguyên & môi trường Đặng Hùng Võ tâm đắc với
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  1%|          | 2/201 [00:01<02:58,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: cơ chế " khuyến khích nhà đầu tư thỏa thuận với người sử dụng đất để nhận
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  1%|▏         | 3/201 [00:02<02:54,  1.14it/s]

DEBUG result:  <class 'str'>
Gốc: chuyển nhượng hoặc thuê quyền sử dụng đất, nhận góp vốn bằng quyền sử
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  2%|▏         | 4/201 [00:03<02:52,  1.14it/s]

DEBUG result:  <class 'str'>
Gốc: dụng đất... " Nhưng tại hội nghị hôm qua, tiếng nói từ các sở tài nguyên
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  2%|▏         | 5/201 [00:04<02:50,  1.15it/s]

DEBUG result:  <class 'str'>
Gốc: & môi trường lại đều đồng thanh " loại bỏ " điều khoản này ra khỏi dự thảo.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  3%|▎         | 6/201 [00:05<02:50,  1.15it/s]

DEBUG result:  <class 'str'>
Gốc: Giám đốc Sở Tài nguyên & môi trường Hải Phòng Chu Minh Tuấn cho
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  3%|▎         | 7/201 [00:06<02:49,  1.15it/s]

DEBUG result:  <class 'str'>
Gốc: biết thành phố cảng từng áp dụng cơ chế " thỏa thuận " trong một số
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  4%|▍         | 8/201 [00:07<02:48,  1.14it/s]

DEBUG result:  <class 'str'>
Gốc: rất ít trường hợp, vậy mà đã gây phản ứng theo kiểu dây chuyền khá
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  4%|▍         | 9/201 [00:07<02:47,  1.15it/s]

DEBUG result:  <class 'str'>
Gốc: mạnh : anh này nhận tiền rồi quay lại đòi nữa, anh kia thỏa thuận
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  5%|▍         | 10/201 [00:08<02:47,  1.14it/s]

DEBUG result:  <class 'str'>
Gốc: xong quay ra đòi thỏa thuận lại...
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  5%|▌         | 11/201 [00:09<02:46,  1.14it/s]

DEBUG result:  <class 'str'>
Gốc: Chưa kể để doanh nghiệp và người dân " nói chuyện " với nhau như
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  6%|▌         | 12/201 [00:10<02:46,  1.14it/s]

DEBUG result:  <class 'str'>
Gốc: vậy, quyền của cơ quan quản lý nhà nước sẽ mất đi. " Tôi cũng có suy
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  6%|▋         | 13/201 [00:11<02:47,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: nghĩ như đồng chí " Bỏ được qui định này đi thì tốt. Cùng một lúc chúng
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  7%|▋         | 14/201 [00:12<02:46,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: ta thực hiện hai cơ chế (vừa Nhà nước thực hiện thu hồi đất như cách
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  7%|▋         | 15/201 [00:13<02:45,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: làm lâu nay, vừa khuyến khích nhà đầu tư thỏa thuận với người sử dụng
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  8%|▊         | 16/201 [00:14<02:44,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: đất) thì phức tạp - ông Trịnh Kiên Đĩnh, phó giám đốc Sở Tài
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  8%|▊         | 17/201 [00:15<02:44,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: nguyên - môi trường và nhà đất Hà Nội, lên tiếng.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  9%|▉         | 18/201 [00:15<02:43,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: Bảo vệ lập trường của cơ quan soạn thảo, Thứ trưởng Đặng Hùng Võ khẳng định
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


  9%|▉         | 19/201 [00:16<02:42,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: " trường hợp nhà đầu tư có nhu cầu thỏa thuận với người đang sử dụng đất, chúng
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 10%|▉         | 20/201 [00:17<02:41,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: ta cần khuyến khích vì Nhà nước chẳng mất cái gì cả ". Ông Võ " kêu gọi " :
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 10%|█         | 21/201 [00:18<02:41,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: chúng ta cần thay đổi trong quan điểm, không nên để hệ thống hành chính
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 11%|█         | 22/201 [00:19<02:40,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: ôm về mình nhiều quá, bởi ôm càng nhiều thì sai càng nhiều. Bộ trưởng Mai
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 11%|█▏        | 23/201 [00:20<02:39,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: Ái Trực tiếp lời : Các nước đều áp dụng cơ chế tự thỏa thuận khi thu hồi
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([6, 100, 1280])


 12%|█▏        | 24/201 [00:21<02:34,  1.15it/s]

DEBUG result:  <class 'str'>
Gốc: đất.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 12%|█▏        | 25/201 [00:22<02:37,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: Ngay cả trường hợp ta không qui định, người dân và doanh nghiệp vẫn thực hiện
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 13%|█▎        | 26/201 [00:23<02:37,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: cơ chế này. " Nếu cứ dùng quyền lực hành chính nhà nước với mô hình khuôn
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 13%|█▎        | 27/201 [00:23<02:37,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: cứng, người dân sẽ kêu " - ông Trực nói. Chuyện " bố " - " con ". Phó giám đốc
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 14%|█▍        | 28/201 [00:24<02:37,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: Sở Tài nguyên - môi trường & nhà đất Hà Nội Trịnh Kiên Đĩnh đề nghị : thẩm
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 14%|█▍        | 29/201 [00:25<02:36,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: quyền thu hồi đất, giao đất phải được thể hiện theo tinh thần " ông bố bao trùm
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 15%|█▍        | 30/201 [00:26<02:36,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: ông con ". Theo đó, UBND cấp tỉnh, thành phố được quyền thu hồi, giao đất
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 15%|█▌        | 31/201 [00:27<02:37,  1.08it/s]

DEBUG result:  <class 'str'>
Gốc: thuộc thẩm quyền của UBND cấp quận, huyện (thay vì qui định như hiện nay,
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 16%|█▌        | 32/201 [00:28<02:36,  1.08it/s]

DEBUG result:  <class 'str'>
Gốc: " ông bố " muốn làm điều này phải thông báo cho " ông con " thực hiện, vừa nhiêu
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 16%|█▋        | 33/201 [00:29<02:36,  1.07it/s]

DEBUG result:  <class 'str'>
Gốc: khê vừa không thể hiện hướng đi cải cách thủ tục hành chính).
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 17%|█▋        | 34/201 [00:30<02:35,  1.07it/s]

DEBUG result:  <class 'str'>
Gốc: Lập tức Thứ trưởng Đặng Hùng Võ phản ứng : " ông bố " có quyền của " ông bố ",
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 17%|█▋        | 35/201 [00:31<02:36,  1.06it/s]

DEBUG result:  <class 'str'>
Gốc: " ông con " có quyền của " ông con ". Luật không cho phép " ông bố " làm thay " ông
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 18%|█▊        | 36/201 [00:32<02:35,  1.06it/s]

DEBUG result:  <class 'str'>
Gốc: con ". Trường hợp nào làm thay là phạm luật, chỉ có điều hiện nay các " ông
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([6, 100, 1280])


 18%|█▊        | 37/201 [00:33<02:26,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: con " không dám kêu mà thôi!
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 19%|█▉        | 38/201 [00:34<02:27,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: Chương trình hành động thực hiện Nghị quyết trung ương 9 - khóa
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 19%|█▉        | 39/201 [00:35<02:26,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: IX của Đảng bộ TP.HCM Về xây dựng Đảng : tiếp tục chỉ đạo mạnh
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 20%|█▉        | 40/201 [00:35<02:27,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: mẽ, có hiệu quả cuộc vận động xây dựng chỉnh đốn Đảng theo tinh
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 20%|██        | 41/201 [00:36<02:28,  1.08it/s]

DEBUG result:  <class 'str'>
Gốc: thần nghị quyết trung ương 6 (lần 2). Theo đó, tiếp tục thực hiện việc
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 21%|██        | 42/201 [00:37<02:28,  1.07it/s]

DEBUG result:  <class 'str'>
Gốc: kê khai nhà đất và cơ sở sản xuất kinh doanh của cán bộ - công chức;
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 21%|██▏       | 43/201 [00:38<02:28,  1.06it/s]

DEBUG result:  <class 'str'>
Gốc: tăng cường thanh kiểm tra những nơi có dấu hiệu vi phạm, đặc biệt
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 22%|██▏       | 44/201 [00:39<02:28,  1.06it/s]

DEBUG result:  <class 'str'>
Gốc: trong lĩnh vực đất đai và các công trình trọng điểm.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 22%|██▏       | 45/201 [00:40<02:27,  1.06it/s]

DEBUG result:  <class 'str'>
Gốc: Xử lý nghiêm minh theo pháp luật và kỷ luật của Đảng những người
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 23%|██▎       | 46/201 [00:41<02:26,  1.06it/s]

DEBUG result:  <class 'str'>
Gốc: có hành vi sai trái và những người bao che. Thực hiện tốt các quy định
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 23%|██▎       | 47/201 [00:42<02:25,  1.06it/s]

DEBUG result:  <class 'str'>
Gốc: đối với cán bộ lãnh đạo, quản lý để xảy ra tham nhũng, tiêu cực ở cơ
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 24%|██▍       | 48/201 [00:43<02:24,  1.06it/s]

DEBUG result:  <class 'str'>
Gốc: quan, đơn vị. Kiện toàn và tăng cường sức chiến đấu của tổ chức
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 24%|██▍       | 49/201 [00:44<02:23,  1.06it/s]

DEBUG result:  <class 'str'>
Gốc: cơ sở Đảng. Tiếp tục đổi mới và nâng cao công tác cán bộ. Tiếp tục
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 25%|██▍       | 50/201 [00:45<02:23,  1.06it/s]

DEBUG result:  <class 'str'>
Gốc: đổi mới phương thức lãnh đạo của cấp ủy Đảng theo phương châm
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([5, 100, 1280])


 25%|██▌       | 51/201 [00:46<02:12,  1.14it/s]

DEBUG result:  <class 'str'>
Gốc: hướng mạnh về cơ sở.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 26%|██▌       | 52/201 [00:47<02:13,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: Về cải cách hành chính : Tập trung chấn chỉnh mạnh hơn nữa kỷ cương,
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 26%|██▋       | 53/201 [00:48<02:14,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: kỷ luật trong bộ máy hành chính, nâng cao tinh thần trách nhiệm và
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 27%|██▋       | 54/201 [00:48<02:13,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: ý thức kỷ luật của CB - CC, nhất là trên lĩnh vực nhà đất, đầu tư,
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 27%|██▋       | 55/201 [00:49<02:13,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: kinh doanh, trật tự xây dựng và giải quyết khiếu nại, tố cáo.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 28%|██▊       | 56/201 [00:50<02:13,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: Xây dựng hoàn thiện hệ thống các qui trình thủ tục hành chính.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([8, 100, 1280])


 28%|██▊       | 57/201 [00:51<02:09,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: Kiên quyết chấn chỉnh bộ máy hành chính các cấp, nhanh chóng
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 29%|██▉       | 58/201 [00:52<02:09,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: khắc phục tình trạng quan liêu, cửa quyền, hách dịch.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 29%|██▉       | 59/201 [00:53<02:09,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: Xây dựng và phát triển đội ngũ CB - CC có chất lượng chuyên môn
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 30%|██▉       | 60/201 [00:54<02:08,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: cao, có phẩm chất, đạo đức. Kiểm tra, xử lý kiên quyết các vụ
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 30%|███       | 61/201 [00:55<02:07,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: tham nhũng, lãng phí, làm thất thoát tài sản nhà nước... Về kinh
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 31%|███       | 62/201 [00:56<02:06,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: tế : Tập trung mọi nỗ lực nhằm tháo gỡ sản xuất kinh doanh,
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 31%|███▏      | 63/201 [00:57<02:06,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: đưa tốc độ tăng trưởng GDP trên địa bàn TP đạt 12% năm
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 32%|███▏      | 64/201 [00:58<02:05,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: 2004 và trên 12% năm 2005. Phát triển nhanh các ngành dịch vụ,
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([6, 100, 1280])


 32%|███▏      | 65/201 [00:58<01:57,  1.16it/s]

DEBUG result:  <class 'str'>
Gốc: tái cấu trúc các ngành công nghiệp.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 33%|███▎      | 66/201 [00:59<01:59,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: Tiếp tục nhân rộng các mô hình huy động vốn đầu tư. Tập trung khai
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 33%|███▎      | 67/201 [01:00<01:59,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: thác các nguồn vốn cho ngân sách. Tổng kết quá trình cổ phần hóa
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 34%|███▍      | 68/201 [01:01<01:59,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: doanh nghiệp nhà nước và việc tổ chức sắp xếp lại doanh nghiệp nhà
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 34%|███▍      | 69/201 [01:02<01:58,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: nước. Triển khai quyết định của TP về một số chính sách ưu đãi
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([8, 100, 1280])


 35%|███▍      | 70/201 [01:03<01:55,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: đối với các dự án có vốn đầu tư nước ngoài. Rà soát lại chương
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 35%|███▌      | 71/201 [01:04<01:55,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: trình hội nhập kinh tế của TP. Về văn hóa - xã hội : đẩy mạnh
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 36%|███▌      | 72/201 [01:05<01:55,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: xã hội hóa, phát triển xã hội học tập, ưu tiên đầu tư ngân
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([6, 100, 1280])


 36%|███▋      | 73/201 [01:05<01:48,  1.18it/s]

DEBUG result:  <class 'str'>
Gốc: sách cho giáo dục - đào tạo.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 37%|███▋      | 74/201 [01:06<01:49,  1.16it/s]

DEBUG result:  <class 'str'>
Gốc: Nâng cao năng lực quản lý nhà nước trên các lĩnh vực kinh doanh
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 37%|███▋      | 75/201 [01:07<01:49,  1.15it/s]

DEBUG result:  <class 'str'>
Gốc: dịch vụ văn hóa; khắc phục những sơ hở, tiêu cực trong quản lý
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 38%|███▊      | 76/201 [01:08<01:48,  1.15it/s]

DEBUG result:  <class 'str'>
Gốc: và hoạt động văn hóa. Tiếp tục tập trung nguồn lực cho chương
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([4, 100, 1280])


 38%|███▊      | 77/201 [01:09<01:39,  1.25it/s]

DEBUG result:  <class 'str'>
Gốc: trình 3 giảm...
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 39%|███▉      | 78/201 [01:10<01:42,  1.20it/s]

DEBUG result:  <class 'str'>
Gốc: Chương trình hành động thực hiện Nghị quyết trung ương 9 - khóa IX của Đảng bộ
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 39%|███▉      | 79/201 [01:11<01:43,  1.17it/s]

DEBUG result:  <class 'str'>
Gốc: TP.HCM Về xây dựng Đảng : tiếp tục chỉ đạo mạnh mẽ, có hiệu quả cuộc vận động xây
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 40%|███▉      | 80/201 [01:11<01:44,  1.16it/s]

DEBUG result:  <class 'str'>
Gốc: dựng chỉnh đốn Đảng theo tinh thần nghị quyết trung ương 6 (lần 2). Theo đó, tiếp tục
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 40%|████      | 81/201 [01:12<01:45,  1.14it/s]

DEBUG result:  <class 'str'>
Gốc: thực hiện việc kê khai nhà đất và cơ sở sản xuất kinh doanh của cán bộ - công
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 41%|████      | 82/201 [01:13<01:45,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: chức; tăng cường thanh kiểm tra những nơi có dấu hiệu vi phạm, đặc biệt
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 41%|████▏     | 83/201 [01:14<01:44,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: trong lĩnh vực đất đai và các công trình trọng điểm.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 42%|████▏     | 84/201 [01:15<01:43,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: Xử lý nghiêm minh theo pháp luật và kỷ luật của Đảng những người có hành
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 42%|████▏     | 85/201 [01:16<01:43,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: vi sai trái và những người bao che. Thực hiện tốt các quy định đối với cán bộ lãnh
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 43%|████▎     | 86/201 [01:17<01:42,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: đạo, quản lý để xảy ra tham nhũng, tiêu cực ở cơ quan, đơn vị. Kiện toàn và
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 43%|████▎     | 87/201 [01:18<01:42,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: tăng cường sức chiến đấu của tổ chức cơ sở Đảng. Tiếp tục đổi mới và nâng
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 44%|████▍     | 88/201 [01:19<01:41,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: cao công tác cán bộ. Tiếp tục đổi mới phương thức lãnh đạo của cấp ủy
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([7, 100, 1280])


 44%|████▍     | 89/201 [01:19<01:36,  1.16it/s]

DEBUG result:  <class 'str'>
Gốc: Đảng theo phương châm hướng mạnh về cơ sở.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 45%|████▍     | 90/201 [01:20<01:36,  1.15it/s]

DEBUG result:  <class 'str'>
Gốc: Về cải cách hành chính : Tập trung chấn chỉnh mạnh hơn nữa kỷ cương, kỷ luật trong
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 45%|████▌     | 91/201 [01:21<01:36,  1.14it/s]

DEBUG result:  <class 'str'>
Gốc: bộ máy hành chính, nâng cao tinh thần trách nhiệm và ý thức kỷ luật của CB - CC,
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 46%|████▌     | 92/201 [01:22<01:36,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: nhất là trên lĩnh vực nhà đất, đầu tư, kinh doanh, trật tự xây dựng và
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 46%|████▋     | 93/201 [01:23<01:35,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: giải quyết khiếu nại, tố cáo. Xây dựng hoàn thiện hệ thống các qui trình
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 47%|████▋     | 94/201 [01:24<01:34,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: thủ tục hành chính. Kiên quyết chấn chỉnh bộ máy hành chính các cấp,
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 47%|████▋     | 95/201 [01:25<01:34,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: nhanh chóng khắc phục tình trạng quan liêu, cửa quyền, hách dịch.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 48%|████▊     | 96/201 [01:26<01:33,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: Xây dựng và phát triển đội ngũ CB - CC có chất lượng chuyên môn cao, có phẩm
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 48%|████▊     | 97/201 [01:27<01:32,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: chất, đạo đức. Kiểm tra, xử lý kiên quyết các vụ tham nhũng, lãng phí,
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 49%|████▉     | 98/201 [01:27<01:31,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: làm thất thoát tài sản nhà nước... Về kinh tế : Tập trung mọi nỗ lực
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 49%|████▉     | 99/201 [01:28<01:30,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: nhằm tháo gỡ sản xuất kinh doanh, đưa tốc độ tăng trưởng GDP trên địa
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 50%|████▉     | 100/201 [01:29<01:29,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: bàn TP đạt 12% năm 2004 và trên 12% năm 2005. Phát triển nhanh
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 50%|█████     | 101/201 [01:30<01:29,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: các ngành dịch vụ, tái cấu trúc các ngành công nghiệp.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 51%|█████     | 102/201 [01:31<01:29,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: Tiếp tục nhân rộng các mô hình huy động vốn đầu tư. Tập trung khai thác
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 51%|█████     | 103/201 [01:32<01:28,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: các nguồn vốn cho ngân sách. Tổng kết quá trình cổ phần hóa doanh
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 52%|█████▏    | 104/201 [01:33<01:27,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: nghiệp nhà nước và việc tổ chức sắp xếp lại doanh nghiệp nhà nước.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 52%|█████▏    | 105/201 [01:34<01:26,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: Triển khai quyết định của TP về một số chính sách ưu đãi đối với
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 53%|█████▎    | 106/201 [01:35<01:25,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: các dự án có vốn đầu tư nước ngoài. Rà soát lại chương
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 53%|█████▎    | 107/201 [01:36<01:24,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: trình hội nhập kinh tế của TP. Về văn hóa - xã hội : đẩy mạnh xã
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 54%|█████▎    | 108/201 [01:36<01:24,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: hội hóa, phát triển xã hội học tập, ưu tiên đầu tư ngân sách
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([5, 100, 1280])


 54%|█████▍    | 109/201 [01:37<01:17,  1.18it/s]

DEBUG result:  <class 'str'>
Gốc: cho giáo dục - đào tạo.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 55%|█████▍    | 110/201 [01:38<01:18,  1.16it/s]

DEBUG result:  <class 'str'>
Gốc: Nâng cao năng lực quản lý nhà nước trên các lĩnh vực kinh doanh dịch vụ
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 55%|█████▌    | 111/201 [01:39<01:18,  1.14it/s]

DEBUG result:  <class 'str'>
Gốc: văn hóa; khắc phục những sơ hở, tiêu cực trong quản lý và hoạt động
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 56%|█████▌    | 112/201 [01:40<01:18,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: văn hóa. Tiếp tục tập trung nguồn lực cho chương trình 3 giảm...
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 56%|█████▌    | 113/201 [01:41<01:18,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: Viết tiếp về vụ anh Trương Xuân Đại. Ngay từ khi tờ báo có bài " Số phận của
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 57%|█████▋    | 114/201 [01:42<01:18,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: những người nói lên sự thật " phát hành, nhiều bạn đọc đã bày tỏ sự chia sẻ,
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 57%|█████▋    | 115/201 [01:43<01:17,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: ủng hộ anh Trương Xuân Đại. Một bạn đọc 67 tuổi ở Q.11 đến gửi tặng anh Trương
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 58%|█████▊    | 116/201 [01:44<01:16,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: Xuân Đại 150.000 đồng, một cô gái tên Nhung ở Tân Bình gửi tặng 100.000 đ,
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 58%|█████▊    | 117/201 [01:44<01:16,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: một thanh niên tên Hà đến gửi 200.000 đ. Sau đó nữa là rất
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 59%|█████▊    | 118/201 [01:45<01:15,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: nhiều bạn đọc gọi đến bày tỏ sự chia sẻ, ủng hộ.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 59%|█████▉    | 119/201 [01:46<01:14,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: Ban biên tập báo Tuổi Trẻ cũng quyết định gửi tặng nhóm công nhân
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 60%|█████▉    | 120/201 [01:47<01:13,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: đã tố cáo tiêu cực ở đường liên cảng A5 10 triệu đồng. Đừng để người dân
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 60%|██████    | 121/201 [01:48<01:12,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: đặt cược cho niềm tin! Qua báo chí, bản thân tôi đã được biết về việc tố cáo những
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 61%|██████    | 122/201 [01:49<01:11,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: sai phạm của công rình đường liên cảng A5 mấy năm trước đây, nhưng nay
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 61%|██████    | 123/201 [01:50<01:11,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: mới biết việc làm dũng cảm và tốt đẹp đó đã mang đến bao hệ lụy phiền phức
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 62%|██████▏   | 124/201 [01:51<01:10,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: cho những người trong cuộc, những người mà theo tôi vô cùng xứng đáng với danh
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([3, 100, 1280])


 62%|██████▏   | 125/201 [01:51<01:03,  1.19it/s]

DEBUG result:  <class 'str'>
Gốc: hiệu hiệp sĩ.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 63%|██████▎   | 126/201 [01:52<01:04,  1.16it/s]

DEBUG result:  <class 'str'>
Gốc: Thế nhưng những hiệp sĩ ấy giờ ra sao? Người thì lang thang, phiêu bạt, kẻ thì
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 63%|██████▎   | 127/201 [01:53<01:05,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: vợ bỏ, kẻ thì cày ải trên những con đường đô thị để lượm ve chai, phải tá túc trong
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 64%|██████▎   | 128/201 [01:54<01:05,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: những căn chòi tạm bợ sống qua ngày. Ngẫm sao mà thương thế! Đáng lẽ phải được
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 64%|██████▍   | 129/201 [01:55<01:04,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: tôn vinh thì trái lại những con người ấy đã bị đẩy xuống đáy cùng của cuộc
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 65%|██████▍   | 130/201 [01:56<01:04,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: sống! Cũng may mà anh Đại đã thắng kiện, đó chắc là một niềm an ủi và
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 65%|██████▌   | 131/201 [01:57<01:03,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: là một khẳng định để anh và các đồng nghiệp, người thân tin rằng các
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 66%|██████▌   | 132/201 [01:58<01:02,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: anh không đơn độc trong việc theo đuổi niềm tin về lẽ phải của mình.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 66%|██████▌   | 133/201 [01:59<01:02,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: Lại nữa, khi thanh tra đã xác định sai phạm sao không xử lý mà để " ngâm "
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([8, 100, 1280])


 67%|██████▋   | 134/201 [02:00<01:00,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: lâu ngày đến vậy? Tôi không phải là người trong lĩnh vực chuyên môn nhưng
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 67%|██████▋   | 135/201 [02:01<01:00,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: có thể hình dung công trình đường liên cảng A5 chắc là nhằm phục vụ hoạt động của
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 68%|██████▊   | 136/201 [02:02<00:59,  1.08it/s]

DEBUG result:  <class 'str'>
Gốc: các nhà đầu tư trong Khu chế xuất Tân Thuận. Vậy thì khi không khắc phục ngay
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 68%|██████▊   | 137/201 [02:03<00:58,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: mà còn để con đường xuống cấp thê thảm, có phải là góp thêm phần
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 69%|██████▊   | 138/201 [02:03<00:57,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: làm xấu đi môi trường đầu tư của thành phố hay không, và cũng
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 69%|██████▉   | 139/201 [02:04<00:57,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: đồng nghĩa với việc mất đi bao nhiêu cơ hội làm việc và cải thiện cuộc sống
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([7, 100, 1280])


 70%|██████▉   | 140/201 [02:05<00:54,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: của người lao động - đồng bào - hay không?
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 70%|███████   | 141/201 [02:06<00:53,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: Chúng ta " hoan nghênh và biểu dương những việc làm tốt của công nhân
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 71%|███████   | 142/201 [02:07<00:53,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: xây dựng trong việc thông tin, phản ánh sai phạm của công trình đường
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 71%|███████   | 143/201 [02:08<00:52,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: liên cảng A5 ", nhưng chắc là không có hình thức hoan nghênh và biểu
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 72%|███████▏  | 144/201 [02:09<00:52,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: dương nào thiết thực hơn đối với anh Đại và những đồng nghiệp là xử lý ngay
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 72%|███████▏  | 145/201 [02:10<00:51,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: những sai phạm (đã rõ mười mươi) và có biện pháp hữu hiệu khắc phục
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 73%|███████▎  | 146/201 [02:11<00:50,  1.08it/s]

DEBUG result:  <class 'str'>
Gốc: những sai phạm đó. Có như vậy niềm tin vào lẽ phải mới được khôi phục
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 73%|███████▎  | 147/201 [02:12<00:50,  1.07it/s]

DEBUG result:  <class 'str'>
Gốc: và người dân sẽ không còn phải đặt cược cho niềm tin của mình.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 74%|███████▎  | 148/201 [02:13<00:49,  1.08it/s]

DEBUG result:  <class 'str'>
Gốc: Phải là một câu chuyện đàng hoàng! Nhóm công nhân dũng cảm ấy gồm
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 74%|███████▍  | 149/201 [02:14<00:48,  1.08it/s]

DEBUG result:  <class 'str'>
Gốc: 20 người vậy mà hầu như nay đã lang bạt hết. Chỉ còn anh Đại và bốn
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 75%|███████▍  | 150/201 [02:14<00:47,  1.08it/s]

DEBUG result:  <class 'str'>
Gốc: người khác. Thân phận, cuộc sống của họ là bi đát, và điều mỉa mai cũng
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 75%|███████▌  | 151/201 [02:15<00:45,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: như làm chạnh lòng tôi là có phải họ đã xả thân vì đại nghĩa để rồi gia đình,
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 76%|███████▌  | 152/201 [02:16<00:44,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: vợ con ly tán, thất nghiệp, lâm vào cảnh đời tan nát như thế sao! Vì sao họ
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 76%|███████▌  | 153/201 [02:17<00:43,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: đã làm điều đó? Ba năm trôi qua, chắc hẳn đã hàng trăm, ngàn lần
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 77%|███████▋  | 154/201 [02:18<00:42,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: câu hỏi đó tự đến với họ hoặc đến từ người thân, bạn bè đi kèm sự chua
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([3, 100, 1280])


 77%|███████▋  | 155/201 [02:19<00:37,  1.22it/s]

DEBUG result:  <class 'str'>
Gốc: chát, ngậm ngùi.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 78%|███████▊  | 156/201 [02:20<00:38,  1.18it/s]

DEBUG result:  <class 'str'>
Gốc: Và hôm nay, chúng ta cũng cần hỏi câu hỏi này với chính mình.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 78%|███████▊  | 157/201 [02:20<00:38,  1.15it/s]

DEBUG result:  <class 'str'>
Gốc: KHÁI QUÁT VỀ BIỂN ĐẢO VIỆT NAM
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 79%|███████▊  | 158/201 [02:21<00:37,  1.14it/s]

DEBUG result:  <class 'str'>
Gốc: Nước ta giáp với biển Đông ở hai phía Đông và Nam. Vùng biển Việt Nam
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([5, 100, 1280])


 79%|███████▉  | 159/201 [02:22<00:34,  1.21it/s]

DEBUG result:  <class 'str'>
Gốc: là một phần biển Đông.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 80%|███████▉  | 160/201 [02:23<00:34,  1.17it/s]

DEBUG result:  <class 'str'>
Gốc: Bờ biển dài 3.260 km, từ Quảng Ninh đến Kiên Giang. Như vậy cứ 100 km2
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 80%|████████  | 161/201 [02:24<00:34,  1.15it/s]

DEBUG result:  <class 'str'>
Gốc: thì có 1 km bờ biển (trung bình của thế giới là 600 km2 đất liền / 1 km bờ biển).
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 81%|████████  | 162/201 [02:25<00:34,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: Biển có vùng nội thủy, lãnh hải, vùng đặc quyền kinh tế và thềm lục địa với
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 81%|████████  | 163/201 [02:26<00:33,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: diện tích trên 1 triệu km2 (gấp 3 diện tích đất liền : 1 triệu km2 /
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([3, 100, 1280])


 82%|████████▏ | 164/201 [02:26<00:29,  1.24it/s]

DEBUG result:  <class 'str'>
Gốc: 330.000 km2)
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 82%|████████▏ | 165/201 [02:27<00:30,  1.19it/s]

DEBUG result:  <class 'str'>
Gốc: Trong đó có 2 quần đảo Hoàng Sa, Trường Sa và 2.577 đảo lớn, nhỏ,
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 83%|████████▎ | 166/201 [02:28<00:29,  1.17it/s]

DEBUG result:  <class 'str'>
Gốc: gần và xa bờ, hợp thành phòng tuyến bảo vệ, kiểm soát và làm chủ
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([8, 100, 1280])


 83%|████████▎ | 167/201 [02:29<00:29,  1.14it/s]

DEBUG result:  <class 'str'>
Gốc: vùng biển.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 84%|████████▎ | 168/201 [02:30<00:29,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: Có vị trí chiến lược quan trọng : nối liền Thái Bình Dương với Ấn Độ Dương,
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 84%|████████▍ | 169/201 [02:31<00:28,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: châu Á với châu Âu, châu Úc với Trung Đông. Giao lưu quốc tế thuận
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([5, 100, 1280])


 85%|████████▍ | 170/201 [02:32<00:26,  1.18it/s]

DEBUG result:  <class 'str'>
Gốc: lợi, phát triển ngành biển.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 85%|████████▌ | 171/201 [02:33<00:26,  1.15it/s]

DEBUG result:  <class 'str'>
Gốc: Có khí hậu biển là vùng nhiệt đới tạo điều kiện cho sinh vật biển phát
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([3, 100, 1280])


 86%|████████▌ | 172/201 [02:33<00:22,  1.27it/s]

DEBUG result:  <class 'str'>
Gốc: triển, tồn tại tốt.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 86%|████████▌ | 173/201 [02:34<00:23,  1.22it/s]

DEBUG result:  <class 'str'>
Gốc: Có tài nguyên sinh vật và khoáng sản phong phú, đa dạng, quý hiếm.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 87%|████████▋ | 174/201 [02:35<00:22,  1.18it/s]

DEBUG result:  <class 'str'>
Gốc: Vùng biển và hải đảo nước ta có vị trí chiến lược hết sức to lớn, có ảnh hưởng
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 87%|████████▋ | 175/201 [02:36<00:22,  1.15it/s]

DEBUG result:  <class 'str'>
Gốc: trực tiếp đến sự nghiệp bảo vệ nền độc lập dân tộc và xây dựng chủ nghĩa
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 88%|████████▊ | 176/201 [02:37<00:21,  1.14it/s]

DEBUG result:  <class 'str'>
Gốc: xã hội, có liên quan trực tiếp đến sự phồn vinh của đất nước, đến văn
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([7, 100, 1280])


 88%|████████▊ | 177/201 [02:38<00:20,  1.17it/s]

DEBUG result:  <class 'str'>
Gốc: minh và hạnh phúc của nhân dân.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([6, 100, 1280])


 89%|████████▊ | 178/201 [02:38<00:18,  1.22it/s]

DEBUG result:  <class 'str'>
Gốc: BẢN CHẤT CỦA THÀNH CÔNG
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 89%|████████▉ | 179/201 [02:39<00:18,  1.19it/s]

DEBUG result:  <class 'str'>
Gốc: Đã bao giờ bạn tự hỏi thành công là gì mà bao kẻ bỏ cả cuộc đời mình theo đuổi? Phải chăng
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 90%|████████▉ | 180/201 [02:40<00:18,  1.17it/s]

DEBUG result:  <class 'str'>
Gốc: đó là kết quả hoàn hảo trong công việc, sự chính xác đến từng chi tiết? Hay đó là cách nói
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 90%|█████████ | 181/201 [02:41<00:17,  1.14it/s]

DEBUG result:  <class 'str'>
Gốc: khác của từ thành đạt, nghĩa là có được một cuộc sống giàu sang, được mọi người nể phục?
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 91%|█████████ | 182/201 [02:42<00:16,  1.13it/s]

DEBUG result:  <class 'str'>
Gốc: Vậy thì bạn hãy dành chút thời gian để lặng mình suy ngẫm.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 91%|█████████ | 183/201 [02:43<00:16,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: Cuộc sống sẽ chỉ cho bạn có những người thành đạt được thành công theo một cách giản dị đến bất
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 92%|█████████▏| 184/201 [02:44<00:15,  1.07it/s]

DEBUG result:  <class 'str'>
Gốc: ngờ
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 92%|█████████▏| 185/201 [02:45<00:14,  1.08it/s]

DEBUG result:  <class 'str'>
Gốc: Thành công là khi bố và con trai có dũng khí bước vào bếp, nấu những món ăn mẹ thích nhân
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 93%|█████████▎| 186/201 [02:46<00:13,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: ngày 8 - 3. Món canh có thể hơi mặn, món cá sốt đáng lẽ phải có màu đỏ sậm thì lại ngả sang
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 93%|█████████▎| 187/201 [02:47<00:12,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: màu... đen cháy. Nhưng nhìn mâm cơm, mẹ vẫn cười. Bởi vì hai bố con không thể thành
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 94%|█████████▎| 188/201 [02:48<00:11,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: công trên " chiến trường " bếp núc, nhưng lại thành công khi tặng mẹ " đoá hồng " của tình yêu.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 94%|█████████▍| 189/201 [02:48<00:10,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: Một món quà ý nghĩa hơn cả những món quà quý giá, hạnh phúc ấy long lanh in trong mắt
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([8, 100, 1280])


 95%|█████████▍| 190/201 [02:49<00:10,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: mẹ.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 95%|█████████▌| 191/201 [02:50<00:09,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: Thành công còn là hình ảnh một cậu bé bị dị tật ở chân, không bao giờ đi lại bình thường
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 96%|█████████▌| 192/201 [02:51<00:08,  1.09it/s]

DEBUG result:  <class 'str'>
Gốc: được. Từ nhỏ cậu đã nuôi ước mơ trở thành cầu thủ bóng đá. Sau bao nỗ lực khổ luyện, cậu
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 96%|█████████▌| 193/201 [02:52<00:07,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: bé trở thành cầu thủ dự bị trong một đội bóng nhỏ, và chưa bao giờ được chính thức ra sân.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 97%|█████████▋| 194/201 [02:53<00:06,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: Nhưng đó không phải là thất bại. Trái lại, thành công đã nở hoa khi cậu bé năm xưa, với bao
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 97%|█████████▋| 195/201 [02:54<00:05,  1.10it/s]

DEBUG result:  <class 'str'>
Gốc: nghị lực và quyết tâm, đã chiến thắng hoàn cảnh để theo đuổi ước mơ từ ngày thơ bé.
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([8, 100, 1280])


 98%|█████████▊| 196/201 [02:55<00:04,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: Thành công ấy, liệu có mấy người đạt được?
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 98%|█████████▊| 197/201 [02:56<00:03,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: Sau mỗi mùa thi đại học, có bao " sĩ tử " buồn rầu khi biết mình trở thành " sĩ tử ". Hai bảy điểm,
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 99%|█████████▊| 198/201 [02:57<00:02,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: cao thật đấy. Nhưng cao mà làm gì khi NV1 lấy tới hai bảy phẩy năm? Đó thật ra không phải
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


 99%|█████████▉| 199/201 [02:57<00:01,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: là thất bại, chỉ là khi thành công - bị - trì - hoãn mà thôi. Cuộc sống vẫn chào đón họ với
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([9, 100, 1280])


100%|█████████▉| 200/201 [02:58<00:00,  1.11it/s]

DEBUG result:  <class 'str'>
Gốc: NV2, NV3. Quan trọng là họ đã nỗ lực hết sức để khẳng định mình. Đó là ý nghĩa vẹn nguyên
Dự đoán: 
BASE:  torch.Size([1, 256, 1280])
PATCHES:  torch.Size([8, 100, 1280])


100%|██████████| 201/201 [02:59<00:00,  1.12it/s]

DEBUG result:  <class 'str'>
Gốc: của các kỳ thi, và cũng là bản chất của thành công.
Dự đoán: 





In [50]:
for i, r in enumerate(results[:5]):
    print(f"[Mẫu số {i + 1}]")
    print("Gốc     :", repr(r["gt"]))
    print("Dự đoán :", repr(r["pred"]))
    print("-" * 50)

[Mẫu số 1]
Gốc     : 'Thứ trưởng Bộ Tài nguyên & môi trường Đặng Hùng Võ tâm đắc với'
Dự đoán : ''
--------------------------------------------------
[Mẫu số 2]
Gốc     : 'cơ chế " khuyến khích nhà đầu tư thỏa thuận với người sử dụng đất để nhận'
Dự đoán : ''
--------------------------------------------------
[Mẫu số 3]
Gốc     : 'chuyển nhượng hoặc thuê quyền sử dụng đất, nhận góp vốn bằng quyền sử'
Dự đoán : ''
--------------------------------------------------
[Mẫu số 4]
Gốc     : 'dụng đất... " Nhưng tại hội nghị hôm qua, tiếng nói từ các sở tài nguyên'
Dự đoán : ''
--------------------------------------------------
[Mẫu số 5]
Gốc     : '& môi trường lại đều đồng thanh " loại bỏ " điều khoản này ra khỏi dự thảo.'
Dự đoán : ''
--------------------------------------------------


CER

In [51]:
from jiwer import cer

total_cer = 0.0
count = 0

for r in results:
    gt = r["gt"].strip()
    pred = r["pred"].strip()

    if len(gt) == 0:
        continue

    total_cer += cer(gt, pred)
    count += 1

avg_cer = total_cer / count
print(f"CER trên toàn bộ mẫu: {avg_cer:.4f}")


CER trên toàn bộ mẫu: 1.0000
