# การประเมินผล OCR (Optical Character Recognition)

โน้ตบุ๊กนี้แสดงวิธีการประเมินประสิทธิภาพของระบบ OCR โดยใช้ตัวชี้วัดสองตัว:

- CER (Character Error Rate) หรืออัตราความผิดพลาดระดับตัวอักษร
- ความแม่นยำ (Accuracy)

## ติดตั้งไลบรารีที่จำเป็น

In [None]:
%%capture
!pip install torch
!pip install torchmetrics

นำเข้าไลบรารีและการกำหนดฟังก์ชัน

- สร้างคลาส `CharErrorRate` และ คำนวณความผิดพลาด
- หรือใช้ฟังก์ชั่น `char_error_rate` เพื่อคำนวณ CER โดยตรง
- สำหรับ accuracy สามารถใช้ `==` เพื่อเทียบ string 2 ตัวได้เลย

In [None]:
import numpy as np
import torch
from torchmetrics.text import CharErrorRate

def calculate_cer(preds: list, targets: list):
    cer = CharErrorRate() # Initialize the CharErrorRate metric
    cer_val = cer(preds, targets) # Calculate CER
    return cer_val.tolist()

In [None]:
preds = ["สวัสดีครับ ยินดีต้อนรับ"]
targets = ["สวัสดีคับ ยินดีต้อนรบ"]

In [None]:
cer = calculate_cer(preds, targets)
print(f"Character Error Rate (CER): {cer:.2%}")

In [None]:
# Or use the build-in function to calculate CER
from torchmetrics.functional.text import char_error_rate

cer_rate = char_error_rate(preds, targets)
print(f"\nDetailed CER calculation: {cer_rate:.2%}")

In [None]:
accuracy = [int(pred == target) for pred, target
            in zip(preds, targets)]  # 1 if the strings are equal, 0 otherwise
print(f"\nAccuracy: {np.mean(accuracy)}")