In [3]:
import shutil
import easyocr
import pytesseract
from PIL import Image
from pathlib import Path
from doctr.models import ocr_predictor
from doctr.io import DocumentFile
from paddleocr import PaddleOCR

img_path = '/home/nahumfg/GithubProjects/parliament-voting-records/data/procesamiento_todas_votaciones/b_zonas/00b74263-2ccc-5014-b3ab-f4e2617c1867_page003_/test_3.jpg'

# Cargar imagen
image = Image.open(img_path)

In [4]:
# 1️⃣ Tesseract OCR
print("🔹 Tesseract OCR:")
print(pytesseract.image_to_string(image, lang='spa'))
print("-" * 60)

# 2️⃣ EasyOCR
print("🔹 EasyOCR:")
reader = easyocr.Reader(['es'], gpu=False)
for line in reader.readtext(img_path, detail=1):
    text, score = line[1], line[2]
    print(f"Texto: {text} | Confianza: {score:.2f}")
print("-" * 60)

# 3️⃣ docTR
print("🔹 docTR:")
doc = DocumentFile.from_images(img_path)
model = ocr_predictor(pretrained=True)
result = model(doc)
for block in result.pages[0].blocks:
    for line in block.lines:
        text = " ".join([word.value for word in line.words])
        print(f"Línea: {text}")
print("-" * 60)


# 4️⃣ PaddleOCR
ocr = PaddleOCR(
    det_model_dir="models/det/ppocrv3_det_infer",
    rec_model_dir="models/rec/ppocrv3_rec_infer",
    use_angle_cls=True,
    lang="es",
)

result = ocr.ocr(str(img_path), cls=True)  

for line in result[0]:
    text = line[1][0]
    score = line[1][1]
    print(f"Texto: {text} | Confianza: {score:.2f}")



🔹 Tesseract OCR:
SI +++
aus
Abst.
SI +++
LO

SI +++
SI ++
Aus

Lo

NO ==-
SI +++
SI +++
SI +++
LE

SI +++
aus

NO ---
NO ===
NO ---
SI +++
SI +++
SI +44
SI +++
SI Hr
AbSt.
aus

SI +++

SI +++

------------------------------------------------------------
🔹 EasyOCR:
Progress: |██████████████████████████████████████████████████| 100.0% Complete



Progress: |██████████████████████████████████████████████████| 100.0% CompleteTexto: SI | Confianza: 0.97
Texto: aus | Confianza: 1.00
Texto: Abst. | Confianza: 0.99
Texto: SI | Confianza: 1.00
Texto: LO | Confianza: 0.39
Texto: SI | Confianza: 0.61
Texto: SI | Confianza: 0.99
Texto: aus | Confianza: 0.88
Texto: Lo | Confianza: 0.82
Texto: No | Confianza: 0.89
Texto: SI | Confianza: 0.98
Texto: SI | Confianza: 0.33
Texto: SI | Confianza: 0.92
Texto: LE | Confianza: 0.49
Texto: SI | Confianza: 0.95
Texto: aus | Confianza: 0.99
Texto: No | Confianza: 0.71
Texto: No | Confianza: 0.76
Texto: No | Confianza: 0.48
Texto: SI | Confianza: 1.00
Texto: SI | Confianza: 0.97
Texto: 5I | Confianza: 0.83
Texto: SI | Confianza: 0.46
Texto: SI | Confianza: 0.98
Texto: Abst | Confianza: 1.00
Texto: aus | Confianza: 0.67
Texto: SI | Confianza: 1.00
Texto: SI | Confianza: 1.00
Texto: SI | Confianza: 0.98
Texto: SI | Confianza: 0.81
Texto: SI | Confianza: 0.99
Texto: Abst | Confianza: 0.95
Texto: aus | Co

  0%|          | 0/65814772 [00:00<?, ?it/s]

Downloading https://doctr-static.mindee.com/models?id=v0.12.0/crnn_vgg16_bn-0417f351.pt&src=0 to /home/nahumfg/.cache/doctr/models/crnn_vgg16_bn-0417f351.pt


  0%|          | 0/63303144 [00:00<?, ?it/s]

Línea: SI
Línea: aus
Línea: Abst.
Línea: SI
Línea: +++
Línea: LO
Línea: SI
Línea: ++
Línea: SI
Línea: +++
Línea: aus
Línea: LO
Línea: NO
Línea: SI
Línea: +++
Línea: SI
Línea: +++
Línea: SI
Línea: +++
Línea: LE
Línea: SI
Línea: +++
Línea: aus
Línea: NO
Línea: NO
Línea: NO
Línea: SI
Línea: +++
Línea: SI
Línea: +++
Línea: SI
Línea: +
Línea: SI
Línea: +++
Línea: SI
Línea: +++
Línea: Abst.
Línea: aus
Línea: SI
Línea: + ++
Línea: SI
Línea: +++
Línea: SI
Línea: +++
Línea: SI
Línea: +
Línea: SI
Línea: +++
Línea: Abst.
Línea: aus
Línea: NO
Línea: Abst.
Línea: SI
Línea: +++
Línea: NO
Línea: NO
Línea: Abst.
Línea: aus
Línea: NO
Línea: SI
Línea: +++
Línea: SI
Línea: +++
Línea: Abst.
------------------------------------------------------------
download https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_infer.tar to models/det/ppocrv3_det_infer/en_PP-OCRv3_det_infer.tar


100%|██████████| 3910/3910 [00:19<00:00, 197.28it/s]


download https://paddleocr.bj.bcebos.com/PP-OCRv3/multilingual/latin_PP-OCRv3_rec_infer.tar to models/rec/ppocrv3_rec_infer/latin_PP-OCRv3_rec_infer.tar


100%|██████████| 9930/9930 [00:02<00:00, 3502.44it/s]


download https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar to /home/nahumfg/.paddleocr/whl/cls/ch_ppocr_mobile_v2.0_cls_infer/ch_ppocr_mobile_v2.0_cls_infer.tar


100%|██████████| 2138/2138 [00:18<00:00, 115.43it/s]

[2025/10/29 15:23:26] ppocr DEBUG: Namespace(help='==SUPPRESS==', use_gpu=False, use_xpu=False, use_npu=False, use_mlu=False, use_gcu=False, ir_optim=True, use_tensorrt=False, min_subgraph_size=15, precision='fp32', gpu_mem=500, gpu_id=0, image_dir=None, page_num=0, det_algorithm='DB', det_model_dir='models/det/ppocrv3_det_infer', det_limit_side_len=960, det_limit_type='max', det_box_type='quad', det_db_thresh=0.3, det_db_box_thresh=0.6, det_db_unclip_ratio=1.5, max_batch_size=10, use_dilation=False, det_db_score_mode='fast', det_east_score_thresh=0.8, det_east_cover_thresh=0.1, det_east_nms_thresh=0.2, det_sast_score_thresh=0.5, det_sast_nms_thresh=0.2, det_pse_thresh=0, det_pse_box_thresh=0.85, det_pse_min_area=16, det_pse_scale=1, scales=[8, 16, 32], alpha=1.0, beta=1.0, fourier_degree=5, rec_algorithm='SVTR_LCNet', rec_model_dir='models/rec/ppocrv3_rec_infer', rec_image_inverse=True, rec_image_shape='3, 48, 320', rec_batch_num=6, max_text_length=25, rec_char_dict_path='/home/nahumf




[2025/10/29 15:23:27] ppocr DEBUG: dt_boxes num : 71, elapsed : 0.03667187690734863
[2025/10/29 15:23:27] ppocr DEBUG: cls num  : 71, elapsed : 0.06295490264892578
[2025/10/29 15:23:27] ppocr DEBUG: rec_res num  : 71, elapsed : 0.22912836074829102
Texto: S1 | Confianza: 0.51
Texto: +++ | Confianza: 0.99
Texto: aus | Confianza: 1.00
Texto: Abst. | Confianza: 0.97
Texto: SI | Confianza: 0.88
Texto: +++ | Confianza: 0.91
Texto: LO | Confianza: 0.95
Texto: ST | Confianza: 0.93
Texto: +++ | Confianza: 0.97
Texto: 51 | Confianza: 0.83
Texto: +++ | Confianza: 0.86
Texto: aus | Confianza: 1.00
Texto: LO | Confianza: 0.97
Texto: NO | Confianza: 0.99
Texto: --- | Confianza: 0.75
Texto: SI | Confianza: 0.79
Texto: +++ | Confianza: 1.00
Texto: S1 | Confianza: 0.79
Texto: +++ | Confianza: 0.88
Texto: S1 | Confianza: 0.63
Texto: +++ | Confianza: 0.99
Texto: LE | Confianza: 1.00
Texto: S1 | Confianza: 0.68
Texto: +++ | Confianza: 0.99
Texto: aus | Confianza: 1.00
Texto: NO | Confianza: 0.98
Texto: --