In [None]:
!pip install google-cloud-vision



In [None]:
import os
import re
from google.cloud import vision

# Set up Google Vision API authentication
os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = 'vision_key.json'


def extract_cheque_details(detected_text):
    """Extract specific details from the cheque's OCR text."""
    cheque_details = {}

    # Extract the number starting with "00799999"
    number_match = re.search(r'00799999\d+', detected_text)
    cheque_details['number'] = number_match.group() if number_match else None

    date_match = re.search(r'(?:في|Le)\s*(\d{1,2}[-./]\d{1,2}[-./]\d{4})', detected_text)
    cheque_details['date']= date_match.group(1) if date_match else None

    # Extract the amount (before or after "إدفعوا مقابل هذا الصك" or "Payez, contre ce chèque")
    amount_match = re.search(r'(?:DA)\s*(\d+)|(\d+)\s*(?:دج)', detected_text)
    cheque_details['amount'] = amount_match.group(1) if amount_match else None

    # Extract the name (assume it's in a recognizable pattern like "M.KHELIL FOUAD")
    name_match = re.search(r'M\.KHELIL FOUAD', detected_text)
    cheque_details['name'] = name_match.group() if name_match else None

    return cheque_details

def extract_cheque_data(path , extract_cheque_details):
    """Perform OCR on a cheque and extract specific details."""
    # Initialize the Vision API client
    client = vision.ImageAnnotatorClient()

    # Load the image
    with open(path, "rb") as image_file:
        content = image_file.read()

    # Create an Image object
    image = vision.Image(content=content)

    # Perform text detection
    response = client.document_text_detection(image=image)
    annotations = response.full_text_annotation

    if not annotations.text:
        print("No text detected.")
        return None

    # Extract the detected text
    detected_text = annotations.text

    a=extract_cheque_details(detected_text)

    return a


if __name__ == "__main__":
    # Path to the cheque image
    cheque_image_path = r'ccp.png'

    # Extract cheque data
    cheque_details = extract_cheque_data(cheque_image_path,extract_cheque_details)

    if cheque_details:
        print("\nExtracted Cheque Details:")
        for key, value in cheque_details.items():
            print(f"{key.capitalize()}: {value}")



Extracted Cheque Details:
Number: 00799999002569681332
Date: 02/12/2024
Amount: 2000
Name: M.KHELIL FOUAD


In [None]:
def extract_residence(detected_text):
  #the template of extraction here
  return detected_text

cheque_details = extract_cheque_data('residence.jpg', extract_residence)
q=cheque_details
q

'وزارة الداخلية\nولاية الجزائر\nدائرة الشراقة\nبلدية الحمامات\nالجمهورية الجزائرية الديمقراطية الشعبية\nبطاقة إقامة\nنَحْنُ\n61820060761605A6E7855CE7117303\nمنصوري\nتو فيق\nرئيس المجلس الشعبي البلدي لبلدية : الحمامات\nنَشْهَدُ بأن:\nالسيد\nبرحال محمد ساعد\nالمولود بـ الأبيار\nبتاريخ 1997/06/19\nالجنسية\nالمهنة\n************\nالسكن حي 502 مسكن عمارة ب 21 رقم 06 الحمامات الجزائر\nيقيم بنفس العنوان مُند أكثرَ مِن سِتَّةِ (6) أشهرٍ\nوقد سلمت له هَذِهِ الشَّهادَة لِلإدلاء بها في حدودِ ما يَسْمَحُ بِهِ القانون\nحرره\nالحمامات\nبتاريخ (1)\nوَالغَرضُ مِنْ مَنحِ هَذِهِ الشَّهَادَةِ هُوَ إثْبَات السكن\n2019/11/12\n(٢) إِنَّ صَلاحِيَّة العَمَل بهذهِ الشَّهادَةِ لا يُمكن أن تتجاوز سنة (6) أشهر\nالكتابة السابقة للإسم و اللقب\nالحالة المدنية\nالبلدي\nمنه\nBERRAHAL MOHAMED SAAD'