### Goal :
* Application de l'OCR sur les images prétraitées
* Extraction du texte brut
* Stockage des coordonnées de chaque bloc de texte
* Évaluation de la qualité de l'OCR sur différents types de menus

Imports

In [11]:
import os
from azure.ai.formrecognizer import DocumentAnalysisClient
from azure.core.credentials import AzureKeyCredential
import requests
import json
from dotenv import load_dotenv

Loard env variables

In [19]:
load_dotenv() 

api_key = os.environ.get('azure_api_key')
endpoint = os.environ.get("azure_endpoint")  

Paths

In [13]:
marcello_path = "../Menu_img/Originals/marcello.jpg"
prima_path = "../Menu_img/Originals/menu-Prima-Family.jpg"
output_dir = '../data/raw_extracted/Azure_doc_intelligence'


Functions

In [14]:
# Fonction pour l'OCR avec Azure Document Intelligence
def extract_text_from_menu(image_path):
    """Extrait le texte d'une image de menu avec Azure Document Intelligence."""

    document_analysis_client = DocumentAnalysisClient(
        endpoint=endpoint, credential=AzureKeyCredential(api_key)
    )
    
    with open(image_path, "rb") as image:
        poller = document_analysis_client.begin_analyze_document(
            "prebuilt-read", document=image
        )
        result = poller.result()


    return result

In [15]:
# Fonction pour extraire le text brut du resultat de l'OCR
def to_raw_text(OCR_result):    
    extracted_text = ""
    for page in OCR_result.pages:
        for line in page.lines:
            extracted_text += line.content + "\n"
    return extracted_text

Results

In [None]:
# Application de l'OCR sur le menu marcello
result_marcello = extract_text_from_menu(marcello_path)

In [16]:
# Application de l'OCR sur le menu prima lova
result_prima = extract_text_from_menu(prima_path)

In [None]:
# Formatage du resultat de l'OCR de marcello
resultat_OCR_marcello = to_raw_text(result_marcello)

In [17]:
# Formatage du resultat de l'OCR de marcello
resultat_OCR_prima = to_raw_text(result_prima)

In [9]:
print(resultat_OCR_marcello)

Classiques
VERDURA
12,90
tomate', aubergines grillées, poivrons grillés, champignons
de Paris, oignons rouges, olives Leccine, huile de basilic, mozzarella
fdl
MIELINA
12.90
crème, chèvre, miel, mozzarella fdl'
TARTUFO
14.90
crème de truffes et champignons, mozzarella fdl'
(après cuisson, roquette, bresaola, copeaux de parmesan AOC)
MARGHERITA
9.90
tomate', olives Leccine, huile de basilic, mozzarella fdl'
REGINA
11,90
tomate', jambon blanc italien, champignons de Paris,
olives Leccine, huile de basilic, mozzarella fdl'
PARMA
14,90
tomate @ huile de basilic, mozzarella fdl' (après cuisson,
roquette, jambon de Parme, burrata, tomates cerises,
copeaux de parmesan AOC, crème de balsamique)
QUATTRO FORMAGGI
12,00
tomate', taleggio AOC, gorgonzola DOP,
parmigiano AOC, mozzarella fdl'
CALZONE CLASSICA
12,90
tomate', jambon blanc italien, oeuf, champignons de Paris,
huile de basilic, mozzarella fdl"
MARCELLO
14.90
crème, gorgonzola DOP, coppa, huile de basilic, mozzarella fdl'
(après cuisson,

In [None]:
# Enregistrement du resultat de marcello dans un fichier
with open(output_dir + '/result_OCR_marcello.txt', 'w', encoding='utf-8') as file:
    file.write(resultat_OCR_marcello)

In [18]:
# Enregistrement du resultat de prima dans un fichier
with open(output_dir + '/result_OCR_prima.txt', 'w', encoding='utf-8') as file:
    file.write(resultat_OCR_prima)

Conclusion : 

* Le resultat de l'OCR avec Azure document intelligence est tres satisfaisant.
* EasyOCR est moins performant mais a voir avec un preprocessing plus poussé.
* Point d'amelioration a prevoir : 
    * rotation des images en preprocessing car le modele ne gere pas correctement cette partie.
    * Pour le reste du preprocessing, le modele semble bien gerer mais tester la performance avec un preprocessing prealable.

