In [3]:
#%pip install -q -U google-generativeai easyocr opencv-python-headless fastapi uvicorn python-multipart pyngrok nest_asyncio

In [4]:
import google.generativeai as genai
import easyocr
import cv2
import numpy as np
import json
import os
import uvicorn
import nest_asyncio
from fastapi import FastAPI, File, UploadFile, HTTPException
from pyngrok import ngrok
from PIL import Image
import io

In [None]:
# ---------------- CONFIGURATION ----------------
# D√©finition de la cl√© API Google pour l'acc√®s √† Gemini
print("üîê Initialisation de la cl√© API Google...")
os.environ['GOOGLE_API_KEY'] = "VOTRE_CLE_API_ICI" 
print("‚úÖ Cl√© API Google d√©finie dans les variables d'environnement.")

# Token d'authentification Ngrok (permet d'exposer un service local)
print("üåê Configuration du token Ngrok...")
NGROK_AUTH_TOKEN = "VOTRE_TOKEN_ICI"  # Cr√©ez un compte gratuit sur ngrok.com
print("‚úÖ Token Ngrok configur√©.")

# Configuration du SDK Gemini avec la cl√© API
print("‚öôÔ∏è Configuration du SDK Gemini...")
genai.configure(api_key=os.environ['GOOGLE_API_KEY'])
print("‚úÖ SDK Gemini configur√©.")

# Initialisation du mod√®le Gemini utilis√© pour la g√©n√©ration
print("ü§ñ Chargement du mod√®le Gemini (gemini-2.5-flash-lite)...")
model = genai.GenerativeModel('gemini-2.5-flash-lite')
print("‚úÖ Mod√®le Gemini pr√™t.")

# Initialisation OCR (Charg√© une seule fois au d√©marrage)
print("‚è≥ Chargement du mod√®le OCR EasyOCR (langues : EN, FR | GPU activ√©)...")
reader = easyocr.Reader(['en', 'fr'], gpu=True)
print("‚úÖ Mod√®le OCR charg√©.")


üîê Initialisation de la cl√© API Google...
‚úÖ Cl√© API Google d√©finie dans les variables d'environnement.
üåê Configuration du token Ngrok...
‚úÖ Token Ngrok configur√©.
‚öôÔ∏è Configuration du SDK Gemini...
‚úÖ SDK Gemini configur√©.
ü§ñ Chargement du mod√®le Gemini (gemini-2.5-flash-lite)...
‚úÖ Mod√®le Gemini pr√™t.
‚è≥ Chargement du mod√®le OCR EasyOCR (langues : EN, FR | GPU activ√©)...
‚úÖ Mod√®le OCR charg√©.


In [6]:
# ---------------- LOGIQUE ---------------- #

def clean_json_text(text):
    """
    üîπ Nettoie le texte brut pour ne garder que le JSON.
    Supprime les balises ```json et ``` √©ventuelles.
    """
    text = text.replace("```json", "").replace("```", "").strip()
    print("üßπ Texte nettoy√© pour JSON :", text[:100], "...")  # log des 100 premiers caract√®res
    return text


def process_image(img_cv):
    """
    üîπ Traite une image :
    1Ô∏è‚É£ OCR pour extraire le texte
    2Ô∏è‚É£ G√©n√©ration d'un JSON via Gemini selon le type document (Facture / Vin)
    """
    # A. OCR
    print("üì∏ D√©but OCR sur l'image...")
    result_ocr = reader.readtext(img_cv, detail=0)
    raw_text = " ".join(result_ocr)
    print("‚úÖ OCR termin√©. Texte extrait :", raw_text[:100], "...")  # log partiel pour lisibilit√©

    # B. PROMPT GEMINI
    prompt = f"""
    Tu es un assistant expert en extraction de donn√©es.
    Analyse ce texte brut OCR : "{raw_text}"
    
    D√©termine si c'est 'Facture' ou 'Vin'.
    
    Si FACTURE, extrais (JSON) :
    - type: "Facture"
    - date (JJ/MM/AAAA)
    - vendeur
    - montant_total
    - numero_facture
    
    Si VIN, extrais (JSON) :
    - type: "Vin"
    - nom
    - millesime
    - appellation
    - degre_alcool
    
    R√©ponds UNIQUEMENT en JSON valide.
    """
    print("‚úèÔ∏è Prompt envoy√© √† Gemini :", prompt[:200], "...")  # log partiel du prompt

    # Envoi du prompt au mod√®le Gemini
    print("ü§ñ G√©n√©ration du JSON via Gemini...")
    response = model.generate_content(prompt)
    print("‚úÖ R√©ponse Gemini re√ßue :", response.text[:200], "...")  # log partiel

    # Tentative de parsing JSON
    try:
        parsed_json = json.loads(clean_json_text(response.text))
        print("‚úÖ Parsing JSON r√©ussi :", parsed_json)
        return parsed_json
    except Exception as e:
        print("‚ö†Ô∏è Erreur parsing JSON :", e)
        return {"error": "Echec du parsing JSON", "raw_ai": response.text}


In [7]:
# ---------------- D√âFINITION DE L'API (FastAPI) ----------------

# Cr√©ation de l'application FastAPI
print("üöÄ Initialisation de l'API FastAPI...")
app = FastAPI()
print("‚úÖ API FastAPI pr√™te.")


# Endpoint racine pour v√©rifier si l'API est en ligne
@app.get("/")
def home():
    print("üè† Endpoint '/' appel√©")
    return {"status": "L'API OCR+Gemini est en ligne !"}


# Endpoint principal pour analyser une image
@app.post("/analyze")
async def analyze_endpoint(file: UploadFile = File(...)):
    print("üì© Endpoint '/analyze' appel√©")

    # V√©rification du type de fichier
    print("üîç V√©rification du type de fichier :", file.content_type)
    if not file.content_type.startswith('image/'):
        print("‚ùå Fichier non image re√ßu")
        raise HTTPException(status_code=400, detail="Le fichier doit √™tre une image.")
    print("‚úÖ Fichier image valid√©")

    try:
        # Lecture de l'image en m√©moire
        print("üñºÔ∏è Lecture du fichier image...")
        contents = await file.read()
        nparr = np.frombuffer(contents, np.uint8)
        img_cv = cv2.imdecode(nparr, cv2.IMREAD_COLOR)
        print("‚úÖ Image charg√©e en m√©moire pour traitement")

        # Traitement de l'image via OCR + Gemini
        print("‚öôÔ∏è Traitement de l'image avec OCR + Gemini...")
        result = process_image(img_cv)
        print("‚úÖ Traitement termin√©. R√©sultat :", result)
        return result

    except Exception as e:
        print("‚ö†Ô∏è Erreur lors du traitement :", str(e))
        return {"error": str(e)}


üöÄ Initialisation de l'API FastAPI...
‚úÖ API FastAPI pr√™te.


In [8]:
# ---------------- LANCEMENT DU SERVEUR ----------------
print("üîÑ Application du patch nest_asyncio pour Jupyter/async...")
nest_asyncio.apply()
print("‚úÖ nest_asyncio appliqu√©")

# Configuration du token Ngrok pour exposer localement le serveur
print("üåê Configuration du token Ngrok...")
ngrok.set_auth_token(NGROK_AUTH_TOKEN)
print("‚úÖ Token Ngrok configur√©")

# Nettoyage de toute connexion Ngrok existante
print("üßπ Fermeture des tunnels Ngrok existants...")
ngrok.kill()
print("‚úÖ Tunnels Ngrok ferm√©s")

# Cr√©ation d'un nouveau tunnel Ngrok sur le port 8000
print("üîå Cr√©ation d'un tunnel Ngrok sur le port 8000...")
tunnel = ngrok.connect(8000)
print(f"‚úÖ Tunnel Ngrok cr√©√©. URL publique : {tunnel.public_url}")

# Affichage des informations d'acc√®s √† l'API
print(f"\nüöÄ VOTRE API EST ACCESSIBLE ICI : {tunnel.public_url}")
print(f"üëâ Endpoint d'analyse : {tunnel.public_url}/analyze (M√©thode POST)")
print(f"üëâ Documentation auto : {tunnel.public_url}/docs")

# Configuration et lancement du serveur Uvicorn
print("‚öôÔ∏è Configuration du serveur Uvicorn...")
config = uvicorn.Config(app, port=8000)
server = uvicorn.Server(config)
print("üöÄ Lancement du serveur Uvicorn (CTRL+C pour arr√™ter)...")
await server.serve()


üîÑ Application du patch nest_asyncio pour Jupyter/async...
‚úÖ nest_asyncio appliqu√©
üåê Configuration du token Ngrok...
‚úÖ Token Ngrok configur√©
üßπ Fermeture des tunnels Ngrok existants...
‚úÖ Tunnels Ngrok ferm√©s
üîå Cr√©ation d'un tunnel Ngrok sur le port 8000...
‚úÖ Tunnel Ngrok cr√©√©. URL publique : https://2b8b2d996e55.ngrok-free.app

üöÄ VOTRE API EST ACCESSIBLE ICI : https://2b8b2d996e55.ngrok-free.app
üëâ Endpoint d'analyse : https://2b8b2d996e55.ngrok-free.app/analyze (M√©thode POST)
üëâ Documentation auto : https://2b8b2d996e55.ngrok-free.app/docs
‚öôÔ∏è Configuration du serveur Uvicorn...


INFO:     Started server process [91572]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://127.0.0.1:8000 (Press CTRL+C to quit)


üöÄ Lancement du serveur Uvicorn (CTRL+C pour arr√™ter)...
INFO:     89.30.29.68:0 - "GET /docs HTTP/1.1" 200 OK
INFO:     89.30.29.68:0 - "GET /openapi.json HTTP/1.1" 200 OK


INFO:     Shutting down
INFO:     Waiting for application shutdown.
INFO:     Application shutdown complete.
INFO:     Finished server process [91572]
