In [5]:
import io
import time
import logging
from urllib.parse import urlsplit, urlunsplit
import requests
import pandas as pd

def _redact_sas(url: str) -> str:
    """Masque le query-string SAS pour les logs."""
    parts = urlsplit(url)
    return urlunsplit((parts.scheme, parts.netloc, parts.path, "***", ""))

def load_excel_from_sas(sas_url: str, sheet_name=0, timeout=60, retries=3, backoff=1.5) -> pd.DataFrame:
    """
    Télécharge un .xlsx via SAS URL et le charge en DataFrame.
    - sheet_name: index/nom de feuille (0 par défaut)
    - timeout: seconds pour l'appel HTTP
    - retries/backoff: contrôles réseau simples
    """
    last_err = None
    for attempt in range(1, retries + 1):
        try:
            resp = requests.get(sas_url, stream=True, timeout=timeout)
            resp.raise_for_status()
            with io.BytesIO(resp.content) as buf:
                # openpyxl est utilisé par défaut pour .xlsx
                df = pd.read_excel(buf, sheet_name=sheet_name)
            return df
        except Exception as e:
            last_err = e
            # Ne pas logger le token SAS
            logging.warning(f"[load_excel_from_sas] tentative {attempt}/{retries} échouée pour { _redact_sas(sas_url) }: {e}")
            if attempt < retries:
                time.sleep(backoff ** attempt)
    # Si on est ici, toutes les tentatives ont échoué
    raise RuntimeError(f"Echec de téléchargement du fichier Excel via SAS URL (voir logs). Dernière erreur: {last_err}")


In [3]:


def entrypoint() -> dict:

    """
    Exemple d'entrypoint simple, avec entrée harcodée de la SAS URL
    Retourne quelques infos + aperçu DataFrame.
    """

     # Ici tu colles ton lien SAS complet (y compris le ?sv=...&sig=...)
    sas_url = "https://sthubessai00496503795985.blob.core.windows.net/cc9f393e-5235-4868-8754-9b633b054385-azureml-blobstore/essais/250915_IT_components_ACME_Simple_02.xlsx?sp=r&st=2025-09-15T16:51:54Z&se=2025-09-16T01:06:54Z&sv=2024-11-04&sr=b&sig=kEzbrXaZaSAlCAdhF5FK8Dj1vwKUv8agL9vNX6kQC3E%3D"
  
    df = load_excel_from_sas(sas_url, sheet_name=0)
    
    # Exemple: préserver les retours à la ligne des colonnes de description (déjà le cas par défaut).
    # Si vous sérialisez ensuite en JSON pour inspection :
    preview = df.head(5).to_dict(orient="records")
    

    return {
        "rows": len(df),
        "cols": len(df.columns),
        "columns": list(df.columns),
        "preview": preview
    }