In [None]:
import io
import logging
from urllib.parse import urlsplit, urlunsplit
import requests
import pandas as pd


def my_python_tool(code_block_to_run: str, sas_url) -> str:
    """
    Exécute un bloc de code Python qui manipule un DataFrame `df`
    et doit définir une variable `answercode` (str, JSON, nombre, etc.).
    Retourne `answercode` sous forme de str.
    """
    # Charger le fichier Excel via SAS URL 
    # sas_url = sas_url
    df = load_excel_from_sas(sas_url, sheet_name=0)

    # Préparer un namespace pour exec : on y met les objets exposés au bloc
    ns = {
        "df": df,           # le DataFrame à interroger
        # Ajoutez ici ce que vous voulez autoriser : "pd": pandas, "np": numpy, etc.
    }

    # Exécuter le bloc dans ce namespace
    #   conséquence : toutes les variables créées (dont `answercode`) iront dans `ns`
    try:
        exec(code_block_to_run, ns)  # globals=ns, locals=None => locals == globals
    except Exception as e:
        # Faites remonter une erreur lisible dans Prompt Flow
        raise RuntimeError(f"Echec d'exécution du code fourni: {e}") from e

    # Récupérer `answercode` défini par le bloc
    if "answercode" not in ns:
        raise NameError(
            "Votre bloc doit définir une variable 'answercode'. "
            "Exemple :\n\n"
            "answercode = str(df.shape)\n"
            "# ou\n"
            "answercode = df.head(3).to_json(orient='records', force_ascii=False)"
        )

    # Convertir en chaîne pour le retour (Prompt flow attend souvent du texte)
    return str(ns["answercode"])
    

def _redact_sas(url: str) -> str:
    """Masque le query-string SAS pour les logs."""
    parts = urlsplit(url)
    return urlunsplit((parts.scheme, parts.netloc, parts.path, "***", ""))

def load_excel_from_sas(sas_url: str, sheet_name=0, timeout=60, retries=3, backoff=1.5) -> pd.DataFrame:
    """
    Télécharge un .xlsx via SAS URL et le charge en DataFrame.
    - sheet_name: index/nom de feuille (0 par défaut)
    - timeout: seconds pour l'appel HTTP
    - retries/backoff: contrôles réseau simples
    """
    last_err = None
    for attempt in range(1, retries + 1):
        try:
            resp = requests.get(sas_url, stream=True, timeout=timeout)
            resp.raise_for_status()
            with io.BytesIO(resp.content) as buf:
                # openpyxl est utilisé par défaut pour .xlsx
                df = pd.read_excel(buf, sheet_name=sheet_name)
            return df
        except Exception as e:
            last_err = e
            # Ne pas logger le token SAS
            logging.warning(f"[load_excel_from_sas] tentative {attempt}/{retries} échouée pour { _redact_sas(sas_url) }: {e}")
            if attempt < retries:
                time.sleep(backoff ** attempt)
    # Si on est ici, toutes les tentatives ont échoué
    raise RuntimeError(f"Echec de téléchargement du fichier Excel via SAS URL (voir logs). Dernière erreur: {last_err}")

In [None]:
def call_my_python_tool():
    code_block_to_run = "len(df[df['completion'] > 0.4])"
    sas_url= "https://sthubessai00496503795985.blob.core.windows.net/cc9f393e-5235-4868-8754-9b633b054385-azureml-blobstore/essais/250915_IT_components_ACME_Simple_02.xlsx?sp=r&st=2025-09-15T16:51:54Z&se=2025-09-16T01:06:54Z&sv=2024-11-04&sr=b&sig=kEzbrXaZaSAlCAdhF5FK8Dj1vwKUv8agL9vNX6kQC3E%3D"
    result=my_python_tool(code_block_to_run, sas_url)
    return(result)

In [16]:
call_my_python_tool()

NameError: name 'df' is not defined