# üìä 7 Questions : Construire un agent Text-to-SQL avec GPT-4.1

## üá´üá∑ Bienvenue dans ce workshop pratique ! üá¨üáß Welcome to this hands-on workshop!

Dans ce notebook, nous allons construire **progressivement** un agent intelligent capable de transformer des questions en langage naturel en requ√™tes SQL, puis d'ex√©cuter ces requ√™tes et m√™me de cr√©er des visualisations.

### üéØ Objectifs du workshop
- Comprendre les bases du **Text-to-SQL** avec les LLMs
- Ma√Ætriser la **sortie structur√©e** avec Pydantic 
- Impl√©menter un **syst√®me de m√©moire** conversationnelle
- Cr√©er un **agent autonome** avec function calling

### üõ†Ô∏è Pr√©requis
- Python ‚â• 3.10
- Une cl√© API OpenAI (GPT-4.1 recommand√©, GPT-4o compatible)
- Le fichier `catalogue.csv` dans le m√™me dossier

---

## üìñ Section 1 : Introduction & Setup

### Qu'est-ce que le Text-to-SQL ?

Le **Text-to-SQL** est une technique qui permet de convertir des questions en langage naturel en requ√™tes SQL. Par exemple :

- üó£Ô∏è **Question** : "Combien d'articles rouges avons-nous ?"
- üîç **SQL g√©n√©r√©** : `SELECT COUNT(*) FROM catalogue WHERE couleur = 'rouge'`

### Pourquoi utiliser des agents ?

Un **agent** peut encha√Æner plusieurs outils :
1. üß† G√©n√©rer du SQL √† partir d'une question
2. ‚ö° Ex√©cuter la requ√™te sur la base de donn√©es  
3. üìä Cr√©er une visualisation si n√©cessaire
4. üí¨ R√©pondre en langage naturel

C'est exactement ce que nous allons construire !

### üîß Installation des d√©pendances

Commen√ßons par installer les biblioth√®ques n√©cessaires :

In [1]:
# Installation des d√©pendances
!pip install openai>=1.0.0 pandas python-dotenv matplotlib ipython-sql pydantic

zsh:1: 1.0.0 not found


### üîë Configuration de la cl√© API OpenAI

Vous avez deux options pour d√©finir votre cl√© API :

**Option 1 : Fichier .env (recommand√©)**
```bash
# Cr√©ez un fichier .env dans le m√™me dossier que ce notebook
OPENAI_API_KEY=sk-your-key-here
```

API ressources : 
- https://platform.openai.com/docs/guides/text?api-mode=chat

In [11]:
# Imports et configuration
import os
import pandas as pd
import sqlite3
import json
from typing import List, Dict, Any
from dotenv import load_dotenv
from openai import OpenAI
from pydantic import BaseModel
import matplotlib.pyplot as plt
import matplotlib.style as style

# Chargement des variables d'environnement
load_dotenv()

# Configuration du client OpenAI
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

# Mod√®le par d√©faut (GPT-4.1)
DEFAULT_MODEL = "gpt-4.1-2025-04-14"  # Version stable de GPT-4.1
# Alternative pour les utilisateurs avec GPT-4o uniquement :
# DEFAULT_MODEL = "gpt-4o"

print("‚úÖ Configuration termin√©e !")
print(f"ü§ñ Mod√®le utilis√© : {DEFAULT_MODEL}")

# Test de la connexion
try:
    test_response = '...'
    """
    analysez la doc pour faire votre premier appel √† l'API OpenAI 
    """
    print("üîó Connexion √† l'API OpenAI r√©ussie !")
except Exception as e:
    print(f"‚ùå Erreur de connexion : {e}")
    print("üí° V√©rifiez votre cl√© API dans le fichier .env")

‚úÖ Configuration termin√©e !
ü§ñ Mod√®le utilis√© : gpt-4.1-2025-04-14
üîó Connexion √† l'API OpenAI r√©ussie !


---

## ‚öôÔ∏è Question 2 : Premi√®re requ√™te ‚Äì l'LLM renvoie du SQL brut

### üéØ Objectif
Faire en sorte que GPT-4.1 transforme une question en langage naturel en requ√™te SQL pure, sans explication.

### üìã √âtapes
1. Charger le fichier `catalogue.csv` dans SQLite
2. Analyser le sch√©ma de la base de donn√©es  
3. Cr√©er un prompt syst√®me optimis√©
4. Tester avec une question simple

In [3]:
# √âtape 1 : Chargement du catalogue en SQLite
def setup_database():
    """Charge le fichier catalogue.csv dans une base SQLite en m√©moire"""
    
    # Lecture du CSV
    try:
        df = pd.read_csv('catalogue.csv')
        print(f"üìä Fichier charg√© : {len(df)} lignes, {len(df.columns)} colonnes")
        print(f"üè∑Ô∏è Colonnes : {list(df.columns)}")
        
        # Affichage des premi√®res lignes
        print("\nüîç Aper√ßu des donn√©es :")
        print(df.head())
        
    except FileNotFoundError:
        print("‚ùå Fichier catalogue.csv non trouv√© !")
        print("üí° Assurez-vous qu'il soit dans le m√™me dossier que ce notebook")
        return None, None
    
    # Cr√©ation de la base SQLite en m√©moire
    conn = sqlite3.connect(':memory:')
    df.to_sql('catalogue', conn, index=False, if_exists='replace')
    
    print(f"\n‚úÖ Base de donn√©es cr√©√©e avec la table 'catalogue'")
    
    return conn, df

# Ex√©cution
conn, df = setup_database()

üìä Fichier charg√© : 590 lignes, 9 colonnes
üè∑Ô∏è Colonnes : ['external_id', 'reference', 'color', 'tra_value', 'size', 'label', 'ean', 'image', 'price']

üîç Aper√ßu des donn√©es :
  external_id reference color   tra_value  size           label  \
0  A065H94000     A065H   ALF  variante 7     0  3 BODIES US MC   
1  A065H94010     A065H   ALF  variante 7     1  3 BODIES US MC   
2  A065H94030     A065H   ALF  variante 7     3  3 BODIES US MC   
3  A065H94070     A065H   ALF  variante 7     7  3 BODIES US MC   
4  A065H94080     A065H   ALF  variante 7     8  3 BODIES US MC   

             ean                                              image  price  
0  3666072761781  https://www.petit-bateau.fr/dw/image/v2/BCKL_P...   22.0  
1  3666072761798  https://www.petit-bateau.fr/dw/image/v2/BCKL_P...   22.0  
2  3666072761828  https://www.petit-bateau.fr/dw/image/v2/BCKL_P...   22.0  
3  3666072761811  https://www.petit-bateau.fr/dw/image/v2/BCKL_P...   22.0  
4  3666072761835  https:/

In [None]:
# Exemple : Ex√©cuter une requ√™te SQL avec le connecteur conn
query = "VOTRE REQUETE SQL ICI"
cursor = conn.cursor()
cursor.execute(query)
results = cursor.fetchall()
print("Top 5 couleurs les plus fr√©quentes :")
for color, count in results:
    print(f"{color}: {count}")

Top 5 couleurs les plus fr√©quentes :
ZGA: 65
ZG9: 52
BFQ: 45
ZG7: 39
FOZ: 25


## Prenez le temps d'analyser la dataframe df et de comprendre les colonnes disponibles.

In [None]:
df.head() ...

## √âtape 2 : Analyse des donn√©es avec OpenAI

In [7]:
schema = """
D√©finissez ici le sch√©ma de votre base de donn√©es pour que le LLM puisse l'utiliser.
pr√©cisez le nom des colonnes et leurs types, des exemples de donn√©es, etc.

output attendu : string
"""

In [8]:
# √âtape 3 : Cr√©ation du prompt syst√®me optimis√©
def create_text_to_sql_prompt(schema_info):
    prompt = """Cr√©e un prompt syst√®me pour la g√©n√©ration de SQL"""
        
    return prompt

# Cr√©ation du prompt
text_to_sql_prompt = create_text_to_sql_prompt(schema)
print("üìù Prompt syst√®me cr√©√© :")
print("=" * 50)
print(text_to_sql_prompt[:300] + "..." if len(text_to_sql_prompt) > 300 else text_to_sql_prompt)

üìù Prompt syst√®me cr√©√© :
Cr√©e un prompt syst√®me pour la g√©n√©ration de SQL


In [9]:
# √âtape 4 : Fonction de g√©n√©ration SQL simple
def text_to_sql_basic(question: str) -> str:
    """Convertit une question en requ√™te SQL avec GPT-4.1.
    Utilisez l'api pour requeter OPENAI"""

    sql_query = 'la bonne query'
    return sql_query
    
# Test avec une question simple
test_question = "Donne-moi la requ√™te SQL pour sortir tous les articles rouges"

print(f"üó£Ô∏è Question : {test_question}")
print("=" * 60)

sql_result = text_to_sql_basic(test_question)
print(f"üîç SQL g√©n√©r√© :")
print(sql_result)

# Validation rapide de la syntaxe
if sql_result.startswith("SELECT") and sql_result.endswith(";"):
    print("\n‚úÖ La requ√™te semble syntaxiquement correcte !")
else:
    print("\n‚ö†Ô∏è La requ√™te pourrait avoir des probl√®mes de syntaxe")

üó£Ô∏è Question : Donne-moi la requ√™te SQL pour sortir tous les articles rouges
üîç SQL g√©n√©r√© :
la bonne query

‚ö†Ô∏è La requ√™te pourrait avoir des probl√®mes de syntaxe


### üß™ Mini-Quiz : Understanding Text-to-SQL

**Question** : Pourquoi demandons-nous √† GPT-4.1 de r√©pondre "uniquement par la requ√™te SQL" ?

<details>
<summary>üí° Cliquez pour voir la r√©ponse</summary>

**R√©ponse** : C'est pour avoir une sortie **d√©terministe** et **facile √† traiter programmatiquement**. Si le mod√®le ajoute du texte explicatif, il faudrait le parser pour extraire juste le SQL, ce qui est plus complexe et source d'erreurs.

Dans la prochaine section, nous verrons comment **Pydantic** nous permet de structurer encore mieux cette sortie !

</details>

---

## üóÇ Question 3 : Sortie structur√©e avec Pydantic

### üéØ Objectif
Utiliser **Pydantic** pour valider et structurer la r√©ponse de GPT-4.1, garantissant un format de sortie coh√©rent.

### üåü Pourquoi Pydantic ?
- ‚úÖ **Validation automatique** des types de donn√©es
- üõ°Ô∏è **Gestion d'erreur** robuste  
- üèóÔ∏è **Structure pr√©visible** pour notre code
- üìö Compatible avec l'API **Structured Outputs** d'OpenAI

### üìñ Ressources
- [OpenAI Structured Outputs Guide](https://platform.openai.com/docs/guides/structured-outputs)
- [Pydantic Documentation](https://docs.pydantic.dev/)

In [None]:
# D√©finition du mod√®le Pydantic pour la sortie structur√©e
class TextToSQLResponse(BaseModel):
    """Mod√®le complet pour la r√©ponse text-to-SQL
    definissez les keys necessaires et les bons types"""
    field1: list
    field2 : str
    query : int
    # A compl√©ter avec les champs n√©cessaires
 

# Affichage du sch√©ma JSON pour comprendre la structure
print("üìã Sch√©ma Pydantic g√©n√©r√© :")
print("=" * 40)
print(json.dumps(TextToSQLResponse.model_json_schema(), indent=2))

üìã Sch√©ma Pydantic g√©n√©r√© :
{
  "description": "Mod\u00e8le complet pour la r\u00e9ponse text-to-SQL\ndefinissez les keys necessaires et les bons types",
  "properties": {
    "field1": {
      "items": {},
      "title": "Field1",
      "type": "array"
    },
    "field2": {
      "title": "Field2",
      "type": "string"
    },
    "query": {
      "title": "Query",
      "type": "integer"
    }
  },
  "required": [
    "field1",
    "field2",
    "query"
  ],
  "title": "TextToSQLResponse",
  "type": "object"
}


In [23]:
#rappel
text_to_sql_prompt[:100]

'Cr√©e un prompt syst√®me pour la g√©n√©ration de SQL'

Pour cette question, utiliser le endpoint decrit dans cette doc :
- https://platform.openai.com/docs/guides/structured-outputs?api-mode=chat

In [None]:
def text_to_sql_structured(question: str) -> TextToSQLResponse:
    response = client.responses.parse(
       # a completer
    )
    return response.output_parsed

# Test de la fonction structur√©e
test_question = "Combien d'articles de couleur bleue avons-nous ?"

print(f"üó£Ô∏è Question : {test_question}")
print("=" * 60)

structured_result = text_to_sql_structured(test_question)

print(f"üîç Requ√™te SQL : {structured_result.query}")

# Validation du type
print(f"\n‚úÖ Type de retour : {type(structured_result)}")
print(f"üèóÔ∏è Validation Pydantic : {'R√©ussie' if structured_result.query else '√âchou√©e'}")


In [None]:
structured_result.query


In [None]:
# Comparaison entre l'approche basique et structur√©e
print("üî¨ COMPARAISON DES DEUX APPROCHES")
print("=" * 60)

test_questions = [
    "Quels sont les 5 articles les plus chers ?",
    "Donne-moi la moyenne des prix par cat√©gorie",
    "Combien d'articles contiennent le mot 'premium' ?"
]

for i, question in enumerate(test_questions, 1):
    print(f"\nüìù Test {i}: {question}")
    print("-" * 40)
    
    # Approche basique
    basic_result = text_to_sql_basic(question)
    print(f"üü° Basique: {basic_result}")
    
    # Approche structur√©e  
    struct_result = text_to_sql_structured(question)
    print(f"üü¢ Structur√©e: {struct_result.query}")


In [None]:
structured_result.model_dump_json()

---

## üß† Question 4 : Adding Memory (Conversation History)

### üéØ Objectif  
Maintenir un **historique de conversation** pour que l'agent puisse se souvenir des interactions pr√©c√©dentes et fournir des r√©ponses plus contextuelles.

Exemple : 
- Quels sont les articles rouges?
- Combien valent plus de 20 Euros?

### üîÑ Pourquoi la m√©moire est importante ?
- **Continuit√©** : "Maintenant trie par prix" fait r√©f√©rence √† la requ√™te pr√©c√©dente
- **Contexte** : L'agent comprend les questions de suivi
- **Exp√©rience utilisateur** : Conversation plus naturelle

### üí° Approche
Maintenir une liste de messages qui grandit au fil de la conversation.

In [None]:
# Classe pour g√©rer la m√©moire conversationnelle
class ConversationalSQLAgent:
    """Agent Text-to-SQL avec m√©moire conversationnelle"""
    
    def __init__(self, system_prompt: str):
        # Ajoute une consigne pour la prise en compte du contexte conversationnel
        #TODO
        historical_prompt = (
            system_prompt
            + "AJUSTER LE SYSTEME PROMPT POUR PRENDRE EN COMPTE L'HISTORIQUE DE LA CONVERSATION"
        )
        self.system_prompt = historical_prompt
        self.conversation_history = [
            {"role": "system", "content": historical_prompt}
            # tous les autres messages seront ajout√©s ici sous la forme de dictionnaires en precisant le role
            # message de l'utilisatuer : user, reponse de l'AI : assistant
        ]
        self.query_count = 0
    
    def add_user_message(self, message: str):
        """Ajoute un message utilisateur √† l'historique - ATTENTION A BIEN PRECISER LE ROLE USER DANS LE DICT"""
        self.conversation_history.append({"role": "user", "content": message})
    
    def add_assistant_message(self, message: str):
        """Ajoute une r√©ponse de l'assistant √† l'historique"""
        #TODO
    
    def generate_sql(self, question: str) -> TextToSQLResponse:
        #TODO
        """G√©n√®re du SQL en tenant compte de l'historique"""
        
        # Ajouter la question actuelle de l'utilisateur √† l'historique
        self.add_user_message(question)
        
        try:
            # Utilise la fonction structur√©e pour obtenir la r√©ponse.
            # L'historique est a jour avec la toute derniere question de l;utilisateur
            structured_result = client.responses.parse(...         #TODO
            
            # sauve la reponse du LLM dans l'historique en mode assistant. Ne pas oublier de formatter le BAseModel en JSON 
            self.add_assistant_message(structured_result.model_dump_json())
            self.query_count += 1
            return structured_result
            
        except Exception as e:
            error_response = TextToSQLResponse(
                query="SELECT 1; -- Erreur"
            )
            self.add_assistant_message(error_response.model_dump_json())
            return error_response
    
    def get_history_summary(self) -> str:
        """R√©sum√© de l'historique de conversation"""
        return f"Conversation: {len(self.conversation_history)} messages, {self.query_count} requ√™tes g√©n√©r√©es"
    
    def clear_history(self):
        """Remet √† z√©ro l'historique (garde le prompt syst√®me)"""
        self.conversation_history = [self.conversation_history[0]]  # Garde seulement le syst√®me
        self.query_count = 0

# Initialisation de l'agent conversationnel
conversational_agent = ConversationalSQLAgent(text_to_sql_prompt)
print("ü§ñ Agent conversationnel initialis√© !")
print(f"üìä √âtat initial : {conversational_agent.get_history_summary()}")


ü§ñ Agent conversationnel initialis√© !
üìä √âtat initial : Conversation: 1 messages, 0 requ√™tes g√©n√©r√©es


In [None]:
# Test de la m√©moire conversationnelle avec reset
print("üé≠ D√âMONSTRATION DE LA M√âMOIRE CONVERSATIONNELLE (avec reset)")
print("=" * 60)

# S√©quence de questions qui s'appuie sur le contexte
conversation_sequence = [
    "Montre-moi tous les articles plus chers que 20 euros",
    "Maintenant trie-les par prix d√©croissant", 
    "Limite √† 3 r√©sultats",
    "Ajoute aussi les articles bleus √† cette s√©lection"
]

for i, question in enumerate(conversation_sequence, 1):
    print(f"\nüí¨ Question {i}: {question}")
    print("-" * 30)
    
    result = conversational_agent.generate_sql(question)
    
    print(f"üîç SQL: {result.query}")
    print(f"üìù Historique: {conversational_agent.get_history_summary()}")
    

    # teste manuellement l'ex√©cution de la requ√™te SQL - pour verifier la validit√©
    try:
        cursor = conn.cursor()
        cursor.execute(result.query)
        rows = cursor.fetchall()
        print(f"‚úÖ Ex√©cution r√©ussie: {len(rows)} r√©sultats")
    except Exception as e:
        print(f"‚ùå Erreur d'ex√©cution: {e}")


In [None]:
print("\nüîÑ Maintenant, on va faire quelque chose de nouveau : on r√©initialise la m√©moire de l'agent !")
conversational_agent.clear_history()
print(f"üßπ Historique apr√®s reset: {conversational_agent.get_history_summary()}")

# Nouvelle s√©quence de questions ind√©pendantes
new_questions = [
    "Combien d'articles co√ªtent moins de 10 euros ?",
    "Quels sont les 2 articles les moins chers ?"
]

for i, question in enumerate(new_questions, 1):
    print(f"\nüí¨ Nouvelle question {i}: {question}")
    print("-" * 30)
    
    result = conversational_agent.generate_sql(question)
    
    print(f"üîç SQL: {result.query}")
    print(f"üìù Historique: {conversational_agent.get_history_summary()}")
    
    try:
        cursor = conn.cursor()
        cursor.execute(result.query)
        rows = cursor.fetchall()
        print(f"‚úÖ Ex√©cution r√©ussie: {len(rows)} r√©sultats")
    except Exception as e:
        print(f"‚ùå Erreur d'ex√©cution: {e}")

print(f"\nüéØ BILAN FINAL")
print(f"üìä {conversational_agent.get_history_summary()}")
print("‚ú® L'agent a bien r√©initialis√© et g√©r√© deux contextes s√©par√©s !")

---

## üîß Question 5 : Function / Tool Calling

### üéØ Objectif
Impl√©menter le **Function Calling** (Tool Calling) d'OpenAI pour que l'agent puisse :
1. üß† **G√©n√©rer** des requ√™tes SQL (`make_sql`)
2. ‚ö° **Ex√©cuter** les requ√™tes sur la base (`run_query`)

### üõ†Ô∏è Concept de Function Calling
Le mod√®le GPT-4.1 peut d√©cider quand et comment utiliser des outils externes. Il re√ßoit une description des outils disponibles et choisit lequel utiliser en fonction du contexte.

### üìö Flux de travail
1. **Question utilisateur** : "Combien d'articles rouges ?"
2. **GPT-4.1 d√©cide** : J'ai besoin de `make_sql` 
3. **Ex√©cution** : L'outil g√©n√®re `SELECT COUNT(*) FROM catalogue WHERE couleur = 'rouge';`

--- 
1. **Question utilisateur** : "execute la query SELECT * FROM TABLE"
2. **GPT-4.1 d√©cide** : J'ai besoin de runner `run_query_tool` 
3. **Ex√©cution** : L'outil execute la function avec l'argument `SELECT * FROM TABLE;`




Ressources : 
- https://platform.openai.com/docs/guides/function-calling?api-mode=chat

In [None]:
# D√©finition des outils (tools) disponibles pour l'agent

def make_sql_tool(question: str) -> str:
    #TODO

def run_query_tool(sql_query: str) -> str:
    """
    Outil : Ex√©cute une requ√™te SQL sur la base de donn√©es
    """
    
    #TODO
    df_result = pd.DataFrame(rows, columns=columns)
    
    if len(df_result) == 0:
        return "Aucun r√©sultat trouv√©."
    elif len(df_result) <= 10:
        return f"R√©sultats ({len(df_result)} lignes):\\n{df_result.to_string(index=False)}"
    else:
        return f"R√©sultats ({len(df_result)} lignes, affichage des 10 premi√®res):\\n{df_result.head(10).to_string(index=False)}"


# D√©finition des outils au format OpenAI Function Calling
tools_definition = [
   #TODO
]

print("üîß Outils d√©finis avec succ√®s !")
print("üìã Outils disponibles :")
for tool in tools_definition:
    func = tool["function"]
    print(f"  ‚Ä¢ {func['name']}: {func['description']}")

In [None]:
# Agent avec Function Calling
class ToolCallingAgent:
    """Agent qui utilise les outils via Function Calling """
    
    def __init__(self):
        self.tools = tools_definition
        self.conversation_history = []
        self.available_functions = {
            "make_sql": make_sql_tool,
            "run_query": run_query_tool
        }
    
    def chat(self, user_message: str) -> str:
        """Interface principale pour discuter avec l'agent """
        
        # Ajouter le message utilisateur
        self.conversation_history.append({"role": "user", "content": user_message})
        
        # Prompt syst√®me pour l'agent
        #TODO
        system_prompt = f"""modifier le systemen prompt pour prendre en compte les outils disponibles"""
        
        # Pr√©parer les messages avec le syst√®me
        messages = [{"role": "system", "content": system_prompt}] + self.conversation_history
        
        try:
            # Appel initial avec les outils
            response = client.chat.completions.create(
                #TODO
            )
            
            response_message = response.choices[0].message
            
            # V√©rifier si le mod√®le veut utiliser des outils
            if response_message.tool_calls:
                # Ajouter la r√©ponse du mod√®le √† l'historique
                self.conversation_history.append({
                    "role": "assistant", 
                    "content": response_message.content,
                    "tool_calls": response_message.tool_calls
                })
                
                # Ex√©cuter chaque outil demand√©
                for tool_call in response_message.tool_calls:
                    function_name = #get the function name from the tool call
                    function_args = #get the json args from the tool call
                    
                    print(f"üîß Utilisation de l'outil : {function_name}")
                    print(f"üì• Arguments : {function_args}")
                    
                    # Ex√©cuter la fonction
                    if function_name in self.available_functions:
                        function_result = self.available_functions[function_name](**function_args)
                        print(f"üì§ R√©sultat : {function_result[:100]}{'...' if len(str(function_result)) > 100 else ''}")
                        
                        # Ajouter le r√©sultat √† l'historique
                        self.conversation_history.append({
                            "tool_call_id": tool_call.id,
                            "role": "tool", 
                            "name": function_name,
                            "content": str(function_result)
                        })
                
                # Nouvel appel pour obtenir la r√©ponse finale
                final_response = client.chat.completions.create(
                    #prendre en compte l'historique mis √† jour avec la derniere reponse de l'outil
                )
                
                final_message = final_response.choices[0].message.content
                self.conversation_history.append({"role": "assistant", "content": final_message})
                
                return final_message
            
            else:
                # Pas d'outils utilis√©s, r√©ponse directe
                self.conversation_history.append({"role": "assistant", "content": response_message.content})
                return response_message.content
                
        except Exception as e:
            error_msg = f"Erreur lors du traitement : {e}"
            self.conversation_history.append({"role": "assistant", "content": error_msg})
            return error_msg



In [None]:
# Cr√©ation de l'agent avec tools
tool_agent = ToolCallingAgent()
print("ü§ñ Agent avec Function Calling initialis√© !")

# Test du Function Calling avec un dialogue complet
print("üé™ D√âMONSTRATION DU FUNCTION CALLING")
print("=" * 60)

test_questions = [
    "donne moi la query pour sortir tous les articles plus chers que 15 euros",
    "execute la query SELECT * FROM catalogue ORDER BY price ASC LIMIT 2;",
    "Combien d'articles rouges avons-nous ?",
    "Parmi ceux la, donne moi les 3 articles les plus chers",
]

for i, question in enumerate(test_questions, 1):
    print(f"\nüó£Ô∏è Question {i}: {question}")
    print("=" * 40)
    
    response = tool_agent.chat(question)
    
    print(f"\nü§ñ R√©ponse finale:")
    print(response)
    print("\n" + "-" * 40)

---

## ü§ñ Question 6 : Building a Simple Agent Loop

### üéØ Objectif
Cr√©er un **agent autonome** qui tourne en boucle et peut traiter plusieurs demandes de l'utilisateur de mani√®re interactive.

### üîÑ Concept d'Agent Loop
Un agent en boucle peut :
- Attendre des commandes utilisateur
- Traiter les demandes de mani√®re autonome
- Maintenir le contexte entre les interactions
- G√©rer les erreurs gracieusement
- Permettre √† l'utilisateur de sortir proprement

Exemple : quels sont les articles a moins de 30 Euros ?
- generer une query
- executer la query
- repondre a l'utilisateur

On est plus limite a un seul call de fonction

In [None]:
# Agent avec Function Calling am√©lior√© : boucle jusqu'√† satisfaction de la requ√™te utilisateur
class ToolCallingAgent:
    """Agent qui utilise les outils via Function Calling, avec boucle jusqu'√† r√©sultat final"""

    def __init__(self):
        self.tools = tools_definition
        self.conversation_history = []
        self.available_functions = {
            "make_sql": make_sql_tool,
            "run_query": run_query_tool
        }

    def reset_history(self):
        """R√©initialise l'historique de conversation"""
        self.conversation_history = []
        print("üßπ Historique r√©initialis√© !")
    
    def chat(self, user_message: str) -> str:
        """Interface principale pour discuter avec l'agent (boucle jusqu'√† r√©ponse finale)"""

        self.conversation_history.append({"role": "user", "content": user_message})

        system_prompt = " Definir le systeme prompt pour l'agent manager qui va appeler les differents outils " \
        "successivement jusqu'√† obtenir une r√©ponse satisfaisante. " 

        messages = [{"role": "system", "content": system_prompt}] + self.conversation_history

        try:
            while True:
                response = client.chat.completions.create(
                   #TODO: utiliser le mod√®le et les messages avec les outils disponibles
                )
                response_message = response.choices[0].message

                # Si le mod√®le demande un ou plusieurs outils
                if getattr(response_message, "tool_calls", None):
                    self.conversation_history.append({
                        "role": "assistant",
                        "content": response_message.content,
                        "tool_calls": response_message.tool_calls
                    })
                    for tool_call in response_message.tool_calls:
                        function_name = # TODO get the function name from the tool call
                        function_args = # TODO get the json args from the tool call
                        print(f"üîß Utilisation de l'outil : {function_name}")
                        print(f"üì• Arguments : {function_args}")

                        if function_name in self.available_functions:
                            function_result = self.available_functions[function_name](**function_args)
                            print(f"üì§ R√©sultat : {str(function_result)[:100]}{'...' if len(str(function_result)) > 100 else ''}")
                            self.conversation_history.append({
                                "tool_call_id": tool_call.id,
                                "role": "tool",
                                "name": function_name,
                                "content": str(function_result)
                            })
                    # Rafra√Æchir les messages pour la prochaine boucle
                    messages = [{"role": "system", "content": system_prompt}] + self.conversation_history
                    continue  # Boucle tant qu'il y a des tool_calls

                # Si pas d'outils demand√©s, r√©ponse finale
                self.conversation_history.append({"role": "assistant", "content": response_message.content})
                return response_message.content

        except Exception as e:
            error_msg = f"Erreur lors du traitement : {e}"
            self.conversation_history.append({"role": "assistant", "content": error_msg})
            return error_msg


In [None]:
interactive_agent = ToolCallingAgent()

# Test automatique de l'agent (simulation d'une session)
print("üé≠ SIMULATION D'UNE SESSION INTERACTIVE")
print("=" * 60)

# Simulation de commandes utilisateur
simulated_session = [
    "Combien d'articles avons-nous au total ?",
    "Montre-moi les articles contenant le mot 'bodies'",
    "Parmi ces articles, quels sont les 3 plus chers ?",
]

print("ü§ñ D√©marrage de la simulation...")
print("üìù Commandes √† tester :", simulated_session)
print("\\n" + "=" * 40)

for i,msg in enumerate(simulated_session):
    print('')
    print('')
    print(f"\\nüé¨ Simulation {i}: {msg}")
    print("-" * 30)
    
    # Traitement de la commande
    agent_answer = interactive_agent.chat(msg)
    print(f"ü§ñ R√©ponse de l'agent : {agent_answer}")
    print("-" * 30)
    
    if not agent_answer:
        print("‚ö†Ô∏è L'agent a demand√© l'arr√™t")
        break

print("\\nüé¨ Fin de la simulation")
print("üí° Pour une session r√©elle, ex√©cutez : interactive_agent.run_interactive_loop()")

In [None]:
interactive_agent = ToolCallingAgent()

# Test automatique de l'agent (simulation d'une session)
print("üé≠ SIMULATION D'UNE SESSION INTERACTIVE")
print("=" * 60)

# Simulation de commandes utilisateur
simulated_session = [
    "regarde successivement le nombre d'articles par couleur, puis la couleur de l'article le plus cher, et enfin les articles de cette couleur. ",
]

print("ü§ñ D√©marrage de la simulation...")
print("üìù Commandes √† tester :", simulated_session)
print("\\n" + "=" * 40)

for i,msg in enumerate(simulated_session):
    print(f"\\nüé¨ Simulation {i}: {msg}")
    print("-" * 30)
    
    # Traitement de la commande
    should_continue = interactive_agent.chat(msg)
    
    if not should_continue:
        print("‚ö†Ô∏è L'agent a demand√© l'arr√™t")
        break

print("\\nüé¨ Fin de la simulation")
print("üí° Pour une session r√©elle, ex√©cutez : interactive_agent.run_interactive_loop()")




## üìä Question 7 : Simplify it using the Agents SDK


Benefices: 
 - Gestion automatique du contexte
 - Gestion automatique de la boucle de l'agent, on definit uniquement les tools 

Resources : 
- https://openai.github.io/openai-agents-python/
- https://github.com/openai/openai-agents-python/blob/main/examples/basic/tools.py

In [None]:
pip install openai-agents

In [None]:
from agents import Agent, Runner, function_tool
import pandas as pd  # Ensure this is imported
import asyncio

# Assume conn and text_to_sql_structured are globally available
# e.g. conn = sqlite3.connect('your_db.sqlite') or similar

@function_tool
def make_sql(question: str) -> str:
    # TODO

@function_tool
def run_query(sql_query: str) -> str:
   #TODO

# Define the agent
sql_agent = Agent(
    name="SQL Assistant",
    instructions=(
        "your system prompt manager here"
    ),
    tools=[make_sql, run_query],
)

result = await Runner.run(sql_agent, "how many items below 10 euros do we have? ")  # type: ignore[top-level-await]  # noqa: F704
print(result.final_output)


# Showing streamed items

In [None]:
import asyncio
import pandas as pd
from agents import Agent, Runner, function_tool, ItemHelpers

# Assume conn and text_to_sql_structured are defined globally
# e.g. conn = sqlite3.connect('your_db.sqlite')


async def main(input_query):
    sql_agent = Agent(
        name="SQL Assistant",
        instructions=(
        "your system prompt manager here"
    ),
        tools=[make_sql, run_query],
    )

    result = Runner.run_streamed(sql_agent,input_query)
    
    print("=== Run starting ===")
    async for event in result.stream_events():
        if event.type == "raw_response_event":
            continue
        elif event.type == "agent_updated_stream_event":
            print(f"Agent updated: {event.new_agent.name}")
        elif event.type == "run_item_stream_event":
            item = event.item
            if item.type == "tool_call_item":
                print(f"-- Tool called: {item.raw_item.name}")
                print(f"   With input: {item.raw_item.arguments}")
            elif item.type == "tool_call_output_item":
                print(f"-- Tool output: {item.output}")
            elif item.type == "message_output_item":
                print(f"-- Message output:\n{ItemHelpers.text_message_output(item)}")
            print('')
    print("=== Run complete ===")

if __name__ == "__main__":
    asyncio.run(main("how many items below 10 euros do we have? "))  # type: ignore[top-level-await]  # noqa: F704
    print('==========')
    print('==========')

    asyncio.run(main("how many of them are red? "))  # type: ignore[top-level-await]  # noqa: F704

=== Run starting ===
Agent updated: SQL Assistant
-- Tool called: make_sql
   With input: {"question":"how many items below 10 euros do we have?"}

-- Tool output: SELECT COUNT(*) FROM catalogue WHERE price < 10;

-- Tool called: run_query
   With input: {"sql_query":"SELECT COUNT(*) FROM catalogue WHERE price < 10;"}

-- Tool output: R√©sultats (1 lignes):
 COUNT(*)
        3

-- Message output:
We have 3 items priced below 10 euros.

=== Run complete ===
=== Run starting ===
Agent updated: SQL Assistant
-- Tool called: make_sql
   With input: {"question":"How many products are red?"}

-- Tool output: SELECT COUNT(*) FROM catalogue WHERE color LIKE '%red%';

-- Tool called: run_query
   With input: {"sql_query":"SELECT COUNT(*) FROM catalogue WHERE color LIKE '%red%';"}

-- Tool output: R√©sultats (1 lignes):
 COUNT(*)
        0

-- Message output:
There are no red products in the catalog.

=== Run complete ===


# Maintainting conversation context between two conversations

In [78]:
# Alternative: Create a conversation manager class
class ConversationManager:
    def __init__(self, agent):
        self.agent = agent
        self.conversation_history = []
    
    async def ask(self, question):
        # Add the new user message to conversation history
        if self.conversation_history:
            new_input = self.conversation_history + [{"role": "user", "content": question}]
        else:
            new_input = question
        
        print(f"=== Processing: {question} ===")
        result = Runner.run_streamed(self.agent, new_input)
        
        async for event in result.stream_events():
            if event.type == "raw_response_event":
                continue
            elif event.type == "agent_updated_stream_event":
                print(f"Agent updated: {event.new_agent.name}")
            elif event.type == "run_item_stream_event":
                item = event.item
                if item.type == "tool_call_item":
                    print(f"-- Tool called: {item.raw_item.name}")
                    print(f"   With input: {item.raw_item.arguments}")
                elif item.type == "tool_call_output_item":
                    print(f"-- Tool output: {item.output}")
                elif item.type == "message_output_item":
                    print(f"-- Message output:\n{ItemHelpers.text_message_output(item)}")
                print('')
        
        # Update conversation history for next turn
        self.conversation_history = result.to_input_list()
        print("=== Processing Complete ===")
        return result

async def main_with_manager():
    sql_agent = Agent(
        name="SQL Assistant",
        instructions=(
            "You are an expert SQL assistant helping to analyze a product catalog database.\n"
            "Use the 'make_sql' tool to generate SQL queries from questions.\n"
            "Use the 'run_query' tool to execute SQL queries.\n"
            "Iterate as needed until you can provide a final answer to the user."
        ),
        tools=[make_sql, run_query],
    )
    
    conversation = ConversationManager(sql_agent)
    
    # Now these calls will maintain context
    await conversation.ask("how many items below 10 euros do we have?")
    await conversation.ask("how many of them are red?")
    await conversation.ask("what about blue ones?")

if __name__ == "__main__":

    
    # Option 2: Using conversation manager
    asyncio.run(main_with_manager())

=== Processing: how many items below 10 euros do we have? ===
Agent updated: SQL Assistant
-- Tool called: make_sql
   With input: {"question":"How many items are priced below 10 euros in the product catalog?"}

-- Tool output: SELECT COUNT(*) FROM catalogue WHERE price < 10;

-- Tool called: run_query
   With input: {"sql_query":"SELECT COUNT(*) FROM catalogue WHERE price < 10;"}

-- Tool output: R√©sultats (1 lignes):
 COUNT(*)
        3

-- Message output:
We have 3 items priced below 10 euros in the catalog.

=== Processing Complete ===
=== Processing: how many of them are red? ===
Agent updated: SQL Assistant
-- Tool called: make_sql
   With input: {"question":"How many red items are priced below 10 euros in the product catalog?"}

-- Tool called: make_sql
   With input: {"question":"How many red items are in the product catalog?"}

-- Tool output: SELECT COUNT(*) FROM catalogue WHERE color LIKE '%red%' AND price < 10;

-- Tool output: SELECT COUNT(*) FROM catalogue WHERE color LI

---

## üéä F√©licitations ! Workshop termin√© avec succ√®s !

### üèÜ Ce que vous avez accompli

1. **üìñ Compr√©hension des bases** : Text-to-SQL, agents, et GPT-4.1
2. **‚öôÔ∏è G√©n√©ration SQL** : Conversion de langage naturel en requ√™tes SQL
3. **üóÇ Sortie structur√©e** : Validation robuste avec Pydantic
4. **üß† M√©moire conversationnelle** : Contexte persistant entre les interactions
5. **üîß Function Calling** : Outils autonomes pour SQL et ex√©cution  
6. **ü§ñ Agent en boucle** : Interface interactive compl√®te
7. **üìä Openai Agents SDK ** : Comments Simplifier le code

### üöÄ Comment utiliser votre agent

```python
# Agent simple (questions individuelles)
response = advanced_agent.chat("Montre-moi un graphique des ventes par r√©gion")

# Agent interactif (session compl√®te)
interactive_agent = InteractiveAgent()
interactive_agent.run_interactive_loop()
```

### üí° Extensions possibles

- **üåê API REST** : Exposer l'agent via FastAPI
- **üîê Authentification** : Gestion des utilisateurs
- **üíæ Persistance** : Sauvegarde de l'historique
- **üìà Analytics** : M√©triques d'usage de l'agent
- **üé® Interface Web** : Frontend avec Streamlit ou React

### üìö Ressources pour aller plus loin

- **OpenAI Function Calling** : [Documentation officielle](https://platform.openai.com/docs/guides/function-calling)
- **Pydantic V2** : [Guide complet](https://docs.pydantic.dev/latest/)
- **Text-to-SQL avanc√©** : Recherchez "few-shot learning" et "RAG pour SQL"

---

**üéØ Merci d'avoir suivi ce workshop ! Vous ma√Ætrisez maintenant la cr√©ation d'agents Text-to-SQL avec GPT-4.1.**

*üë®‚Äçüíª Happy coding! üöÄ*