# Notebook : Génération d'Images, Low-Code AI, Function Calling, RAG

Dans ce notebook, nous allons tour à tour découvrir :

1. Comment générer des **images** à partir de prompts en texte (ex: DALL-E, Midjourney).
2. Comment créer des **applications low-code** enrichies par l'IA, grâce à **Power Platform** (Copilot, AI Builder).
3. **Function Calling** côté OpenAI : structurer les réponses d’un LLM pour déclencher des actions.
4. **RAG** (Retrieval Augmented Generation) et **bases vectorielles** (indexation, recherche sémantique, chunking, etc.).



## Prérequis & Installation

- **Python 3.9+** (ou version ultérieure).
- Un compte [OpenAI](https://platform.openai.com/) et une clé d’API valide.
- Le fichier `.env` contenant votre clé d’API :
OPENAI_API_KEY=sk-...




## 1.1 Pourquoi générer des images ?

La génération d'images via IA offre une multitude d'applications : 
- prototypes visuels (design, marketing, art),
- éducation (illustrations d’un cours, images pour un devoir),
- game dev (concept art), 
- usage créatif (avatars, logos).

Deux modèles phares : 
- **DALL-E** (OpenAI)
- **Midjourney**


In [49]:
# ============================
# Cellule 1 : Installation
# ============================

%pip install openai tiktoken python-dotenv
# Remarque : Aucune fin de ligne en commentaire pour éviter l'erreur


Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 24.3.1 -> 25.0
[notice] To update, run: python.exe -m pip install --upgrade pip


In [52]:
import os
import requests
# from PIL import Image
from IPython.display import Image
from IPython.core.display import HTML 
import openai
from dotenv import load_dotenv

# Charger le fichier .env pour la clé OPENAI_API_KEY
load_dotenv()

# Config globale
openai.api_key = os.getenv("OPENAI_API_KEY")

try:
    response = openai.images.generate(
        prompt="Lapin sur un cheval tenant une sucette, dans un champ brumeux"
    )
    # response est un ImagesResponse
    image_url = response.data[0].url
    print("Image URL:", image_url)

    # Téléchargement de l'image
    # img_data = requests.get(image_url).content
    # with open("my_image.png","wb") as f:
    #     f.write(img_data)

    # # Ouverture
    # img = Image.open("my_image.png")
    # img.show()
    
    
    image = Image(url= image_url)
    display(image)

except openai.APIConnectionError as e:
    print("Erreur de connexion réseau:", e)
except openai.RateLimitError as e:
    print("Limite atteinte ou quota dépassé:", e)
except openai.APIStatusError as e:
    print("Erreur HTTP renvoyée par l'API (4xx, 5xx, etc.):", e)
except openai.APIError as e:
    print("Autre erreur OpenAI:", e)


Image URL: https://oaidalleapiprodscus.blob.core.windows.net/private/org-3vPGVqYeKnTllNNI566kc9VD/user-f6xh2Ni7M3g4e6BRSpvSRb4A/img-wFVWcradlWiyGJlQRtEP889Y.png?st=2025-02-03T09%3A51%3A44Z&se=2025-02-03T11%3A51%3A44Z&sp=r&sv=2024-08-04&sr=b&rscd=inline&rsct=image/png&skoid=d505667d-d6c1-4a0a-bac7-5c84a87759f8&sktid=a48cca56-e6da-484e-a814-9c849652bcb3&skt=2025-02-02T16%3A41%3A05Z&ske=2025-02-03T16%3A41%3A05Z&sks=b&skv=2024-08-04&sig=uHSkp8FnrgFDFN2Mqw4D6kW6fFAkvgOV2oek4lToS/g%3D


## 1.2 Méta-prompts et usage responsable

Pour gérer un usage plus responsable et filtrer des images non souhaitées, on peut ajouter un 
**meta-prompt** en amont, décrivant les restrictions (ex: Safe for Work, No adult content, etc.).

Ex:
You are an assistant that only generates children-friendly images. [... consignes ...]


# 2. Low-Code AI Apps (Power Platform)

## 2.1 Introduction
Power Platform inclut :
- Power Apps (construction rapide d'apps)
- Power Automate (workflows et automatisations)
- Dataverse (stockage de données)
- AI Builder (modèles IA pré-construits)
- Copilot (assistant pour générer tables, flux, e-mails)

Avantages : construction **no-code / low-code** pour mettre en place des solutions rapidement, 
y compris connectées à des services IA.


## 2.2 Copilot dans Power Apps : Student Assignment Tracker

Exemple : On veut un **Student Assignment Tracker**.

1. Sur la home de [Power Apps](https://make.powerapps.com), on saisit dans la zone Copilot : 
   "I want an app to track and manage student assignments."
2. Copilot propose une table Dataverse (champs Title, DateDue, StudentName, etc.)
3. Personnaliser la table (ajouter `StudentEmail`, etc.)
4. Cliquer "Create app" => Copilot génère une **Canvas App** auto.
5. Ajouter une page (screen) pour "Envoyer un email" (Prompt : "I want a screen to send an email to the student").

On obtient en quelques clics un début d'application.


## 2.3 Copilot dans Power Automate : Invoice Processing

Même concept : Dans [Power Automate](https://make.powerautomate.com),
on demande "Process an invoice when it arrives in my mailbox", 
Copilot propose un flux (trigger: new mail arrives + extractions + email)...

On peut ensuite y intégrer **AI Builder** : 
- ex: le prébuilt model "Invoice Processing" pour extraire `supplier`, `amount`, etc.
- stocker dans Dataverse, 
- email de confirmation.

C’est un gros gain de temps pour la finance ou la logistique !


# 3. Function Calling (OpenAI)


## 3.1 Pourquoi ?

Sans function calling, le LLM renvoie du texte non structuré. 
Difficile d’automatiser (ex: parse JSON, exécuter une fonction tierce).
Avec function calling, on déclare un `schema` JSON, 
le LLM répond par un `function_call`: 
- Nom de la fonction 
- Arguments structurés

Ensuite on exécute la fonction en Python (ou autre).


In [None]:
import openai

messages = [
    {"role": "user", "content": "Find me a good course for a beginner developer to learn Azure."}
]

functions = [
  {
    "name": "search_courses",
    "description": "Retrieves relevant courses based on role, product & level",
    "parameters": {
      "type": "object",
      "properties": {
        "role":   {"type":"string","description":"the role of the user"},
        "product":{"type":"string","description":"the product/tech"},
        "level": {"type":"string","description":"the user skill level"}
      },
      "required": ["role","product","level"]
    }
  }
]


try:
    response = openai.chat.completions.create(
        model="gpt-3.5-turbo",  
        messages=messages,
        functions=functions,
        function_call="auto"  # laisse le LLM décider s’il appelle la fonction
    )

    print("Réponse brute:\n", response.choices[0].message)

except openai.RateLimitError as e:
    print("Limite atteinte:", e)
except openai.APIError as e:
    print("Autre erreur:", e)


In [None]:
import json


def search_courses(role,product,level):
    # Ton code Python => Appel API Microsoft Learn
    # On renvoie un JSON/string
    return "Liste de cours: Azure Fundamentals, etc."

resp_msg = response.choices[0].message
if resp_msg.function_call:
    fn_name = resp_msg.function_call.name
    fn_args = json.loads(resp_msg.function_call.arguments)
    
    # Exécuter la fonction Python correspondante
    result = search_courses(**fn_args)

    # On crée deux messages :
    # 1) le function_call
    # 2) le role="function" + content du résultat
    second_messages = [
      {"role":"assistant","function_call": {"name":fn_name,"arguments":resp_msg.function_call.arguments}},
      {"role":"function","name":fn_name,"content": result}
    ]

    # On relance le chat
    final_resp = openai.chat.completions.create(
       model="gpt-3.5-turbo",
       messages=messages + second_messages
    )
    print("Réponse finale:\n", final_resp.choices[0].message.content)


# 4. Retrieval Augmented Generation & Vector Databases

## 4.1 Principe
Un LLM (ex: GPT) a une limite : il ne connaît pas forcément nos documents internes. 
RAG => on stocke nos docs dans une base vectorielle (embeddings), 
puis à chaque question, on envoie au LLM les passages pertinents (retrieval + augmentation).

## 4.2 Création d’une base vectorielle

- On découpe (chunk) nos documents en petits segments (ex: 400 tokens).
- On calcule embeddings (ex: text-embedding-ada-002).
- On stocke : ex. Cosmos DB, Pinecone, ChromaDB, Elasticsearch, Qdrant, etc.

In [None]:
%pip install scikit-learn numpy pandas


In [None]:
%pip install requests beautifulsoup4 lxml


In [None]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

# URL du débat
url = "https://home.nps.gov/liho/learn/historyculture/debate1.htm"

# Requête HTTP
response = requests.get(url)
html = response.text  # contenu HTML sous forme de string

# On parse avec BeautifulSoup
soup = BeautifulSoup(html, "html.parser")

# Sélection du noeud principal.
# Selon ton info: div.ColumnMain:nth-child(2)
# (Le "nth-child(2)" est parfois incertain, on peut tenter un select plus large.)
main_div = soup.select_one("div.ColumnMain")

if not main_div:
    raise ValueError("Impossible de trouver le div.ColumnMain dans la page !")

# Extraction du texte brut (on sépare par " " pour éviter les collisions)
debate_text = main_div.get_text(separator="\n", strip=True)

# Pour débogage:
print("=== Longueur du texte récupéré:", len(debate_text))
print(debate_text[:500], "...")


In [None]:
df = pd.DataFrame(
    [
        {
            "title":"First Debate: Ottawa, Illinois (NPS)",
            "text": debate_text
        }
    ]
)
df


In [None]:
def split_text_into_chunks(text, chunk_size=500, overlap=50):
    words = text.split()
    chunks = []
    start = 0
    while start < len(words):
        end = start + chunk_size
        chunk_words = words[start:end]
        chunk = " ".join(chunk_words)
        chunks.append(chunk)
        start += (chunk_size - overlap)
    return chunks

rows = []
for _, row in df.iterrows():
    splitted = split_text_into_chunks(row["text"], chunk_size=400, overlap=50)
    for chunk in splitted:
        rows.append({
            "title": row["title"],
            "chunk": chunk
        })

df_chunks = pd.DataFrame(rows)
print("Nombre de chunks =", len(df_chunks))
df_chunks.head()


In [47]:
from openai import OpenAI

# Initialiser le client OpenAI (indispensable avec la nouvelle API)
client = OpenAI()

def create_embedding(text: str):
    try:
        response = client.embeddings.create(
            model="text-embedding-ada-002",
            input=[text]  # ⚠️ Doit être une **liste**
        )
        return response.data[0].embedding  # Extraction correcte

    except Exception as e:
        print(f"⚠️ Erreur lors de la génération d'embedding: {e}")
        return None


In [None]:
import numpy as np
from sklearn.neighbors import NearestNeighbors

# Générer les embeddings pour les chunks du DataFrame
df_chunks["embedding"] = df_chunks["chunk"].apply(create_embedding)

# Nettoyage des embeddings
all_vectors = np.array([emb for emb in df_chunks["embedding"] if emb is not None])  # Exclure None
nn = NearestNeighbors(n_neighbors=3, metric="euclidean")
nn.fit(all_vectors)

def retrieve(user_query: str) -> str:
    try:
        # Générer l'embedding de la requête
        q_emb = create_embedding(user_query)
        if q_emb is None:
            return "⚠️ Impossible de générer un embedding pour la requête."

        dist, idx = nn.kneighbors([q_emb])

        # Récupérer les meilleurs chunks
        best_chunks = df_chunks.iloc[idx[0]]["chunk"].tolist()
        prompt = user_query + "\n\n" + "\n".join(best_chunks)

        # ✅ Appel OpenAI corrigé
        response = client.chat.completions.create(
            model="gpt-3.5-turbo",
            messages=[{"role": "user", "content": prompt}]
        )

        return response.choices[0].message.content if response.choices else "⚠️ Aucune réponse générée."

    except Exception as e:
        return f"⚠️ Erreur lors de la récupération : {str(e)}"


# 🔥 Test avec la question sur Lincoln
question = "What did Lincoln argue about slavery in that first debate?"
answer = retrieve(question)
print("🔍 Réponse générée :\n", answer)


# 5. Conclusion & Pistes

Nous avons exploré :
- la génération d’images (DALL-E, prompts, meta-prompts),
- la création d’apps low-code Power Apps / Automate,
- l’usage de Copilot & AI Builder pour des scénarios métiers (tracking, invoice),
- la structuration des réponses via Function Calling,
- RAG : indexer nos docs dans une base vectorielle et enrichir un LLM.

Pistes d’exercices :
- Améliorer les prompts d’images (température, variations, mask, etc.)
- Créer un flux complet dans Power Automate avec AI Builder
- Mettre en place Function Calling plus complexe (multi-fonctions, error-handling)
- Stocker un doc plus large (ex: 10 pages PDF) en chunks + RAG

Fin de la synthèse ! 
