In [3]:

# RAG system using OpenAI embeddings + FAISS + Excel anomaly data
import openai
import pandas as pd
import numpy as np
import faiss
import time

# ========================
# CONFIG
# ========================
openai.api_key = "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"
EMBEDDING_MODEL = "text-embedding-3-small"
GPT_MODEL = "gpt-4-turbo"
EXCEL_PATH = "test02.xlsx"  # Your Excel file with anomalies
TOP_K = 5  # Number of chunks to retrieve

# ========================
# Load and Prepare Data
# ========================
df = pd.read_excel(EXCEL_PATH)
df["content"] = (
    df["Systeme"].astype(str) + " | " +
    df["Description"].astype(str) + " | " +
    df["Description de l'équipement"].astype(str)
)

# ========================
# Get Embedding
# ========================
def get_embedding(text):
    try:
        response = openai.embeddings.create(input=text, model=EMBEDDING_MODEL)
        return response.data[0].embedding
    except Exception as e:
        print("Error in embedding:", e)
        return [0.0] * 1536  # Fallback if embedding fails

# ========================
# Compute or Load Embeddings
# ========================
print("Embedding dataset...")
df["embedding"] = df["content"].apply(lambda x: get_embedding(x))
embedding_matrix = np.array(df["embedding"].tolist()).astype("float32")

# ========================
# Create FAISS Index
# ========================
index = faiss.IndexFlatL2(embedding_matrix.shape[1])
index.add(embedding_matrix)
print(f"FAISS index built with dimension {index.d} and {index.ntotal} vectors.")

# ========================
# RAG Ask Function
# ========================
def ask_rag(query, top_k=TOP_K):
    query_embedding = np.array(get_embedding(query)).astype("float32").reshape(1, -1)
    D, I = index.search(query_embedding, top_k)
    contexts = df.iloc[I[0]]["content"].tolist()

    prompt = "Voici des anomalies liées aux équipements :\n"
    for i, ctx in enumerate(contexts):
        prompt += f"{i+1}. {ctx}\n"
    prompt += f"\nRéponds à la question suivante de manière précise :\n{query}"

    print("\n======== PROMPT TO GPT ========")
    print(prompt)

    response = openai.ChatCompletion.create(
        model=GPT_MODEL,
        messages=[{"role": "user", "content": prompt}]
    )
    return response.choices[0].message.content

# ========================
# Example Usage
# ========================
question = "Quels sont les anomalies critiques liées à la sécurité du process ?"
answer = ask_rag(question)
print("\n======== RÉPONSE GPT ========")
print(answer)

Embedding dataset...
FAISS index built with dimension 1536 and 400 vectors.

Voici des anomalies liées aux équipements :
1. f771d801-5357-4818-976c-6a8102b713e2 | Prévoir contrôler le système  d'évacuation des mâchefers (Défaut de communication). | SYSTEM ETA
2. f771d801-5357-4818-976c-6a8102b713e2 | arrêt fréquemment du système (a contrôler) | SYSTEM ETA
3. f7edce60-d1a5-401a-b673-f1193930615c | Révision des vannes entré des SAS | SYSTEM ETG
4. c5799184-0dba-4180-a805-1028a4215ab8 | Contact sécurité: Etude de faisabilité d'ajout un système de sectionnement au niveau de sortie 72KV des transfo-redresseurs des electro-filtres U34. | ELECTROFILTRE A
5. c111ab6f-a961-43ce-b8fe-54b2abf73628 | éclairage insuffisant au niveau 0 près des broyeurs et ventilateur de tirage. | Systeme  de broyage U3

Réponds à la question suivante de manière précise :
Quels sont les anomalies critiques liées à la sécurité du process ?


APIRemovedInV1: 

You tried to access openai.ChatCompletion, but this is no longer supported in openai>=1.0.0 - see the README at https://github.com/openai/openai-python for the API.

You can run `openai migrate` to automatically upgrade your codebase to use the 1.0.0 interface. 

Alternatively, you can pin your installation to the old version, e.g. `pip install openai==0.28`

A detailed migration guide is available here: https://github.com/openai/openai-python/discussions/742
