In [None]:
from pydantic import BaseModel, Field
from typing import List, Optional, Literal

In [None]:
intent_category = Literal[
    "acadimique information", "Admissions et inscriptions", "Services aux étudiants",
    "Droits et responsabilités des étudiants", "Activités étudiantes", "Services administratifs",
    "Vie sur le campus", "Autre"
]
class RelatedQuestion(BaseModel):
    question1: str = Field(description="Question suggérée liée à la réponse et à la question posée" )
    question2: str = Field(description="Question suggérée liée à la réponse et à la question posée" )
    question3: str = Field(description="Question suggérée liée à la réponse et à la question posée" )

class ChatBotResponse(BaseModel):
    contentment: str = Field(
    ...,
    min_length=20,
    max_length=80,
    description=(
        "Exprimez poliment que vous avez bien compris la question. "
        "Utilisez une phrase courte, rassurante, naturelle et adaptée au contexte de la question. "
        "Par exemple : 'Merci pour votre question', 'Je comprends votre demande', 'سؤال جيد، شكرًا لك'. "
        "Répondez dans la même langue que celle de la question."
                 )
         )
    main_answer: str = Field(
    ...,
    min_length=20,
    max_length=100,
    description=(
        "Fournissez une réponse directe, claire et concise à la question posée. "
        "Évitez les longueurs inutiles. "
        "Répondez dans la même langue que celle utilisée dans la question."
                 )
           )
    details: Optional[str] = Field(
    None,
    min_length=20,
    max_length=500,
    description=(
        "Ajoutez des explications ou informations supplémentaires pour enrichir la réponse si nécessaire. "
        "Incluez des exemples, contextes ou précisions utiles. "
        "Répondez dans la même langue que celle de la question."
                 )
           )

    intent: intent_category = Field(
    ...,
    description=(
        "Identifiez l'intention principale de la question."
                )
           )

    related_questions: Optional[List[RelatedQuestion]] = Field(
    None,
    description=(
        "Une liste de questions similaires ou couramment posées en lien avec la question actuelle. "
        "Répondez dans la même langue que celle de la question d'origine."
                 )
             )

In [None]:
import json

In [None]:
prompte_Task_messages = [
     {
        "role": "system",
        "content": "\n".join([
            "Vous êtes un assistant dans une école qui s'appelle l'École Nationale de l'Intelligence Artificielle et Digitale de Berkane, capable de répondre aux questions des étudiants.",
            "Vérifiez les données attentivement lorsque vous répondez.",
            "Essayez d'éviter tous les mots et textes qui n'ont pas de sens dans ces données.",
            "Faites très attention à la langue dans laquelle la question est posée.",
            "Vous devez répondre dans la même langue que celle de la question.",
            "Ne répondez pas tant que vous n’êtes pas sûr de la langue de la question.",
            "Si c'est en arabe, répondez en arabe. Si c'est en français, répondez en français. Si c'est en anglais, répondez en anglais.",
            "Ignorez les éléments inutiles dans la question tels que les numéros de version ou de commande, et concentrez-vous uniquement sur la question.",
            "Faites attention aux fautes d'orthographe pour ne pas altérer votre compréhension.",
            # "Extraire les détails JSON du texte conformément aux questions posées et aux spécifications Pydantic.",
            "Extraire les détails comme indiqué dans le texte. Vous pouvez les reformater, mais gardez le sens.",
            "Ne pas générer d'introduction ni de conclusion.",
            "repandre en paragraphe text"
            "n'oblier pas les questions similaires a la fin au moins deux mais Ils doivent être présentés avec le contexte du texte et ne doivent en aucun cas être mentionnés auparavant. Indiquez simplement à l'utilisateur que vous pouvez l'aider avec d'autres choses, puis posez des questions. "
            "",
            "Ne vous limitez pas toujours à la première phrase de votre question, très bien, merci, mais diversifiez plutôt la phrase.",


        ])
    },
    {
        "role": "user",
        "content": "\n".join([
            "## Question : عرف لي عده المدرسة وكيف الولوج اليها  ",
            "## Pydantic Details:",
            json.dumps(
                ChatBotResponse.model_json_schema(), ensure_ascii=False
            ),
            "",
            "## Output text:",
        ])
    }
]

In [None]:
!pip install openai



In [None]:

import openai

client = openai.OpenAI(
    base_url="https://abdellahennajari2018--llama3-openai-compatible-serve.modal.run/v1",
    api_key="super-secret-key",
)

response = client.chat.completions.create(
    model="ahmed-ouka/llama3-8b-eniad-merged-32bit",
    messages=prompte_Task_messages,
    temperature=0.2,
    max_tokens=1024
)

print(response.choices[0].message.content)

سؤال جيد، شكرًا لك.

العدد المدرسة هو 3.

يمكن الولوج إلى المدرسة من خلال تقديم ملفات التسجيل التي تشمل شهادة البكالوريا، وكشوف النقاط، وصورة شخصية، وشهادة طبية، وassicurance.

التسجيل يفتح في نهاية يونيو من كل عام، و يجب على الطلاب تقديم جميع الوثائق المطلوبة قبل تاريخ الاستحقاق المحدد.

هل لديك سؤال آخر عن شروط القبول أو الوثائق المطلوبة؟


In [None]:
!pip install --upgrade elevenlabs
!apt-get install -y mpv

Collecting elevenlabs
  Downloading elevenlabs-2.3.0-py3-none-any.whl.metadata (6.8 kB)
Downloading elevenlabs-2.3.0-py3-none-any.whl (708 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m708.1/708.1 kB[0m [31m8.5 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: elevenlabs
Successfully installed elevenlabs-2.3.0
Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
The following additional packages will be installed:
  libdvdnav4 libdvdread8 liblua5.2-0 libmujs1 libplacebo192 libsixel1
  libva-wayland2 libvulkan1 mesa-vulkan-drivers python3-brotli python3-certifi
  python3-mutagen python3-pycryptodome python3-pyxattr python3-websockets
  rtmpdump yt-dlp
Suggested packages:
  libdvdcss2 libcuda1 python-mutagen-doc python3-pyxattr-dbg
  python-pyxattr-doc libfribidi-bin | bidiv phantomjs
The following NEW packages will be installed:
  libdvdnav4 libdvdread8 liblua5.2-0 libmujs1 libplacebo192 libsixel1
  libva

In [None]:
from elevenlabs.client import ElevenLabs
from IPython.display import Audio, display
MY_API_KEY = "sk_6cf5064cd435e231f7bd3c9925fa9218433cec59a59ad665"
elevenlabs = ElevenLabs(api_key=MY_API_KEY)
try:
    audio_output = elevenlabs.text_to_speech.convert(
        text="السلام عليكم ",
        voice_id="Xb7hH8MSUJpSbSDYk0k2",
        model_id="eleven_multilingual_v2"
    )
    final_audio_bytes = b"".join(audio_output)
    display(Audio(data=final_audio_bytes, rate=44100))
except Exception as e:
    print(f"{e}")

In [None]:
!pip install gradio

In [None]:
# imports

import os
import glob
import gradio as gr

In [None]:
!pip install langchain
!pip install langchain_openai
!pip install langchain_chroma
!pip install plotly
!pip install tiktoken

Collecting langchain_openai
  Downloading langchain_openai-0.3.24-py3-none-any.whl.metadata (2.3 kB)
Downloading langchain_openai-0.3.24-py3-none-any.whl (68 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m69.0/69.0 kB[0m [31m2.9 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: langchain_openai
Successfully installed langchain_openai-0.3.24
Collecting langchain_chroma
  Downloading langchain_chroma-0.2.4-py3-none-any.whl.metadata (1.1 kB)
Collecting chromadb>=1.0.9 (from langchain_chroma)
  Downloading chromadb-1.0.13-cp39-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (7.0 kB)
Collecting pybase64>=1.4.1 (from chromadb>=1.0.9->langchain_chroma)
  Downloading pybase64-1.4.1-cp311-cp311-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (8.4 kB)
Collecting posthog>=2.4.0 (from chromadb>=1.0.9->langchain_chroma)
  Downloading posthog-5.3.0-py3-none-any.whl.metadata (5.7 kB)
Collecting onnxrunti

In [None]:
!pip install -U langchain-community

Collecting langchain-community
  Downloading langchain_community-0.3.25-py3-none-any.whl.metadata (2.9 kB)
Collecting dataclasses-json<0.7,>=0.5.7 (from langchain-community)
  Downloading dataclasses_json-0.6.7-py3-none-any.whl.metadata (25 kB)
Collecting pydantic-settings<3.0.0,>=2.4.0 (from langchain-community)
  Downloading pydantic_settings-2.9.1-py3-none-any.whl.metadata (3.8 kB)
Collecting httpx-sse<1.0.0,>=0.4.0 (from langchain-community)
  Downloading httpx_sse-0.4.0-py3-none-any.whl.metadata (9.0 kB)
Collecting marshmallow<4.0.0,>=3.18.0 (from dataclasses-json<0.7,>=0.5.7->langchain-community)
  Downloading marshmallow-3.26.1-py3-none-any.whl.metadata (7.3 kB)
Collecting typing-inspect<1,>=0.4.0 (from dataclasses-json<0.7,>=0.5.7->langchain-community)
  Downloading typing_inspect-0.9.0-py3-none-any.whl.metadata (1.5 kB)
Collecting mypy-extensions>=0.3.0 (from typing-inspect<1,>=0.4.0->dataclasses-json<0.7,>=0.5.7->langchain-community)
  Downloading mypy_extensions-1.1.0-py3-no

In [None]:
# imports for langchain

from langchain.document_loaders import DirectoryLoader, TextLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain.schema import Document
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain_chroma import Chroma
import numpy as np
from sklearn.manifold import TSNE
import plotly.graph_objects as go
from langchain.memory import ConversationBufferMemory
from langchain.chains import ConversationalRetrievalChain

In [None]:
# price is a factor for our company, so we're going to use a low cost model

# MODEL = "gpt-4o-mini"
db_name = "vector_db"

In [None]:
# Install necessary libraries
!pip install langchain
!pip install unstructured[md]
!pip install tiktoken

Collecting unstructured[md]
  Downloading unstructured-0.17.2-py3-none-any.whl.metadata (24 kB)
Collecting filetype (from unstructured[md])
  Downloading filetype-1.2.0-py2.py3-none-any.whl.metadata (6.5 kB)
Collecting python-magic (from unstructured[md])
  Downloading python_magic-0.4.27-py2.py3-none-any.whl.metadata (5.8 kB)
Collecting emoji (from unstructured[md])
  Downloading emoji-2.14.1-py3-none-any.whl.metadata (5.7 kB)
Collecting python-iso639 (from unstructured[md])
  Downloading python_iso639-2025.2.18-py3-none-any.whl.metadata (14 kB)
Collecting langdetect (from unstructured[md])
  Downloading langdetect-1.0.9.tar.gz (981 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m981.5/981.5 kB[0m [31m23.2 MB/s[0m eta [36m0:00:00[0m
[?25h  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting rapidfuzz (from unstructured[md])
  Downloading rapidfuzz-3.13.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (12 kB)
Collecting unstructure

In [None]:
!rm -rf knowledge-base knowledge-base.zip

In [None]:
import os
import zipfile
from google.colab import files

# Prompt the user to upload the zip file
print("الرجاء رفع ملف 'knowledge-base.zip' الذي قمت بإنشائه.")
uploaded = files.upload()

# Check if the file was uploaded and unzip it
zip_file_name = "knowledge-base.zip"
if zip_file_name in uploaded:
    print(f"\nتم رفع الملف '{zip_file_name}' بنجاح. جاري فك الضغط...")
    with zipfile.ZipFile(zip_file_name, 'r') as zip_ref:
        zip_ref.extractall('.') # Extract to the current directory
    print("تم فك ضغط المجلد بنجاح. أصبح مجلد 'knowledge-base' جاهزاً للاستخدام.")
else:
    print("\nلم يتم رفع الملف. الرجاء التأكد من أن اسم الملف هو 'knowledge-base.zip' وإعادة المحاولة.")

الرجاء رفع ملف 'knowledge-base.zip' الذي قمت بإنشائه.


Saving knowledge-base.zip to knowledge-base (1).zip

لم يتم رفع الملف. الرجاء التأكد من أن اسم الملف هو 'knowledge-base.zip' وإعادة المحاولة.


In [None]:
import glob
import os
from langchain.document_loaders import DirectoryLoader, TextLoader

# This code should now work perfectly in Colab

# Check if the knowledge-base directory exists before proceeding
if os.path.exists("knowledge-base"):
    # Read in documents using LangChain's loaders
    # Take everything in all the sub-folders of our knowledge-base
    folders = glob.glob("knowledge-base/*")

    text_loader_kwargs = {'encoding': 'utf-8'}

    documents = []
    for folder in folders:
        # Check if the path is a directory
        if os.path.isdir(folder):
            doc_type = os.path.basename(folder)
            loader = DirectoryLoader(folder, glob="**/*.md", loader_cls=TextLoader, loader_kwargs=text_loader_kwargs, show_progress=True)
            folder_docs = loader.load()
            for doc in folder_docs:
                doc.metadata["doc_type"] = doc_type
                documents.append(doc)

    print(f"تم تحميل {len(documents)} مستند بنجاح.")
    # You can optionally print a sample document to verify
    if documents:
        print("\nمثال على مستند تم تحميله:")
        print(documents[0])
else:
    print("لم يتم العثور على مجلد 'knowledge-base'. الرجاء التأكد من إتمام الخطوة الثانية بنجاح.")

100%|██████████| 1/1 [00:00<00:00, 780.05it/s]
100%|██████████| 1/1 [00:00<00:00, 3318.28it/s]
100%|██████████| 1/1 [00:00<00:00, 2716.52it/s]

تم تحميل 3 مستند بنجاح.

مثال على مستند تم تحميله:
page_content='=== ENIAD BERKANE - ÉCOLE NATIONALE DE L'INTELLIGENCE ARTIFICIELLE ET DU DIGITAL ===

INFORMATIONS GÉNÉRALES:
L'ENIAD (École Nationale de l'Intelligence Artificielle et du Digital) est une école d'ingénieurs située à Berkane, Maroc.
L'école est spécialisée dans les domaines de l'intelligence artificielle, du digital et des nouvelles technologies.

CONTACT:
- Site web: www.eniad.ac.ma
- Email: contact@eniad.ac.ma
- Localisation: Berkane, Maroc
- Téléphone: +212 [numéro à compléter]

FORMATIONS PROPOSÉES:
1. Génie Informatique (GI)
   - Développement logiciel
   - Systèmes d'information
   - Programmation avancée
   - Bases de données

2. Intelligence Artificielle (IA)
   - Machine Learning
   - Deep Learning
   - Traitement du langage naturel
   - Vision par ordinateur
   - Réseaux de neurones

3. Systèmes Embarqués (IRSI)
   - Microcontrôleurs
   - IoT (Internet des Objets)
   - Systèmes temps réel
   - Électronique numér




In [None]:
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
chunks = text_splitter.split_documents(documents)



In [None]:
len(chunks)

105

In [None]:
doc_types = set(chunk.metadata['doc_type'] for chunk in chunks)
print(f"Document types found: {', '.join(doc_types)}")

Document types found: eniad1, eniad2, eniad3


In [None]:
# Put the chunks of data into a Vector Store that associates a Vector Embedding with each chunk
# Chroma is a popular open source Vector Database based on SQLLite

#embeddings = OpenAIEmbeddings()

# If you would rather use the free Vector Embeddings from HuggingFace sentence-transformers
# Then replace embeddings = OpenAIEmbeddings()
# with:
from langchain.embeddings import HuggingFaceEmbeddings
embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")

# Delete if already exists

if os.path.exists(db_name):
    Chroma(persist_directory=db_name, embedding_function=embeddings).delete_collection()

# Create vectorstore

vectorstore = Chroma.from_documents(documents=chunks, embedding=embeddings, persist_directory=db_name)
print(f"Vectorstore created with {vectorstore._collection.count()} documents")

Vectorstore created with 105 documents


In [None]:
# Get one vector and find how many dimensions it has

collection = vectorstore._collection
sample_embedding = collection.get(limit=1, include=["embeddings"])["embeddings"][0]
dimensions = len(sample_embedding)
print(f"The vectors have {dimensions:,} dimensions")

The vectors have 384 dimensions


In [None]:
# Prework

result = collection.get(include=['embeddings', 'documents', 'metadatas'])
vectors = np.array(result['embeddings'])
documents = result['documents']
doc_types = [metadata['doc_type'] for metadata in result['metadatas']]
colors = [['blue', 'green', 'red', 'orange'][['eniad1','eniad2','eniad3'].index(t)] for t in doc_types]

In [None]:
# We humans find it easier to visalize things in 2D!
# Reduce the dimensionality of the vectors to 2D using t-SNE
# (t-distributed stochastic neighbor embedding)

tsne = TSNE(n_components=2, random_state=42)
reduced_vectors = tsne.fit_transform(vectors)

# Create the 2D scatter plot
fig = go.Figure(data=[go.Scatter(
    x=reduced_vectors[:, 0],
    y=reduced_vectors[:, 1],
    mode='markers',
    marker=dict(size=5, color=colors, opacity=0.8),
    text=[f"Type: {t}<br>Text: {d[:100]}..." for t, d in zip(doc_types, documents)],
    hoverinfo='text'
)])

fig.update_layout(
    title='2D Chroma Vector Store Visualization',
    scene=dict(xaxis_title='x',yaxis_title='y'),
    width=800,
    height=600,
    margin=dict(r=20, b=10, l=10, t=40)
)

fig.show()

In [None]:
# Let's try 3D!

tsne = TSNE(n_components=3, random_state=42)
reduced_vectors = tsne.fit_transform(vectors)

# Create the 3D scatter plot
fig = go.Figure(data=[go.Scatter3d(
    x=reduced_vectors[:, 0],
    y=reduced_vectors[:, 1],
    z=reduced_vectors[:, 2],
    mode='markers',
    marker=dict(size=5, color=colors, opacity=0.8),
    text=[f"Type: {t}<br>Text: {d[:100]}..." for t, d in zip(doc_types, documents)],
    hoverinfo='text'
)])

fig.update_layout(
    title='3D Chroma Vector Store Visualization',
    scene=dict(xaxis_title='x', yaxis_title='y', zaxis_title='z'),
    width=900,
    height=700,
    margin=dict(r=20, b=10, l=10, t=40)
)

fig.show()

In [None]:
YOUR_OPENROUTER_API_KEY = "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" # ضع مفتاح OpenRouter هنا
YOUR_SITE_URL = "http://localhost:7860"
YOUR_SITE_NAME = "ENIAD Chatbot"

In [None]:
intent_category = Literal[
    "acadimique information", "Admissions et inscriptions", "Services aux étudiants",
    "Droits et responsabilités des étudiants", "Activités étudiantes", "Services administratifs",
    "Vie sur le campus", "Autre"
]
class RelatedQuestion(BaseModel):
    question1: str = Field(description="Question suggérée liée à la réponse et à la question posée" )
    question2: str = Field(description="Question suggérée liée à la réponse et à la question posée" )
    question3: str = Field(description="Question suggérée liée à la réponse et à la question posée" )

class ChatBotResponse(BaseModel):
    contentment: str = Field(
    ...,
    min_length=20,
    max_length=80,
    description=(
        "Exprimez poliment que vous avez bien compris la question. "
        "Utilisez une phrase courte, rassurante, naturelle et adaptée au contexte de la question. "
        "Par exemple : 'Merci pour votre question', 'Je comprends votre demande', 'سؤال جيد، شكرًا لك'. "
        "Répondez dans la même langue que celle de la question."
                 )
         )
    main_answer: str = Field(
    ...,
    min_length=20,
    # max_length=100,
    description=(
        "Fournissez une réponse directe, claire et concise à la question posée. "
        "Évitez les longueurs inutiles. "
        "Répondez dans la même langue que celle utilisée dans la question."
                 )
           )
    details: Optional[str] = Field(
    None,
    min_length=20,
    max_length=500,
    description=(
        "Ajoutez des explications ou informations supplémentaires pour enrichir la réponse si nécessaire. "
        "Incluez des exemples, contextes ou précisions utiles. "
        "Répondez dans la même langue que celle de la question."
                 )
           )

    intent: intent_category = Field(
    ...,
    description=(
        "Identifiez l'intention principale de la question."
                )
           )

    related_questions: Optional[List[RelatedQuestion]] = Field(
    None,
    description=(
        "Une liste de questions similaires ou couramment posées en lien avec la question actuelle. "
        "Répondez dans la même langue que celle de la question d'origine."
                 )
             )

In [None]:
llm_retriever = ChatOpenAI(
    model="openai/gpt-4o-mini", # نموذج سريع للبحث
    temperature=0.3,
    openai_api_base="https://openrouter.ai/api/v1",
    openai_api_key=YOUR_OPENROUTER_API_KEY,
    extra_headers={
        "HTTP-Referer": YOUR_SITE_URL,
        "X-Title": YOUR_SITE_NAME
    }
)


                extra_headers was transferred to model_kwargs.
                Please confirm that extra_headers is what you intended.



In [None]:
!pip install openai



In [None]:
import openai

custom_llama_client = openai.OpenAI(
    base_url="https://ahmedoukachaa1--llama3-openai-compatible-serve.modal.run/v1",
    api_key="super-secret-key", # كما في الكود الأصلي الذي قدمته
)

In [None]:
memory = ConversationBufferMemory(memory_key='chat_history', return_messages=True, output_key='answer')
retriever = vectorstore.as_retriever()


Please see the migration guide at: https://python.langchain.com/docs/versions/migrating_memory/



In [None]:
conversation_chain = ConversationalRetrievalChain.from_llm(
    llm=llm_retriever, # استخدام نموذج البحث GPT
    retriever=retriever,
    memory=memory,
    return_source_documents=True
)

In [None]:
def get_structured_response_from_llama(query: str, context: str) -> Optional[ChatBotResponse]:
    """
    تأخذ السؤال والسياق، وتستدعي نموذج Llama المخصص للحصول على إجابة مهيكلة.
    """
    system_prompt_content = "\n".join([
        "Vous êtes un assistant dans une école qui s'appelle l'École Nationale de l'Intelligence Artificielle et Digitale de Berkane, capable de répondre aux questions des étudiants.",
        "Utilisez le CONTEXTE fourni pour répondre à la QUESTION.",
        "Vérifiez les données attentivement lorsque vous répondez.",
        "Faites très attention à la langue dans laquelle la question est posée et répondez dans la même langue.",
        "Extraire les détails JSON du texte conformément aux spécifications Pydantic.",
        "Ne générez pas d'introduction ni de conclusion.",
        "Générez toujours 3 questions similaires à la fin.",
        "Votre unique sortie doit être un objet JSON valide, sans aucun autre texte avant ou après."
    ])

    user_prompt_content = "\n".join([
        f"## CONTEXTE:\n{context}",
        f"\n## QUESTION:\n{query}",
        "\n## Pydantic JSON Schema:",
        json.dumps(ChatBotResponse.model_json_schema(), ensure_ascii=False),
        "\n## JSON Output:",
    ])

    messages = [
        {"role": "system", "content": system_prompt_content},
        {"role": "user", "content": user_prompt_content}
    ]

    try:
        # استدعاء نموذج Llama المخصص
        completion = custom_llama_client.chat.completions.create(
            model="ahmed-ouka/llama3-8b-eniad-merged-32bit", # اسم نموذجك المخصص
            messages=messages,
            temperature=0.2,
            max_tokens=1024,
        )

        response_content = completion.choices[0].message.content
        structured_data = ChatBotResponse.model_validate_json(response_content)
        return structured_data

    except Exception as e:
        print(f"Error calling Custom Llama API or parsing JSON: {e}")
        return None


In [None]:
import json

In [None]:
# ===================================================================
# == النسخة النهائية المصححة (تستخدم OpenRouter للإجابة مؤقتاً) ==
# ===================================================================

# تأكد أن كل الكود السابق (تعريف Pydantic clients و conversation_chain) قد تم تشغيله بنجاح

def get_bot_response(message: str, history: list) -> str:
    """
    هذه هي الدالة الوحيدة التي تحتاجها.
    تأخذ السؤال وتاريخ المحادثة، وتُرجع الإجابة النهائية.
    """
    # 1. استدعاء سلسلة RAG للحصول على السياق
    # ملاحظة: تاريخ المحادثة تتم إدارته تلقائياً عبر `memory` في السلسلة
    rag_result = conversation_chain.invoke({"question": message})
    context = "\n\n".join([doc.page_content for doc in rag_result['source_documents']])

    # 2. استدعاء OpenRouter للحصول على الإجابة المهيكلة
    structured_response = get_structured_response_from_llama(query=message, context=context)

    if structured_response:
        # 3. تنسيق الإجابة النهائية كنص واحد
        final_answer = f"{structured_response.contentment}\n\n"
        final_answer += f"**{structured_response.main_answer}**\n\n"
        if structured_response.details:
            final_answer += f"{structured_response.details}\n\n"

        # --- الجزء الذي تم تصحيحه (استخدام حلقة for) ---
        # التحقق من وجود قائمة الأسئلة المقترحة والمرور على كل عنصر فيها
        if structured_response.related_questions:
            final_answer += "قد يهمك أيضًا أن تسأل عن:\n"
            # 'related_questions' هي قائمة، لذلك نستخدم حلقة for
            for related_item in structured_response.related_questions:
                # الآن 'related_item' هو الكائن الذي يحتوي على الأسئلة
                if related_item.question1:
                    final_answer += f"- {related_item.question1}\n"
                if related_item.question2:
                    final_answer += f"- {related_item.question2}\n"
                if related_item.question3:
                    final_answer += f"- {related_item.question3}\n"
        # --- نهاية الجزء المصحح ---

        return final_answer
    else:
        # في حالة فشل استدعاء API أو تحليل JSON
        return "عذراً، حدث خطأ أثناء صياغة الإجابة. يرجى المحاولة مرة أخرى."


# --- بدء حلقة المحادثة التفاعلية ---
print("✅ الشاتبوت جاهز للعمل.")
print("   (اكتب 'خروج' أو 'exit' في أي وقت لإنهاء المحادثة)")
print("-" * 50)

while True:
    user_input = input("أنت: ")
    if user_input.lower() in ["exit", "خروج"]:
        print("\nمع السلامة! شكراً لاستخدامك الشاتبوت.")
        break

    # استدعاء الدالة الجديدة والموحدة
    bot_response = get_bot_response(user_input, [])
    print("\nالشاتبوت:")
    print(bot_response)
    print("-" * 50)

✅ الشاتبوت جاهز للعمل.
   (اكتب 'خروج' أو 'exit' في أي وقت لإنهاء المحادثة)
--------------------------------------------------
أنت: salut

الشاتبوت:
Merci pour votre question.

**L'inscription en troisième année de l'ENIAD Berkane est ouverte aux candidats titulaires du DUT/DEUST, DEUG ou une licence, et une procédure de sélection est mise en place.**

Cette procédure de sélection prend en compte les notes académiques, un entretien et un contrôle des documents. Les candidats doivent également passer un concours d'entrée pour être sélectionnés.

قد يهمك أيضًا أن تسأل عن:
- Quels sont les critères d'admission pour l'ENIAD Berkane ?
- Comment se déroule la procédure de sélection pour l'inscription ?
- Quels documents sont nécessaires pour l'inscription à l'ENIAD Berkane ?

--------------------------------------------------


KeyboardInterrupt: Interrupted by user

In [None]:
# ===================================================================
# ==         الكود الكامل والنهائي (مع إظهار السياق)              ==
# ===================================================================

# --- 1. الإعداد والمكتبات ---
import os
import json
import openai
from pydantic import BaseModel, Field
from typing import List, Optional, Literal, Tuple # تمت إضافة Tuple
from langchain_openai import ChatOpenAI
from langchain.memory import ConversationBufferMemory
from langchain.chains import ConversationalRetrievalChain
from langchain.schema.document import Document # تمت إضافة Document

# تأكد من أنك قمت بإعداد الـ vectorstore في خلايا سابقة وتم تشغيلها
# from langchain_community.vectorstores import Chroma
# from langchain_openai import OpenAIEmbeddings
# vectorstore = Chroma(persist_directory="./chroma_db", embedding_function=OpenAIEmbeddings())


# --- 2. إعداد متغيرات OpenRouter ---
# !! مهم: قم باستبدال هذه القيم بالقيم الخاصة بك !!
YOUR_OPENROUTER_API_KEY = "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" # ضع مفتاح OpenRouter هنا
YOUR_SITE_URL = "http://localhost:7860"
YOUR_SITE_NAME = "ENIAD Chatbot"

# --- 3. تعريف نماذج Pydantic ---
# (لا تغيير هنا)
intent_category = Literal[
    "acadimique information", "Admissions et inscriptions", "Services aux étudiants",
    "Droits et responsabilités des étudiants", "Activités étudiantes", "Services administratifs",
    "Vie sur le campus", "Autre"
]
class RelatedQuestion(BaseModel):
    question1: str = Field(description="Question suggérée liée à la réponse et à la question posée")
    question2: str = Field(description="Question suggérée liée à la réponse et à la question posée")
    question3: str = Field(description="Question suggérée liée à la réponse et à la question posée")
class ChatBotResponse(BaseModel):
    contentment: str = Field(description="Exprimez poliment que vous avez bien compris la question. Utilisez une phrase courte, rassurante, naturelle et adaptée au contexte. Répondez dans la même langue que la question.")
    main_answer: str = Field(max_length=300, description="Fournissez une réponse directe, claire et concise à la question posée. Évitez les longueurs inutiles. Répondez dans la même langue que la question.")
    details: Optional[str] = Field(None, description="Ajoutez des explications ou informations supplémentaires pour enrichir la réponse si nécessaire. Incluez des exemples ou précisions. Répondez dans la même langue que la question.")
    intent: intent_category = Field(description="Identifiez l'intention principale de la question.")
    related_questions: Optional[List[RelatedQuestion]] = Field(None, description="Une liste contenant un objet de questions similaires. Répondez dans la même langue que la question d'origine.")

# --- 4. إعداد العملاء (Clients) وسلسلة RAG ---
# (لا تغيير هنا)
openrouter_client = openai.OpenAI(base_url="https://openrouter.ai/api/v1", api_key=YOUR_OPENROUTER_API_KEY)
llm_retriever = ChatOpenAI(
    model="openai/gpt-4o-mini", temperature=0.3,
    openai_api_base="https://openrouter.ai/api/v1", openai_api_key=YOUR_OPENROUTER_API_KEY,
    extra_headers={"HTTP-Referer": YOUR_SITE_URL, "X-Title": YOUR_SITE_NAME}
)
memory = ConversationBufferMemory(memory_key='chat_history', return_messages=True, output_key='answer')
retriever = vectorstore.as_retriever()
conversation_chain = ConversationalRetrievalChain.from_llm(
    llm=llm_retriever, retriever=retriever, memory=memory, return_source_documents=True
)

# --- 5. تعريف الدوال الوظيفية ---

def get_structured_response_from_openrouter(query: str, context: str) -> Optional[ChatBotResponse]:
    # (لا تغيير هنا في هذه الدالة)
    system_prompt_content = "\n".join([
        "You are an assistant for a school named 'École Nationale de l'Intelligence Artificielle et Digitale de Berkane'.",
        "Use the provided CONTEXT to answer the QUESTION.", "Check the data carefully when responding.",
        "Pay close attention to the language of the question and respond in the same language.",
        "Your unique output must be a valid JSON object that conforms to the Pydantic schema, without any other text before or after."
    ])
    user_prompt_content = "\n".join([
        f"## CONTEXT:\n{context}", f"\n## QUESTION:\n{query}",
        "\n## Pydantic JSON Schema:", json.dumps(ChatBotResponse.model_json_schema(), ensure_ascii=False),
        "\n## JSON Output:",
    ])
    messages = [{"role": "system", "content": system_prompt_content}, {"role": "user", "content": user_prompt_content}]
    try:
        completion = openrouter_client.chat.completions.create(
            extra_headers={"HTTP-Referer": YOUR_SITE_URL, "X-Title": YOUR_SITE_NAME},
            model="openai/gpt-4o",
            messages=messages, temperature=0.2, max_tokens=1024,
            response_format={"type": "json_object"}
        )
        response_content = completion.choices[0].message.content
        return ChatBotResponse.model_validate_json(response_content)
    except Exception as e:
        print(f"Error calling OpenRouter or parsing JSON: {e}")
        return None

def get_bot_response(message: str) -> Tuple[str, List[Document]]:
    """
    الدالة الرئيسية التي تنسق بين البحث والإجابة.
    الآن تُرجع الإجابة النهائية والمستندات المصدر.
    """
    rag_result = conversation_chain.invoke({"question": message})
    source_documents = rag_result.get('source_documents', [])
    context = "\n\n".join([doc.page_content for doc in source_documents])

    structured_response = get_structured_response_from_openrouter(query=message, context=context)

    if structured_response:
        final_answer = f"{structured_response.contentment}\n\n**{structured_response.main_answer}**\n\n"
        if structured_response.details:
            final_answer += f"{structured_response.details}\n\n"
        if structured_response.related_questions:
            final_answer += "قد يهمك أيضًا أن تسأل عن:\n"
            for related_item in structured_response.related_questions:
                if hasattr(related_item, 'question1') and related_item.question1: final_answer += f"- {related_item.question1}\n"
                if hasattr(related_item, 'question2') and related_item.question2: final_answer += f"- {related_item.question2}\n"
                if hasattr(related_item, 'question3') and related_item.question3: final_answer += f"- {related_item.question3}\n"
        # === التعديل الأول: إرجاع المصادر مع الإجابة ===
        return final_answer, source_documents
    else:
        return "عذراً، حدث خطأ أثناء صياغة الإجابة. يرجى المحاولة مرة أخرى.", []

# --- 6. بدء حلقة المحادثة التفاعلية (مع طباعة السياق) ---
print("✅ الشاتبوت جاهز للعمل.")
print("   (اكتب 'خروج' أو 'exit' في أي وقت لإنهاء المحادثة)")
print("-" * 50)

while True:
    try:
        user_input = input("أنت: ")
        if user_input.lower() in ["exit", "خروج"]:
            print("\nمع السلامة! شكراً لاستخدامك الشاتبوت.")
            break

        # === التعديل الثاني: استقبال الإجابة والمصادر ===
        bot_response, source_docs = get_bot_response(user_input)

        # --- الجزء الجديد: طباعة السياق المستخرج ---
        print("\n" + "="*20)
        print("🔍 السياق الذي تم استخراجه:")
        if source_docs:
            for i, doc in enumerate(source_docs):
                source_name = doc.metadata.get('source', 'مصدر غير معروف')
                print(f"  - المصدر {i+1}: {source_name}")
                # طباعة أول 150 حرف من المحتوى لكي لا تكون المخرجات طويلة جداً
                print(f"    المحتوى: {doc.page_content[:150]}...")
        else:
            print("  - لم يتم العثور على سياق مطابق.")
        print("="*20 + "\n")
        # -----------------------------------------

        print("\nالشاتبوت:")
        print(bot_response)
        print("-" * 50)

    except Exception as e:
        print(f"حدث خطأ غير متوقع: {e}")
        break


                extra_headers was transferred to model_kwargs.
                Please confirm that extra_headers is what you intended.



✅ الشاتبوت جاهز للعمل.
   (اكتب 'خروج' أو 'exit' في أي وقت لإنهاء المحادثة)
--------------------------------------------------
أنت: salut

🔍 السياق الذي تم استخراجه:
  - المصدر 1: knowledge-base/eniad2/ENIAD_COMPLET.md
    المحتوى: Je soussigné M., Mlle CIN
inscrit(e) en année, filière déclare avoir pris connaissance du règlement intérieur de l'école et m'engage à le respecter.
B...
  - المصدر 2: knowledge-base/eniad2/ENIAD_COMPLET.md
    المحتوى: Faq:
  1. {'question': "Comment candidater à l'ENIAD Berkane ?", 'reponse': "La candidature se fait en ligne sur le site officiel de l'ENIAD Berkane."...
  - المصدر 3: knowledge-base/eniad2/ENIAD_COMPLET.md
    المحتوى: === Faq Sur Le Règlement Intérieur De L'Eniad Berkane ===...
  - المصدر 4: knowledge-base/eniad2/ENIAD_COMPLET.md
    المحتوى: Q7: Quel est l’URL du site web officiel de l’ENIAD ?
R7: http://eniad.ump.ma

Q8: Qui est le directeur de l’ENIAD et quelle est son adresse email ?
R8...


الشاتبوت:
Bonjour ! Comment puis-je vous aide