In [None]:
import pandas as pd

from Corpus import Corpus
from Document import Document
from SearchEngine import SearchEngine


In [None]:
# FICHIER CSV
CSV_PATH = "discours_us.csv"  

# Colonnes dans le CSV
AUTHOR_COL = "author"
TEXT_COL = "text"

df = pd.read_csv(CSV_PATH)

print("Colonnes du CSV :", list(df.columns))
print("\nTop auteurs :\n", df[AUTHOR_COL].value_counts().head(10))


In [None]:
# Création du corpus (singleton)
corpus = Corpus("discours")

# Reset du singleton 
corpus.id2aut = {}
corpus.id2doc = {}
corpus.ndoc = 0
corpus.naut = 0
corpus.iddocument = 0

# Ajout des documents au corpus
for i in range(len(df)):
    doc = Document(
        type="Speech",
        titre=f"Discours {i}",
        auteur=str(df.loc[i, AUTHOR_COL]),
        date="",
        url="",
        texte=str(df.loc[i, TEXT_COL])
    )
    corpus.add_document(doc)

print("Corpus créé")
print("Nombre de documents :", corpus.ndoc)
print("Nombre d’auteurs :", corpus.naut)


In [None]:
engine = SearchEngine(corpus)
print("SearchEngine initialisé")


In [None]:
import ipywidgets as widgets
from ipywidgets import VBox, Label, Text, IntSlider, Button, Output
from IPython.display import display


In [None]:
# Widgets
title = Label(value="Moteur de recherche")
keywords = Text(
    value="",
    placeholder="Saisir les mots clés",
    description="Mots clés:"
)
topn = IntSlider(
    value=10,
    min=1,
    max=50,
    step=1,
    description="Nb docs:"
)
btn = Button(description="Rechercher")
out = Output()

# Organisation avec VBox
ui = VBox([title, keywords, topn, btn, out])
display(ui)


In [None]:
def clique_bouton(b):
    out.clear_output()

    texte = keywords.value
    n = int(topn.value)

    with out:
        if not texte.strip():
            print(" Entrez des mots clés.")
            return

        # Appel du moteur TF-IDF
        res = engine.search(texte, n)

        if res is None or res.empty:
            print("Aucun résultat.")
            return

        display(res)

btn.on_click(clique_bouton)

print("Interface prête — entrez une requête et cliquez sur Rechercher")
