In [3]:
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
import pandas as pd
import time


# Daten laden
file_produkte = "produkte abteilungen.csv"
df = pd.read_csv(file_produkte)


# Trainingsdaten vorbereiten
X_train = df["Produkt"]
y_train = df["Abteilung"]

# Text in numerische Features umwandeln
vectorizer = CountVectorizer()
X_train_vec = vectorizer.fit_transform(X_train)

# Naive Bayes Modell trainieren
model = MultinomialNB()
model.fit(X_train_vec, y_train)

# Funktion zur Vorhersage der Abteilung mit Wahrscheinlichkeitsbewertung
def predict_abteilung(produktname):
    X_test_vec = vectorizer.transform([produktname])
    probabilities = model.predict_proba(X_test_vec)
    predicted_class = model.classes_[probabilities.argmax()]
    confidence = probabilities.max()
    return predicted_class, confidence

# Funktion zur Klassifikation einer Liste von Produkten mit Zeitmessung
def classify_products(einkaufsliste):
    klassifizierte_liste = {}
    start_time = time.time()
    
    for produkt in einkaufsliste:
        start_time_product = time.time()
        abteilung, confidence = predict_abteilung(produkt)
        elapsed_time = time.time() - start_time_product
        klassifizierte_liste[produkt] = (abteilung, confidence, elapsed_time)
        print(f"[{elapsed_time:.2f} Sekunden] {produkt} → {abteilung} (Sicherheit: {confidence:.2%})")
    
    elapsed_time_total = time.time() - start_time
    print(f"\n⏳ Gesamte Verarbeitungszeit: {elapsed_time_total:.2f} Sekunden\n")
    return klassifizierte_liste

# Beispiel-Liste
KURZE_LISTE = ["Milch", "Bananen", "Nudeln", "Mehl", "Tomatensoße", "Joghurt"]
classified = classify_products(KURZE_LISTE)


[0.00 Sekunden] Milch → Milchprodukte (Sicherheit: 10.05%)
[0.00 Sekunden] Bananen → Backmittel (Sicherheit: 5.26%)
[0.00 Sekunden] Nudeln → Trockenprodukte (Sicherheit: 10.05%)
[0.00 Sekunden] Mehl → Backmittel (Sicherheit: 10.05%)
[0.00 Sekunden] Tomatensoße → Backmittel (Sicherheit: 5.26%)
[0.00 Sekunden] Joghurt → Milchprodukte (Sicherheit: 9.57%)

⏳ Gesamte Verarbeitungszeit: 0.00 Sekunden

