# Modèle de modération CIVIC-DRC
## Détection de propos injurieux, tribaux ou menaçants (spaCy + lexique multilingue)
Objectif : signaler à l'admin les textes hors normes avant publication.
Langues : français, lingala, kikongo, swahili, tshiluba.

In [None]:
# Cellule 1 — Imports et chargement du modèle spaCy (français)
# En ligne de commande : pip install spacy pandas scikit-learn joblib && python -m spacy download fr_core_news_sm

import spacy
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
import joblib
import re

# Charger le modèle spaCy français (tokenisation, lemmatisation)
try:
    nlp = spacy.load("fr_core_news_sm")
except OSError:
    import subprocess
    subprocess.run(["python", "-m", "spacy", "download", "fr_core_news_sm"], check=True)
    nlp = spacy.load("fr_core_news_sm")

print("spaCy chargé (fr_core_news_sm).")

In [None]:
# Cellule 2 — Lexique de 50 mots/phrases à détecter (injurieux, tribal, menaçant)
# Répartis en français, lingala, kikongo, swahili, tshiluba. À compléter selon votre contexte.

LEXIQUE_A_SIGNALER = [
    # Français (injurieux / menaces)
    "fou", "idiot", "débile", "salaud", "menteur", "traître", "mort", "tuer", "violence", "haine",
    # Lingala
    "mbwa", "likoso", "kozala", "kolya", "koboma", "mpamba", "ndoki", "lisumu", "bobe", "ebele",
    # Kikongo
    "mpasi", "nfumu", "lufu", "vonda", "ndoki", "kosa", "mbwa", "nuni", "yala", "kondwa",
    # Swahili
    "kufa", "kuua", "mwizi", "mbwa", "shari", "maovu", "adui", "hasira", "dhuluma", "fitina",
    # Tshiluba
    "kufwa", "kuvonda", "buji", "bulemu", "kabidi", "mulopwe", "bwana", "mukalanga", "tabulwa", "kabanga",
]

# On s'assure d'avoir 50 entrées (certains mots peuvent être communs à plusieurs langues)
LEXIQUE_A_SIGNALER = list(dict.fromkeys(LEXIQUE_A_SIGNALER))[:50]
print(f"Lexique : {len(LEXIQUE_A_SIGNALER)} termes à détecter.")
print(LEXIQUE_A_SIGNALER)

In [None]:
# Cellule 3 — Construction des données d'entraînement
# Phrases contenant un mot du lexique → étiquette 1 (à signaler). Phrases neutres → 0 (acceptable).

phrases_positives = [
    "le president est fou", "c est un idiot", "il faut tuer", "violence partout", "haine entre nous",
    "mbwa na yo", "kolya bato", "koboma", "kufa", "kuua", "mwizi", "adui", "ndoki", "vonda",
    "salaud de ministre", "menteur", "traître à la nation", "mort aux autres", "débile",
    "mpasi mingi", "lufu", "hasira", "maovu", "bulemu", "fitina", "lisumu", "bobe",
]

phrases_negatives = [
    "le president a annoncé un projet", "améliorer les routes", "santé et éducation",
    "construction d une école", "eau potable dans le village", "formation des jeunes",
    "transparence et bonne gouvernance", "élections libres", "développement économique",
    "sécurité alimentaire", "accès aux soins", "réparation des ponts", "emploi pour tous",
    "protection de l environnement", "culture et patrimoine", "sport pour la jeunesse",
]

texts = phrases_positives + phrases_negatives
labels = [1] * len(phrases_positives) + [0] * len(phrases_negatives)
df = pd.DataFrame({"texte": texts, "etiquette": labels})
print(df.head(10))
print(f"\nTotal : {len(df)} exemples ({df['etiquette'].sum()} à signaler, {len(df) - df['etiquette'].sum()} acceptables).")

In [None]:
# Cellule 4 — Prétraitement avec spaCy (tokenisation, lemmatisation, nettoyage)
# On normalise le texte et on extrait les lemmes pour améliorer la détection.

def preprocess_spacy(texte, nlp_model):
    if pd.isna(texte) or not isinstance(texte, str):
        return ""
    texte = re.sub(r"\s+", " ", texte.strip().lower())
    doc = nlp_model(texte)
    lemmas = [t.lemma_ for t in doc if not t.is_stop and t.is_alpha]
    return " ".join(lemmas) if lemmas else texte

df["texte_norm"] = df["texte"].apply(lambda x: preprocess_spacy(x, nlp))
print("Exemples après prétraitement :")
print(df[["texte", "texte_norm", "etiquette"]].head(8))

In [None]:
# Cellule 5 — Vectorisation TF-IDF des textes
# Transformation des textes en vecteurs numériques pour le classifieur.

X = df["texte_norm"]
y = df["etiquette"]

vectorizer = TfidfVectorizer(
    max_features=500,
    ngram_range=(1, 2),
    min_df=1,
    strip_accents="unicode",
    lowercase=True,
)

X_vec = vectorizer.fit_transform(X)
print(f"Matrice TF-IDF : {X_vec.shape[0]} textes, {X_vec.shape[1]} traits.")

In [None]:
# Cellule 6 — Entraînement du classifieur (régression logistique)
# Prédit 1 = à signaler à l'admin, 0 = acceptable.

X_train, X_test, y_train, y_test = train_test_split(
    X_vec, y, test_size=0.25, random_state=42, stratify=y
)

clf = LogisticRegression(max_iter=500, random_state=42)
clf.fit(X_train, y_train)

y_pred = clf.predict(X_test)
print("Entraînement terminé.")
print(f"Accuracy (test) : {accuracy_score(y_test, y_pred):.2%}")

In [None]:
# Cellule 7 — Évaluation : rapport de classification et matrice de confusion

print("Rapport de classification :")
print(classification_report(y_test, y_pred, target_names=["acceptable", "a_signer"]))
print("Matrice de confusion :")
print(confusion_matrix(y_test, y_pred))

In [None]:
# Cellule 8 — Sauvegarde du modèle, du vectoriseur et du lexique pour le backend
# Le backend Node pourra appeler un script Python qui charge ces fichiers.

import os
os.makedirs("model_moderation", exist_ok=True)

joblib.dump(clf, "model_moderation/classifier.joblib")
joblib.dump(vectorizer, "model_moderation/vectorizer.joblib")
joblib.dump(LEXIQUE_A_SIGNALER, "model_moderation/lexique.joblib")

print("Fichiers sauvegardés dans model_moderation/ : classifier.joblib, vectorizer.joblib, lexique.joblib.")

In [None]:
# Cellule 9 — Fonction de prédiction (réutilisable)
# Retourne True si le texte doit être signalé à l'admin, False sinon.

def predire_texte(texte, nlp_model, vec, clf_model):
    """Retourne (a_signer: bool, proba: float)."""
    if not texte or not str(texte).strip():
        return False, 0.0
    norm = preprocess_spacy(str(texte), nlp_model)
    X = vec.transform([norm])
    proba = clf_model.predict_proba(X)[0][1]  # proba classe 1 (à signaler)
    a_signer = clf_model.predict(X)[0] == 1
    return bool(a_signer), float(proba)

# Recharger pour tester (en production on charge une seule fois)
clf_loaded = joblib.load("model_moderation/classifier.joblib")
vec_loaded = joblib.load("model_moderation/vectorizer.joblib")
print("Modèle et vectoriseur rechargés.")

In [None]:
# Cellule 10 — Tests sur des exemples (dont "le president est fou")
# Vérification que les propos injurieux ou hors normes sont bien détectés.

exemples = [
    "le president est fou",
    "il faut construire des écoles",
    "salaud et traître",
    "améliorer la santé en RDC",
    "koboma bato",
    "transparence des élections",
]

print("Résultats des tests :")
print("-" * 50)
for phrase in exemples:
    a_signer, proba = predire_texte(phrase, nlp, vec_loaded, clf_loaded)
    statut = "SIGNALER À L'ADMIN" if a_signer else "acceptable"
    print(f"  '{phrase}'")
    print(f"    → {statut} (proba à signaler: {proba:.2%})")
    print()