In [86]:
# Import des bibliothèques nécessaires
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

In [87]:
# Chargement des données
data = pd.read_csv("donnees_fake_news.csv", sep=",")

In [88]:
# Séparation des données en ensemble d'entraînement et ensemble de test
X_train, X_test, y_train, y_test = train_test_split(data['information'], data['fake'], test_size=0.2, random_state=42)

In [89]:
# Création d'un vecteur TF-IDF
vectorizer = TfidfVectorizer(max_features=10000, ngram_range=(1,2))
X_train_vect = vectorizer.fit_transform(X_train)
X_test_vect = vectorizer.transform(X_test)

In [90]:
# Entraînement du modèle de classification (Logistic Regression)
model = LogisticRegression()
model.fit(X_train_vect, y_train)

In [91]:
# Prédiction sur l'ensemble de test
y_pred = model.predict(X_test_vect)

In [92]:
# Calcul de l'accuracy
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

Accuracy: 0.9682539682539683


In [93]:
# Texte de la nouvelle fake news
new_fake_news = "Benyamin Nétanyahou répète qu’Israël combattra, même « seul », après la menace de Joe Biden au sujet des livraisons d’armes"

In [94]:
# Prétraitement du texte de la nouvelle fake news
new_fake_news_vectorized = vectorizer.transform([new_fake_news])

In [95]:
# Prédiction de la nouvelle fake news
prediction = model.predict(new_fake_news_vectorized)

In [96]:
# Affichage du résultat de la prédiction
if prediction[0] == 1:
    print(new_fake_news)
    print("La nouvelle est prédite comme étant une fake news.")
else:
    print(new_fake_news)
    print("La nouvelle est prédite comme étant authentique.")

Benyamin Nétanyahou répète qu’Israël combattra, même « seul », après la menace de Joe Biden au sujet des livraisons d’armes
La nouvelle est prédite comme étant authentique.
