### Import packages

In [1]:
import pandas as pd
import sqlite3
import seaborn as sns
import matplotlib.pyplot as plt
import spacy 
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
import re
import sys
import os


# Définition du chemin du répertoire courant
sys.path.append(os.path.abspath(os.path.join(os.getcwd(), '..', 'src')))

from processing.data_handler import DataHandler
from processing.text_preprocessor import TextPreprocessor
from processing.restaurant_classifier import RestaurantClassifier
from processing.review_clusterer import ReviewClusterer
from processing.sentiment_analyzer import SentimentAnalyzer
from processing.visualizer import Visualizer
from processing.keyword_extractor import KeywordExtractor

In [2]:
# Chemin vers la DB
db_path = os.path.abspath(os.path.join(os.getcwd(), '..', 'data', 'database.db'))

# Connexion à la base de données
conn = sqlite3.connect(db_path)

# Vérifier la connexion
print("Connexion réussie à la base de données")

Connexion réussie à la base de données


In [3]:
# recuperer les données de restaurant 
query = "SELECT * FROM restaurants"

infos_resto = pd.read_sql_query(query, conn)


In [4]:
# recuperer les avis par restaurant
query = "SELeCT * FROM avis"
avis = pd.read_sql_query(query, conn)

In [5]:
dh = DataHandler()

# Combiner et agréger les données
aggregated_data = dh.combine_and_aggregate(avis, infos_resto)

In [6]:
# nom des colonnes de 
print(aggregated_data.columns)

Index(['id_restaurant', 'commentaire', 'nom', 'type_cuisine',
       'fourchette_prix', 'description', 'adresse', 'note_moyenne'],
      dtype='object')


In [9]:
# Prétraitement des commentaires
tp = TextPreprocessor()
aggregated_data['commentaire'] = tp. preprocess_reviews(aggregated_data['commentaire'])


In [10]:
# afficher les commentaires prétraités
print(aggregated_data['commentaire'])

0        quantité garniture galett minable mini morceal...
1        juste après cinéma déjeuner famille deux enfan...
2        restaurer sans intérêt crêpe saler très médioc...
3        demander crêpe jour bah pendant vacance comme ...
4        absolument aucun intérêt culinaire crêpe sucre...
                               ...                        
13796    visiter lyon durer fête lumière viller florent...
13797    petit bijou restaurer long marche jusqu sommet...
13798    meilleur hôtel lyon piscine jacuzzi meilleur v...
13799    emplacement service équipement incroyabler cha...
13800    prendre menu dégustation bien penser magnifiqu...
Name: commentaire, Length: 13801, dtype: object


In [11]:
# Sauvegarde des données agrégées dans un fichier CSV
dh.save_preprocessed_data(aggregated_data, "../data/dataClean/restaurants_data.csv")
print("Les données ont été sauvegardées dans 'restaurants_data.csv'.")

Les données ont été sauvegardées dans 'restaurants_data.csv'.


In [12]:
# Sauvegarde des données agrégées dans une base SQLite
dh.save_to_sqlite(aggregated_data, "../data/dataClean/restaurants.db", "restaurants_table")
print("Les données ont été sauvegardées dans la base SQLite 'restaurants.db'.")

Les données ont été sauvegardées dans la base SQLite 'restaurants.db'.


In [13]:
# Analyse des sentiments par restaurant
results = SentimentAnalyzer.analyze_by_restaurant(aggregated_data)

# Affichage des résultats
print("\nRésultats des sentiments par restaurant :")
for result in results:
    print(f"Restaurant (ID: {result['id_restaurant']} - {result['nom']}): "
          f"Polarité={result['polarité']:.2f}, Subjectivité={result['subjectivité']:.2f}")




Résultats des sentiments par restaurant :
Restaurant (ID: 1 - Crêperie Amélie): Polarité=0.00, Subjectivité=0.00
Restaurant (ID: 2 - Crêperie Amélie): Polarité=0.00, Subjectivité=0.00
Restaurant (ID: 3 - Crêperie Amélie): Polarité=0.00, Subjectivité=0.00
Restaurant (ID: 4 - Crêperie Amélie): Polarité=0.10, Subjectivité=0.40
Restaurant (ID: 5 - Crêperie Amélie): Polarité=0.00, Subjectivité=0.00
Restaurant (ID: 6 - Crêperie Amélie): Polarité=-0.04, Subjectivité=0.49
Restaurant (ID: 7 - Crêperie Amélie): Polarité=0.26, Subjectivité=0.52
Restaurant (ID: 8 - Crêperie Amélie): Polarité=0.00, Subjectivité=0.00
Restaurant (ID: 9 - Crêperie Amélie): Polarité=0.00, Subjectivité=0.00
Restaurant (ID: 10 - Crêperie Amélie): Polarité=0.00, Subjectivité=0.00
Restaurant (ID: 11 - Crêperie Amélie): Polarité=0.21, Subjectivité=0.57
Restaurant (ID: 12 - Crêperie Amélie): Polarité=0.00, Subjectivité=0.00
Restaurant (ID: 13 - Crêperie Amélie): Polarité=0.00, Subjectivité=0.00
Restaurant (ID: 14 - Crêperie