### Import packages

In [1]:
import pandas as pd
import sqlite3
import seaborn as sns
import matplotlib.pyplot as plt
import spacy 
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
import re
import sys
import os


# Définition du chemin du répertoire courant
sys.path.append(os.path.abspath(os.path.join(os.getcwd(), '..', 'src')))

from processing.data_handler import DataHandler
from processing.text_preprocessor import TextPreprocessor
from processing.restaurant_classifier import RestaurantClassifier
from processing.review_clusterer import ReviewClusterer
from processing.sentiment_analyzer import SentimentAnalyzer
from processing.visualizer import Visualizer
from processing.keyword_extractor import KeywordExtractor

In [2]:
# Chemin vers la DB
db_path = os.path.abspath(os.path.join(os.getcwd(), '..', 'data', 'database.db'))

# Connexion à la base de données
conn = sqlite3.connect(db_path)

# Vérifier la connexion
print("Connexion réussie à la base de données")

Connexion réussie à la base de données


In [3]:
# recuperer les données de restaurant 
query = "SELECT * FROM restaurants"

infos_resto = pd.read_sql_query(query, conn)


In [4]:
# recuperer les avis par restaurant
query = "SELeCT * FROM avis"
avis = pd.read_sql_query(query, conn)

In [5]:
dh = DataHandler()

# Combiner et agréger les données
aggregated_data = dh.combine_and_aggregate(avis, infos_resto)

In [6]:
# nom des colonnes de 
print(aggregated_data.columns)

Index(['id_restaurant', 'commentaire', 'nom', 'type_cuisine',
       'fourchette_prix', 'description', 'adresse', 'note_moyenne'],
      dtype='object')


In [7]:

# Sauvegarde des données agrégées dans un fichier CSV
dh.save_preprocessed_data(aggregated_data, "restaurants_data.csv")
print("Les données ont été sauvegardées dans 'restaurants_data.csv'.")

Les données ont été sauvegardées dans 'restaurants_data.csv'.


In [8]:
# Sauvegarde des données agrégées dans une base SQLite
dh.save_to_sqlite(aggregated_data, "restaurants.db", "restaurants_table")
print("Les données ont été sauvegardées dans la base SQLite 'restaurants.db'.")

Les données ont été sauvegardées dans la base SQLite 'restaurants.db'.


In [9]:
# Prétraitement des commentaires
tp = TextPreprocessor()
aggregated_data['commentaire'] = tp. preprocess_reviews(aggregated_data['commentaire'])


In [10]:
# afficher les commentaires prétraités
print(aggregated_data['commentaire'])

0       pizza excellent bon ambiance très bon service ...
1       endroit parfaire lyon manger pizza napolitain ...
2       déguster excellente pizz pizza diavola juste p...
3       tre bel endroit famill manger très bien consei...
4       très bon pizza bien gourmand pâte jour délicie...
                              ...                        
9471    visiter lyon durer fête lumière viller florent...
9472    petit bijou restaurer long marche jusqu sommet...
9473    meilleur hôtel lyon piscine jacuzzi meilleur v...
9474    emplacement service équipement incroyabler cha...
9475    prendre menu dégustation bien penser magnifiqu...
Name: commentaire, Length: 9476, dtype: object


In [11]:
# Analyse des sentiments par restaurant
results = SentimentAnalyzer.analyze_by_restaurant(aggregated_data)

# Affichage des résultats
print("\nRésultats des sentiments par restaurant :")
for result in results:
    print(f"Restaurant (ID: {result['id_restaurant']} - {result['nom']}): "
          f"Polarité={result['polarité']:.2f}, Subjectivité={result['subjectivité']:.2f}")




Résultats des sentiments par restaurant :
Restaurant (ID: 1 - L'affreux Jojo): Polarité=0.75, Subjectivité=0.75
Restaurant (ID: 2 - L'affreux Jojo): Polarité=0.00, Subjectivité=0.00
Restaurant (ID: 3 - L'affreux Jojo): Polarité=0.00, Subjectivité=0.00
Restaurant (ID: 4 - L'affreux Jojo): Polarité=0.00, Subjectivité=0.00
Restaurant (ID: 5 - L'affreux Jojo): Polarité=0.00, Subjectivité=0.00
Restaurant (ID: 6 - L'affreux Jojo): Polarité=0.00, Subjectivité=0.00
Restaurant (ID: 7 - L'affreux Jojo): Polarité=0.50, Subjectivité=0.50
Restaurant (ID: 8 - L'affreux Jojo): Polarité=0.75, Subjectivité=0.75
Restaurant (ID: 9 - L'affreux Jojo): Polarité=0.33, Subjectivité=0.67
Restaurant (ID: 10 - L'affreux Jojo): Polarité=0.33, Subjectivité=0.67
Restaurant (ID: 11 - L'affreux Jojo): Polarité=0.33, Subjectivité=0.67
Restaurant (ID: 12 - L'affreux Jojo): Polarité=0.75, Subjectivité=0.75
Restaurant (ID: 13 - L'affreux Jojo): Polarité=0.67, Subjectivité=0.83
Restaurant (ID: 14 - L'affreux Jojo): Polar