# 02 - Indicateurs & Exploration

Maintenant que nous avons nos données, nous allons calculer des KPIs essentiels et créer des visualisations interactives avec **Plotly**.

### Objectifs :
1. Calculer la note moyenne et le volume.
2. Segmenter les avis (Promoteurs vs Détracteurs).
3. Créer des graphiques (Barres, Donut).

## 1. Chargement des Données

Pour cet exercice, nous allons simuler un chargement de données si vous n'avez pas exécuté le notebook précédent, ou utiliser le DataFrame `df_final`.

In [None]:
import pandas as pd
import plotly.express as px


df = pd.read_csv('df_final.csv')

df.head()

## 2. Calcul des KPIs

Les indicateurs clés de performance (KPIs) nous donnent une vue d'ensemble immédiate.

In [None]:
df[df['rating'] == 3]

In [None]:
# 1. Volume total
total_reviews = len(df)

# 2. Note moyenne
avg_rating = round(df['rating'].mean(), 2)

# 3. Segmentation NPS (Net Promoter Score)
# Promoteurs : 4-5 étoiles
# Neutres : 3 étoiles
# Détracteurs : 1-2 étoiles

promoters = len(df[df['rating'] >= 4])
detractors = len(df[df['rating'] <= 2])
neutrals = len(df[df['rating'] == 3])

print(f"Total: {total_reviews}")
print(f"Moyenne: {avg_rating}/5")
print(f"Promoteurs: {promoters} | Détracteurs: {detractors}")

## 3. Visualisations avec Plotly

Plotly permet de créer des graphiques interactifs très simplement.

### A. Volumétrie par Source (Camembert/Donut)

In [None]:
fig_pie = px.pie(
    df, 
    names='source', 
    title='Répartition des avis par Store',
    hole=0.6, # Pour faire un donut
    color_discrete_sequence=['#36A2EB', '#FF6384'] # Couleurs personnalisées
)
fig_pie.show()

### B. Distribution des Notes (Barres Horizontales)

In [None]:
rating_counts = df['rating'].value_counts().sort_index().reset_index()
rating_counts.columns = ['Note', 'Volume']

fig_bar = px.bar(
    rating_counts, 
    x='Volume', 
    y='Note', 
    orientation='h', 
    title='Distribution des Notes',
    text='Volume', # Affiche le chiffre sur la barre
    color_discrete_sequence=['#f1c40f']
)
fig_bar.show()

### C. Évolution Temporelle

In [None]:
daily_counts = df.groupby('date').size().reset_index(name='count')

fig_line = px.bar(
    daily_counts, 
    x='date', 
    y='count', 
    title='Évolution du nombre d\'avis par jour'
)
fig_line.show()

## Conclusion

Ces graphiques constitueront le cœur de notre dashboard. Dans la prochaine étape, nous allons ajouter une couche d'intelligence artificielle pour analyser le *contenu* des commentaires.