# EDA - Scores Touristiques
## Analyse des indicateurs calculés

In [1]:
import matplotlib.pyplot as plt
import seaborn as sns
from pathlib import Path
import pandas as pd
import numpy as np

# 1. Configuration du style
sns.set_theme(style="whitegrid", palette="viridis")
plt.figure(figsize=(10, 6))

# 2. Chargement des données (exemple)
df = pd.DataFrame({
    'season': ['Printemps']*30 + ['Été']*30 + ['Automne']*30 + ['Hiver']*30,
    'avg_score': (list(np.random.normal(2.8, 0.3, 30)) + 
                 list(np.random.normal(3.2, 0.2, 30)) +
                 list(np.random.normal(2.5, 0.4, 30)) +
                 list(np.random.normal(1.9, 0.3, 30)))
})

# 3. Boxplot version moderne (sans warning)
ax = sns.boxplot(
    data=df,
    x='season',
    y='avg_score',
    hue='season',  # Obligatoire avec palette
    palette="viridis",
    legend=False,  # Évite la légende redondante
    width=0.6,
    linewidth=1.5,
    fliersize=4
)

# 4. Personnalisation avancée
ax.set(
    title='Distribution des Scores Touristiques par Saison\n',
    xlabel='',
    ylabel='Score Moyen',
    ylim=(1, 4)  # Ajuster selon vos données
)

# 5. Ajout de moyennes
sns.stripplot(
    data=df,
    x='season',
    y='avg_score',
    color='black',
    size=4,
    alpha=0.3,
    jitter=True
)

# 6. Finalisation
plt.axhline(y=2.5, color='red', linestyle='--', alpha=0.5)  # Seuil de référence
sns.despine(left=True)
plt.tight_layout()

# 7. Sauvegarde professionnelle
output_dir = Path("plots")
output_dir.mkdir(exist_ok=True)
plt.savefig(
    output_dir / "season_boxplot_seaborn.png",
    dpi=300,
    bbox_inches='tight',
    transparent=False
)
plt.close()