In [None]:
import pandas as pd
import glob

# Lire tous les fichiers CSV dans les dossiers des années
data_files = glob.glob("destination_*/*.csv")
data_frames = [pd.read_csv(file) for file in data_files]
data = pd.concat(data_frames, ignore_index=True)

# Afficher les premières lignes des données
print(data.head())

# Informations générales sur les données
print(data.info())

# Statistiques descriptives
print(data.describe())

# Compter le nombre total d'entrées
total_entries = data.shape[0]
print(f"Total entries: {total_entries}")

# Analyse des voyageurs par période
period_summary = data.groupby('period').agg({
    'analytics.travelers.score': 'sum',
    'analytics.travelers.predictability': 'mean'
}).reset_index()
print(period_summary)

# Visualisation avec matplotlib ou seaborn
import matplotlib.pyplot as plt
import seaborn as sns

# Diagramme en barres du nombre total de voyageurs par période
plt.figure(figsize=(10, 6))
sns.barplot(data=period_summary, x='period', y='analytics.travelers.score')
plt.xticks(rotation=45)
plt.xlabel('Période')
plt.ylabel('Nombre total de voyageurs')
plt.title('Nombre total de voyageurs par période')
plt.tight_layout()
plt.show()

# Nuage de points entre la prévisibilité et le nombre de voyageurs par période
plt.figure(figsize=(10, 6))
sns.scatterplot(data=period_summary, x='analytics.travelers.predictability', y='analytics.travelers.score')
plt.xlabel('Prévisibilité')
plt.ylabel('Nombre total de voyageurs')
plt.title('Nuage de points: Prévisibilité vs. Nombre total de voyageurs')
plt.tight_layout()
plt.show()
