In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from statsmodels.tsa.seasonal import seasonal_decompose

# Chargement des données
def load_data(file_path):
    """
    Charger les données depuis un fichier CSV. 
    Le fichier contient des informations sur la demande en produits sanguins.
    """
    df = pd.read_csv(file_path)
    df['date'] = pd.to_datetime(df['date'], format='%Y-%m-%d')  # Assurer le bon format de date
    return df

# Prétraitement des données (gestion des valeurs manquantes, extraction de caractéristiques temporelles)
def preprocess_data(df):
    """
    Effectuer le prétraitement des données : gestion des valeurs manquantes et ajout d'attributs temporels.
    """
    df.fillna(method='ffill', inplace=True)  # Remplir les valeurs manquantes par propagation vers l'avant
    df['jour_semaine'] = df['date'].dt.weekday  # Extraire le jour de la semaine
    df['mois'] = df['date'].dt.month  # Extraire le mois
    df['année'] = df['date'].dt.year  # Extraire l'année
    return df

# Visualisation de la demande au fil du temps
def plot_time_series(df):
    """
    Visualisation de la demande en produits sanguins au fil du temps pour détecter les tendances générales.
    """
    plt.figure(figsize=(10, 6))
    sns.lineplot(x='date', y='demande', data=df, label='Demande Totale', color='blue')
    plt.title("Évolution de la demande en produits sanguins")
    plt.xlabel('Date')
    plt.ylabel('Quantité demandée')
    plt.xticks(rotation=45)
    plt.legend()
    plt.tight_layout()  # Assure que les étiquettes ne se chevauchent pas
    plt.show()

# Décomposition saisonnière de la série temporelle
def decompose_time_series(df):
    """
    Décomposer la série temporelle de la demande en tendances, saisonnalités et résidus.
    """
    df.set_index('date', inplace=True)
    decomposition = seasonal_decompose(df['demande'], model='additive', period=12)
    decomposition.plot()
    plt.tight_layout()
    plt.show()

# Histogramme de la demande pour analyser la distribution
def plot_histogram(df):
    """
    Affichage d'un histogramme de la demande pour étudier sa distribution et détecter des anomalies.
    """
    plt.figure(figsize=(8, 6))
    sns.histplot(df['demande'], kde=True, color='purple')
    plt.title('Distribution de la demande en produits sanguins')
    plt.xlabel('Quantité demandée')
    plt.ylabel('Fréquence')
    plt.tight_layout()
    plt.show()

# Chargement des données et prétraitement
df = load_data('data/produits_sanguins.csv')
df = preprocess_data(df)

# Sauvegarde des données prétraitées
df.to_csv('results/preprocessed_data.csv', index=False)
print(f"Les données prétraitées ont été sauvegardées dans 'results/preprocessed_data.csv'.")

# Visualisation des données avec différentes analyses
plot_time_series(df)
decompose_time_series(df)
plot_histogram(df)
