# Objectifs
A partir d'une série temporelle d'un processus physique donné, il faudrait d'être capable d'analyser et de prévoir les données. Il faudrait également être en mesure d'évaluer l'erreur de la méthode.

## Problème
Supposons que nous ayons un oscillateur harmonique amorti et que ses coordonnées de position sont mesurées à chaque intervalle de temps $dt $.

Les temps \( t \) sont générés de 0 à \( T \) avec un pas \( dt \) :
$t = 0, \, dt, \, 2dt, \, \ldots, \, (n-1)dt$
où $( n = \frac{T}{dt} $).

La position \( x(t) \) de l'oscillateur harmonique amorti est donnée par :
$x(t) = A e^{-bt} \cos(\omega t)$

où :
\begin{align*}
A; \text{ est l'amplitude}, \\
b; \text{ est le coefficient d'amortissement}, \\
\omega; \text{ est la fréquence angulaire}.
\end{align*}

Les données de position sont le résultat de mesures, qui par définition sont d'une précision limitée. 
Les erreurs de mesure agissent comme un bruit gaussien sur les vraies positions. 
Les données de position bruitées $( x_{\text{noisy}}(t) $) sont donc obtenues en ajoutant un bruit gaussien aux vraies données de position :

$x_{\text{noisy}}(t) = x(t) + \epsilon(t)$

où $( \epsilon(t) \sim \mathcal{N}(0, \sigma^2) $) est un bruit normalement distribué avec une moyenne de 0 et un écart type de $( \sigma $). 

Le code donné dans la cellule ci-dessous stocke la position dépendante du temps bruitée et le temps de l'oscillateur dans un fichier excel.

In [None]:
# Importer les bibliothèques nécessaires
import numpy as np
import pandas as pd

# Définir la graine aléatoire pour la reproductibilité
np.random.seed(42)

# Définir les paramètres pour l'oscillateur harmonique amorti
A = 1.0    # Amplitude
b = 0.05   # Coefficient d'amortissement
omega = 2 * np.pi / 5  # Fréquence angulaire
T = 100    # Temps total
dt = 0.1   # Pas de temps

# Générer des points de temps
t = np.arange(0, T, dt)

# Générer les données d'oscillation amortie
x = A * np.exp(-b * t) * np.cos(omega * t)

# Ajouter du bruit aux données
noise = np.random.normal(scale=0.1, size=len(t))
x_noisy = x + noise

# Créer un DataFrame
df = pd.DataFrame({'Time': t, 'Position': x_noisy})

df.to_excel('damped_oscillator.xlsx','series')

### Data importation and visualization
Import the excel file and visulaize the data with different techniques

In [None]:
# Exercice 1
# Lisez le fichier excel damped_oscillator.xlsx en utilisant pandas dans un objet dataframe

In [None]:
# Exercice 2
# Tracez le temps (axe des x) par rapport à la position (axe des y) en utilisant matplotlib pyplot. Ajoutez des labels appropriés.

In [None]:
# Exercice 3
# Utilisez la bibliothèque statsmodels.graphics.tsaplots pour :
# Tracer la fonction d'autocorrélation de la série temporelle des données de position (50 retards par exemple)

# Tracer la fonction d'autocorrélation partielle de la série temporelle des données de position (50 retards par exemple)

### Modélisation et prévision
Après avoir dessiné et visualisé les données de base, essayez d'analyser les données de position et de faire des prévisions en utilisant le modèle SARIMAX

In [None]:
# Exercice 4 
# importez itertools, et utilisez-le pour générer différentes combinaisons de paramètres pour le modèle SARIMAX


# Définissez les paramètres p, q pour prendre n'importe quelle valeur entre 1 et 2, et le paramètre d pour prendre n'importe quelle valeur entre 0 et 1


# Générez toutes les différentes combinaisons de triplets p, d et q


# Générez toutes les différentes combinaisons de triplets saisonniers p, d et q (c'est-à-dire, P, D, Q)

In [None]:
# Exercice 5 
# Définissez un modèle SARIMAX et identifiez les paramètres optimaux selon le critère AIC

import warnings
warnings.filterwarnings("ignore") # spécifie d'ignorer les messages d'avertissement

# Identification du meilleur modèle parmi différentes combinaisons de pdq et seasonal_pdq

In [None]:
# Exercice 6 
# Affichez le meilleur ensemble de paramètres selon le critère AIC

In [None]:
# Exercice 7 
# Ajustez à nouveau le modèle en utilisant les paramètres optimaux, et affichez un résumé des résultats

In [None]:
# Exercice 8 
# Prévoir les valeurs futures pour 50 étapes

In [None]:
# Exercice 9 
# Tracez les résultats, la tendance prédite selon le modèle, et la prévision

# Tracez les données originales, c'est-à-dire le temps (axe des x) vs position

# Tracez le temps (axe des x) vs prédictions 

# Tracez l'indice de prévision (axe des x) vs valeurs de prévision

### Analyse des erreurs
Analysez les erreurs des prédictions

In [None]:
# Exercice 10 
# Calculez :
#   la somme totale des carrés (SST),
#   la somme des carrés des erreurs (SSE),
#   la somme des carrés de la régression (SSR),
# et ensuite le coefficient de détermination (R²) 

# Affichez les résultats

In [None]:
# Exercice 11 
# Les degrés de liberté sont 
n = len(observed)  # Nombre d'observations
p = len(results.params)  # Nombre de prédicteurs dans SARIMAX

# Calculez le MST, MSE, MSR, et le score F


# Affichez les résultats

### Modèle linéaire de Holt

Bien que SARIMAX fournisse une bonne prévision pour les points futurs, d'autres méthodes comme la méthode linéaire de Holt ne fonctionnent pas aussi bien dans le cas de ces données. Vérifions cela.

In [None]:
# Exercice 12 
# Ajustez le modèle de tendance linéaire de Holt aux mêmes données

In [None]:
# Exercice 13 
# Faites des prédictions sur l'échantillon et des prévisions pour les points futurs (50 étapes)

In [None]:
# Exercice 14 
# Tracez les données originales, la tendance prédite selon le modèle linéaire de Holt, et la prévision pour les points futurs