**Une série temporelle** peut être décomposée en 3 composantes.

* **Tendance :** Mouvement de hausse et de baisse des données au cours du temps sur une longue période (par exemple le prix de l’immobilier)

* **Saisonnalité :** Variance saisonnière (par exemple une augmentation de la demande de glace pendant l’été)

* **Bruit :** Des pics et des creux à intervalles aléatoires

Avant de pouvoir construire et d’appliquer un modèle statistique sur une série temporelle, nous devons nous assurer qu’elle est **stationnaire.**

Il y a deux façons principales de déterminer si une série temporelle donnée est stationnaire:

* **A l'oeil nu :** La série temporelle est stationnaire si elle reste constante dans le temps 

* **Test de Dickey-Fuller augmenté (ADF) :**  La série temporelle est considérée comme stationnaire si la valeur p est faible (selon l’hypothèse nulle) et si les valeurs critiques à des intervalles de confiance de 1%, 5%, 10% sont aussi proches que possible des statistiques de l’ADF (Augmented Dickey-Fuller)

* La moyenne de la série ne doit pas être fonction du temps.
Une série **n’est pas stationnaire si** la moyenne augmente avec le temps.

* La variance de la série ne doit pas être une fonction du temps. 
Une série **n’est pas stationnaire si** la variance des données varient dans le temps.

Si une série temporelle **n'est pas stationnaire -->** 

* Prendre **le logarithme** de la variable dépendante est un moyen simple de réduire le taux d’augmentation de la moyenne mobile : df_log = np.log(df)

* **Soustraire** la moyenne mobile : rolling_mean = df_log.rolling(window=12).mean() ;   df_log_minus_mean = df_log - rolling_mean


**Le processus AR signifie autorégressif.**

Concrètement si l’on considère un processus stationnaire Xt , 
on considère qu’il est autorégressif d’ordre p si l’on peut expliquer 
sa valeur à l’instant t en utilisant ses p termes précédents.

**---------------------------------------------------------------------------------------------------**

**Le processus MA signifie ‘moving average’ ou en français moyenne mobile.**

Soit Xt  une série temporelle, on considère que c’est un processus MA d’ordre p 
si on peut exprimer sa valeur à l’instant t comme une 
combinaison linéaire d’erreur aléatoires (bruit blanc).

**---------------------------------------------------------------------------------------------------**

**le modèle ARMA** est tout simplement une combinaison d’un processus AR et d’un processus MA. 

Cela permet de modéliser des séries temporelles plus complexes.

Cependant l’une des limitations de ce modèle est qu’il ne peut modéliser que des séries temporelles **stationnaires.**


Trois entiers **(p, d, q)** sont généralement utilisés pour paramétrer les modèles ARIMA :

* p : nombre de termes autorégressifs (ordre AR)
* d : nombre de différences non saisonnières (ordre de différenciation)
* q : nombre de termes moyens mobiles (ordre MA)


**Le I du modèle ARIMA** signifie ‘integrated’ pour intégration.
**Le modèle ARIMA** est une combinaison d'un processus de différenciation et du processus ARMA classique.

* En différenciant les séries temporelles ( X(t)-X(t-1) ), il est possible de retirer les tendances qu’elles présentent pour les stationnariser.

* Ainsi en différenciant la série une fois , la dépendance temporelle linéaire est éliminée et la différence est stationnaire.

* De la même façon, une tendance quadratique peut être éliminée en différenciant la série deux fois.

* Une fois la série stationnarisée, il est alors possible  d’appliquer le modèle ARMA.


Par ailleurs, si la série temporelle présente à la fois 
* une tendance et 
* une saisonnalité,

il est possible d’utiliser **le modèle SARIMA** qui est un modèle ARIMA 
prenant aussi en compte une composante saisonnière.

**la fonction SARIMAX** de la bibliothèque **statsmodels**, 
il est possible de prédire la série temporelle sur les N prochains mois. 

Plus récemment **les réseaux de neurones** sont devenus de plus en plus utilisés pour la prédiction des séries temporelles car ils viennent corriger certains défauts des méthodes ‘classiques’ comme **l’ARIMA.**