###**Manipulation de données de séries chronologiques avec xts et zoo dans R**
+ *4 heures*
+ *15 vidéos*
+ *55 exercices*
+ *43 353 participants*
+ *4 500 XP*

####**Description du cours**

+ *Les séries chronologiques sont partout autour de nous, des journaux de serveur aux données financières à haute fréquence. La gestion et la manipulation d'observations ordonnées sont au cœur de toute analyse de séries chronologiques. Les packages xts et zoo fournissent un ensemble d'outils puissants pour rendre cette tâche rapide et sans erreur. Dans ce cours, vous apprendrez tout, des bases de xts aux trucs et astuces avancés pour travailler avec des données de séries chronologiques dans R.*

####**1) Introduction aux séries temporelles extensibles, en utilisant xts et zoo pour les séries temporelles**

+ ***xts et zoo ne sont que deux des nombreux types d'objets différents qui existent dans R. Ce chapitre présente les objets de base de xts et zoo et leurs composants, et propose des exemples de construction et d'examen des données.***

|OBJECTIFS|
|---------|
Présentation des xts et des objets du zoo
Qu'est-ce qu'un objet xts ?
Plus qu'une matrice
Votre premier objet xts
Déconstruire xts
Indices basés sur le temps
Importation, exportation et conversion de séries chronologiques
Conversion d'objets xts
Importation de données
Exporter des objets xts

####**2) Premier ordre du jour - Manipulations de base**

+ ***Maintenant que vous pouvez créer des objets xts de base, il est temps de voir à quel point ils peuvent être puissants. Ce chapitre couvrira les bases de l'une des fonctionnalités les plus utiles de xts : le sous-ensemble basé sur le temps. À partir de là, vous explorerez d'autres moyens d'extraire des données à l'aide d'expressions temporelles et conclurez sur la manière d'effectuer des opérations de base telles que l'ajout et la soustraction de vos objets xts.***

|OBJECTIFS|
|---------|
Présentation des requêtes basées sur le temps
La norme ISO-8601
Recherche de dates
Extraction d'intervalles intrajournaliers récurrents
Techniques d'extraction alternatives
Sélection de lignes avec des objets temporels
Mettre à jour et remplacer des éléments
Méthodes pour trouver des périodes dans vos données
Trouver la première ou la dernière période de temps
Combiner le premier et le dernier
Opérations mathématiques utilisant xts
Arithmétique matricielle - additionnez, soustrayez, multipliez et divisez dans le temps !
Mathématiques avec des index qui ne se chevauchent pas

####**3) Fusionner et modifier des séries chronologiques**

+ ***L'une des parties les plus importantes de l'utilisation de données de séries chronologiques consiste à créer des séries chronologiques dérivées. Pour le faire efficacement, il est essentiel de garder une trace des dates et des heures. Dans ce chapitre, vous verrez comment xts gère la fusion de nouvelles colonnes et lignes dans des données existantes, comment gérer les inévitables observations manquantes dans les séries chronologiques et comment décaler votre série dans le temps.***

|OBJECTIFS|
|---------|
Fusionner des séries temporelles
Combiner xts par colonne avec fusion
Combiner xts par ligne avec rbind
Quels types de données peuvent être combinés à l'aide de la fusion ?
Manipulation des manquants
Remplir les valeurs manquantes en utilisant la dernière observation ou la précédente
Interpolation NA à l'aide de na.approx()
Décalages et différences
Combiner une série chronologique en avance et en retard
Calculer une différence d'une série en utilisant diff()
Quelle est la principale différence de décalage entre xts et zoo

####**4) Appliquer et agréger par temps**

+ ***Maintenant, le plaisir commence ! Un modèle d'utilisation très courant des séries chronologiques consiste à calculer des valeurs pour des périodes de temps disjointes ou des valeurs agrégées d'une fréquence plus élevée à une fréquence plus faible. Pour la plupart des séries, vous voudrez souvent voir la moyenne hebdomadaire d'un prix ou d'une mesure. Vous pouvez même vous retrouver à regarder des données qui ont des fréquences différentes et vous devez vous normaliser à la fréquence la plus basse. C'est dans ce chapitre que tout se passe. Accrochez-vous bien, et allons-y !***

|OBJECTIFS|
|---------|
Appliquer les fonctions par heure
Trouver des intervalles par temps en xts
Appliquer une fonction par période(s) de temps
Utilisation de lapply() et split() pour appliquer des fonctions sur des intervalles
Sélection par points de terminaison vs split-lapply-rbind
Conversion de périodicité
Convertir des séries univariées en données OHLC
Convertir une série à une fréquence inférieure
Fonctions de roulement
Calculer la valeur glissante de base de la série par mois
Calculer l'écart type glissant d'une série chronologique

####**5) Fonctionnalités supplémentaires de xts**

+ ***Maintenant que vous êtes à l'aise avec la plupart des fonctionnalités de base, il est temps d'explorer certains des aspects moins connus (mais puissants !) de l'utilisation de xts. Dans ce dernier chapitre, vous utiliserez les éléments internes de l'index pour trouver des itérations répétitives, découvrirez comment xts fournit une prise en charge intuitive des fuseaux horaires et expérimenterez des moyens d'explorer vos données par heure, y compris l'identification de la fréquence et de la couverture dans le temps. Finissons ce cours !***

|OBJECTIFS|
|---------|
Index, attributs et fuseaux horaires
Heure via index()
Attributs de classe - tclass, tzone et tformat
Fuseaux horaires (et pourquoi vous devriez vous en soucier !)
Périodes, périodicité et horodatages
Détermination de la périodicité
Trouver le nombre de périodes dans vos données
Outils d'index secrets
Modification des horodatages

###**Présentation des xts et des objets zoo**

####**1. Présentation des xts et des objets zoo**

+ Alors, qu’est-ce que xts?

####**2. Qu’est-ce que xts?**

+ xts signifie « eXtensible time series »; Des objets conçus pour être flexibles et puissants, conçus pour faciliter l’utilisation des séries chronologiques. 

+ Au cœur de xts se trouve un objet zoo, un objet matriciel plus un vecteur de temps correspondant à chaque ligne, qui à son tour représente une observation dans le temps. 

+ Visuellement, vous pouvez considérer cela comme des données plus un éventail de fois.

####**3. Un exemple xts**

+ Pour illustrer, nous allons créer une matrice simple appelée « x ». Chaque ligne de nos données est une observation dans le temps. 

+ Pour suivre ces observations, nous avons des dates dans un objet appelé « idx ». 

+ Notez que cet index *doit* être un objet de temps réel, et non une chaîne ou un nombre qui ressemble à l’heure. 

+ Maintenant, xts vous permet d’utiliser presque n’importe quelle classe de temps, que ce soit la classe **Date, POSIX times, timeDate, chron et plus encore** - mais ils doivent être basés sur le temps. Ici, nous utilisons les objets Date de R.

####**4. Un exemple xts**
+ À ce stade, nous n’avons pas de série chronologique. 
+ Nous devrons les joindre pour créer notre objet xts. 
+ Pour ce faire, nous appelons le constructeur xts avec nos données « x » et passons nos dates « idx » à commander.

####**5. Le constructeur xts**

+ Le constructeur dispose de quelques arguments optionnels, le plus utile étant « tzone », pour définir les fuseaux horaires et « unique », qui Force tous les temps être unique. 

+ Notez que xts n’applique pas l’unicité de votre index, mais vous pouvez en avoir besoin dans vos propres applications. 

+ Une chose à noter est que votre index doit être dans l’ordre croissant de temps. 

+ Observations antérieures en haut de votre objet, et observations plus récentes plus tard vers le bas. 

+ Si vous transmettez un vecteur non trié, xts réorganisera votre index et les lignes correspondantes de vos données pour vous assurer que vous disposez d’une série chronologique correctement ordonnée.

####**6. Un exemple xts**

+ En regardant l’exemple, vous pouvez voir que nous avons maintenant une matrice de valeurs avec des dates à gauche. 

+ Ils peuvent ressembler à des noms de ligne, mais rappelez-vous que c’est vraiment notre index.

####**7. Comportement spécial xts**

+ Alors, qu’est-ce qui rend xts spécial? Comme je l’ai mentionné précédemment, xts est une matrice qui a des temps associés pour chaque observation. 

+ Les opérations de base fonctionnent comme sur une matrice, presque. 

+ Une différence que vous remarquerez est que les sous-ensembles préserveront toujours la forme « matrice » de l’objet, choisir une ou plusieurs colonnes donnera toujours un autre objet de matrice. 

+ Une autre différence est que les attributs sont généralement conservés lorsque vous travaillez avec vos données, donc si vous stockez quelque chose comme un horodatage du moment où vous avez acquis les données dans un sous-ensemble 'attribut xts' n’entraînera pas la perte de ces informations. 

+ Enfin, puisque xts est une sous-classe de zoo, vous obtenez toute la puissance des méthodes de zoo gratuitement. Nous verrons à quel point c’est important tout au long du cours.

####**8. Déconstruire xts**

+ Un dernier point avant de décomposer les exercices. 

+ Parfois, il sera nécessaire d’inverser les étapes que nous avons prises pour créer la série chronologique, et d’extraire plutôt nos données brutes ou nos temps bruts pour les utiliser dans d’autres contextes.
+  XTS fournit deux fonctions que nous allons couvrir ici. 

+ coredata() est la façon dont vous récupérez la matrice brute, et index() est la façon dont vous extrayez les dates ou les heures. Simple et efficace.

####**9. Entraînons-nous!**
+ Maintenant, mettons-nous au travail!

In [None]:
install.packages("xts")
install.packages("zoo")
install.packages("PerformanceAnalytics")

In [None]:
library(xts)
library(zoo)
library(PerformanceAnalytics)

###**EXERCICES**


####**Qu'est-ce qu'un objet xts ?**

+ Il existe de nombreux types d'objets dans R. Avec une variété de fonctionnalités différentes, chacun a un but unique. 

+ Certaines classes héritent du comportement de leurs parents, permettant ainsi des extensions personnalisées aux objets R existants et bien compris. Il est ainsi facile d'adapter le code existant à de nouvelles fonctionnalités.

+ C'est pour cette raison que xts étend la classe populaire zoo. Sachant cela, et ce que vous avez vu jusqu'à présent, laquelle de ces affirmations est vraie ?

####**Instructions**


+ Les objets xts sont des objets matriciels en interne.

+ Les objets xts sont indexés par un objet temps formel.

+ La plupart des méthodes zoo fonctionnent pour les xts.

+ **Toutes ces réponses**.



In [48]:
# Create the object data using 5 random numbers
X1 <- c(1,1,1)
X2 <- c(2,2,2)
data <- cbind(X1, X2)

# Create dates as a Date class object starting from 2016-01-01
dates <- seq(as.Date("2016-01-01"), length = 3, by = "days")


# Use xts() to create smith
ex_matrix <- xts(x = data, order.by = dates)
ex_matrix

           X1 X2
2016-01-01  1  2
2016-01-02  1  2
2016-01-03  1  2

In [49]:
# Load xts
library(xts)

# View the structure of ex_matrix
str(ex_matrix)

An xts object on 2016-01-01 / 2016-01-03 containing: 
  Data:    double [3, 2]
  Columns: X1, X2
  Index:   Date [3] (TZ: "UTC")


In [51]:
# Extract the 3rd observation of the 2nd column of ex_matrix
ex_matrix[3, 2]

           X2
2016-01-03  2

In [53]:
# Extract the 3rd observation of the 2nd column of core 
core <- matrix(c(1,1,1, 2,2,2), nrow = 3, ncol = 2)
core

0,1
1,2
1,2
1,2


In [54]:
core[3, 2]

###**EXERCICES**
####**Votre premier objet xts**
+ Les objets xts sont simples. 

+ Considérez-les comme une matrice d'observations combinée à un index des dates et heures correspondantes.

          xts = matrice + heures

+ Le constructeur principal de xts prend un certain nombre d'arguments, mais les deux plus importants sont $x$ pour les données et order.by pour l'index. 

+ $x$ doit être un vecteur ou une matrice. order.by est un vecteur qui doit avoir la même longueur ou le même nombre de lignes que $x$, être un objet de date ou d'heure approprié (très important !), et être dans un ordre croissant.

+ xts vous permet également de lier des attributs clés-valeurs arbitraires à vos données. 

+ Cela vous permet de conserver les métadonnées de votre objet dans votre objet. Pour ajouter ces attributs à la création, il suffit de passer des arguments supplémentaires nom = valeur à la fonction xts().

+ Puisque nous nous concentrons ici sur la mécanique, nous utiliserons des nombres aléatoires comme données afin de pouvoir nous concentrer sur la création de l'objet plutôt que de nous soucier de son contenu.

####**Instructions**

+ Créez un objet appelé data qui contient cinq nombres aléatoires en utilisant rnorm().

+ Créez un index de classe Date à partir de "2016-01-01" de longueur cinq appelé dates.

+ Utilisez le constructeur xts pour créer un objet appelé smith en utilisant data et dates comme index.

+ Créez un objet appelé bday qui contient un objet POSIXct date contenant la date "1899-05-08".

+ Créez un objet xts appelé hayek en utilisant des données, des dates, et un nouvel attribut appelé born, qui devrait contenir l'objet birthday que vous venez de créer.



In [55]:
# Create the object data using 5 random numbers
data <- rnorm(5)

# Create dates as a Date class object starting from 2016-01-01
dates <- seq(as.Date("2016-01-01"), length = 5, by = "days")

# Use xts() to create smith
smith <- xts(x = data, order.by = dates)
smith

                  [,1]
2016-01-01 -0.01557975
2016-01-02 -0.36515376
2016-01-03  0.76072802
2016-01-04  0.02906926
2016-01-05  0.25280687

In [56]:
# Create bday (1899-05-08) using a POSIXct date class object
bday <- as.POSIXct("1899-05-08")
bday

[1] "1899-05-08 UTC"

In [57]:
# Create hayek and add a new attribute called born
hayek <- xts(x = data, order.by = dates, born = bday)
hayek

                  [,1]
2016-01-01 -0.01557975
2016-01-02 -0.36515376
2016-01-03  0.76072802
2016-01-04  0.02906926
2016-01-05  0.25280687

####**Déconstruction de xts**
+ Maintenant que vous savez créer des objets xts, votre prochaine tâche est d'examiner un objet xts de l'intérieur.

+ Au cœur de xts et de zoo se trouve une simple matrice R avec quelques attributs supplémentaires. 
+ Le plus important de ces attributs est l'index. 
+ L'index contient toutes les informations dont nous avons besoin pour que xts traite nos données comme une série chronologique.

+ Lorsque vous travaillez avec des séries temporelles, il sera parfois nécessaire de séparer votre série temporelle en ses attributs de données de base et d'index pour une analyse et une manipulation supplémentaires. 
+ Les données de base sont la partie matrice de xts. 
+ Vous pouvez la séparer de l'objet xts en utilisant coredata(). 
+ La partie index de l'objet xts est disponible à l'aide de la fonction index(). Notez que ces deux fonctions sont des méthodes de la classe zoo, que xts étend.

+ Dans cet exercice, vous utiliserez ces fonctions intégrées pour extraire les données de la matrice interne et l'index interne de votre échantillon d'objet xts. 
+ Vous utiliserez la série temporelle hayek que vous avez créée dans le dernier exercice pour mettre en pratique ces nouvelles fonctions.

####**Instructions**

+ Extrayez les données de base de hayek en utilisant coredata() et appelez cela hayek_core.
+ Visualisez la classe de hayek_core en utilisant la fonction class().
+ Extraire l'indice de date de hayek en utilisant index() et appeler hayek_index.
+ Visualisez la classe de hayek_index.

In [58]:
# Extract the core data of hayek
hayek_core <- coredata(hayek)

# View the class of hayek_core
class(hayek_core)

In [59]:
# Extract the index of hayek
hayek_index <- index(hayek)

# View the class of hayek_index
class(hayek_index)

####**Indices basés sur le temps**

+ Les objets xts tirent leur puissance de l'attribut index qui contient la dimension temporelle. 

+ Une différence majeure entre xts et la plupart des autres objets de séries temporelles dans R est la possibilité d'utiliser n'importe laquelle des diverses classes utilisées pour représenter le temps. 

+ Qu'il s'agisse de POSIXct, de Date ou d'une autre classe, xts le convertira en une forme interne pour rendre le sous-ensemble aussi naturel que possible pour l'utilisateur.

        a <- xts(x = 1:2, as.Date("2012-01-01") + 0:1)
        a[index(a)]

+ Nous reviendrons plus en détail sur le sous-ensemble des objets xts dans un chapitre ultérieur. 

+ Pour l'instant, vous pouvez simplement utiliser les objets date pour indexer les lignes appropriées de votre série chronologique. 

+ Vous pouvez considérer que cela correspond effectivement aux noms de lignes que vous voyez dans l'objet. 

+ Cela fonctionne comme prévu pour les objets temporels, car les noms de domaine sont en réalité des dates !

+ Pour cet exercice, vous allez créer deux séries chronologiques en utilisant deux classes de temps différentes. Vous allez ensuite sous-ensembler chaque objet en utilisant l'index de l'autre objet.

####**Instructions**

+ Créez un objet de 5 dates appelé dates commençant à "2016-01-01".

+ Créez une série temporelle ts_a en utilisant les nombres 1 à 5 comme données, et les dates comme index order.by.

+ Créez une série temporelle ts_b en utilisant les nombres 1 à 5 comme données, et les mêmes dates, mais en tant qu'objets POSIXct.
+ Utilisez l'index de ts_b pour extraire les dates de ts_a.

+ Faites maintenant l'inverse, en indexant ts_b à l'aide des dates de ts_a.

In [60]:
# Create dates
dates <- as.Date("2016-01-01") + 0:4

# Create ts_a
ts_a <- xts(x = 1:5, order.by = dates)

# Create ts_b
ts_b <- xts(x = 1:5, order.by = as.POSIXct(dates))

# Extract the rows of ts_a using the index of ts_b
ts_a[index(ts_a)]

           [,1]
2016-01-01    1
2016-01-02    2
2016-01-03    3
2016-01-04    4
2016-01-05    5

In [61]:
# Extract the rows of ts_b using the index of ts_a
ts_a[index(ts_b)]

           [,1]
2016-01-01    1
2016-01-02    2
2016-01-03    3
2016-01-04    4
2016-01-05    5

###**Importation, exportation et conversion de séries chronologiques**

####**1. Importation, exportation et conversion de séries chronologiques**

+ Dans la dernière vidéo, nous avons examiné la création d’objets xts à partir de zéro. 

+ Ceux-ci étaient plutôt artificiels, simplement pour illustrer la mécanique de la construction xts et à quoi ressemblaient les objets xts en interne.

####**2. Rappel à la réalité**
+ Dans la plupart des cas réels, vous travaillerez avec des données qui existent déjà, généralement à partir d’un autre processus. 

+ Il s’agit peut-être d’une série chronologique d’un collègue d’une classe de données différente. 

+ Dans d’autres cas, vous pouvez vous retrouver à importer des données à partir d’une source externe qui peut répondre à tous les critères dont vous avez besoin pour xts, mais qui provient d’un fichier au lieu d’un autre objet R. 

+ Dans ce chapitre, regardez bien la conversion de types à l’aide de xts, la lecture de données dans R en tant qu’objet xts, ainsi que l’exportation d’objets xts à partir de R pour d’autres utilisations.

####**3. Conversion à l’aide de as.xts()**

+ Jetons d’abord un coup d’œil au moyen le plus utile et le plus simple de convertir la plupart des objets que vous rencontrerez dans R en xts. 

+ Cela fonctionnera dans 90% des cas, car xts a été conçu dès le début pour rendre le travail avec la myriade de séries chronologiques et de classes temporelles de R aussi facile et flexible que possible. 

+ Pour illustrer à quel point c’est facile, nous utiliserons le célèbre ensemble de données sur les taches solaires livré avec R. 

+ les taches solaires sont un objet ts, ce qui est assez difficile à travailler car il est régulier, c’est-à-dire des intervalles fixes, mais est moins intuitif dans sa structure. 

+ Pour convertir, il suffit d’utiliser as-dot-xts et vous voyez que la série est maintenant bien structurée et ressemble à ce que vous vous attendiez à une série chronologique.

####**4. Importation de données externes dans xts**

+ Pour importer des données de l’extérieur, nous pouvons suivre un modèle similaire. 

+ Ici, nous pouvons lire des données dans R en utilisant des fonctions intégrées telles que read-dot-table, et forcer dans xts à ce stade. 

+ Comme nous l’avons mentionné précédemment, puisque xts est une sous-classe appropriée de zoo, nous pouvons également tirer parti des outils puissants fournis par le zoo pour rendre la vie encore plus facile. 

+ Read-dot-zoo est un excellent outil pour lire les données sous forme de séries chronologiques, et encore une fois, AS-dot-XTS le convertira consciencieusement en sa classe XTS finale si vous le souhaitez.

####**5. Exportation de xts à partir de R**

+ Enfin, vous avez peut-être terminé la manipulation ou la transformation de vos données en xts, et vous devrez peut-être les envoyer à un processus extérieur à R. 

+ Encore une fois, zoo fournit une excellente fonction appelée « write-dot-zoo » qui fera beaucoup de travail pour extraire et formater vos temps pour vous. 

+ Si vous enregistrez simplement des données pour une utilisation ultérieure dans R, je vous recommande de les enregistrer en utilisant la fonction de base « saveRDS ». 

+ Ceci est optimisé pour des objets tels que xts et rend rapide et efficace la lecture et l’écriture de données sur le disque.

####**6. Entraînons-nous!**
+ Maintenant que vous avez vu un peu sur le déplacement de données dans et hors de xts, essayons-le!

###**EXERCICE**

####**Conversion d'objets xts**

+ ***Il est souvent nécessaire de convertir entre les classes lorsque vous travaillez avec des données de séries chronologiques dans R. La conversion peut être nécessaire pour de nombreuses raisons, mais généralement, vous chercherez à utiliser une fonction qui peut ne pas être compatible avec les séries chronologiques ou vous voudrez peut-être utiliser un aspect particulier de xts avec quelque chose qui n'a pas nécessairement besoin d'être une série à temps plein.***

+ **Heureusement, il est assez facile de convertir dans les deux sens en utilisant la fonctionnalité de style as.standard fournie dans R (par exemple, as.POSIXct() ou as.matrix()).**

+ *xts fournit des méthodes pour convertir tous les principaux objets que vous êtes susceptible de rencontrer. Les types R natifs appropriés tels que matrix, data.frame et ts sont pris en charge, ainsi que ceux contribués tels que timeSeries, fts et bien sûr zoo. as.xts() est la fonction de cheval de bataille pour effectuer les conversions en xts, et des fonctions similaires fourniront le comportement inverse.*

+ *Pour avoir une idée du déplacement des données entre les classes, essayons quelques exemples en utilisant l'objet Australian population ts de R nommé austres.*

####**Instructions**

+ Convertissez le jeu de données austres de la classe ts en xts et appelez-le au.


+ Ensuite, convertissez le nouvel objet au xts en une matrice, am.


+ Inspectez les premières entrées de cette nouvelle matrice en utilisant la fonction head().


+ Convertit les austres d'origine directement en une matrice appelée am2.

+ Inspectez maintenant les premières entrées de cette nouvelle matrice en utilisant la même fonction. 

+ Remarquez comment cette fois, la conversion n'a pas conservé les informations de temps ?

In [62]:
# Convert austres to an xts object called au
au <- as.xts(austres)

# Then convert your xts object (au) into a matrix am
am <- as.matrix(au)

# Inspect the head of am
head(am)

Unnamed: 0,au
1971 Q2,13067.3
1971 Q3,13130.5
1971 Q4,13198.4
1972 Q1,13254.2
1972 Q2,13303.7
1972 Q3,13353.9


In [63]:
# Convert the original austres into a matrix am2
am2 <- as.matrix(austres)

# Inspect the head of am2
head(am2)

0
13067.3
13130.5
13198.4
13254.2
13303.7
13353.9


+ https://www.rdocumentation.org/packages/zoo/versions/1.8-11/topics/read.zoo

+ https://www.rdocumentation.org/packages/utils/versions/3.6.2/topics/read.table

+ https://www.rdocumentation.org/packages/xts/versions/0.12.2/topics/as.xts

####**Importation de données**

+ ***Vous pouvez maintenant convertir des données en xts en utilisant as.xts(). Cependant, dans la plupart des applications du monde réel, vous aurez souvent besoin de lire des données brutes à partir de fichiers sur disque ou sur le Web. Cela peut être difficile sans connaître les bonnes commandes.***

+ **Dans la première partie de cet exercice, vous commencerez par lire un fichier csv à partir du disque en utilisant le base-R read.csv. Après avoir lu les données, l'étape suivante consiste à les convertir en xts. Ici, vous devrez utiliser le constructeur xts() ainsi que la conversion de dates non standard en quelque chose que xts comprend.**

+ *Dans la deuxième partie de cet exercice, vous allez lire les mêmes données dans un objet zoo à l'aide de read.zoo, puis convertir l'objet zoo en objet xts.*

+ *Les données de cet exercice sont assez simples, mais nécessiteront quelques efforts pour être correctement importées et nettoyées. Le nom complet du fichier avec lequel vous allez travailler a été enregistré en tant que valeur de tmp_file. Sur le disque, les données ressemblent à *:

                    a, b
        02/01/2015, 1, 3
        03/02/2015, 2, 4

####**Instructions**
+ Lisez les données situées à la valeur de tmp_file en utilisant read.csv() dans une nouvelle variable appelée dat.

+ Convertissez dat en un objet xts en utilisant le constructeur xts(). 

+ Utilisez as.Date() avec rownames(dat) comme premier argument.
+ Créez dat_zoo en utilisant read.zoo() pour lire dans le même tmp_file et définissez le format d'argument égal à "%m/%d/%Y".
+ Créez dat_xts en convertissant dat_zoo en xts en utilisant as.xts().

In [64]:
tmp_file = "https://s3.amazonaws.com/assets.datacamp.com/production/course_1127/datasets/tmp_file.csv"

In [65]:
# Create dat by reading tmp_file
dat <- read.csv(tmp_file)

# Convert dat into xts
xts(dat, order.by = as.Date(rownames(dat), "%m/%d/%Y"))

           a b
2015-01-02 1 3
2015-02-03 2 4

In [66]:
# Read tmp_file using read.zoo
dat_zoo <- read.zoo(tmp_file, index.column = 0, sep = ",", format = "%m/%d/%Y")
dat_zoo

           a b
2015-01-02 1 3
2015-02-03 2 4

In [67]:
# Convert dat_zoo to xts
dat_xts <- xts(dat_zoo)
dat_xts

           a b
2015-01-02 1 3
2015-02-03 2 4

####**Exporter des objets xts**
+ ***Maintenant que vous pouvez lire des données brutes dans des xts et des objets zoo, il est naturel que vous appreniez à inverser le processus.***

+ **Il existe deux principaux cas d'utilisation pour l'exportation d'objets xts. Tout d'abord, vous pouvez exiger qu'un objet persiste d'une session à l'autre pour être utilisé dans une analyse ultérieure. Dans ce cas, il est presque toujours préférable d'utiliser saveRDS() et readRDS() pour sérialiser des objets R uniques.**

+ **Alternativement, vous pouvez avoir besoin de partager les résultats de votre analyse avec d'autres, s'attendant souvent à ce que les données soient consommées par des processus ignorant à la fois R et xts. La plupart d'entre nous préféreraient ne pas penser à ce destin horrible pour nos données, mais le monde réel exige que nous comprenions au moins comment cela fonctionne.**

+ *L'une des meilleures façons d'écrire un objet xts à partir de R consiste à utiliser la fonction zoo write.zoo(). Dans cet exercice, vous allez prendre vos données temporaires et les écrire sur le disque à l'aide de write.zoo().*

####**Instructions**
+ Convertissez les taches solaires en xts et enregistrez-les sous sunspots_xts.

+ Le nom du fichier temporaire sera chargé pour vous.

+ À l'aide de write.zoo(), enregistrez les données sunspots_xts dans le fichier tmp.

+ Relisez le fichier tmp dans R en utilisant read.zoo(). Appelez ce soleil.

+ Convertissez sun en xts en utilisant la fonction as.xts(). Appelez cela sun_xts.

In [68]:
# Convert sunspots to xts using as.xts().
sunspots_xts <- as.xts(sunspots)


# Get the temporary file name
tmp <- tempfile()

# Write the xts object using zoo to tmp 
write.zoo(sunspots_xts, sep = ",", file = tmp)

# Read the tmp file. FUN = as.yearmon converts strings such as Jan 1749 into a proper time class
sun <- read.zoo(tmp, sep = ",", FUN = as.yearmon)

# Convert sun into xts. Save this as sun_xts
sun_xts <- as.xts(sun)

sun_xts

         [,1]
Jan 1749 58.0
Feb 1749 62.6
Mar 1749 70.0
Apr 1749 55.7
May 1749 85.0
Jun 1749 83.5
Jul 1749 94.8
Aug 1749 66.3
Sep 1749 75.9
Oct 1749 75.5
     ...     
Mar 1983 66.5
Apr 1983 80.7
May 1983 99.2
Jun 1983 91.1
Jul 1983 82.2
Aug 1983 71.8
Sep 1983 50.3
Oct 1983 55.8
Nov 1983 33.3
Dec 1983 33.4

###**Introduction des requêtes basées sur le temps**


####**1. Introduction des requêtes basées sur le temps**

+ L’une des fonctionnalités les plus puissantes et les plus amusantes de xts est le sous-réglage par le temps. 


+ Dans une utilisation interactive normale, pour laquelle R excelle, vous vous retrouverez à penser aux séries temporelles non pas comme des observations relatives au début ou à la fin de votre série, mais plutôt comme des positions dans le temps. 

+ Dans ce chapitre, nous examinerons un aspect de la façon dont xts vous permet de penser à vos données dans ce contexte temporel, et à quel point il est facile de trouver des observations pertinentes compte tenu de cette approche.

####**2.ISO 8601:2004**

+ Tout d’abord, un peu de contexte. 

+ ***xts prend en charge la norme internationale pour la représentation des dates et des heures connue sous le nom de ISO 8601:2004***. 

+ Ce nom quelque peu lourd décrit ce que j’aime penser comme la « bonne » façon d’écrire et de lire les dates et les heures. 

+ ***La norme crée une référence pour la façon dont les dates, les heures, les intervalles et les durées sont représentés de manière claire et sans ambiguïté***. 

+ La façon la plus simple de penser à la représentation est de vous déplacer de gauche à droite du chiffre le plus significatif au moins significatif. 

+ En d’autres termes, changer le premier chiffre représenterait un plus grand saut dans le temps que de changer le dernier chiffre. 

+ Concrètement, vous voyez que nous sommes tenus de représenter intégralement les dates de gauche à droite, en fonction de la spécificité dont nous avons besoin. 

+ La représentation complète de la date et de l’heure comprendrait une année à quatre chiffres, un mois à deux chiffres, un jour à deux chiffres, suivis d’heures, de minutes, de secondes et enfin de fractions de secondes à deux chiffres exprimées en décimales. 

+ Spécifier uniquement l’année (par exemple 2014) est parfaitement acceptable (et utile!), mais ne fournir que le mois serait incorrect - ainsi que ambigu dans le sens. 

+ Est-ce que 02 impliquerait février, ou le 2 de ce mois ou 2 heures?

####**3. Prise en charge xts de la norme ISO 8601:2004**

+ **XTS prend en charge quatre façons différentes de tirer parti de cette norme**. 

+ **Tout d’abord, xts prend en charge les intervalles à un et deux côtés**. 

+ **Il prend également en charge les représentations tronquées des dates, essentiellement des raccourcis pour spécifier des intervalles**. 

+ **XTS fournit également un support temporel ainsi que la notion d’intervalles de répétition**.

####**4. Intervalles à un et deux côtés**

+ Jetons un coup d’œil à chacun d’entre eux avec quelques exemples: 
  + En utilisant le jeu de données de l’indice edhec hedge funds, 
  + du package PerformanceAnalytics, nous voyons à quel point il est facile de spécifier des intervalles recto ou deux 
    - ici obtenir janvier 2007 ainsi que la possibilité d’extraire une plage de mois de janvier à mars.

####**5. Dates tronquées**
+ XTS prend également en charge une fonctionnalité de la norme qui vous permet d’utiliser des raccourcis. 

+ Ici, vous recyclez le 2007 du côté gauche et nous pouvons lire cela comme allant de janvier 2007 à fin mars 07.

####**6. Prise en charge du temps**
+ Le support de temps est disponible en incluant simplement le composant de temps que vous souhaitez extraire. 

+ Ici, nous utilisons un exemple d’ensemble de données intrajournalières appelé iday pour illustrer. 

+ Notez que cette syntaxe fonctionne également sans tirets ni deux-points. 

+ Ici, le T majuscule est utilisé pour séparer les composantes de date et d’heure de votre requête.

####**7. Répétition des intervalles intrajournaliers**

+ Enfin, xts soutient également l’idée de répéter les intervalles intrajournaliers. 

+ Pour certaines données qui peuvent être collectées en continu, il peut être nécessaire de n’examiner qu’une petite fenêtre de temps chaque jour. 

+ En utilisant le format T slash T, vous serez en mesure de décrire clairement les intervalles que vous désirez chaque jour et d’extraire efficacement ces intervalles pour une analyse plus approfondie.

####**8. Entraînons-nous!**
+ Maintenant que vous avez vu comment fonctionne l’extraction du temps, travaillons sur quelques exercices pour vous assurer que vous êtes prêt à utiliser cette fonctionnalité!

+ https://www.rdocumentation.org/packages/xts/versions/0.12.2/topics/.parseISO8601

+ https://www.rdocumentation.org/packages/xts/versions/0.12.2/topics/[.xts

+ https://en.wikipedia.org/wiki/ISO_8601

###**EXERCICE**

####**La norme ISO-8601**

+ ***La norme ISO-8601 est la manière internationalement reconnue et acceptée de représenter les dates et les heures***. L

+ ***a norme permet un format commun non seulement pour décrire les dates, mais aussi pour représenter des plages et des intervalles répétitifs***.

+ ***xts utilise cette norme pour toutes les opérations d'extraction et de remplacement***. 

+ **Cela rend le code à la fois facile à écrire et facile à maintenir. Cela permet également une expression très concise des plages de dates et des intervalles**.

+ *Pour que xts fonctionne correctement, il est très important de suivre exactement la norme. Les détails peuvent être trouvés dans le sous-ensemble xts et la documentation .parseISO8601.*

+ Quelle est une chaîne ISO-8601 valide acceptable par xts ?

#####**Instructions**


+ "2005-01-02"

+ "200501"

+ "2010/02/22"

+ **(1) et (2) uniquement**

+ tout ce qui précède



***Exactement! ISO-8601 peut sembler un format complexe, mais il est très flexible tant que vous suivez les règles.***

####**Recherche de dates**


+ ***L'un des aspects les plus puissants de l'utilisation de séries chronologiques dans xts est la possibilité de spécifier rapidement et efficacement des dates et des plages horaires pour les sous-ensembles.***

      A["20090825"]       ## Aug 25, 2009
      A["201203/201212"]  ## Mar to Dec 2012
      A["/201601"]        ## Up to and including January 2016

+ **Les plages de dates peuvent être extraites des objets xts en spécifiant simplement la ou les périodes souhaitées à l'aide de chaînes de caractères spéciales dans votre sous-ensemble.**

+ *Pour cet exercice, vous allez créer une requête simple mais très courante. Extrayez une plage de dates à l'aide de la fonctionnalité ISO-8601 de xts. Après avoir réussi à extraire une année complète, vous créerez ensuite un sous-ensemble de votre nouvel objet avec des dates de début et de fin spécifiques en utilisant cette même notation.*

+ Trouvons un peu de temps !

####**Instructions**
+ À l'aide d'un sous-ensemble temporel de style xts, sélectionnez uniquement l'année 2016 dans la série temporelle $x$ et appelez-la x_2016.


+ À l'aide d'une chaîne de date de début et de fin explicite, obtenez toutes les données du 1er janvier 2016 au 22 mars 2016. Appelez ceci jan_march.

+ Pour vous assurer que vous créez un sous-ensemble des 82 lignes, utilisez la fonction de longueur.

In [71]:
# Create the object data using 5 random numbers
data <- rnorm(90)

# Create dates as a Date class object starting from 2016-01-01
dates <- seq(as.Date("2016-01-01"), length = 90, by = "days")

# Use xts() to create smith
x <- xts(x = data, order.by = dates)
x

                  [,1]
2016-01-01 -1.84798308
2016-01-02 -0.97484419
2016-01-03  0.30627727
2016-01-04 -0.18713651
2016-01-05 -0.65522029
2016-01-06 -1.07269417
2016-01-07 -2.18848785
2016-01-08 -1.17935398
2016-01-09  0.42356360
2016-01-10  0.48874951
2016-01-11  1.24714778
2016-01-12 -2.68997408
2016-01-13  1.10868893
2016-01-14  1.86615192
2016-01-15  1.14413770
2016-01-16 -0.79865008
2016-01-17  0.22337299
2016-01-18  0.34863320
2016-01-19  1.19783288
2016-01-20  0.24712229
2016-01-21  0.71783355
2016-01-22 -0.08077526
2016-01-23 -0.56435507
2016-01-24  0.72448749
2016-01-25  1.18290844
2016-01-26  0.74631486
2016-01-27 -1.37346053
2016-01-28 -0.34129797
2016-01-29 -0.38155854
2016-01-30 -0.08356078
2016-01-31 -0.90821015
2016-02-01  0.17993351
2016-02-02 -0.40354182
2016-02-03 -0.72372654
2016-02-04  0.21281659
2016-02-05 -1.14075066
2016-02-06 -0.19608832
2016-02-07  0.79164558
2016-02-08  0.01123004
2016-02-09  1.12836231
2016-02-10 -1.25755722
2016-02-11  0.13233721
2016-02-12 

In [70]:
# Select all of 2016 from x
x_2016 <- x["2016"]

# Select January 1, 2016 to March 22, 2016
jan_march <- x["2016/2016-03-22"]

# Verify that jan_march contains 82 rows
82 == length(jan_march)

####**suivi des intervalles intrajournaliers récurrents**

+ Les données de séries chronologiques les plus courantes "dans la nature" sont quotidiennes. 

+ À l'occasion, vous pouvez vous retrouver à travailler avec des données intrajournalières, qui contiennent à la fois des dates et des heures. Dans ce cas, il est parfois nécessaire de n'afficher qu'un sous-ensemble de temps pour chaque jour sur plusieurs jours.

+  À l'aide de xts, vous pouvez facilement découper les jours en utilisant une notation spéciale dans l'argument i = de l'extraction de crochet unique (c'est-à-dire [i, j]).

+ Comme vous l'avez appris dans l'exercice précédent, l'astuce consiste à ne pas spécifier de dates explicites, mais plutôt à utiliser la notation spéciale T/T conçue pour les intervalles de répétition intrajournaliers.

      # Heures intrajournalières pour tous les jours
      NYSE["T09:30/T16:00"]


+ *Dans cet exercice, vous allez extraire les heures récurrentes du matin de la série chronologique irreg, qui contient des données irrégulières du mois de janvier 2010. N'oubliez pas que vous pouvez toujours utiliser la console R pour expérimenter irreg ou pour afficher les pages d'aide avec xts?.*

####**Instructions**


+ En utilisant la série chronologique irrégulière irreg, attribuez toutes les observations entre 8 h et 10 h au matin_2010.

+ À l'aide de morn_2010, extrayez uniquement les observations du matin du 13 janvier 2010.

In [None]:
# Extract all data between 8AM and 10AM
morn_2010 <- irreg["T08:00/T10:00"]

# Extract the observations for January 13th, 2010
morn_2010["2010-01-13"]

###**Techniques d’extraction alternatives**

####**1. Techniques d’extraction alternatives**

+ Comme nous l’avons vu, sous-définir vos objets de séries chronologiques par le temps est trivial avec xts. 

+ À l’occasion, vous pouvez vous retrouver à chercher à extraire des lignes basées sur des moyens plus traditionnels, à savoir l’utilisation de décalages entiers ou d’un autre moyen de type R pour trouver des éléments.

####**2. Sélection des lignes avec le temps**

+ Comme vous l’avez peut-être deviné, puisque xts étend zoo et zoo étend les objets de base, R-like est un élément de conception très important pour xts. 

+ À cette fin, xts prend en charge les lignes de sous-ensembles par index entier, y compris l’indexation négative pour exclure les lignes. 

+ Vous pouvez également utiliser des vecteurs logiques qui couvrent le même nombre de lignes dans vos données. 

+ Ceci est utile lorsque vous devez conditionner les données en fonction de certains critères externes. 

+ Le troisième moyen, utile, de trouver des éléments de données consiste à utiliser les objets de date eux-mêmes. 

+ Pour des raisons que nous n’avons pas encore abordées, ce dernier fonctionne non seulement avec la classe de date avec laquelle vous avez créé l’objet, mais fonctionnera avec presque toutes les classes de date prises en charge que xts peut gérer. 

+ Il est donc possible d’indexer des objets xts indexés par Date, avec un vecteur de temps POSIXct. 

+ Bien sûr, ce n’est pas un modèle commun, et il est probablement préférable de l’éviter, mais illustre une partie de la flexibilité que xts peut offrir au développeur et aux analystes lorsqu’il s’agit d’examiner des séries chronologiques.

####**3. Modification des séries chronologiques**

+ Outre l’extraction de valeurs, il est souvent pratique de pouvoir modifier les valeurs de votre série. 

+ Pour cela, xts offre la même flexibilité que le sous-ensemble. 

+ Vous pouvez utiliser des chaînes ISO 8601, des entiers, des logiques ou des objets de date. 

+ Une autre caractéristique intéressante du sous-ensemble xts, en particulier lorsque vous utilisez des chaînes de date de style ISO, est l’argument « which-dot-i ». 

+ Lorsque la valeur TRUE est attribuée, cela renvoie les index correspondants de vos objets, c’est-à-dire les décalages entiers correspondant aux heures. 

+ Cela peut être utile lorsque vous tirez parti de l’indexation xts avec d’autres objets qui ne sont pas nécessairement convertibles en xts. 

+ Pour l’instant, sachez simplement que cette option existe.

####**4. Comportements clés**

+ Enfin, il y a quelques autres choses à savoir sur le sous-ensemble dans xts qui valent la peine d’être examinées. 

+ Tous les sous-ensembles utiliseront drop=FALSE par défaut, c’est-à-dire que l’extraction d’une colonne d’un xts renverra une matrice à une colonne, pas un vecteur. 

+ L’ordre est toujours préservé. La sélection des lignes 2 et 1 dans cet ordre enverra 1 et 2. 

+ Vous ne pouvez pas accidentellement, ou intentionnellement!, modifier le continuum temporel! 

+ En interne, de nombreux sous-ensembles sont facilités par binsearch et memcpy, ce qui signifie que c’est plus rapide que l’extraction de base R! 

+ Les attributs d’index sont toujours attachés, même s’ils sont éventuellement modifiés en raison du sous-ensemble, et les attributs xts sont conservés dans la plupart des cas. 

+ Ce que vous commencez par est généralement ce qu’il vous reste après le sous-ensemble.

####**5. Entraînons-nous!**
+ Arrêtons-nous ici et essayons quelques exercices pour vous assurer que vous avez cela.

###**EXERCICE**

####**Sélection de lignes avec des objets temporels**

+ ***Souvent, vous devrez peut-être créer un sous-ensemble d'une série chronologique existante avec un ensemble de dates ou d'objets temporels. Celles-ci peuvent provenir de as.Date(), as.POSIXct() ou d'une variété d'autres classes. Dans cet exercice, vous allez explorer comment, étant donné un objet xts x, il est possible d'extraire des observations pertinentes à l'aide d'un vecteur de dates entre parenthèses***.

+ Les objets x et dates ont été préchargés dans votre espace de travail.

####**Instructions**
+ Utilisez les dates vectorielles pour créer un sous-ensemble de l'objet x.
+ Sous-ensemble x utilisant des dates qui sont d'abord converties en POSIXct.

In [78]:
# Create the object data using 5 random numbers
data <- rnorm(10)

# Create dates as a Date class object starting from 2016-01-01
dates <- seq(as.Date("2016-06-02"), length = 10, by = "days")

# Use xts() to create smith
x <- xts(x = data, order.by = dates)
x

                  [,1]
2016-06-02 -0.90081534
2016-06-03  0.64248133
2016-06-04 -1.33387919
2016-06-05 -0.95680176
2016-06-06  0.70110383
2016-06-07  0.02885597
2016-06-08 -0.94438116
2016-06-09  0.12578937
2016-06-10  1.57612893
2016-06-11 -1.58348956

In [79]:
# Subset x using the vector dates
x[dates]

                  [,1]
2016-06-02 -0.90081534
2016-06-03  0.64248133
2016-06-04 -1.33387919
2016-06-05 -0.95680176
2016-06-06  0.70110383
2016-06-07  0.02885597
2016-06-08 -0.94438116
2016-06-09  0.12578937
2016-06-10  1.57612893
2016-06-11 -1.58348956

In [80]:
# Subset x using dates as POSIXct
x[as.POSIXct(dates)]

                  [,1]
2016-06-02 -0.90081534
2016-06-03  0.64248133
2016-06-04 -1.33387919
2016-06-05 -0.95680176
2016-06-06  0.70110383
2016-06-07  0.02885597
2016-06-08 -0.94438116
2016-06-09  0.12578937
2016-06-10  1.57612893
2016-06-11 -1.58348956

####**Mettre à jour et remplacer des éléments**

+ Remplacer des valeurs dans des objets xts est aussi simple que de les extraire. 

+ Vous pouvez utiliser des chaînes ISO-8601, des objets de date, des logiques ou des entiers pour localiser les lignes que vous souhaitez remplacer. 

+ Une des raisons pour lesquelles vous voudrez peut-être le faire serait de remplacer les intervalles ou les observations connus par NA, par exemple en raison d'un capteur défectueux un jour particulier ou d'un ensemble de valeurs aberrantes données un jour férié.

+ Pour les observations individuelles situées sporadiquement tout au long de vos dates de données, les nombres entiers ou les vecteurs logiques sont un excellent choix. Pour les blocs de temps continus, ISO-8601 est la méthode préférée.

+ Dans cet exercice, vous continuerez à utiliser les dates vectorielles de l'exercice précédent pour modifier votre objet x. Les deux sont déjà chargés dans votre espace de travail.

####**Instructions**
+ Utilisez les dates vectorielles pour remplacer les valeurs dans x par des valeurs NA.
+ Remplacez toutes les valeurs dans x pour les dates (ne faisant pas référence au vecteur) à partir du 9 juin 2016 par 0. Utilisez le style de remplacement ISO-8601.
+ Utilisez la console pour consulter la valeur du 11 juin 2016 et montrer que votre travail acharné a porté ses fruits !

In [81]:
# Replace the values in x contained in the dates vector with NA
x[dates] <- NA

# Replace all values in x for dates starting June 9, 2016 with 0
x["2016-06-09/"] <- 0

# Verify that the value in x for June 11, 2016 is now indeed 0
x["20160611"]

           [,1]
2016-06-11    0

###**Méthodes pour trouver des points dans vos données**


####**1. Méthodes pour trouver des points dans vos données**

+ Nous avons donc couvert l’une des caractéristiques les plus importantes du sous-ensemble dans xts, à savoir comment obtenir des lignes par temps en utilisant divers moyens. 

+ Dans ce chapitre, examinez bien deux autres fonctions qui nous aideront à trouver des moments d’intérêt.

####**2. Trouver des moments d’intérêt**
+ Dans R, vous êtes probablement familier avec les fonctions de la tête et de la queue. 

+ Ceux-ci extraient traditionnellement la première ou la dernière n lignes de vos données. 

+ Ceci est surtout utile pour avoir une idée de ce que contiennent les colonnes ou pour vérifier que tout semble correct du point de vue de la valeur. 

+ XTS ajoute deux fonctions pour faire quelque chose de similaire, mais avec une torsion. 

+ Ici, nous sommes plus intéressés à trouver une fenêtre de temps fixe au début ou à la fin d’une période. 

+ Encore une fois, pas un décalage particulier du début ou de la fin en termes absolus, mais plutôt avec la notion plus flexible du temps. 

+ Ces nouvelles fonctions soutiennent la ligne de pensée telle que « 3 derniers jours » ou « 6 premières semaines ». 

+ Nous ne savons peut-être pas combien de données il y a, ni à quelle fréquence, mais nous savons que nous voulons ce laps de temps. 

+ Ces fonctions xts sont appelées first() et last(), et utilisent cette idée pour résoudre un problème très courant lorsque l’on regarde des séries temporelles, à savoir quel est le premier ou le dernier ensemble d’observations sur un ensemble fixe de périodes.

####**3. first() et last()**

+ En utilisant les données des fonds edhec, nous pouvons voir comment la description de périodes arbitraires nous permet de revenir en arrière. 

+ Vous pouvez paramétrer les périodes en question, en l’occurrence en trouvant les quatre premiers mois. 

+ Vous pouvez également obtenir la dernière année civile de données, même si nous n’avons pas d’année complète à extraire. 

+ C’est différent de dire l’année dernière, pour cela vous utiliseriez les douze derniers mois.

####**4. first() et last()**
+ Toutes les périodes courantes peuvent être utilisées, même jusqu’à des intervalles intrajournaliers tels que les heures et les secondes. 

+ Vous pouvez également annuler la valeur numérique pour tout récupérer, sauf la période que vous demandez. 

+ Notez qu’il s’agit d’un comportement différent de la négation de l’argument 'n' à la fonction tête et queue de base R.

####**5. Combinez les appels de fonction**

+ Un aspect très puissant de cette paire de fonctions est que vous pouvez imbriquer les appels au premier et au dernier pour trouver des périodes de début ou de fin dans d’autres périodes. 

+ Cet exemple montre les cinq premiers mois de l’avant-dernière année civile en edhec.

####**6. Entraînons-nous!**
+ Maintenant que vous avez vu quelques exemples, il est temps d’essayer cela par vous-même.

###**EXERCICE**

####**Trouver la première ou la dernière période de temps**

+ ***Parfois, vous devez localiser les données par temps relatif. Quelque chose qui est plus facile à dire qu'à mettre dans le code. Cela équivaut à demander la tête ou la queue d'une série, mais au lieu d'utiliser un décalage absolu, vous décrivez une position relative dans le temps. Un exemple simple serait quelque chose comme les 3 dernières semaines d'une série, ou le premier jour du mois en cours.***

+ **Sans objet conscient du temps, cela devient assez compliqué très rapidement. Heureusement, xts a les prérequis nécessaires intégrés pour que vous puissiez les utiliser avec très peu d'apprentissage requis. En utilisant les fonctions first() et last(), c'est en fait assez facile !**

+ *Pour cet exercice, vous allez extraire des observations relatives d'un ensemble de données appelé temps, une série chronologique de données de température estivale de Chicago, Illinois, États-Unis.*

####**Instructions**
+ Créez une nouvelle variable lastweek en extrayant la dernière semaine de temps.

+ À l'aide de vos données nouvellement créées, extrayez les 2 dernières observations sans respecter le temps.

+ Maintenant, extrayez tous les jours de la semaine dernière sauf les deux premiers jours (c'est délicat !).

In [82]:
Temp.Max <- c(74, 78, 79, 80, 90, 89, 87, 89, 81, 83, 93, 89, 86, 89, 75, 79)
Temp.Mean <- c(69, 66, 68, 76, 79, 79, 78, 80, 73, 72, 81, 82, 78, 80, 72, 69) 
Temp.Min <- c(60, 56, 59, 69, 68, 70, 72, 72, 67, 64, 69, 77, 68, 68, 60, 60)     

In [83]:
# Create the object data using 5 random numbers
data <- data.frame(Temp.Max, Temp.Mean, Temp.Min)

# Create dates as a Date class object starting from 2016-01-01
dates <- seq(as.Date("2016-07-01"), length = 16, by = "days")

# Use xts() to create smith
temps <- xts(x = data, order.by = dates)

In [98]:
#temps <- read.csv("/content/Temps.csv")
#temps

In [85]:
# Create lastweek using the last 1 week of temps
lastweek <- last(temps, "1 week")

# Print the last 2 observations in lastweek
last(lastweek, 2)

           Temp.Max Temp.Mean Temp.Min
2016-07-15       75        72       60
2016-07-16       79        69       60

In [86]:
# Extract all but the first two days of lastweek
first(lastweek, "-2 days")

           Temp.Max Temp.Mean Temp.Min
2016-07-13       86        78       68
2016-07-14       89        80       68
2016-07-15       75        72       60
2016-07-16       79        69       60

###**Combiner le premier et le dernier**


+ ***Maintenant que vous avez vu comment extraire le premier ou le dernier morceau d'une série chronologique en utilisant un langage d'apparence naturelle, ce n'est qu'une question de temps avant que vous deviez devenir un peu plus complexe.***

+ **Dans cet exercice, vous allez extraire un sous-ensemble très spécifique d'observations en reliant plusieurs appels à first() et last().**

      # 3 derniers jours de la première semaine
      last(first(Temps, '1 week'), '3 days') 


+ *Vous allez reconfigurer l'exemple ci-dessus en utilisant les données temporelles de l'exercice précédent. L'astuce pour utiliser une commande aussi complexe est de travailler de l'intérieur vers l'extérieur.*

####**Instructions**

+ Trouvez les trois premiers jours de la deuxième semaine de l'ensemble de données temporaires. 

+ Utilisez des combinaisons de first() et last() pour ce faire.




In [87]:
last(first(temps, '1 week'), '3 days') 

           Temp.Max Temp.Mean Temp.Min
2016-07-01       74        69       60
2016-07-02       78        66       56
2016-07-03       79        68       59

In [88]:
# Extract the first three days of the second week of temps
first(last(first(temps, "2 weeks"), "1 week"), "3 days")

           Temp.Max Temp.Mean Temp.Min
2016-07-04       80        76       69
2016-07-05       90        79       68
2016-07-06       89        79       70

###**Opérations mathématiques à l’aide de xts**

####**1. Opérations mathématiques à l’aide de xts**

+ Une opération courante pour les données de séries chronologiques que vous devrez utiliser, mais que nous n’avons pas encore mentionnée, est le fonctionnement des opérations mathématiques de base. 

+ Dans cette vidéo, nous examinerons la conception et l’implémentation de ce comportement, qui dans R est généralement appelé comportement Ops, du nom de la méthode qui gère la répartition des fonctions.

####**2. Principales caractéristiques**

+ Dans xts, il y a quelques éléments clés à savoir avant de pouvoir travailler pleinement avec vos données. Tout d’abord, xts est une matrice, vous devrez donc faire attention à la façon dont vous procédez avec les opérations matricielles. 

+ Dans R, ceux-ci peuvent être élément par élément pour certaines opérations binaires ou ils peuvent être l’algèbre matricielle standard. 

+ La plupart des règles applicables aux objets matriciels s’appliquent également à xts et zoo. 

+ Une partie de xts (et zoo) qui est différente d’une matrice normale est la façon dont les temps sont utilisés lors de l’exécution des opérations. 

+ Ce comportement conscient du temps est absolument essentiel pour obtenir des résultats raisonnables basés sur le temps. 

+ La règle de base est que nous prenons toujours l’intersection des dates entre vos objets. 

+ ***C’est-à-dire que deux objets ajoutés seront d’abord fusionnés le long de la dimension temporelle pour identifier toutes les observations qui se croisent - et ce sont ces observations ET SEULEMENT CELLES observations qui seront utilisées dans l’opération***. 

+ À l’occasion, comme dans les opérations matricielles normales, vous devrez peut-être même supprimer une dimension ou supprimer la classe xts pour obtenir le résultat souhaité. 

+ Dans ce cas, vous pouvez utiliser des outils que nous avons vus auparavant, tels que les fonctions « as-dot » ou coredata pour modifier vos données. 

+ Dans d’autres cas, vous pouvez avoir besoin d’un résultat avec l’union de dates. 

+ C’est un peu plus de travail, mais assez facile une fois que vous voyez la syntaxe. 

+ La pleine puissance de cette dernière idée sera expliquée dans le prochain chapitre sur la fusion, mais pour l’instant, vous pouvez simplement répéter ce que vous voyez pour avoir une idée de son fonctionnement.

####**3. Opérations prêtes à l’emploi (+, -, *, /)**

+ Pour voir ce comportement en action, jetons un coup d’œil à quelques exemples. 

+ Tout d’abord, nous avons un exemple simple du comportement par défaut. Nous commençons par deux petites séries chronologiques, $X$ et $Y$. 

+ Chaque couverture est similaire, mais pas exactement aux mêmes dates. 

+ Pour souligner à nouveau le point clé d’avant, xts et zoo identifieront d’abord l’intersection des dates dans chaque objet et seules ces lignes seront utilisées dans l’opération finale. 

+ Vous pouvez voir ce fait dans nos résultats, nous n’avons maintenant que des observations de l’intersection de $X$ et $Y$.

####**4. Opérations sur le syndicat**
+ À l’occasion, cependant, ce n’est peut-être pas exactement ce que vous voulez. 

+ Par exemple, vous pouvez vouloir l’union de dates, c’est-à-dire que vous voulez que votre résultat soit la valeur de X ou Y ou la somme, le produit, etc. de $X$ et $Y$. 

+ Pour ce faire, nous devons explicitement réindexer nos objets pour nous assurer qu’ils partagent l’union des dates, en prenant soin de gérer les valeurs manquantes qui en résultent. 

+ En général, vous voudrez spécifier un remplissage = valeur approprié en fonction de l’opération. 

+ Pour l’addition et la soustraction, 0 a du sens, mais d’autres valeurs sont facilement substituées. 

+ Nous discuterons de ce processus de fusion beaucoup plus en détail dans le chapitre suivant, sachez simplement que cela est disponible lors des opérations de base.

####**5. Entraînons-nous!**
+ OK, assez avec les diapositives, essayons quelques exercices.

###**EXERCICES**

####**Arithmétique matricielle - additionnez, soustrayez, multipliez et divisez dans le temps !**

+ ***Les objets xts respectent le temps. De par leur conception, lorsque vous effectuez une opération binaire à l'aide de deux objets xts, ces objets sont d'abord alignés à l'aide de l'intersection des index. Cela peut surprendre lors de la première rencontre.***

+ ***La raison en est que vous souhaitez conserver l'aspect ponctuel de vos données, en vous assurant que vous n'introduisez pas de biais d'anticipation accidentel (ou d'anticipation !) dans vos calculs.***

+ **Cela signifie en pratique que vous serez parfois chargé de gérer ce comportement si vous souhaitez conserver les dimensions de vos données.**

+ Vos options incluent :

  + ***Utilisez coredata() ou as.numeric() (déposez-en un dans une matrice ou un vecteur).***
  + ***Décalez manuellement les valeurs d'index - c'est-à-dire utilisez lag().***
  + ***Réindexez vos données (avant ou après le calcul).***

+ *Dans cet exercice, vous examinerez le comportement normal, ainsi qu'un exemple utilisant la première option. Pour l'instant vous allez utiliser deux petits objets a et b. Examinez ces objets dans la console avant de commencer.*

####**Instructions**

+ Ajoutez a et b. Remarquez le comportement des dates, lesquelles restent ?
+ Ajoutez a à la valeur numérique de b. b devra être converti en numérique pour que cela fonctionne.

In [None]:
>
a
           a
2015-01-24 1
2015-01-25 1
2015-01-26 1
>
b
           b
2015-01-24 2

In [None]:
# Add a and b
a + merge(b, index(a), fill = 0)

# Add a with the numeric value of b
a + merge(b, index(a), fill = na.locf)

***Excellent! Comme vous pouvez le voir, l'ajout de deux objets xts ne renvoie que les dates communes aux deux. Ajouter un numérique à un objet xts est un peu plus intuitif.***

####**Mathématiques avec des index qui ne se chevauchent pas**
+ ***L'exercice précédent illustrait les tenants et les aboutissants des calculs de base avec des objets xts. À ce stade, vous savez que xts respecte le temps et ne renverra l'intersection des temps que lors de diverses opérations mathématiques.***

+ **Nous avons fait allusion à une autre façon de gérer ce comportement dans le dernier exercice. A savoir, ré-indexer vos données avant une opération. Cela permet de préserver les dimensions de vos données en tirant parti du même mécanisme que xts utilise en interne dans sa propre méthode Ops (le code envoyé lorsque vous appelez + ou similaire).**

+ **La troisième méthode consiste à modifier les deux séries souhaitées en vous assurant d'avoir une union de dates - les dates dont vous avez besoin dans votre sortie finale. Pour ce faire, vous aurez besoin de quelques fonctions qui ne seront pas traitées en profondeur avant le chapitre 3, mais qui sont très utiles ici.**

        merge(b, index(a))

+ *Ne vous inquiétez pas si vous n'êtes pas encore familiarisé avec merge(). Cet exercice peut être plus facile si vous suivez simplement les instructions.*

####**Instructions**

+ En utilisant a et b de l'exercice précédent, obtenez la valeur de a + b pour chaque date de a. Si aucun b n'est disponible à une date donnée, la réponse doit être a à cette date.
+ Ajoutez maintenant a à b, mais cette fois assurez-vous que toutes les valeurs de a sont ajoutées à la dernière valeur connue de b dans le temps.


In [None]:
# Add a to b, and fill all missing rows of b with 0
a + merge(b, index(a), fill = 0)

# Add a to b and fill NAs with the last observation
a + merge(b, index(a), fill = na.locf)

***Bon travail! Math avec des objets xts n'est pas trop difficile une fois que vous comprenez les bases.***

###**Fusion de séries chronologiques**


####**1. Fusion de séries chronologiques**

+ ***À la fin du dernier chapitre, nous avons créé une série chronologique en fusionnant une série avec l’index d’une autre pour créer une union de temps dans l’objet final. Dans cette vidéo, nous examinerons les fonctions derrière la combinaison de séries.***

####**2. Présentation de merge()**
+ L’un des moyens les plus courants d’ajouter des valeurs à des séries chronologiques consiste à ajouter des colonnes. 

+ La combinaison par colonne se fait avec la fonction xts merge ou cbind, il s’agit du même appel. 

+ Ces fonctions sont comme des jointures de base de données, mais au lieu d’utiliser les valeurs des données, elles utilisent les heures. 

+ XTS prend en charge quatre jointures différentes, les jointures internes, l’intersection des temps, les jointures externes, l’union des temps et les jointures gauche et droite, en utilisant uniquement les temps des séries gauche ou droite respectivement. 

+ merge() prend un nombre arbitraire d’objets à joindre, un argument « join » et un argument « fill » pour gérer les absences résultant de la fusion. 

+ Il existe d’autres arguments facultatifs, mais nous pouvons les ignorer pour l’instant.

####**3. Exemple de merge()**
+ Regardons quelques exemples. Dans la première fusion, nous effectuons une jointure externe, fusionnant tous les temps qui apparaissent dans $X$ avec ceux de $Y$. 

+ Notez que les temps manquants dans chaque série sont remplis par défaut avec des NA. 

+ Le deuxième cas est une jointure interne, ici nous avons juste les temps qui se croisent. C’est ce qui se passe dans les opérations mathématiques de base. 

+ Enfin, nous avons une jointure droite, en utilisant uniquement les dates de la série $Y$. 

+ Notez que le 12 août a maintenant un 1 dans la colonne $X$ même si nous n’avons pas d’observation $X$ pour cette période. 

+ Ceci est le résultat de la définition de l’argument 'fill' sur na-dot-locf. Nous verrons plus de façons de traiter les absences dans la prochaine vidéo, mais le remplissage est très pratique de temps en temps.

####**4. Exemple de merge**
+ En plus de lier des objets xts, vous pouvez également lier divers autres types R. 

+ Si vous passez un vecteur de la même longueur que les lignes de votre série, il suffit d’ajouter une nouvelle colonne de ces valeurs. 

+ La même chose se produira avec une seule valeur, les règles normales de recyclage R s’appliquent. 

+ Un autre cas que nous avons vu la dernière vidéo est le passage d’un vecteur de dates ou d’heures dans la fusion. 

+ Cela peut être utilisé comme si vous rejoigniez une série chronologique normale, mais vous obtenez un nouvel objet avec l’union ou l’intersection de ces temps. 

+ C’est un excellent moyen d’aligner des séries irrégulièrement espacées sur une série avec des intervalles définis.

####**5. Présentation de rbind()**
+ Une fois que vous pouvez rejoindre par colonne, vous voudrez probablement insérer de nouvelles lignes dans votre série. 

+ C’est légèrement différent de la fusion. Tout d’abord, nous appelons rbind, abréviation en R pour row-bind. 

+ Nous pouvons toujours passer un nombre illimité d’objets à lier, mais les objets doivent être un peu plus spécifiques. 

+ Ils ont d’abord besoin d’avoir des temps, sinon nous ne saurons pas où ils doivent aller ni quel indice leur attribuer. 

+ Au-delà de cela, vous devez vous assurer que l’objet que vous liez a le même nombre de colonnes. Une fois que vous obtenez ces deux choses, votre ou vos nouvelles lignes seront insérées dans le bon ordre temporel.

####**6. Exemple rbind()**
+ Un exemple rapide fera valoir ce point. Ici, nous alignons les liaisons $X$ et $Y$, et remarquons que les données ont maintenant des temps de répétition et que les valeurs sont entrelacées. 

+ Nous avons fusionné avec succès par rangée! Le deuxième exemple montre l’erreur qui se produit si $Y$ n’est PAS une série chronologique. 
+ Rappelez-vous simplement que rbind n’accepte que les séries chronologiques et que vous devriez être prêt à partir.

####**7. Entraînons-nous!**
+ Essayons quelques exemples pour nous entraîner.

###**EXERCICES**

####**Combiner xts par colonne avec fusion**

+ ***xts permet de joindre facilement des données par colonne et ligne à l'aide de quelques fonctions différentes. Tous les résultats seront correctement classés dans le temps, quelles que soient les fréquences d'origine ou la classe de dates. L'une des fonctions les plus importantes pour accomplir cela est merge(). Il prend une ou plusieurs séries et les joint par colonne. Il est également possible de combiner une série avec un vecteur de dates. Ceci est particulièrement utile pour normaliser les observations sur un calendrier fixe.***

+ merge() prend trois arguments clés sur lesquels nous insisterons ici. Le premier est le ..., qui vous permet de passer un nombre arbitraire d'objets à combiner. 

+ Le deuxième argument est join, qui spécifie comment joindre la série - en acceptant des arguments tels que inner ou left. 

+ Ceci est similaire à une jointure de base de données relationnelle, sauf qu'ici, l'index est ce sur quoi nous nous joignons. Le dernier argument de cet exercice est le remplissage. Ce mot-clé spécifie ce qu'il faut faire avec les nouvelles valeurs d'une série s'il y a un manque introduit à la suite de la fusion.

      # Utilisation des arguments de base
      merge(a, b, join = "right", fill = 9999)

+ *Pour cet exercice, vous allez explorer certains des différents types de jointure pour avoir une idée de l'utilisation de merge(). Les objets a et b ont été préchargés dans votre espace de travail.*

####**Instructions**

+ Fusionnez a et b en utilisant merge() (ou cbind()), avec l'argument join défini sur "inner".
+ Effectuez une jointure gauche de a et b. 
+ Utilisez merge() et définissez l'argument join sur la valeur correcte. 
+ Remplissez toutes les valeurs manquantes avec zéro (utilisez l'argument fill).

In [None]:
>
a
                    a
2016-06-05 -1.2070657
2016-06-08  0.2774292
2016-06-09  1.0844412
2016-06-13 -2.3456977
>
b
                    b
2016-06-05  0.4291247
2016-06-06  0.5060559
2016-06-08 -0.5747400
2016-06-09 -0.5466319

In [None]:
# Perform an inner join of a and b
merge(a, b, join = "inner")

# Perform a left-join of a and b, fill missing values with 0
merge(a, b, join = "left", fill = 0)

***Excellent! La fusion d'objets xts par colonne est pratique lors de la préparation de données pour l'analyse de séries chronologiques.***

####**Combiner xts par ligne avec rbind**

+ ***Maintenant que vous avez fusionné les données par colonne, vous serez heureux de savoir qu'il est tout aussi simple d'ajouter de nouvelles lignes à vos données.***

+ **xts fournit sa propre méthode S3 à la fonction générique de base rbind(). La fonction xts rbind est beaucoup plus simple que merge(). Le seul argument qui compte est ..., qui prend un nombre arbitraire d'objets à lier. Ce qui est différent, c'est que rbind nécessite une série chronologique, car nous avons besoin d'horodatages pour que R sache où insérer de nouvelles données.**

+ **Pour cet exercice, vous mettrez à jour vos données temporelles avec trois nouvelles observations. L'un sera avant le début de la série et deux après. Faites attention à votre appel de fonction, l'ordre est-il important ?**

+ *Dans votre espace de travail, les objets temps, temps_june30, temps_july17 et temps_july18 sont déjà chargés.*

####**Instructions**

+ Liez la ligne du 30 juin (temps_june30) à temps et appelez-la temps2.
+ Relier les rangs du 17 et 18 juillet au temps2. Appelez ce temps3.

In [175]:
Temp.Max <- c(74, 78, 79, 80, 90, 89, 87, 89, 81, 83, 93, 89, 86, 89, 75, 79)
Temp.Mean <- c(69, 66, 68, 76, 79, 79, 78, 80, 73, 72, 81, 82, 78, 80, 72, 69) 
Temp.Min <- c(60, 56, 59, 69, 68, 70, 72, 72, 67, 64, 69, 77, 68, 68, 60, 60)     

In [184]:
# Create the object data using 5 random numbers
data <- data.frame(Temp.Max, Temp.Mean, Temp.Min)

# Create dates as a Date class object starting from 2016-01-01
dates <- seq(as.Date("2016-07-01"), length = 16, by = "days")

# Use xts() to create smith
temps <- xts(x = data, order.by = dates)

In [187]:
temp_max <- 79
temps_mean <- 70
temps_min <- 68
data <- data.frame(temp_max, temp_mean, temp_min) 
dates <- as.Date("2016-07-17")
# Use xts() to create smith
temps_july17 <- xts(x = data, order.by = dates)

In [188]:
temp_max <- 75
temps_mean <- 70
temps_min <- 65
data <- data.frame(temp_max, temp_mean, temp_min) 
dates <- as.Date("2016-07-18")
# Use xts() to create smith
temps_july18 <- xts(x = data, order.by = dates)

In [189]:
temp_max <- 75
temp_mean <- 73
temp_min <- 63
data <- data.frame(temp_max, temp_mean, temp_min) 
dates <- as.Date("2016-07-30")
# Use xts() to create smith
temps_june30 <- xts(x = data, order.by = dates)

In [191]:
# Row bind temps_june30 to temps, assign this to temps2
temps2 <- rbind(temps_june30, temps)

In [192]:
temps2

           temp_max temp_mean temp_min
2016-07-01       74        69       60
2016-07-02       78        66       56
2016-07-03       79        68       59
2016-07-04       80        76       69
2016-07-05       90        79       68
2016-07-06       89        79       70
2016-07-07       87        78       72
2016-07-08       89        80       72
2016-07-09       81        73       67
2016-07-10       83        72       64
2016-07-11       93        81       69
2016-07-12       89        82       77
2016-07-13       86        78       68
2016-07-14       89        80       68
2016-07-15       75        72       60
2016-07-16       79        69       60
2016-07-30       75        73       63

In [193]:
# Row bind temps_july17 and temps_july18 to temps2, call this temps3
temps3 <- rbind(temps_july17, temps_july18, temps2)

In [194]:
temps3

           temp_max temp_mean temp_min
2016-07-01       74        69       60
2016-07-02       78        66       56
2016-07-03       79        68       59
2016-07-04       80        76       69
2016-07-05       90        79       68
2016-07-06       89        79       70
2016-07-07       87        78       72
2016-07-08       89        80       72
2016-07-09       81        73       67
2016-07-10       83        72       64
2016-07-11       93        81       69
2016-07-12       89        82       77
2016-07-13       86        78       68
2016-07-14       89        80       68
2016-07-15       75        72       60
2016-07-16       79        69       60
2016-07-17       79        73       63
2016-07-18       75        73       63
2016-07-30       75        73       63

***Bon travail! Étant donné que les objets xts sont classés par leur index temporel, l'ordre des arguments dans la commande rbind() de xts n'a pas d'importance.***

####**Quels types de données peuvent être combinés à l'aide de la fusion ?**
+ ***Bien que xts soit très flexible lorsqu'il s'agit de lier de nouvelles colonnes à des objets existants, il existe encore quelques exceptions. Lequel des éléments suivants ne peut pas être fusionné avec succès avec l'objet xts a ?***

+ **Avant de répondre, essayez chaque possibilité dans la console à votre droite pour voir comment elles se comportent. Nous avons fourni deux séries chronologiques, a et b, avec lesquelles vous pouvez travailler.**

####**Instructions**


+ xts objets de type identique (par exemple entier 
+ entier).

+ ***data.frames avec différents types de colonnes.***

+ Vecteur de dates POSIXct.

+ Vecteurs atomiques du même type (par exemple, numériques).

+ Une seule NA.

***C'est correct! Passons au problème du manque.***

###**Gestion des manquants**

####**1. Gestion des manquants**
+ ***Maintenant que vous avez une idée de la fusion de séries, il est temps de vous attaquer à une fatalité dans les séries chronologiques en général. Valeurs manquantes. Heureusement pour nous, xts hérite de la fantastique suite d’outils de valeur NA du zoo.***

####**2. Remplir les NA avec la dernière observation**


+ L’une des façons les plus courantes de traiter les valeurs NA dans les séries chronologiques consiste à appliquer ce que l’on appelle communément la dernière observation reportée, ou locf. 

+ Cela fait exactement ce qu’il dit, prend la dernière valeur non-NA connue et la fait avancer. 

+ Si vous avez plus d’un NA d’affilée, cette opération est répétée et la valeur est reportée vers l’avant. Pour ce faire, nous utiliserons la fonction « na-dot-locf » du zoo. La fonction prend un objet de série chronologique sur lequel travailler. 

+ L’argument suivant contrôle la suppression des absences pour les observations qui ne sont pas remplies, par exemple les NA principaux qui n’ont pas d’observations précédentes à reporter. La valeur par défaut pour xts est FALSE, ce qui diffère du comportement du zoo. 

+ L’argument fromLast vous permet d’inverser le flux, essentiellement de prendre l’observation suivante et de la reporter à l’envers. « Maxgap » vous permet de limiter le portage aux seules plages égales ou inférieures à ce seuil. 

+ Par exemple, maxgap=5 ne remplirait aucune valeur une fois que vous avez plus de cinq NA consécutifs. 

+ Nous avons ici un exemple utilisant la série temporelle Z avec deux NA. 

+ La première colonne est la série originale, la deuxième colonne Z-dot-1 montre l’opération de report, où les 1 sont reportés pour remplir tous les NA avant que la valeur finale de 4 ne soit rencontrée. 

+ La dernière colonne, Z-dot-2 illustre l’argument fromLast et fonctionne efficacement à l’envers.

####**3. Autres options NA**
+ Zoo fournit également des outils utiles supplémentaires pour la manipulation des NA. 

+ Le remplissage de tous les NA de votre série avec une valeur de remplacement se fait avec « na-dot-fill » La suppression des valeurs NA peut être effectuée avec deux fonctions, en fonction de l’emplacement de vos NA. 

+ « na-dot-trim » supprime uniquement les lignes avec des NA qui se trouvent au début ou à la fin de votre série « na-dot-omit » supprime toutes les lignes qui ont des valeurs NA.

+ Pour une manipulation plus nuancée, vous pouvez interpoler les valeurs entre les observations. zoo fournit une fonction pour XTS appelée « na-dot-approx » qui fait une interpolation linéaire entre les observations en fonction de la distance entre les horodatages. 

+ Cela a cependant une utilité pratique limitée pour la prévision, car cela nécessite d’utiliser des observations futures pour calculer les observations passées, mais cela peut être utile dans certaines circonstances.

####**4. NA remplacer et supprimer**
+ Nous avons ici quelques exemples supplémentaires de remplacement ou de suppression des valeurs manquantes. Dans le premier appel, nous remplissons toutes les valeurs manquantes avec l’entier -999. 

+ Dans la seconde, nous supprimons les valeurs manquantes du début ou de la fin de notre série, ce qui signifie dans ce cas supprimer le 13 août. 

+ Dans le dernier exemple, nous supprimons simplement toutes les valeurs manquantes à l’aide de na-dot-omit.

####**5. Interpolation NA**
+ Pour remplir les valeurs avec autre chose que la dernière observation ou une constante, nous pouvons également utiliser l’interpolation linéaire via na-dot-approx. 

+ Comme vous pouvez le voir dans cet exemple, la nouvelle valeur est 3, qui n’est pas le point médian entre 1 et 4, mais plutôt la valeur entre 1 et 4 qui correspond aux deux jours entre les 9 et 12 août.

####**6. Entraînons-nous!**
+ Pour avoir une meilleure idée de la façon dont vous utilisez quelques-uns d’entre eux, essayons-les.

###**EXERCICES**

####**Remplir les valeurs manquantes en utilisant la dernière observation ou la précédente**

+ ***Comme vous l'avez déjà rencontré, il n'est pas rare de se retrouver avec des valeurs manquantes (c'est-à-dire NA) dans votre série chronologique. Cela peut être le résultat d'une omission de données ou d'une opération mathématique ou de fusion que vous effectuez sur vos données.***

+ **Le package xts tire parti de la puissance de zoo pour vous aider. zoo fournit une variété de fonctions de traitement des données manquantes qui sont utilisables par xts.**

+ **Dans cet exercice, vous utiliserez le plus basique d'entre eux, na.locf(). Cette fonction adopte l'approche de la dernière observation reportée. Dans la plupart des cas, c'est la bonne chose à faire. Il préserve à la fois la dernière valeur connue et empêche tout biais d'anticipation d'entrer dans les données.**

+ *Vous pouvez également appliquer la prochaine observation reportée en arrière en définissant fromLast = TRUE.*
          # Last obs. carried forward
          na.locf(x)                

          # Next obs. carried backward
          na.locf(x, fromLast = TRUE) 

####**Instructions**

+ À l'aide d'un sous-ensemble de temps, remplissez les observations NA manquantes avec la dernière observation connue. Stockez-les dans temps_last.
+ À l'aide d'un autre sous-ensemble de temps, remplissez les observations NA manquantes avec l'observation suivante. Stockez-les dans temps_next.

In [132]:
# Fill missing values in temps using the last observation
temps_last <- na.locf(temps)

# Fill missing values in temps using the next observation
temps_next <- na.locf(temps, fromLast = TRUE)

In [133]:
head(temps_last)

Unnamed: 0_level_0,Temp.Max,Temp.Mean,Temp.Min
Unnamed: 0_level_1,<int>,<int>,<int>
2016-07-01,74,69,60
2016-07-02,78,66,56
2016-07-03,79,68,59
2016-07-04,80,76,69
2016-07-05,90,79,68
2016-07-06,89,79,70


In [134]:
head(temps_next)

Unnamed: 0_level_0,Temp.Max,Temp.Mean,Temp.Min
Unnamed: 0_level_1,<int>,<int>,<int>
2016-07-01,74,69,60
2016-07-02,78,66,56
2016-07-03,79,68,59
2016-07-04,80,76,69
2016-07-05,90,79,68
2016-07-06,89,79,70


####**Interpolation NA à l'aide de na.approx()**
+ ***À l'occasion, une simple approche de report vers l'absence n'est pas appropriée. Il se peut qu'une série manque une observation en raison d'un échantillonnage à fréquence plus élevée que le processus de génération. Vous pouvez également rencontrer une observation erronée, mais censée se situer quelque part entre les valeurs de ses observations voisines.***

+ **Ce sont des scénarios où l'interpolation est utile. zoo fournit un outil puissant pour ce faire. Sur la base d'une simple interpolation linéaire entre les points, implémentée avec [na.approx()](https://www.rdocumentation.org/packages/zoo/versions/1.8-11/topics/na.approx), les points de données sont approximés en utilisant la distance entre les valeurs d'index. Autrement dit, la valeur estimée est linéaire dans le temps.**

+ **Pour cet exercice, vous utiliserez une version xts plus petite de l'ensemble de données AirPassengers de Box et Jenkin fourni avec R. Nous avons supprimé quelques mois de données pour illustrer diverses techniques de remplissage.**

+ **Un point à retenir, en plus de se faire une idée des fonctions, est de voir comment les différentes techniques de remplissage impactent vos données, et surtout comment cela affectera votre compréhension de celles-ci.**


+ *L'ensemble de données [AirPassengers](https://www.rdocumentation.org/packages/datasets/versions/3.6.2/topics/AirPassengers) est disponible dans votre espace de travail en tant qu'AirPass.*

####**Instructions**

+ Remplissez les mois manquants dans AirPass avec une interpolation linéaire à l'aide de na.approx().

In [140]:
missing <- c(417, 391, NA, NA, NA, 535, 622, 606, 508, 561, 390, 432)
original <- c(417, 391, 419, 461, 472, 535, 622, 606, 508, 461, 390, 432)
data <- data.frame(missing, original)

# Create dates as a Date class object starting from 2016-01-01
dates <- seq(as.Date("1960-01-01"), length = 12, by = "days")

# Use xts() to create smith
AirPass <- xts(x = data, order.by = dates)

In [141]:
AirPass 

           missing original
1960-01-01     417      417
1960-01-02     391      391
1960-01-03      NA      419
1960-01-04      NA      461
1960-01-05      NA      472
1960-01-06     535      535
1960-01-07     622      622
1960-01-08     606      606
1960-01-09     508      508
1960-01-10     561      461
1960-01-11     390      390
1960-01-12     432      432

In [142]:
# Interpolate NAs using linear approximation
na.approx(AirPass)

           missing original
1960-01-01     417      417
1960-01-02     391      391
1960-01-03     427      419
1960-01-04     463      461
1960-01-05     499      472
1960-01-06     535      535
1960-01-07     622      622
1960-01-08     606      606
1960-01-09     508      508
1960-01-10     561      461
1960-01-11     390      390
1960-01-12     432      432

###**Retards et différences**

####**1. Retards et différences**
+ ***Jusqu’à présent, nous avons examiné la fusion des séries chronologiques et la façon de traiter les valeurs manquantes qui peuvent être présentes. La dernière chose que nous aborderons dans ce chapitre est le calcul des décalages et des différences pour vos données.***

####**2. Saisonnalité et stationnarité**
+ Dans la littérature chronologique, vous rencontrerez souvent l’idée de saisonnalité et de stationnarité. La saisonnalité est similaire à un modèle répétitif, disons des températures plus basses en hiver, tandis que la stationnarité est l’idée qu’une série reste dans une certaine limite plutôt que d’augmenter ou de diminuer continuellement. 

+ Quel est le lien avec les objets de séries chronologiques ? Eh bien, il sera souvent nécessaire de comparer les valeurs de différentes périodes, disons les chiffres de production de ce lundi avec tous les lundis précédents. 

+ Nous avons discuté de la façon dont xts tente d’aligner vos temps avant d’effectuer toute opération. 

+ Bien que ce soit la « bonne chose à faire », cela rend effectivement impossible l’alignement des dates d’une période à l’autre. 

+ Alors, comment contourner ce problème si vous voulez comparer la valeur d’aujourd’hui avec celle d’hier?

####**3. Retard sur une série chronologique**
+ La clé est l’opérateur Lag. 

+ Cette fonction simple vous permet de déplacer vos observations vers l’arrière ou vers l’avant dans le temps. La valeur d’hier est transformée pour avoir les horodatages d’aujourd’hui. 

+ En pratique, cela signifie décaler votre série d’un montant fixe, qu’il s’agisse d’un horodatage ou de plusieurs. 

+ Pour ce faire, nous utilisons l’opérateur de décalage. L’utiliser ne pourrait pas être plus facile, il suffit de passer une série chronologique xts et le nombre de décalages que vous voulez à l’argument k. 

+ Notez que les valeurs positives « k » déplaceront les observations vers l’avant dans le temps et les valeurs négatives « k » déplaceront les observations dans le temps. 

+ k peut même être un vecteur de décalages à appliquer, par exemple en définissant k égal à 0 1 et 5, vous allez créer une matrice avec de nouvelles colonnes correspondant à la série originale (le décalage zéro), un décalage d’une période et un décalage de cinq périodes. Un point important à souligner avec le comportement de décalage de xts vs zoo vs. ts. 

+ L’implémentation de Base R pour ts, également partagée avec le zoo, utilise des valeurs k négatives pour indiquer des décalages positifs, c’est-à-dire que le fait d’avancer dans le temps dans le zoo nécessite un k négatif. 

+ Ceci est contraire à presque toute la littérature, donc xts met en œuvre le comportement opposé. Si vous commencez avec l’objet xts, vous êtes en bonne forme. Si vous convertissez à partir d’un code zoo ou d’un code R de base, vous devez faire très attention à cette différence!

####**4. Différenciation des séries**
+ La dernière fonction que nous examinerons est diff(), la méthode de différenciation de xts. 

+ Cela permet de calculer les différences entre les observations de votre série. 

+ Par exemple, avec une série de cours boursiers quotidiens cumulés, vous pouvez calculer la différence de prix au jour le jour dans un appel de fonction, connu sous le nom de première différence de décalage d’une période. 

+ Diff va au-delà de ce simple cas et permet de calculer la différence sur n’importe quel décalage, et n’importe quel nombre de différences. Il existe également une possibilité d’utiliser l’arithmétique ou la différenciation logarithmétique en fonction de vos besoins.

####**5. Entraînons-nous!**
+ À ce stade, nous allons travailler sur quelques exemples concrets et vous permettre de vous faire une idée du travail avec les décalages et les différences.

###**EXERCICES**

####**Combiner une série chronologique en avance et en retard**


+ ***Une autre modification courante pour les séries chronologiques est la possibilité de retarder une série. Également connue sous le nom d'opération de $L^{k}$ rétrogradation, elle est généralement illustrée dans la littérature en utilisant $L^{k}X = X_{t-k}$ notation, indiquant une transformation dans le temps. Cela vous permet de voir des observations comme la valeur d'hier dans le contexte d'aujourd'hui.***

+ **zoo et xts implémentent tous deux ce comportement et l'étendent en fait à partir de l'original ts dans R. Il existe deux différences majeures entre les implémentations xts et zoo dont vous devez être conscient. L'un est la direction du décalage pour un k donné. La seconde est la façon dont les absences sont gérées par la suite.**

+ ***Pour des raisons historiques dans R, zoo utilise une convention pour le signe de k dans laquelle les valeurs négatives indiquent des retards et les valeurs positives indiquent des avances. Autrement dit, dans zoo lag(x, k = 1) décalera les valeurs futures d'un pas en arrière dans le temps. Ceci est incompatible avec la grande majorité de la littérature sur les séries chronologiques, mais est cohérent avec le comportement dans la base R. xts implémente exactement le contraire, à savoir pour un k positif, la série décalera la dernière valeur dans le temps d'une période vers l'avant ; c'est cohérent avec l'intuition, mais tout à fait différent du zoo.***

+ *Dans cet exercice, vous allez construire un seul objet xts avec trois colonnes. La première colonne contient les données d'un jour à l'avance, la deuxième colonne les données d'origine et la troisième colonne le jour de retard - le tout utilisant xts. Un simple objet xts, x, a été chargé dans votre espace de travail.*

      # Votre objet final
      cbind(lead_x, x, lag_x)


####**Instructions**

+ Créez une avance d'une période de x appelée lead_x.
+ Créez un décalage d'une période de x appelé lag_x.
+ En utilisant la fonction merge(), combinez lead + x + lag dans un nouvel objet z.

In [143]:
x <- c(5, 6, 7, 8, 9)
data <- data.frame(x)

# Create dates as a Date class object starting from 2016-01-01
dates <- seq(as.Date("2023-02-17"), length = 5, by = "days")

# Use xts() to create smith
x <- xts(x = data, order.by = dates)

In [145]:
# Create a leading object called lead_x
lead_x <- lag(x, k = -1)

lead_x

            x
2023-02-17  6
2023-02-18  7
2023-02-19  8
2023-02-20  9
2023-02-21 NA

In [146]:
# Create a lagging object called lag_x
lag_x <- lag(x, k = 1)

lag_x

            x
2023-02-17 NA
2023-02-18  5
2023-02-19  6
2023-02-20  7
2023-02-21  8

In [147]:
# Merge your three series together and assign to z
z <- cbind(lead_x, x, lag_x)
z

            x x.1 x.2
2023-02-17  6   5  NA
2023-02-18  7   6   5
2023-02-19  8   7   6
2023-02-20  9   8   7
2023-02-21 NA   9   8

***Bien joué! La génération d'avances et de retards peut vous aider à visualiser les tendances de vos données de séries chronologiques au fil du temps.***

####**Calculer une différence d'une série en utilisant diff()**
+ ***Une autre opération courante sur les séries chronologiques, généralement sur celles qui ne sont pas stationnaires, consiste à prendre une différence de la série. Le nombre de différences à prendre d'une série est une application consistant à appeler récursivement la fonction de différence $n$ fois.***

+ **Une façon simple de voir une différence unique (ou "de premier ordre") est de la voir comme $x(t) - x(t-k)$ où k est le nombre de retards à remonter. Les différences d'ordre supérieur sont simplement la réapplication d'une différence à chaque résultat précédent.**

+ **Dans R, l'opérateur de différence pour xts est rendu disponible à l'aide de la commande diff(). Cette fonction prend deux arguments à noter. Le premier est le décalage, qui est le nombre de périodes, et le second est la différence, qui est l'ordre de la différence (par exemple, combien de fois diff() est appelé).**

        # Ce sont les mêmes
        diff(x, differences = 2)
        diff(diff(x))

+ *Dans cet exercice, vous réutiliserez les données AirPass du début de ce chapitre, bien que cette fois vous utiliserez la série complète de 1948 à 1960.*

####**Instructions**

+ Construisez une différence de premier ordre d'AirPass à la main, en utilisant lag() et la soustraction. 
+ Enregistrez ceci sous diff_by_hand.
+ Pour vérifier que votre résultat est identique à l'utilisation de diff(AirPass), combinez et inspectez les premières lignes des deux dans votre console. Utilisez merge() et head() pour cela.
+ Obtenez la différence de 12 mois de la première commande de la série AirPass. 
+ Assurez-vous de spécifier à la fois les arguments décalage et différences dans diff().

In [149]:
# Calculate the first difference of AirPass and assign to diff_by_hand
diff_by_hand <- AirPass - lag(AirPass, k = 1)

diff_by_hand

           missing original
1960-01-01      NA       NA
1960-01-02     -26      -26
1960-01-03      NA       28
1960-01-04      NA       42
1960-01-05      NA       11
1960-01-06      NA       63
1960-01-07      87       87
1960-01-08     -16      -16
1960-01-09     -98      -98
1960-01-10      53      -47
1960-01-11    -171      -71
1960-01-12      42       42

In [150]:
# Use merge to compare the first parts of diff_by_hand and diff(AirPass)
merge(head(diff_by_hand), head(diff(AirPass)))

           missing original missing.1 original.1
1960-01-01      NA       NA        NA         NA
1960-01-02     -26      -26       -26        -26
1960-01-03      NA       28        NA         28
1960-01-04      NA       42        NA         42
1960-01-05      NA       11        NA         11
1960-01-06      NA       63        NA         63

In [151]:
# Calculate the first order 12 month difference of AirPass
diff(AirPass, lag = 12, diff = 1)

           missing original
1960-01-01      NA       NA
1960-01-02      NA       NA
1960-01-03      NA       NA
1960-01-04      NA       NA
1960-01-05      NA       NA
1960-01-06      NA       NA
1960-01-07      NA       NA
1960-01-08      NA       NA
1960-01-09      NA       NA
1960-01-10      NA       NA
1960-01-11      NA       NA
1960-01-12      NA       NA

***Bon travail! Comme vous pouvez le voir, différencier votre série n'est qu'une étape plus complexe que de générer des retards et des avances.***

####**Quelle est la principale différence de décalage entre xts et zoo**

+ ***Comme vous l'avez vu, la génération de retards et de pistes est un outil important dans votre arsenal pour gérer les données de séries chronologiques dans R. Cependant, comme xts utilise des procédures légèrement différentes pour générer des retards et des pistes par rapport au zoo de base-R, vous devez être très précis dans vos appels à lag().***

+ *Lequel des éléments suivants est faux?*

####**Instructions**


+ Les observations NA en xts résultant de lag() sont conservées.

+ Les observations NA dans zoo résultant de lag() sont supprimées.

+ ***L'argument k dans zoo utilise des valeurs positives pour déplacer les observations passées vers l'avant.***

+ L'argument k dans xts utilise des valeurs positives pour déplacer les observations passées vers l'avant.

***Exactement! xts suit la littérature, tandis que zoo continue avec les normes de base-R.***

###**Appliquer les fonctions par temps**

####**1. Appliquer les fonctions par temps**
+ ***Pour notre quatrième chapitre, nous examinerons l’application et l’agrégation de nos séries par temps.***

####**2. Thèmes**
+ **Dans cette première vidéo, nous nous concentrerons sur l’application de fonctions sur des périodes discrètes, ou intervalles dans le temps. Il existe deux approches principales pour y parvenir, période-point-appliquer et diviser.**

####**3. Postulez par période**
+ La façon la plus simple d’appliquer une fonction dans le temps est d’utiliser le point point-appliquer de xts. 

+ Cela ressemble beaucoup à la façon dont vous utiliseriez la famille de fonctions d’application de R. 

+ Votre objet d’origine est transmis, un index correspondant aux emplacements de vos intervalles est le suivant, cela devrait être le résultat d’un appel aux points de terminaison. 

+ Et enfin, vous transmettez la fonction et tous les arguments supplémentaires dont vous pourriez avoir besoin.

####**4. Recherche de points de terminaison**
+ Nous définissons les points de terminaison comme l’index de la dernière observation pour un intervalle donné. 

+ Par exemple, si vous avez dix ans de données, trouver les points de terminaison par année renverrait l’index de la dernière date ou heure de chaque année dans nos données. 

+ Notez qu’il s’agit de la dernière valeur affichée pour chaque intervalle. Si nos données se terminent en août, le dernier point final annuel sera à cette date en août. 

+ Cela nous permet d’opérer sur des séries chronologiques irrégulières, sans avoir à connaître les dates exactes dans les séries. 

+ Endpoints prend un objet xts ou une plage de dates et recherche les intervalles en fonction de l’argument on= spécifié. 

+ Cet argument peut être n’importe lequel d’une variété d’intervalles de temps naturels, tels que des années, des trimestres ou des semaines. 

+ Même les valeurs intrajournalières telles que les heures sont prises en charge. La sortie est un vecteur entier des extrémités de votre série, qui par convention commence toujours par zéro et se termine par l’index de la dernière observation.

####**5. period.apply() en action**
+ Un exemple simple est l’utilisation des données des fonds edhec du package PerformanceAnalytics. 

+ Ici, nous pouvons facilement calculer le rendement mensuel moyen par année. 

+ Pour économiser de l’espace, nous avons d’abord sous-défini notre série pour inclure uniquement 1997 à 2001. 

+ Nous calculons ensuite nos critères d’évaluation en fonction des années et appliquons la fonction moyenne à chaque période. 

+ La sortie est un nouvel objet xts indexé avec ces heures finales. 

+ Vous pouvez également utiliser une poignée de fonctions de raccourci prédéfinies pour obtenir le même résultat. Les fonctions portent des noms tels que apply-dot-monthly, apply-dot-annual et apply-dot-quarterly. Ils s’occupent des points de terminaison et des calculs INDEX pour vous.

####**6. split.xts**
+ L’approche finale utilise la méthode fractionnée pour xts. 

+ C’est exactement ce que cela ressemble. Nous divisons nos données en morceaux par temps. 

+ La puissance de cette approche vient du morcellement discret et évident et du contrôle qu’elle vous donne. 

+ Il est généralement très rapide et très facile à lire. La méthode xts pour la division utilise nos noms de période standard pour diviser les séries xts en une liste d’une ou plusieurs périodes. 

+ Par exemple, diviser edhec avec f='trimestres' diviserait les données en une liste de séries trimestrielles xts. Ici, nous pouvons alors extraire le ou les trimestres qui nous intéressent.

####**7. Entraînons-nous!**
+ Maintenant que nous avons vu comment cela est censé fonctionner, il est temps de mettre en pratique ce que nous avons appris.

###**EXERCICES**

####**Trouver des intervalles par temps en xts**

+ ***L'un des avantages de travailler avec des objets de série chronologique est la facilité avec laquelle il est possible d'appliquer des fonctions en fonction du temps.***

+ **La fonction principale dans xts pour faciliter cela est endpoints(). Il prend une série chronologique (ou un vecteur de temps) et renvoie les emplacements des dernières observations dans chaque intervalle.**

+ Par exemple, le code ci-dessous localise la dernière observation de chaque année pour l'ensemble de données AirPass.

      endpoints(AirPass, on = "years")
      [1] 0 12 24 36 48 60 72 84 96 108 120 132 144


+ **L'argument sur prend en charge une variété de périodes, y compris les "années", les "trimestres", les "mois", ainsi que les intervalles intrajournaliers tels que les "heures" et les "minutes". Ce qui est renvoyé est un vecteur commençant par 0 et se terminant par l'étendue (dernière ligne) de vos données.**

+ En plus de chaque période, vous pouvez trouver le $K_{th}$ période en utilisant l'argument k. Par exemple, définir les arguments de votre appel endpoints() sur on = "weeks", k = 2, générerait le dernier jour d'une semaine sur deux dans vos données. Notez que la dernière valeur renvoyée sera toujours la longueur de vos données d'entrée, même si elle ne correspond pas à un intervalle ignoré.

+ *Dans cet exercice, vous utiliserez endpoints() pour trouver deux ensembles de points de terminaison pour les données temporelles quotidiennes.*

####**Instructions**

+ Utilisez endpoints() pour localiser la fin de la semaine dans vos données temporaires.
+ Utilisez endpoints() pour localiser la fin d'une semaine sur deux dans vos données temporaires. N'oubliez pas d'utiliser l'argument k.

In [170]:
Temp.Max <- c(74, 78, 79, 80, 90, 89, 87, 89, 81, 83, 93, 89, 86, 89, 75, 79)
Temp.Mean <- c(69, 66, 68, 76, 79, 79, 78, 80, 73, 72, 81, 82, 78, 80, 72, 69) 
Temp.Min <- c(60, 56, 59, 69, 68, 70, 72, 72, 67, 64, 69, 77, 68, 68, 60, 60)

In [171]:
# Create the object data using 5 random numbers
data <- data.frame(Temp.Max, Temp.Mean, Temp.Min)

# Create dates as a Date class object starting from 2016-01-01
dates <- seq(as.Date("2016-07-01"), length = 16, by = "days")

# Use xts() to create smith
temps <- xts(x = data, order.by = dates)

In [172]:
# Locate the weeks
endpoints(temps, on = "weeks")

In [173]:
# Locate every two weeks
endpoints(temps, on = "weeks", k = 2)

***Bon travail! Comme vous le verrez dans l'exercice suivant, la localisation des points de terminaison peut aider à accélérer le processus d'agrégation des données de séries chronologiques.***

####**Appliquer une fonction par période(s) de temps**

+ ***À ce stade, vous savez comment localiser la fin des périodes à l'aide de endpoints(). Vous vous demandez peut-être ce que vous faites de ces valeurs.***

+ ***Dans le cas le plus simple, vous pouvez créer un sous-ensemble de votre objet pour obtenir les dernières valeurs. Dans certains cas, cela peut être utile. Par exemple, pour identifier la dernière valeur connue d'un capteur au cours de l'heure ou obtenir la valeur du taux de change USD/JPY en début de journée. Pour la plupart des séries, vous souhaiterez appliquer une fonction aux valeurs entre les extrémités. Essentiellement, utilisez la fonction de base apply(), mais utilisée sur une fenêtre de temps.***

+ **Pour ce faire facilement, xts fournit la commande period.apply(), qui prend une série chronologique, un index de points de terminaison et une fonction.**

      period.apply(x, INDEX, FUN, ...)

+ *Dans cet exercice, vous vous entraînerez à utiliser period.apply() en prenant la moyenne hebdomadaire de vos données temporaires. Vous examinerez également l'une des fonctions de raccourci qui fait la même chose avec une syntaxe légèrement différente.*

####**Instructions**

+ Calculez les points finaux hebdomadaires de la série temporaire et attribuez-les à ep.
+ À l'aide de period.apply(), calculez la moyenne hebdomadaire de la colonne Temp.Mean de vos données temporaires. 
+ N'oubliez pas que vos paramètres ont été calculés chaque semaine.

In [174]:
# Calculate the weekly endpoints
ep <- endpoints(temps, on = "weeks")

# Now calculate the weekly mean and display the results
period.apply(temps[, "Temp.Mean"], INDEX = ep, FUN = mean)

           Temp.Mean
2016-07-03  67.66667
2016-07-10  76.71429
2016-07-16  77.00000

***Bien joué! La commande period.apply() vous permet de calculer facilement les qualités complexes de vos données de séries chronologiques.***

####**Utilisation de lapply() et split() pour appliquer des fonctions sur des intervalles**

+ ***Dans le même esprit que l'exercice précédent, xts vous offre un mécanisme supplémentaire pour plonger dans les périodes de vos données. Il est souvent utile de diviser physiquement vos données en morceaux disjoints dans le temps et d'effectuer des calculs sur ces périodes.***

+ **Pour cet exercice, vous utiliserez la commande xts split() pour décomposer vos données en fonction du temps. La fonction split() crée une liste contenant un élément pour chaque split. L'argument f dans split() est une chaîne de caractères décrivant la période à diviser (c'est-à-dire "mois", "années", etc.).**

+ *Ici, vous suivrez le même processus que vous avez suivi dans l'exercice précédent. Cependant, cette fois, vous allez d'abord diviser manuellement vos données, puis appliquer la fonction mean() à chaque morceau. La fonction lapply() est utilisée pour les calculs les plus efficaces. Dans les cas où vous ne souhaitez pas renvoyer une série chronologique, cela s'avère très intuitif et efficace.*

####**Instructions**

+ Utilisez split () pour diviser vos données temporaires par semaines. 
+ Appelez-le temps_weekly
+ Utilisez lapply() pour obtenir la moyenne hebdomadaire de temps_weekly. 
+ Appelez cela temps_avg. Imprimez cette liste.

In [166]:
Temp.Max <- c(74, 78, 79, 80, 90, 89, 87, 89, 81, 83, 93, 89, 86, 89, 75, 79)
Temp.Mean <- c(69, 66, 68, 76, 79, 79, 78, 80, 73, 72, 81, 82, 78, 80, 72, 69) 
Temp.Min <- c(60, 56, 59, 69, 68, 70, 72, 72, 67, 64, 69, 77, 68, 68, 60, 60)

In [167]:
# Create the object data using 5 random numbers
data <- data.frame(Temp.Max, Temp.Mean, Temp.Min)

# Create dates as a Date class object starting from 2016-01-01
dates <- seq(as.Date("2016-07-01"), length = 16, by = "days")

# Use xts() to create smith
temps <- xts(x = data, order.by = dates)

In [168]:
# Split temps by week
temps_weekly <- split(temps, f = "weeks")
temps_weekly

$`2016-07-01`
           Temp.Max Temp.Mean Temp.Min
2016-07-01       74        69       60
2016-07-02       78        66       56
2016-07-03       79        68       59

$`2016-07-04`
           Temp.Max Temp.Mean Temp.Min
2016-07-04       80        76       69
2016-07-05       90        79       68
2016-07-06       89        79       70
2016-07-07       87        78       72
2016-07-08       89        80       72
2016-07-09       81        73       67
2016-07-10       83        72       64

$`2016-07-11`
           Temp.Max Temp.Mean Temp.Min
2016-07-11       93        81       69
2016-07-12       89        82       77
2016-07-13       86        78       68
2016-07-14       89        80       68
2016-07-15       75        72       60
2016-07-16       79        69       60


In [169]:
# Create a list of weekly means, temps_avg, and print this list
temps_avg <- lapply(X = temps_weekly, FUN = mean)
temps_avg

***Excellent! Comme vous pouvez le voir, period.apply() est similaire à l'utilisation d'une combinaison de split() et lapply().***

####**Sélection par points de terminaison vs split-lapply-rbind***

+ ***Vous avez maintenant vu que même dans xts, il existe plusieurs façons d'accomplir une tâche. Dans cet exercice, nous mettrons cela en évidence explicitement en abordant le même défi en utilisant deux méthodes différentes. Lorsque vous êtes seul, vous trouverez probablement des situations où l'un ou l'autre sera plus intuitif, mais pour l'instant, vous devez vous assurer que vous êtes capable de faire les deux.***

+ **En partant des mêmes temps de séries quotidiennes, le défi sera de trouver la dernière observation de chaque semaine.**

+ ***Notez que ces fonctions trouveront toujours les dates qui sont dans l'intervalle fermé [début de période, fin de période] même s'il n'y a pas d'observation au début ou à la fin exacte. xts représente des séries chronologiques irrégulières, il est donc parfaitement valide d'avoir des trous dans les données où l'on pourrait s'attendre à une observation.***

+ *En utilisant les diapositives et les exemples vidéo comme référence, trouvez la dernière observation pour chaque semaine dans nos données temporaires.*

####**Instructions**

+ Utilisez le paradigme split()-lapply()-rbind(), donné pour vous dans le script, pour trouver la dernière observation de chaque semaine en temps. Il est stocké dans temps_1.
+ Utilisez endpoints() pour trouver les derniers jours de la semaine en temps. Stockez le vecteur résultant dans last_day_of_weeks.
+ Créez temps_2 en sous-définissant les températures à l'aide de last_day_of_weeks.

In [195]:
# Use the proper combination of split, lapply and rbind
temps_1 <- do.call(rbind, lapply(split(temps, "weeks"), function(w) last(w, n = "1 day")))

# Create last_day_of_weeks using endpoints()
last_day_of_weeks <- endpoints(temps, on = "weeks")

# Subset temps using last_day_of_weeks 
temps_2 <-  temps[last_day_of_weeks]

In [196]:
temps_1

           Temp.Max Temp.Mean Temp.Min
2016-07-03       79        68       59
2016-07-10       83        72       64
2016-07-16       79        69       60

In [197]:
last_day_of_weeks 

In [198]:
temps_2 

           Temp.Max Temp.Mean Temp.Min
2016-07-03       79        68       59
2016-07-10       83        72       64
2016-07-16       79        69       60

***Excellent travail! Cela ne fait jamais de mal de connaître plusieurs méthodes pour sélectionner certains points dans votre série chronologique.***

###**Périodicité de conversion**
####**1. Périodicité de conversion**

+ ***Une autre façon courante de transformer vos données en fonction du temps est de les agréger.***

####**2. Agrégation de séries chronologiques**
+ ***Dans les séries chronologiques, l’une des agrégations les plus courantes convertit les séries univariées en ce que l’on appelle traditionnellement les barres de gamme, avec le cas particulier en finance connu sous le nom de barres ouvertes-hautes-basses-fermées, ou OHLC. Cette agrégation nous donne un résumé des valeurs observées au cours d’une période donnée. Pour ce faire pour chaque période, nous calculons la valeur de départ, la valeur maximale, la valeur minimale et la valeur finale.***

####**3. Agréger à l’aide de xts**
+ Dans xts, il existe une fonction appelée to-dot-period conçue pour effectuer cette tâche aussi efficacement que possible. Les deux principaux arguments de to-dot-period sont un objet de série chronologique et une chaîne représentant les périodes à agréger. 
+ La chaîne prend des valeurs que nous avons vues dans de nombreuses autres fonctions jusqu’à présent, par exemple des jours ou des mois. Par défaut, toutes les colonnes OHLC auront des suffixes descriptifs ajoutés, tels que point-Open ou point-High. 
+ Vous pouvez contrôler le nom racine de ces colonnes en passant une chaîne à l’argument name=. 
+ Un autre argument utile est indexAt, qui vous permet de modifier la date et l’heure de votre nouvelle observation agrégée. 
+ Par défaut, ce sera toujours la dernière observation de la période. Si vous souhaitez plutôt afficher l’horodatage ou la date du début du point, vous devez passer la chaîne « firstof » à cet argument.

####**4. Agrégation OHLC**
+ Prenons l’exemple de la série mensuelle edhec. Ici, nous le convertissons en clôture annuelle ouverte haute basse. Notez que nous passons également name='EDHEC', ce qui modifiera la racine de chaque nom de colonne pour le rendre plus lisible. 
+ Cela nous donne un nouvel objet montrant la plage de valeurs pour chaque année dans les données d’origine.

####**5. Agrégat OHLC (suite)**
+ Dans le deuxième exemple, nous avons modifié l’index pour refléter les heures au début de chaque période à l’aide de l’argument indexAt.

####**6. Agréger sans barres de plage**
+ Si, au contraire, nous voulons simplement sous-échantillonner nos données au fil du temps, nous pouvons adopter deux approches différentes. 

+ Tout d’abord, nous pouvons utiliser un argument spécial pour to-dot-period pour forcer une série univariée de valeurs finales pour chaque période. 

+ La deuxième option est un peu plus directe, nous utilisons simplement la sortie d’un appel endpoints() approprié pour extraire les valeurs qui nous intéressent.

####**7. Exemple d’observation de fin de période**
+ Voici deux autres exemples utilisant les mêmes données edhec funds, cette fois bien que nous ne nous intéressions qu’à la dernière observation pour chaque période et appliquions les méthodes d’échantillonnage simples dont nous venons de parler.

####**8. Entraînons-nous!**
+ Maintenant que nous avons vu comment cela fonctionne, essayons ce que nous venons d’apprendre.

####**Convertir des séries univariées en données OHLC**
+ ***L'agrégation de séries chronologiques peut être une tâche frustrante. Par exemple, dans les séries financières, il est courant de trouver des données Open-High-Low-Close (ou OHLC) calculées sur un intervalle répétitif et régulier.***

+ **Aussi connu sous le nom de barres de plage, l'agrégation d'une série basée sur une fenêtre régulière peut faciliter l'analyse parmi les séries qui ont des fréquences variables. Une série économique hebdomadaire et une série boursière quotidienne peuvent être comparées plus facilement si le quotidien est converti en hebdomadaire.**

+ **Dans cet exercice, vous allez convertir une série univariée en série OHLC, puis reconvertir votre série OHLC finale en série univariée à l'aide de la fonction xts to.period(). Cette fonction prend une série chronologique, x, et une chaîne pour la période (c'est-à-dire des mois, des jours, etc.), en plus d'un certain nombre d'autres arguments facultatifs.**

        to.period(x,
          period = "months", 
          k = 1, 
          indexAt, 
          name=NULL,
          OHLC = TRUE,
          ...)


+ *Vous utiliserez un nouvel ensemble de données pour cet exercice, usd_eur, un taux de change USD/EUR quotidien de 1999 à août 2016, qui a été chargé dans votre espace de travail.*

####**Instructions**

+ Convertissez usd_eur en une série hebdomadaire OHLC en utilisant to.period(). Appelez cette nouvelle série usd_eur_weekly. Notez que par défaut OHLC = TRUE.
+ Convertissez usd_eur en une série mensuelle OHLC. Appelez cette série usd_eur_monthly.
+ Convertissez usd_eur en une série univariée annuelle (pas de barres OHLC). Appelez cette série usd_eur_yearly.

In [4]:
dat <- read.csv("USDEUR.csv")
usd_eur <- xts(dat, order.by = as.Date(rownames(dat)))

In [5]:
head(usd_eur)

           DEXUSEU
1999-01-04  1.1812
1999-01-05  1.1760
1999-01-06  1.1636
1999-01-07  1.1672
1999-01-08  1.1554
1999-01-11  1.1534

In [6]:
# Convert usd_eur to weekly and assign to usd_eur_weekly
usd_eur_weekly <- to.period(usd_eur, period = "weeks")
head(usd_eur_weekly)

           usd_eur.Open usd_eur.High usd_eur.Low usd_eur.Close
1999-01-08       1.1812       1.1812      1.1554        1.1554
1999-01-15       1.1534       1.1698      1.1534        1.1591
1999-01-22       1.1610       1.1610      1.1575        1.1582
1999-01-29       1.1566       1.1577      1.1371        1.1371
1999-02-05       1.1303       1.1339      1.1283        1.1283
1999-02-12       1.1296       1.1331      1.1282        1.1282

In [7]:
# Convert usd_eur to monthly and assign to usd_eur_monthly
usd_eur_monthly <- to.period(usd_eur, period = "months")
head(usd_eur_monthly)

           usd_eur.Open usd_eur.High usd_eur.Low usd_eur.Close
1999-01-29       1.1812       1.1812      1.1371        1.1371
1999-02-26       1.1303       1.1339      1.0972        1.0995
1999-03-31       1.0891       1.1015      1.0716        1.0808
1999-04-30       1.0782       1.0842      1.0564        1.0564
1999-05-28       1.0571       1.0787      1.0422        1.0422
1999-06-30       1.0449       1.0516      1.0296        1.0310

In [8]:
# Convert usd_eur to yearly univariate and assign to usd_eur_yearly
usd_eur_yearly <- to.period(usd_eur, period = "years", OHLC = FALSE)
head(usd_eur_yearly)

           DEXUSEU
1999-12-31  1.0070
2000-12-29  0.9388
2001-12-31  0.8901
2002-12-31  1.0485
2003-12-31  1.2597
2004-12-31  1.3538

***Bien joué! L'agrégation dans le temps et la conversion d'univarié en OHLC (et vice-versa) sont des compétences utiles pour l'analyse de séries chronologiques, en particulier avec des données financières.***

####**Convertir une série à une fréquence inférieure**
+ ***Outre la conversion de séries chronologiques univariées en séries OHLC, to.period() vous permet également de convertir OHLC en fréquence régularisée inférieure - quelque chose comme sous-échantillonner vos données.***

+ **Selon la fréquence choisie, la classe d'index de vos données peut être contrainte à quelque chose de plus approprié aux nouvelles données. Par exemple, lorsque vous utilisez la fonction de raccourci to. quarterly(), xts convertira votre index en classe [yearqtr](https://www.rdocumentation.org/packages/zoo/versions/1.8-11/topics/yearqtr) pour rendre les périodes plus évidentes.**

+ **Nous pouvons remplacer ce comportement en utilisant l'argument indexAt. Plus précisément, l'utilisation de firstof vous donnerait l'heure depuis le début de la période. De plus, vous pouvez modifier le nom de base de chaque colonne en fournissant une chaîne au nom de l'argument.**

+ ***Pour cet exercice, nous allons introduire un nouveau jeu de données, les données de l'indice [edhec](https://www.rdocumentation.org/packages/PerformanceAnalytics/versions/2.0.4/topics/edhec) hedge funds du package [PerformanceAnalytics](https://www.rdocumentation.org/packages/PerformanceAnalytics/versions/2.0.4/topics/PerformanceAnalytics-package).***

+ *ans cet exercice, vous utiliserez la série chronologique Equity Market Neutral des données de l'edhec, que nous avons attribuée à eq_mkt.*

####**Instructions**

+ Convertissez eq_mkt en OHLC trimestriel en utilisant la base to.period(). 
+ Appelez ceci mkt_quarterly.
+ Convertissez à nouveau l'eq_mkt d'origine, cette fois en utilisant directement to. quarterly(). 
+ Changez le nom de base de chaque colonne OHLC en edhec_equity et changez l'index en "firstof".
+  Appelez ceci mkt_quarterly2.

In [9]:
eq_mkt <- edhec[,5]

In [10]:
# Convert eq_mkt to quarterly OHLC
mkt_quarterly <- to.period(eq_mkt, period = "quarters")

# Convert eq_mkt to quarterly using shortcut function
mkt_quarterly2 <- to.quarterly(eq_mkt, name = "edhec_equity", indexAt = "firstof")

In [11]:
head(mkt_quarterly)

           eq_mkt.Open eq_mkt.High eq_mkt.Low eq_mkt.Close
1997-03-31      0.0189      0.0189     0.0016       0.0016
1997-06-30      0.0119      0.0189     0.0119       0.0165
1997-09-30      0.0247      0.0247     0.0017       0.0202
1997-12-31      0.0095      0.0095     0.0041       0.0066
1998-03-31      0.0060      0.0179     0.0060       0.0179
1998-06-30      0.0067      0.0108     0.0067       0.0108

In [12]:
head(mkt_quarterly2 )

           edhec_equity.Open edhec_equity.High edhec_equity.Low
1997-03-01            0.0189            0.0189           0.0016
1997-06-01            0.0119            0.0189           0.0119
1997-09-01            0.0247            0.0247           0.0017
1997-12-01            0.0095            0.0095           0.0041
1998-03-01            0.0060            0.0179           0.0060
1998-06-01            0.0067            0.0108           0.0067
           edhec_equity.Close
1997-03-01             0.0016
1997-06-01             0.0165
1997-09-01             0.0202
1997-12-01             0.0066
1998-03-01             0.0179
1998-06-01             0.0108

***Bon travail! Des commandes telles que to. quarterly() fournissent un raccourci pratique pour convertir avec précision votre série chronologique à une fréquence inférieure.***

###**Fonctions de roulement**

####**1. Fonctions de roulement**


####**2. Fenêtres roulantes**
+ Les deux dernières façons d’appliquer une fonction aux données de séries chronologiques s’inscrivent dans le contexte de ce que j’appelle le roulement discret.

####**3. Fenêtres roulantes**
+ et les fenêtres roulantes continues.

####**4. Fenêtres roulantes**
+ Lorsque vous travaillez avec des données de séries chronologiques, il est souvent utile de pouvoir effectuer des calculs au fil du temps. 
+ Cela pourrait être quelque chose comme calculer la somme cumulée d’une série pour chaque mois, mais réinitialiser au début de chaque mois,

####**5. Fenêtres roulantes**
+ ou calculer une valeur glissante compte tenu d’une fenêtre fixe d’observations,

####**6. Fenêtres roulantes**
+ essentiellement en prenant l’observation suivante dans le temps,

####**7. Fenêtres roulantes**
+ ajout à la fenêtre,

####**8. Fenêtres roulantes**
+ tout en chutant simultanément

####**9. Fenêtres roulantes**
+ l’observation tout à l’arrière.

####**10. Fenêtres roulantes discrètes**
+ Avec xts, ces deux méthodes sont faciles à réaliser. 
+ Pour des périodes de temps discrètes, disons le nombre total de ventes mensuelles pour un fabricant, nous pouvons tirer parti de certains des outils que nous avons vus tels que le fractionnement. 
+ Nous pouvons ensuite les combiner avec des fonctions de roulement intégrées en xts. 

+ Ces fonctions de roulement font des choses comme calculer la somme cumulée ou la valeur maximale cumulée d’une série. 

+ Les quatre fonctions que nous pouvons utiliser sont cumsum, cumprod, cummin et cummax. 

+ Chacun prend un seul argument et retournera une nouvelle série en appliquant la somme, la prod, la min ou le max à chaque observation, en utilisant toutes les observations vues jusque-là. 

+ Par exemple, le cumsum de 1,2,3 retournerait 1, 3 et 6, la somme de toutes les valeurs vues jusqu’à chaque observation respective.

####**11. Fenêtres roulantes discrètes**
+ Si nous combinons cette fonctionnalité avec split, lapply et rbind, nous pouvons calculer une valeur cumulative pour les fenêtres de temps discrètes. Voyons comment cela fonctionne. 

+ En utilisant les données edhec, nous diviserons nos séries en années et prendrons le rendement cumulé par année. 

+ Nous pouvons ensuite relier ces valeurs pour obtenir une nouvelle série chronologique donnant le rendement de chaque année à ce jour dans le temps. 

+ Vous notez qu’au début de chaque nouvelle année, les valeurs de rendement cumulées sont réinitialisées. C’est exactement ce que nous espérions faire.

####**12. Fenêtres roulantes continues**
+ Un autre modèle très courant consiste à appliquer une fonction arbitraire à un nombre fixe d’observations, en faisant avancer cette fenêtre fixe d’observations, une observation à la fois. 

+ Essentiellement déplacer la fenêtre pour inclure l’observation suivante, tout en laissant tomber la plus ancienne de la fenêtre. 

+ XTS fournit cela par le biais de la fonction générique rollapply dans ZOO. 

+ Les arguments xts incluent les données, c’est-à-dire votre objet xts. 

+ La largeur de la fenêtre, c’est un entier. Et la fonction que vous appliquez. Regardons un exemple simple, mais utile de la fonction rollapply.

####**13. Fenêtres roulantes continues**
+ Nous calculons ici la moyenne mobile sur trois mois de notre série chronologique edhec. 

+ Nous avons donc travaillé sur quelques exemples de fonction de roulement et de xts. Il est maintenant temps de nous salir les mains et d’expérimenter avec du code.

####**14. Entraînons-nous!**
+ Mettons-nous au travail!

###**EXERCICES**

####**Calculer la valeur glissante de base de la série par mois**

+ ***Une agrégation courante que vous souhaiterez peut-être appliquer consiste à effectuer un calcul dans le contexte d'une période, mais en renvoyant les résultats intermédiaires pour chaque observation de la période.***

+ ***Par exemple, vous souhaiterez peut-être calculer une somme cumulée mensuelle cumulée d'une série. Cela serait pertinent lorsque vous examinez les performances mensuelles d'un fonds commun de placement dans lequel vous souhaitez investir.***

+ **Pour cet exercice, vous calculerez le rendement annuel cumulé en utilisant les données du fonds edhec du dernier exercice. Pour ce faire, vous suivrez le modèle split()-lapply()-rbind() illustré ci-dessous :**


      x_split <- split(x, f = "months")
      x_list <- lapply(x_split, cummax)
      x_list_rbind <- do.call(rbind, x_list)



+ *Notez que le dernier appel utilise la syntaxe quelque peu étrange do.call(rbind, ...) de R, qui vous permet de passer une liste à rbind au lieu de passer chaque objet un par un. Ceci est un raccourci pratique pour votre boîte à outils R.*

####**Instructions**

+ En utilisant split(), décomposez les données edhec en années. 
+ Attribuez ceci à edhec_years.
+ Utilisez lapply() pour trouver le cumsum() des retours par an sur edhec_years. 
+ Affectez-le à edhec_ytd.
+ Utilisez do.call() avec rbind pour convertir votre sortie de liste précédente en un seul objet xts. Attribuez ceci à edhec_xts.

In [13]:
# Split edhec into years
edhec_years <- split(edhec , f = "years")

head(edhec_years)

$`1997`
           Convertible Arbitrage CTA Global Distressed Securities
1997-01-31                0.0119     0.0393                0.0178
1997-02-28                0.0123     0.0298                0.0122
1997-03-31                0.0078    -0.0021               -0.0012
1997-04-30                0.0086    -0.0170                0.0030
1997-05-31                0.0156    -0.0015                0.0233
1997-06-30                0.0212     0.0085                0.0217
1997-07-31                0.0193     0.0591                0.0234
1997-08-31                0.0134    -0.0473                0.0147
1997-09-30                0.0122     0.0198                0.0350
1997-10-31                0.0100    -0.0098               -0.0064
1997-11-30                0.0000     0.0133                0.0054
1997-12-31                0.0068     0.0286                0.0073
           Emerging Markets Equity Market Neutral Event Driven
1997-01-31           0.0791                0.0189       0.0213
1997-02-

In [14]:
# Use lapply to calculate the cumsum for each year in edhec_years
edhec_ytd <- lapply(edhec_years, FUN = cumsum)

head(edhec_ytd)

$`1997`
           Convertible Arbitrage CTA Global Distressed Securities
1997-01-31                0.0119     0.0393                0.0178
1997-02-28                0.0242     0.0691                0.0300
1997-03-31                0.0320     0.0670                0.0288
1997-04-30                0.0406     0.0500                0.0318
1997-05-31                0.0562     0.0485                0.0551
1997-06-30                0.0774     0.0570                0.0768
1997-07-31                0.0967     0.1161                0.1002
1997-08-31                0.1101     0.0688                0.1149
1997-09-30                0.1223     0.0886                0.1499
1997-10-31                0.1323     0.0788                0.1435
1997-11-30                0.1323     0.0921                0.1489
1997-12-31                0.1391     0.1207                0.1562
           Emerging Markets Equity Market Neutral Event Driven
1997-01-31           0.0791                0.0189       0.0213
1997-02-

In [15]:
# Use do.call to rbind the results
edhec_xts <- do.call(rbind, edhec_ytd)

head(edhec_xts)

           Convertible Arbitrage CTA Global Distressed Securities
1997-01-31                0.0119     0.0393                0.0178
1997-02-28                0.0242     0.0691                0.0300
1997-03-31                0.0320     0.0670                0.0288
1997-04-30                0.0406     0.0500                0.0318
1997-05-31                0.0562     0.0485                0.0551
1997-06-30                0.0774     0.0570                0.0768
           Emerging Markets Equity Market Neutral Event Driven
1997-01-31           0.0791                0.0189       0.0213
1997-02-28           0.1316                0.0290       0.0297
1997-03-31           0.1196                0.0306       0.0274
1997-04-30           0.1315                0.0425       0.0269
1997-05-31           0.1630                0.0614       0.0615
1997-06-30           0.2211                0.0779       0.0873
           Fixed Income Arbitrage Global Macro Long/Short Equity
1997-01-31                 0.019

***Bon travail! La syntaxe split-lapply-rbind peut sembler compliquée, mais c'est un moyen puissant de manipuler vos données de séries chronologiques.***

####**Calculer l'écart type glissant d'une série chronologique**

+ ***Une autre exigence courante lors de l'utilisation de données de séries chronologiques consiste à appliquer une fonction sur une fenêtre de données glissante. xts fournit cette fonctionnalité via la fonction de zoo nommée intuitivement [rollapply()](https://www.rdocumentation.org/packages/zoo/versions/1.8-11/topics/rollapply).***

+ **Cette fonction prend un objet de série chronologique x, une largeur de fenêtre et une fonction FUN à appliquer à chaque période glissante. L'argument largeur peut être délicat ; un nombre fourni à l'argument largeur spécifie le nombre d'observations dans une fenêtre. Par exemple, pour prendre le maximum de 10 jours glissants d'une série, vous devez taper ce qui suit :**

      rollapply(x, width = 10, FUN = max, na.rm = TRUE)


+ *Notez que ce qui précède ne prendrait que le maximum de 10 jours d'une série avec des observations quotidiennes. Si la série avait des observations mensuelles, cela prendrait le maximum de 10 mois. Notez également que vous pouvez passer des arguments supplémentaires (c'est-à-dire na.rm à la fonction max) comme vous le feriez avec apply().*

####**Instructions**

+ À l'aide de rollapply(), calculez l'écart type sur 3 mois de la série eq_mkt. 
+ Notez que eq_mkt a des observations mensuelles. 
+ Appelez votre écart type mobile sur 3 mois eq_sd.

In [16]:
# Use rollapply to calculate the rolling 3 period sd of eq_mkt
eq_sd <- rollapply(eq_mkt, width = 3, FUN = sd)
head(eq_sd)

           Equity Market Neutral
1997-01-31                    NA
1997-02-28                    NA
1997-03-31           0.008650434
1997-04-30           0.005501212
1997-05-31           0.008702299
1997-06-30           0.003557152

***Bon travail! Les valeurs mobiles sont une mesure utile dans les données de séries chronologiques. Maintenant que vous êtes familiarisé avec les fonctionnalités de base du package xts, le dernier chapitre explorera quelques sujets plus avancés utilisant xts.***

###**Index, attributs et fuseaux horaires**

###1. Index, attributs et fuseaux horaires
+ ***Bienvenue dans le dernier chapitre! Pour cette vidéo, nous allons porter notre attention sur les composants internes de xts et pour mieux comprendre et utiliser les puissantes fonctionnalités de fuseau horaire.***

####**2. Qu’est-ce que l’indice?**
+ Tout au long du cours, nous avons utilisé la fonction index() pour obtenir les heures et les dates de nos objets. 
+ Mais ce qui se passe réellement dans les coulisses est un peu plus complexe que la simple extraction de l’attribut appelé index. 
+ En interne, et quelle que soit la classe de votre index, toutes les heures sont stockées en fractions de secondes depuis minuit, le 1er janvier 1970 UTC.

+ La fonction « index » prend cette valeur numérique et, à l’aide d’une combinaison de variables spéciales définies dans votre objet, crée l’objet de date que vous attendez. 
+ Les trois principaux attributs spéciaux utilisés par xts sont tclass, tzone et un attribut de formatage. 
+ a tclass est la classe dans laquelle l’index est entré : 
  + par conséquent, si vous commencez avec un objet Date, 
  + tclass se souviendra de renvoyer un objet Date lorsque vous appelez index. 
  + tzone est le même, mais pour le fuseau horaire de vos données. 
  + Et le format, exprimé avec indexFormat, contrôle la façon dont les dates de votre objet sont imprimées.

####**3. En savoir plus sur les attributs**
+ Dans cet exemple, vous pouvez voir comment nous inspectons et définissons la classe de notre index à l’aide de indexClass et le fuseau horaire avec indexTZ. Voici un exemple de modification du format de notre index à l’aide de la syntaxe standard sprintf.
  +  %b est l’abréviation de 3 lettres pour le mois,
  + %d est le jour du mois et 
  + la majuscule %Y est l’année à quatre chiffres.

####**4. Comprendre TZ**

+ Nous avons mentionné TZ et les fuseaux horaires dans la dernière diapositive, et y avons fait allusion tout au long du cours. 

+ L’un des objectifs de xts était de rendre cette nécessité intrajournalière aussi simple et intuitive que possible. 

+ Si vous vous souvenez du premier chapitre, tzone est réglable dans le constructeur lui-même ou peut provenir directement de votre objet temporel. 

+ Et comme illustré dans la diapositive précédente, nous pouvons même changer sa valeur. 

+ Alors, quels sont les fuseaux horaires? Les fuseaux horaires sont un moyen de suivre les décalages géographiquement définis par rapport à UTC, également appelés historiquement temps moyen de Greenwich GMT. Lorsque vous vous déplacez vers l’ouest, votre horloge recule. 

+ Déplacez-vous vers l’est et le temps avance. Les fuseaux horaires suivent également l’heure d’été, qui varie d’un endroit à l’autre et change même au fil du temps! Heureusement, xts et R suivent ce problème déroutant pour vous, tout ce que vous avez à faire est de spécifier le fuseau horaire souhaité. 

+ La puissance de décharger cela sur votre objet de série chronologique est que vous êtes maintenant libre de travailler simultanément dans une variété de fuseaux horaires et en interne, tout se comportera simplement de manière appropriée. 

+ Le fuseau horaire est si important que vous devez toujours vous assurer de définir une variable d’environnement TZ, sinon vous pourriez être surpris de trouver le système d’exploitation qui vous convient! 

+ Pour vous aider à choisir votre fuseau horaire, R a une excellente page de référence sur la base de données zoneinfo qui gère tous les détails, et vous pouvez y accéder en utilisant l’aide (OlsonNames). Cela vaut bien votre temps.

####**5. Entraînons-nous!**
+ La meilleure façon de se faire une idée de ce dont nous avons discuté sera probablement de travailler sur quelques exemples. Sur ce, passons aux exercices!

###**EXERCICES**

####**Heure via index()**
+ ***Pour cette question à choix multiples, vous utiliserez les données temporaires préchargées pour vous aider à trouver la bonne réponse.***

+ *Lequel des énoncés suivants est faux?*

####**Instructions**


+ L'utilisation de la fonction tclass() sur les temps renvoie la même sortie que indexClass().

+ indexFormat(temps) <- "%b %d, %Y" change l'index de la première entrée des données au 01 juillet 2016.

+ Taper help(OlsonNames) dans la console fournira une documentation R pour les fuseaux horaires.

+ ***Le fuseau horaire de l'ensemble de données temporaires est défini sur "America/New_York".***

***C'est correct! Le fuseau horaire des données n'est pas spécifié, ce qui, selon la vidéo, est une mauvaise pratique pour les aspirants data scientists.***

####**Attributs de classe - tclass, tzone et tformat**

+ ***Les objets xts sont quelque peu délicats en termes de temps. En interne, nous avons maintenant vu que l'attribut index est en réalité un vecteur de valeurs numériques correspondant aux secondes depuis l'époque UNIX (1970-01-01).***

+ **La manière dont ces valeurs sont affichées lors de l'impression et dont elles sont renvoyées à l'utilisateur lors de l'utilisation de la fonction index() dépend de quelques attributs internes clés.**

+ Les informations qui contrôlent ce comportement peuvent être visualisées et même modifiées via un ensemble de fonctions d'accès détaillées ici :

    + ***La classe d'index utilisant indexClass() (par exemple de Date à chron)***

    + ***Le fuseau horaire utilisant indexTZ() (par exemple d'Amérique/Chicago à Europe/Londres)***

  + ***Le format de l'heure à afficher via indexFormat() (par exemple AAAA-MM-JJ)***


+ *Dans cet exercice, vous allez pratiquer chacune de ces fonctions et afficher les résultats de vos modifications. Pour ce faire, vous utiliserez à nouveau les données temporaires qui ont été préchargées dans votre espace de travail.*

####**Instructions**

+ Affichez les trois premières lignes de l'index dans les données temporaires actuelles.
+ Trouvez la classe d'index des temps en utilisant la commande la plus pertinente ci-dessus.
+ Trouvez le fuseau horaire des températures, en utilisant à nouveau la commande la plus pertinente ci-dessus.
+ Modifiez le format d'index des temps en "%b-%d-%Y".
+ Affichez le nouveau format d'index à l'aide de head().

In [18]:
Temp.Max <- c(74, 78, 79, 80, 90, 89, 87, 89, 81, 83, 93, 89, 86, 89, 75, 79)
Temp.Mean <- c(69, 66, 68, 76, 79, 79, 78, 80, 73, 72, 81, 82, 78, 80, 72, 69) 
Temp.Min <- c(60, 56, 59, 69, 68, 70, 72, 72, 67, 64, 69, 77, 68, 68, 60, 60)

In [19]:
# Create the object data using 5 random numbers
data <- data.frame(Temp.Max, Temp.Mean, Temp.Min)

# Create dates as a Date class object starting from 2016-01-01
dates <- seq(as.Date("2016-07-01"), length = 16, by = "days")

# Use xts() to create smith
temps <- xts(x = data, order.by = dates)

In [29]:
# View the first three indexes of temps
print(index(temps)[1:3])

[1] "2016-07-01" "2016-07-02" "2016-07-03"


In [31]:
# Get the index class of temps
tclass(temps)

In [25]:
# Get the timezone of temps
tzone(temps)

In [28]:
# Change the format of the time display
'tformat<(temps)' <- "%b-%d-%Y"

# View the new format
head(temps)

            Temp.Max Temp.Mean Temp.Min
Jul-01-2016       74        69       60
Jul-02-2016       78        66       56
Jul-03-2016       79        68       59
Jul-04-2016       80        76       69
Jul-05-2016       90        79       68
Jul-06-2016       89        79       70

***Excellent! Ces commandes vous permettent de modifier rapidement et facilement les caractéristiques internes de votre objet xts.***

####**Fuseaux horaires (et pourquoi vous devriez vous en soucier !)**

+ ***L'une des parties les plus délicates du travail avec les séries chronologiques en général concerne les fuseaux horaires. xts offre un moyen simple d'exploiter les fuseaux horaires par série. Alors que R prend en charge les fuseaux horaires dans les classes natives POSIXct et POSIXlt, xts étend ce pouvoir à l'ensemble de l'objet, vous permettant d'avoir plusieurs fuseaux horaires sur divers objets.***

+ **Certaines fonctions du système d'exploitation interne nécessitent un fuseau horaire pour effectuer des calculs de date. Si un fuseau horaire n'est pas explicitement défini, un est choisi pour vous ! Veillez à toujours définir un fuseau horaire dans votre environnement pour éviter les erreurs lorsque vous travaillez avec des dates et des heures.**

+ **xts fournit la fonction tzone(), qui vous permet d'extraire ou de définir des fuseaux horaires.**

          tzone(x) <- "Time_Zone"


+ *Dans cet exercice, vous travaillerez avec un objet appelé times pour vous entraîner à construire vos propres objets xts avec des fuseaux horaires personnalisés.*

####**Instructions**

+ Construisez une série temporelle xts des nombres 1 à 10 appelée times_xts, avec tzone défini sur "America/Chicago" et indexé par l'objet times.
+ Modifiez times_xts pour afficher l'heure en "Asie/Hong_Kong".
+ Extraire le fuseau horaire actuel sous forme de chaîne.

In [33]:
times <- as.Date(c("2020-07-18 15:11:35 GMT", "2020-07-18 15:13:15 GMT", "2020-07-18 15:14:55 GMT", "2020-07-18 15:16:35 GMT","2020-07-18 15:18:15 GMT", "2020-07-18 15:19:55 GMT", "2020-07-18 15:21:35 GMT", "2020-07-18 15:23:15 GMT","2020-07-18 15:24:55 GMT", "2020-07-18 15:26:35 GMT"))

In [36]:
# Construct times_xts with tzone set to America/Chicago
times_xts <- xts(1:10, order.by = times, tzone = "America/Chicago")

“‘tzone’ setting ignored for  Date  indexes”


In [37]:
# Change the time zone of times_xts to Asia/Hong_Kong
tzone(times_xts)<- "Asia/Hong_Kong"
  
# Extract the current time zone of times_xts
tzone(times_xts)

###**Périodes, périodicité et horodatage**

####**1. Périodes, périodicité et horodatage**
####**2. Thèmes finaux**

+ ***Notre dernière série de sujets pour xts implique des fonctions pour vous aider à comprendre les temps couverts par votre objet, à trouver des périodes de temps spécifiques dans votre objet qui peuvent ne pas être contiguës, et enfin à ajuster vos temps pour tenir compte des doublons et des fausses précisions.***

####**3. périodicité()**
+ La première fonction que nous examinerons s’appelle la périodicité. 

+ Ce que cela tente de faire, c’est d’identifier la régularité sous-jacente de vos données. 

+ Ici, nous espérons répondre à la question de savoir quel type de données avons-nous? 

+ Examinons-nous des données quotidiennes, des données annuelles ou des données intrajournalières? 

+ Notez qu’il s’agit simplement d’une estimation de la fréquence de vos données puisque xts prend en charge des séries chronologiques irrégulières, il se peut en effet qu’il n’y ait pas de périodicité exacte. 

+ Considérez-le comme une mesure sommaire de votre indice. En utilisant la série mensuelle edhec, nous pouvons le voir changer de périodicité de mensuel à annuel car nous transformons la série en annuelle.

#####**4. Périodes de comptage**
+ En fonction de l’estimation de la périodicité, nous pouvons également estimer le nombre de périodes discrètes que nos données représentent. 

+ Notez que cela ne détermine pas le nombre de périodes si les données étaient régulières, mais compte plutôt le nombre de points de terminaison uniques dans la série pour une granularité donnée. 

+ Par exemple, nmonths sur les données edhec renvoie 152, mais ndays aussi, puisque nos observations sont en fait mensuelles. 

+ Nous avons aussi 152 jours! nyears, d’autre part, renvoie 13, ce qui correspond au nombre d’années distinctes couvertes par ces données. 

+ Une règle générale est qu’il est logique de compter les périodes si et seulement si vos données ont une fréquence plus élevée que les périodes que vous cherchez à compter.

#####**5. Temps de panne avec .index***
+ XTS fournit également une fonction utilitaire qui exploite la structure interne de l’attribut index que nous avons décrit dans la dernière vidéo. Ici, nous pouvons obtenir le temps décomposé de notre index avec un simple appel de fonction. 

+ Vous pouvez voir comment nous sommes facilement en mesure d’extraire les composants POSIXlt de notre index, tels que le mois jour, l’année jour et même l’année avec très peu de travail. 

+ Étant donné qu’ils renvoient un vecteur de la même longueur que l’index, vous pouvez les combiner à l’aide de tests logiques pour créer des extractions date-heure complexes sans recourir à des conversions explicites.

####**6. Modification des horodatages**
+ Enfin, nous pouvons tirer parti de deux autres fonctions dans xts qui nous permettent de modifier l’index lui-même. 

+ Souvent, il peut être utile d’arrondir toutes les observations dans un intervalle jusqu’à une certaine limite connue de l’intervalle, disons en prenant toutes les mesures qui sont arrivées au cours de la dernière heure et les marquant au haut de l’heure suivante. La fonction align-dot-time de xts prend un objet xts et arrondit toutes les heures en interne à un nombre spécifique de secondes. 

+ Par exemple 60 pour une minute ou 3600 pour une heure. Dans d’autres cas, vous pouvez vous retrouver avec des horodatages en double en tant que artefact d’un processus de collecte ou simplement d’une erreur. 

+ Pour dédupliquer Votre série La fonction make-dot-index-dot-unique permettra votre index d’être légèrement perturbé si et seulement si une valeur est dupliquée. 

+ Réglage drop=TRUE supprimera en fait les entrées en double. Et fromLast regardera pour les doublons dans l’ordre inverse, c’est-à-dire en conservant la dernière valeur dans le temps.

####**7. Entraînons-nous!**
+ Sur ce, une dernière fois, passons maintenant aux exercices !

###**EXERCICES**

####**Détermination de la périodicité**

+ ***L'idée de périodicité est assez simple : avec quelle régularité vos données se répètent-elles ? Pour les données boursières, vous pouvez avoir des prix horaires ou peut-être des barres quotidiennes d'ouverture-haut-bas-fermeture. Pour les séries macroéconomiques, il peut s'agir de chiffres d'enquête mensuels ou hebdomadaires.***

+ **xts fournit un outil pratique pour découvrir cette régularité dans vos données en estimant la fréquence des observations - ce que nous appelons la périodicité - en utilisant la [périodicité()](https://www.rdocumentation.org/packages/xts/) périodicité des sujets commande**

+ *Dans cet exercice, vous allez essayer ceci sur quelques exemples d'ensembles de données. Dans la vraie vie, vous pourriez vous retrouver à faire cela comme une première étape pour comprendre vos données avant de plonger dans une analyse plus approfondie.*

####**Instructions**

+ Calculez la périodicité de l'ensemble de données temporaires.
+ Calculer la périodicité du jeu de données edhec.
+ Convertissez les données edhec en périodicité annuelle en utilisant to.yearly(). Appelez ça edhec_yearly.
+ Calculez la périodicité de edhec_yearly.

In [38]:
# Calculate the periodicity of temps
periodicity(temps)

Daily periodicity from 2016-07-01 to 2016-07-16 

In [39]:
# Calculate the periodicity of edhec
periodicity(edhec)

Monthly periodicity from 1997-01-31 to 2019-11-30 

In [40]:
# Convert edhec to yearly
edhec_yearly <- to.yearly(edhec)

# Calculate the periodicity of edhec_yearly
periodicity(edhec_yearly)

Yearly periodicity from 1997-12-31 to 2019-11-30 

***Bien joué! La commande periodity() combinée à l'ensemble de commandes to.period() vous offre un moyen simple de manipuler vos données de séries chronologiques.***

####**Trouver le nombre de périodes dans vos données**
+ ***Il est souvent utile de connaître non seulement la plage de votre indice de série chronologique, mais également le nombre de périodes irrégulières discrètes couvertes par vos données de série chronologique. Vous ne devriez pas être surpris d'apprendre que xts fournit un ensemble de fonctions pour faire exactement cela !***

+ *Si vous avez une série chronologique, il est maintenant facile de voir combien de jours, de semaines ou d'années vos données contiennent. Pour ce faire, utilisez simplement la fonction ndays() et ses fonctions raccourcies nmonths(), nquarters(), etc., facilitant ainsi le comptage des périodes irrégulières.*

####**Instructions**

+ Compter les mois dans l'edhec.
+ Compter les trimestres à l'edhec.
+ Compter les années à l'edhec.

In [41]:
# Count the days
ndays(edhec)

In [43]:
# Count the months
nmonths(edhec)

In [42]:
# Count the quarters
nquarters(edhec)

In [44]:
# Count the years
nyears(edhec)

***Excellent! Vous maîtrisez assez rapidement ces sujets avancés.***

####**Outils d'index secrets**
+ ***xts utilise un attribut très spécial appelé index pour fournir un support temporel à vos objets. Pour des raisons de performances et de conception, l'index est stocké d'une manière spéciale. Cela signifie que quelle que soit la classe de votre index (par exemple, Date ou yearmon), tout semble identique en interne pour xts. L'index brut est en fait un simple vecteur de fractions de secondes depuis l'époque UNIX.***

+ *Normalement, vous souhaitez accéder aux heures que vous avez enregistrées. index() le fait comme par magie pour vous en utilisant votre [indexClass](https://www.rdocumentation.org/packages/base/versions/3.6.2/topics/DateTimeClasses). Pour accéder au vecteur brut de l'index, vous pouvez utiliser .index(). Notez le point critique avant le nom de la fonction.*

+ **Plus utile que l'extraction de secondes brutes est la possibilité d'extraire des composants de temps similaires à la classe POSIXlt, qui reflète étroitement la structure compilée interne POSIX sous-jacente [tm](https://pubs.opengroup.org/onlinepubs/7908799/xsh/time.h.html). Cette fonctionnalité est fournie par une poignée de commandes telles que .indexday(), .indexmon(), .indexyear(), etc.**

+ *Dans cet exercice, vous allez jeter un œil à la météo du week-end dans nos données temporelles préchargées à l'aide de la commande .indexwday(). Notez que les valeurs vont de 0 à 6, avec Sunday égal à 0. Rappelez-vous que vous pouvez utiliser un vecteur logique pour extraire des éléments d'un objet xts.*

####**Instructions**

+ Entraînez-vous à extraire les unités sous-jacentes de votre index dans les données temporelles. 

+ Utilisez .index() pour voir le nombre de secondes et .indexwday() pour voir le jour de la semaine de vos observations.

+ Créez un index à l'aide de la fonction which() pour extraire les observations du week-end en temps.

+ Sélectionnez les valeurs indexées à partir des temps.

In [45]:
# Explore underlying units of temps in two commands: .index() and .indexwday()
.index(temps)

In [46]:
.indexwday(temps) 

In [47]:
# Create an index of weekend days using which()
index <- which(.indexwday(temps) == 0 | .indexwday(temps) == 6)

# Select the index
temps[index]

            Temp.Max Temp.Mean Temp.Min
Jul-02-2016       78        66       56
Jul-03-2016       79        68       59
Jul-09-2016       81        73       67
Jul-10-2016       83        72       64
Jul-16-2016       79        69       60

***Bien joué! Comme vous pouvez le constater, ces commandes d'index ont diverses applications lorsqu'il s'agit de créer des sous-ensembles pour vos données de séries chronologiques.***

####**Modification des horodatages**


+ ***La plupart des séries chronologiques que nous avons vues ont une fréquence quotidienne ou inférieure. En fonction de votre domaine, vous pouvez rencontrer des données de fréquence plus élevée - pensez à des intervalles de trading intrajournaliers ou à des données de capteurs provenant d'équipements médicaux.***

+ **Dans ces situations, il existe deux fonctions dans xts qu'il est utile de connaître.**

+ ***Si vous constatez que vous avez des observations avec des horodatages identiques, il peut être utile de perturber ou de supprimer ces heures pour permettre l'unicité. xts fournit la fonction [make.index.unique()](https://www.rdocumentation.org/packages/xts/versions/0.13.0/topics/make.index.unique) uniquement dans ce but. L'argument eps, court pour epsilon ou petit changement, contrôle combien de temps identiques doivent être perturbés, et drop = TRUE vous permet simplement de supprimer entièrement les observations en double.***

+ **À d'autres occasions, vous pourriez trouver vos horodatages un peu trop précis. Dans ces cas, il peut être préférable d'arrondir à un intervalle fixe, par exemple une observation peut se produire à n'importe quel moment de l'heure, mais vous souhaitez enregistrer la dernière au début de l'heure suivante. Dans cette situation, la commande [align.time()](https://www.rdocumentation.org/packages/xts/versions/0.13.0/topics/align.time) fera ce dont vous avez besoin, en définissant l'argument n sur le nombre de secondes que vous souhaitez arrondir.**

      make.index.unique(x, eps = 1e-4) # Perturber
      make.index.unique(x, drop = TRUE) # Supprimer les doublons
      align.time(x, n = 60) # Arrondi à la minute près


+ *Dans cet exercice, vous allez essayer les trois cas d'utilisation sur un objet xts appelé z.*

####**Instructions**

+ Convertissez les heures de la série z en une série unique à l'aide de make.index.unique(), où eps = 1e-4. 
+ Enregistrez ceci dans z_unique.
+ Supprimez les heures en double dans z. Enregistrez ceci dans z_dup.
+ Alignez z sur l'heure la plus proche en utilisant align.time(). Enregistrez ceci dans z_round.


In [52]:
z <- rbind(structure(c(-1.53995004190371, -0.928567034713538, -0.928567034713538, 
-0.29472044679056, -0.00576717274753696, 2.40465338885795, 0.76359346114046, 
-0.799009248989368, -0.799009248989368, -1.14765700923635, -0.289461573688223, 
-0.299215117897316), class = c("xts", "zoo"), .Dim = c(12L, 1L
), index = structure(c(1595194275, 1595226140, 1595226140, 1595321751, 
1595425493, 1595540866, 1595566225, 1595712816, 1595712816, 1595803214, 
1595865088, 1595948750), tclass = c("POSIXct", "POSIXt"), tzone = "GMT"), .indexCLASS = c("POSIXct", 
"POSIXt"), .indexTZ = "GMT", tclass = c("POSIXct", "POSIXt"), tzone = "GMT"))

In [54]:
# Make z have unique timestamps
z_unique <- make.index.unique(z, eps = 1e-4)

z_unique

“index value is unique but will be replaced; it is less than the cumulative epsilon for the preceding duplicate index values”


                            [,1]
2020-07-19 21:31:15 -1.539950042
2020-07-20 06:22:20 -0.928567035
2020-07-20 06:22:20 -0.928567035
2020-07-21 08:55:51 -0.294720447
2020-07-22 13:44:53 -0.005767173
2020-07-23 21:47:46  2.404653389
2020-07-24 04:50:25  0.763593461
2020-07-25 21:33:36 -0.799009249
2020-07-25 21:33:36 -0.799009249
2020-07-26 22:40:14 -1.147657009
2020-07-27 15:51:28 -0.289461574
2020-07-28 15:05:50 -0.299215118

In [50]:
# Remove duplicate times in z
z_dup <- make.index.unique(z, drop = TRUE)

z_dup

“object timezone (GMT) is different from system timezone ()”


                            [,1]
2020-07-19 21:31:15 -1.539950042
2020-07-20 06:22:20 -0.928567035
2020-07-21 08:55:51 -0.294720447
2020-07-22 13:44:53 -0.005767173
2020-07-23 21:47:46  2.404653389
2020-07-24 04:50:25  0.763593461
2020-07-25 21:33:36 -0.799009249
2020-07-26 22:40:14 -1.147657009
2020-07-27 15:51:28 -0.289461574
2020-07-28 15:05:50 -0.299215118

In [51]:
# Round observations in z to the next hour
z_round <- align.time(z, n = 3600)
z_round

“object timezone (GMT) is different from system timezone ()”


                            [,1]
2020-07-19 22:00:00 -1.539950042
2020-07-20 07:00:00 -0.928567035
2020-07-20 07:00:00 -0.928567035
2020-07-21 09:00:00 -0.294720447
2020-07-22 14:00:00 -0.005767173
2020-07-23 22:00:00  2.404653389
2020-07-24 05:00:00  0.763593461
2020-07-25 22:00:00 -0.799009249
2020-07-25 22:00:00 -0.799009249
2020-07-26 23:00:00 -1.147657009
2020-07-27 16:00:00 -0.289461574
2020-07-28 16:00:00 -0.299215118

***Bon travail! Ces commandes finales devraient compléter vos connaissances xts et vous donner les outils complets pour manipuler les données de séries chronologiques dans R.***