# Rupture dans la série temporelle ?


On cherche à savoir s'il y a rupture dans la série temporelle pour segmenter en différentes périodes de temps et ceci de manière plus scientifique qu'en regardant des graphes. On utilisera plutot des test de Pettitt (inspiré par Mann-Whitney) sur la détection d'une rupture dans une série temporelle.<br/>
Ceci est la suite du fichier MovingAverage.

## Résumé des résultats
Les résultats sont étonnants. Sur les données de vol brutes, on détecte deux segmentations qui sont en accords avec les segmentations proposées initialement dans MovingAverage.<br/>
Pour le modèle Black (variations relatives), les tests suivant suggèrent d'étendre la deuxième période. Idem pour le modèle Absolute Normal (variations brutes). Sur la deuxième segmentation, les deux modèles Black et Absoulte Normal sont en accord.<br/>
Par ailleurs, toutes les p-valeurs sont extrèmement faibles ! C'est bien car cela nous amène à rejeter l'hypothèse nulle qu'il n'y a pas de rupture dans la série temporelle. La date indiquée est à chaque fois celle qui segmente le mieux la série en deux sous-séries.

#### Sur les données brutes
- <strong>25 Septembre 2008</strong> (Date n°353)
- <strong>3 Novembre 2012</strong> (Date n°515)

#### Sur les variations relatives
- <strong>11 Octobre 2007</strong> (Date n°302)
- <strong>19 Juin 2014</strong> (Date n°651)

#### Sur les variations brutes
- <strong>13 Septembre 2007</strong> (Date n°298)
- <strong>19 Juin 2014</strong> (Date n°651)



<strong>NB : </strong>Script en R. Il nécessite le package 'trend'.

In [1]:
rm(list=ls())

In [2]:
require(trend)

Loading required package: trend
: package 'trend' was built under R version 3.2.4

In [3]:
ATM = read.table("Databases/swaphist.csv", sep= ";", header=TRUE, stringsAsFactors=F)
ATM$Date <- as.Date( ATM$Date, '%d/%m/%Y') #Remise au format américan YYYY-MM-DD
#str(ATM)

In [4]:
ATM['Date']

ERROR: Error in charToDate(x): character string is not in a standard unambiguous format


          Date
1   2001-01-11
2   2001-01-18
3   2001-01-25
4   2001-02-01
5   2001-02-08
6   2001-02-15
7   2001-02-22
8   2001-03-01
9   2001-03-08
10  2001-03-15
11  2001-03-22
12  2001-03-29
13  2001-04-05
14  2001-04-12
15  2001-05-10
16  2001-05-17
17  2001-05-24
18  2001-06-07
19  2001-06-14
20  2001-06-21
21  2001-06-28
22  2001-07-05
23  2001-07-12
24  2001-07-19
25  2001-07-26
26  2001-08-02
27  2001-08-16
28  2001-08-23
29  2001-08-30
30  2001-09-06
31  2001-09-13
32  2001-09-20
33  2001-09-27
34  2001-10-04
35  2001-10-11
36  2001-10-18
37  2001-10-25
38  2001-11-01
39  2001-11-08
40  2001-11-15
41  2001-11-22
42  2001-11-29
43  2001-12-06
44  2001-12-13
45  2001-12-20
46  2001-12-27
47  2002-01-03
48  2002-01-17
49  2002-01-24
50  2002-01-31
51  2002-02-07
52  2002-02-14
53  2002-02-21
54  2002-02-28
55  2002-03-07
56  2002-03-14
57  2002-03-21
58  2002-03-28
59  2002-04-04
60  2002-04-11
61  2002-10-24
62  2002-10-31
63  2002-11-07
64  2002-11-14
65  2002-11-21
66  2002-1

In [5]:
ATM['Date'][1,]
ATM['Date'][315,]
ATM['Date'][349,]
ATM['Date'][353,]
ATM['Date'][515,]
ATM['Date'][524,]
ATM['Date'][576,]

[1] "2001-01-11"

[1] "2008-01-03"

[1] "2008-08-28"

[1] "2008-09-25"

[1] "2011-11-03"

[1] "2012-01-05"

[1] "2013-01-03"

# Sur les données brutes

Le test de Pettitt donne deux affine les deux segmentations que l'on avait proposé dans MovingAverage :
- <strong>25 Septembre 2008</strong> (Date n°353)
- <strong>3 Novembre 2012</strong> (Date n°515)

Dans le premier test, on a fait un max pooling et dans le deuxième, une moyenne.

In [6]:
for (i in 2:10){
    test = pettitt.test(ATM[1:523,i])
    #print(colnames(ATM)[i])
    print(test$estimate)
}

probable change point at tau 
                         353 
probable change point at tau 
                         353 
probable change point at tau 
                         336 
probable change point at tau 
                         353 
probable change point at tau 
                         353 
probable change point at tau 
                         348 
probable change point at tau 
                         161 
probable change point at tau 
                         353 
probable change point at tau 
                         335 


In [7]:
for (i in 2:10){
    test = pettitt.test(ATM[354:741,i])
    #print(colnames(ATM)[i])
    print(test$estimate)
}

probable change point at tau 
                         190 
probable change point at tau 
                         149 
probable change point at tau 
                         148 
probable change point at tau 
                         185 
probable change point at tau 
                         155 
probable change point at tau 
                         153 
probable change point at tau 
                         162 
probable change point at tau 
                         155 
probable change point at tau 
                         149 


# Sur les variations relatives

- <strong>11 Octobre 2007</strong> (Date n°302)
- <strong>19 Juin 2014</strong> (Date n°651)

Max pooling pour le permier test et moyenne pour le deuxième

In [8]:
varRltv = read.table("Databases/var_relatives.csv", sep= ";", header=TRUE, stringsAsFactors=F)
varRltv$Date <- as.Date( varRltv$Date, '%d/%m/%Y') #Remise au format américan YYYY-MM-DD
#str(varRltv)

In [9]:
for (i in 2:10){
    test = pettitt.test(varRltv[1:523,i])
    #print(colnames(varRltv)[i])
    print(test$estimate)
}

probable change point at tau 
                         282 
probable change point at tau 
                         282 
probable change point at tau 
                         276 
probable change point at tau 
                         302 
probable change point at tau 
                         302 
probable change point at tau 
                         277 
probable change point at tau 
                         302 
probable change point at tau 
                         133 
probable change point at tau 
                         276 


In [10]:
for (i in 2:10){
    test = pettitt.test(varRltv[524:740,i])
    #print(colnames(varRltv)[i])
    print(test$estimate)
}

probable change point at tau 
                         127 
probable change point at tau 
                         126 
probable change point at tau 
                         126 
probable change point at tau 
                         127 
probable change point at tau 
                         126 
probable change point at tau 
                         126 
probable change point at tau 
                         127 
probable change point at tau 
                         127 
probable change point at tau 
                         127 


# Sur les variations brutes
- <strong>13 Septembre 2007</strong> (Date n°298)
- <strong>19 Juin 2014</strong> (Date n°651)

Moyenne pour les deux tests.

In [11]:
Incr = read.table("Databases/Incr.csv", sep= ";", header=TRUE, stringsAsFactors=F)
Incr$Date <- as.Date( Incr$Date, '%d/%m/%Y') #Remise au format américan YYYY-MM-DD
#str(Incr)

In [12]:
for (i in 2:10){
    test = pettitt.test(Incr[1:523,i])
    #print(colnames(Incr)[i])
    print(test$estimate)
}

probable change point at tau 
                         282 
probable change point at tau 
                         282 
probable change point at tau 
                         485 
probable change point at tau 
                         302 
probable change point at tau 
                         302 
probable change point at tau 
                         212 
probable change point at tau 
                         330 
probable change point at tau 
                         211 
probable change point at tau 
                         276 


In [13]:
for (i in 2:10){
    test = pettitt.test(Incr[524:740,i])
    #print(colnames(Incr)[i])
    print(test$estimate)
}

probable change point at tau 
                         127 
probable change point at tau 
                         126 
probable change point at tau 
                         126 
probable change point at tau 
                         127 
probable change point at tau 
                         126 
probable change point at tau 
                         127 
probable change point at tau 
                         127 
probable change point at tau 
                         127 
probable change point at tau 
                         127 
