# TD1 : PROBABILITES

On va calculer, en utilisant le langage Python, des probabilités simples, conjointes et
conditionnelles. On basera ces calculs sur des données réelles issues des marchés financiers

* On ne pourrait pas penser à quelque chose de plus incertain que les marchés financiers. C’est la raison pour laquelle on va étudier les mouvements relatifs d’un certain nombre d’indices de ces marchés, notamment :
    - CAC 40 (ˆFCHI), l’indice de la Bourse de Paris ;
    - DAX 30 (ˆGDAXI), l’indice de la Bourse de Francfort ;
    - FTSE 100 (ˆFTSE), l’indice de la Bourse de Londres ;
    - Dow Jones Industrial Average (ˆDJI), l’indice de la bourse de New York ;
    - NASDAQ Composite (ˆIXIC), l’indice du marché des actions des sociétés hi-tech.

Les codes entre parenthèses sont appelés tickers et permettent de consulter la valeur de ces indices auprès des fournisseurs de données financières.

## 1 et 2 - Télécharger les données et garder que Adj Close

In [1]:
import pandas as pd

CAC40 = pd.read_csv('CAC40.csv')
CAC40 = CAC40.loc[:,['Close']]
CAC40.insert(0,'Jour',[i for i in range(1, len(CAC40)+1)])
print(CAC40.head(5))

DAX = pd.read_csv('DAX30.csv')
DAX = DAX.loc[:,['Close']]
DAX.insert(0,'Jour',[i for i in range(1, len(DAX)+1)])

print(DAX.head(5))

FTSE = pd.read_csv('FTSE.csv', sep=";")
print(FTSE.head(5))

DJI = pd.read_csv('DJI.csv', sep=";")
print(DJI.head(5))

IXIC = pd.read_csv('NASDAQ.csv')
IXIC = CAC40.loc[:,['Close']]
IXIC.insert(0,'Jour',[i for i in range(1, len(IXIC)+1)])

print(IXIC.head(5))




   Jour        Close
0     1  5590.790039
1     2  5559.569824
2     3  5472.359863
3     4  5523.520020
4     5  5459.620117
   Jour         Close
0     1  13906.669922
1     2  13873.969727
2     3  13643.950195
3     4  13870.990234
4     5  13620.459961
   Jour    Close
0     1  6715.42
1     2  6695.07
2     3  6638.85
3     4  6654.01
4     5  6567.37
   Jour     Close
0     1  31176.01
1     2  30996.98
2     3  30960.00
3     4  30937.04
4     5  30303.17
   Jour        Close
0     1  5590.790039
1     2  5559.569824
2     3  5472.359863
3     4  5523.520020
4     5  5459.620117


## 3 - Calcul de la série st

In [2]:
import numpy as np

def score_function(DATAFRAME):
    score = [0]
    for i in range(1,len(DATAFRAME)):
        taux = np.log(DATAFRAME['Close'][i]/DATAFRAME['Close'][i-1])
        if taux > 0.005:
            score.append(1)
        if taux <= 0.005 and taux >=-0.005 :
            score.append(0)
        if taux < -0.005:
            score.append(-1)
    DATAFRAME.insert(1,'Score', score)


In [3]:
score_function(DAX)
score_function(CAC40)
score_function(IXIC)
score_function(DJI)
score_function(FTSE)

In [4]:
print(DAX.head(5))
print(CAC40.head(5))
print(IXIC.head(5))
print(DJI.head(5))
print(FTSE.head(5))



   Jour  Score         Close
0     1      0  13906.669922
1     2      0  13873.969727
2     3     -1  13643.950195
3     4      1  13870.990234
4     5     -1  13620.459961
   Jour  Score        Close
0     1      0  5590.790039
1     2     -1  5559.569824
2     3     -1  5472.359863
3     4      1  5523.520020
4     5     -1  5459.620117
   Jour  Score        Close
0     1      0  5590.790039
1     2     -1  5559.569824
2     3     -1  5472.359863
3     4      1  5523.520020
4     5     -1  5459.620117
   Jour  Score     Close
0     1      0  31176.01
1     2     -1  30996.98
2     3      0  30960.00
3     4      0  30937.04
4     5     -1  30303.17
   Jour  Score    Close
0     1      0  6715.42
1     2      0  6695.07
2     3     -1  6638.85
3     4      0  6654.01
4     5     -1  6567.37


## Table de probabilité

In [32]:
print("----- Table de probabilité pour le dataframe DAX ------ ")
table_DAX= DAX['Score'].value_counts()/sum(DAX['Score'].value_counts())
print(table_DAX)

print("----- Table de probabilité pour le dataframe CAC40 ------ ")
table_CAC40= CAC40['Score'].value_counts()/sum(CAC40['Score'].value_counts())
print(table_CAC40)

print("----- Table de probabilité pour le dataframe FTSE ------ ")
table_FTSE=FTSE['Score'].value_counts()/sum(FTSE['Score'].value_counts())
print(table_FTSE)

print("----- Table de probabilité pour le dataframe DJI ------ ")
table_DJI=DJI['Score'].value_counts()/sum(DJI['Score'].value_counts())
print(table_DJI)

print("----- Table de probabilité pour le dataframe IXIC ------ ")
table_IXIC= IXIC['Score'].value_counts()/sum(IXIC['Score'].value_counts())
print(table_IXIC)



----- Table de probabilité pour le dataframe DAX ------ 
 0    0.521401
 1    0.260700
-1    0.217899
Name: Score, dtype: float64
----- Table de probabilité pour le dataframe CAC40 ------ 
 0    0.484615
 1    0.311538
-1    0.203846
Name: Score, dtype: float64
----- Table de probabilité pour le dataframe FTSE ------ 
 0    0.579767
 1    0.249027
-1    0.171206
Name: Score, dtype: float64
----- Table de probabilité pour le dataframe DJI ------ 
 0    0.529644
 1    0.280632
-1    0.189723
Name: Score, dtype: float64
----- Table de probabilité pour le dataframe IXIC ------ 
 0    0.484615
 1    0.311538
-1    0.203846
Name: Score, dtype: float64


## 5. Calculez, pour chaque indice :
* **P(st, st+1) = proba d'avoir st et st+1** :
* P(0,0),P(0,1),P(0,-1)
* P(1,0),P(1,1), P(1,-1)
* (P-1,0), P(-1,1), P(-1,-1)

* **P(st|st-1)** : 
* Proba d'avoir 0 aujour'dhui 
    * sachant qu'on a eu 0 la veille
    * sachant qu'on a eu 1 la veille
    * sachant qu'on a eu -1 la veille
* Proba d'avoir 1 aujour'dhui 
    * sachant qu'on a eu 0 la veille
    * sachant qu'on a eu 1 la veille
    * sachant qu'on a eu -1 la veille
* Proba d'avoir -1 aujour'dhui 
    * sachant qu'on a eu 0 la veille
    * sachant qu'on a eu 1 la veille
    * sachant qu'on a eu -1 la veille

* **P(st+1|st)**:
* Proba d'avoir 0 demain 
    * sachant qu'on a eu 0 la aujour'dhui
    * sachant qu'on a eu 1 la aujour'dhui
    * sachant qu'on a eu -1 la aujour'dhui
* Proba d'avoir 1 demain 
    * sachant qu'on a eu 0 la aujour'dhui
    * sachant qu'on a eu 1 la aujour'dhui
    * sachant qu'on a eu -1 la aujour'dhui
* Proba d'avoir -1 demain 
    * sachant qu'on a eu 0 la aujour'dhui
    * sachant qu'on a eu 1 la aujour'dhui
    * sachant qu'on a eu -1 la aujour'dhui




* p(1|0) -> p(0,1) / (p(0,0)+p(0,1)+p(0,-1))
* P(st ∣ st+1) = P(st ∩ st+1)/P(st+1)
* P(st ∩ st+1) = P(st,st+1)

In [86]:
liste = []

def Proba(DATAFRAME):
    
    for i in range(0,len(DATAFRAME['Score'])-1):
        Test = DATAFRAME['Score'][i],DATAFRAME['Score'][i+1]
        TestS = str(Test)
        liste.append(TestS)

Proba(IXIC)

print("------------ Pr(ST, ST+1) ---------------")

df = pd.DataFrame(columns=['0','1','-1'])
lign1 = pd.DataFrame(
    data=np.array([[liste.count('(0, 0)'),
    liste.count('(0, 1)'),
    liste.count('(0, -1)')]]),
    columns=['0','1','-1'])
lign2 = pd.DataFrame(
    data=np.array([[liste.count('(1, 0)'),
    liste.count('(1, 1)'),
    liste.count('(1, -1)')]]),
    columns=['0','1','-1'])
lign3 = pd.DataFrame(
    data=np.array([[liste.count('(-1, 0)'),
    liste.count('(-1, 1)'),
    liste.count('(-1, -1)')]]),
    columns=['0','1','-1'])
df = pd.concat([df,lign1], ignore_index=True)
df = pd.concat([df,lign2], ignore_index=True)
df = pd.concat([df,lign3], ignore_index=True)
df=df.rename(index={2: '-1'}) 
print(df)
print(df/sum(df.sum()))

print("------------ Pr(ST | ST+1) pareil que Pr(ST-1, ST) ---------------")
print(df/df.sum())



------------ Pr(ST, ST+1) ---------------
     0   1  -1
0   66  30  30
1   43  22  16
-1  16  29   7
           0         1        -1
0   0.254826   0.11583   0.11583
1   0.166023  0.084942  0.061776
-1  0.061776  0.111969  0.027027
------------ Pr(ST | ST+1) pareil que Pr(ST-1, ST) ---------------
        0         1        -1
0   0.528   0.37037  0.566038
1   0.344  0.271605  0.301887
-1  0.128  0.358025  0.132075


0     125
1      81
-1     53
dtype: object

259