# Résultat des tests statistiques effectués #

Dans ce notebook, je vais expliquer les tests statistiques effectués sur les données récoltées afin de vérifier si les valeurs de l'AOP et le DOP suivent une loi normale pour les différents éléments d'une scène routière. Dans un premier temps, je vais m'intéresser aux voitures.

## Valeur moyenne ##

Ici, on va effectuer la série de tests sur la valeur moyenne du pixel.

### Test pour l'AOP lorsqu'il y a du brouillard en début de matinée ###

Pour effectuer ce test, j'ai sélectionné 36 voitures différentes (distances plus ou moins éloignées de la caméra, orientations différentes, modèles différents) parmi les acquisitions que j'ai effectuées avec la caméra polarimétrique. J'ai ensuite calculé l'AOP de ces voitures afin d'obtenir l'AOP moyen pour chacune des voitures. C'est sur cette liste de valeurs de l'AOP moyen que je vais effectuer les tests statistiques pour voir si les valeurs suivent une loi normale. Cette expérience a pour but de voir si les voitures peuvent être caractérisées une valeur spécifique de l'AOP.

Les valeurs de l'AOP moyen par voiture répertoriées sont les suivantes :
y = (101, 88, 105, 99, 82, 102, 93, 97, 101, 86, 92, 102, 98, 106, 92, 93, 107, 99, 104, 95, 115, 91, 92, 124, 91, 96, 105, 96, 102, 98, 107, 91, 98, 83, 99, 104)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (82, 83, 86, 88, 91, 91, 91, 92, 92, 92, 93, 93, 95, 96, 96, 97, 98, 98, 98, 99, 99, 99, 101, 101, 102, 102, 102, 104, 104, 105, 105, 106, 107, 107, 115, 124)

Cette série contient donc n = 36 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 98.16666666666667

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 8.294911425419537

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 0.6581859694627143

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 1.8595402358829434

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 2477.0000000000005

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 2205.902846361601

Les valeurs de alpha sont trouvables à ce lien : http://www.biostat.ulg.ac.be/pages/Site_r/normalite_files/Table-alpha.pdf

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.8905542375299155

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

La valeur de W_0.05 est trouvable au lien suivant : http://www.biostat.ulg.ac.be/pages/Site_r/normalite_files/table-W.png

Si W < W_0.05 cela implique que les données ne sont pas normalement distribuées.

W < W_0.05 cela implique que les données ne sont pas normalement distribuées ce qui confirme bien la conclusion tirée par le calcul des coefficients d'assymétrie et d'applatissement.

### Test pour l'AOP lorsque le temps est ensoleillé en fin d'après-midi ###

Les valeurs de l'AOP moyen par voiture répertoriées sont les suivantes :
y = (83, 80, 86, 74, 81, 58, 76, 86, 74, 76, 93, 77, 78, 87, 81, 74, 77, 63, 96, 90, 79)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (58, 63, 74, 74, 74, 76, 76, 77, 77, 78, 79, 80, 81, 81, 83, 86, 86, 87, 90, 93, 96)

Cette série contient donc n = 21 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 75.58276643990926

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 8.693834967372526

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = -0.4882698363119909

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 1.4186062893418048

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant inférieur à 0, la distribution est étalée à gauche de la médiane, la moyenne de la distribution est donc inférieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 1587.2380952380945

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 1279.6517237284004

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.8062128344622711

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W > W_0.05 cela implique que les données sont normalement distribuées.

### Test pour l'AOP lorsque le temps est couvert en fin de matinée ###

Les valeurs de l'AOP moyen par voiture répertoriées sont les suivantes :
y = (120, 128, 96, 108, 95, 104, 103, 103, 118, 118, 111, 110, 113, 141, 130, 115, 114, 124, 109, 118, 109, 105, 98, 115, 99, 113, 123, 144, 122, 97, 101, 99, 99, 112, 103)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (95, 96, 97, 98, 99, 99, 99, 101, 103, 103, 103, 104, 105, 108, 109, 109, 110, 111, 112, 113, 113, 114, 115, 115, 118, 118, 118, 120, 122, 123, 124, 128, 130, 141, 144)

Cette série contient donc n = 35 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 111.91428571428571

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 11.946000953269264

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 0.8679439214640967

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 0.7843838070466278

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 4994.742857142855

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 4679.202982089999

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.9368256016219912

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W > W_0.05 cela implique que les données sont normalement distribuées.

### Test pour le DOP lorsqu'il y a du brouillard en début de matinée ###

Les valeurs du DOP moyen par voiture répertoriées sont les suivantes :
y = (40, 34, 26, 27, 29, 28, 60, 27, 30, 27, 33, 26, 36, 43, 28, 26, 23, 34, 31, 28, 37, 28, 62, 20, 23, 36, 36, 24, 28, 32)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (20, 23, 23, 24, 26, 26, 26, 27, 27, 27, 28, 28, 28, 28, 28, 29, 30, 31, 32, 33, 34, 34, 36, 36, 36, 37, 40, 43, 60, 62)

Cette série contient donc n = 30 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 32.06666666666667

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 9.305673299420928

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 2.087577144056244

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 5.021788959980142

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 2597.866666666667

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 2063.766783689999

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.7944082774417467

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W < W_0.05 cela implique que les données ne sont pas normalement distribuées.

### Test pour le DOP lorsque le temps est brumeux en fin d'après-midi ###

Les valeurs du DOP moyen par voiture répertoriées sont les suivantes :
y = (37, 48, 32, 41, 39, 42, 44, 32, 41, 46, 32, 24, 27, 34, 31, 32, 36, 37, 43, 62, 61, 35, 60, 62, 27, 39, 29)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (24, 27, 27, 29, 31, 32, 32, 32, 32, 34, 35, 36, 37, 37, 39, 39, 41, 41, 42, 43, 44, 46, 48, 60, 61, 62, 62)

Cette série contient donc n = 27 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 39.74074074074074

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 10.692997336757161

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 0.9760379719401975

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 0.4004651123376566

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 3087.185185185185

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 2757.7832131599994

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.8933002226086328

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W < W_0.05 cela implique que les données ne sont pas normalement distribuées.

### Test pour le DOP lorsque le temps est couvert en début de matinée ###

Les valeurs du DOP moyen par voiture répertoriées sont les suivantes :
y = (25, 42, 77, 41, 39, 42, 48, 24, 62, 21, 24, 20, 29, 31, 30, 38, 38, 43, 45, 45, 63, 53, 39, 31, 34, 43, 28, 24, 38, 28, 35, 26, 30, 28, 44, 32)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (20, 21, 24, 24, 24, 25, 26, 28, 28, 28, 29, 30, 30, 31, 31, 32, 34, 35, 38, 38, 38, 39, 39, 41, 42, 42, 43, 43, 44, 45, 45, 48, 53, 62, 63, 77)

Cette série contient donc n = 36 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 37.22222222222222

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 12.286196208914728

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 1.2804930551915814

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 2.2816749216802323

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 5434.222222222223

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 4942.511809000003

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.9095159540565966

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W < W_0.05 cela implique que les données ne sont pas normalement distribuées.

## Valeur médiane ##

Ici, on va effectuer la série de tests sur la valeur médiane du pixel.

### Test pour l'AOP lorsque le temps est couvert en fin de matinée ###

Les valeurs de l'AOP médian par voiture répertoriées sont les suivantes :
y = (127, 145, 89, 127, 95, 104, 110, 109, 127, 127, 127, 127, 127, 148, 127, 126, 127, 127, 122, 127, 127, 114, 100, 127, 101, 127, 127, 153, 127, 95, 108, 101, 101, 120, 107)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (89, 95, 95, 100, 101, 101, 101, 104, 107, 108, 109, 110, 114, 120, 122, 126, 127, 127, 127, 127, 127, 127, 127, 127, 127, 127, 127, 127, 127, 127, 127, 127, 145, 148, 153)

Cette série contient donc n = 35 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 119.42857142857143

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 14.957627226431937

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = -0.07018767551924708

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = -0.06264467918252814

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant inférieur à 0, la distribution est étalée à gauche de la médiane, la moyenne de la distribution est donc inférieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant inférieur à 0, cela montre que la distribution qui a un pic plus plat et des extrémités moins épaisses que la loi normale ;
* Au final les deux coefficients étant proches de 0, la loi est très susceptible d'être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 7830.5714285714275

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 6999.330243999999

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.8938466761776188

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W < W_0.05 cela implique que les données ne sont pas normalement distribuées.

### Test pour l'AOP lorsque le temps est ensoleillé en fin d'après-midi ###

Les valeurs de l'AOP médian par voiture répertoriées sont les suivantes :
y = (63, 70, 73, 63, 73, 50, 63, 73, 63, 63, 87, 63, 63, 74, 73, 63, 71, 53, 95, 80, 70)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (50, 53, 63, 63, 63, 63, 63, 63, 63, 63, 70, 70, 71, 73, 73, 73, 73, 74, 80, 87, 95)

Cette série contient donc n = 21 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 68.85714285714286

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 10.0488602257537

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 0.727373895001443

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 1.7364703655655132

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 2120.571428571429

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 1942.61444001

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.916080644035974

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W > W_0.05 cela implique que les données sont normalement distribuées.

### Test pour l'AOP lorsqu'il y a du brouillard en début de matinée ###

Les valeurs de l'AOP médian par voiture répertoriées sont les suivantes :
y = (98, 84, 102, 100, 77, 104, 89, 96, 100, 82, 88, 100, 96, 105, 89, 88, 126, 98, 110, 93, 138, 84, 91, 142, 87, 91, 104, 94, 105, 99, 113, 84, 100, 78, 99, 103)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (77, 78, 82, 84, 84, 84, 87, 88, 88, 89, 89, 91, 91, 93, 94, 96, 96, 98, 98, 99, 99, 100, 100, 100, 100, 102, 103, 104, 104, 105, 105, 110, 113, 126, 138, 142)

Cette série contient donc n = 36 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 98.25

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 14.172302800415558

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 1.454781154657534

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 2.989742785150918

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 7230.75

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 6378.482117159999

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.8821328516626904

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W < W_0.05 cela implique que les données ne sont pas normalement distribuées.

### Test pour le DOP lorsqu'il y a du brouillard en début de matinée ###

Les valeurs du DOP médian par voiture répertoriées sont les suivantes :
y = (28, 30, 21, 25, 27, 26, 51, 24, 28, 26, 29, 25, 29, 33, 26, 25, 23, 30, 28, 25, 27, 25, 51, 20, 22, 28, 29, 24, 26, 26)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (20, 21, 22, 23, 24, 24, 25, 25, 25, 25, 25, 26, 26, 26, 26, 26, 27, 27, 28, 28, 28, 28, 29, 29, 29, 30, 30, 33, 51, 51)

Cette série contient donc n = 30 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 27.9

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 6.7495678874033604

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 2.810040468378369

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 8.497519572076078

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 1366.6999999999998

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 911.7984160000001

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.6671533006512038

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W < W_0.05 cela implique que les données ne sont pas normalement distribuées.

### Test pour le DOP lorsque le temps est brumeux en fin d'après-midi ###

Les valeurs du DOP médian par voiture répertoriées sont les suivantes :
y = (29, 37, 29, 25, 31, 26, 29, 27, 32, 36, 29, 19, 22, 26, 25, 25, 26, 32, 37, 39, 39, 30, 40, 41, 22, 31, 25)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (19, 22, 22, 25, 25, 25, 25, 26, 26, 26, 27, 29, 29, 29, 29, 30, 31, 31, 32, 32, 36, 37, 37, 39, 39, 40, 41)

Cette série contient donc n = 27 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 29.962962962962962

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 5.89086852353634

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 0.3525648581066867

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = -0.5497643117495237

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant inférieur à 0, cela montre que la distribution qui a un pic plus plat et des extrémités moins épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 936.9629629629629

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 887.0390022400001

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.9467172527662266

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W > W_0.05 cela implique que les données sont normalement distribuées.

### Test pour le DOP lorsque le temps est couvert en début de matinée ###

Les valeurs du DOP médian par voiture répertoriées sont les suivantes :
y = (23, 32, 47, 29, 29, 33, 38, 22, 45, 20, 21, 16, 22, 26, 26, 27, 26, 31, 31, 34, 36, 35, 27, 23, 27, 34, 23, 23, 22, 25, 27, 23, 25, 27, 30, 26)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (16, 20, 21, 22, 22, 22, 23, 23, 23, 23, 23, 25, 25, 26, 26, 26, 26, 27, 27, 27, 27, 27, 29, 29, 30, 31, 31, 32, 33, 34, 34, 35, 36, 38, 45, 47)

Cette série contient donc n = 36 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 28.083333333333332

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 6.516538788174116

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 1.0913312549566239

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 1.710556562943804

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 1528.7499999999998

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 1417.7032257600006

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.9273610634570733

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W < W_0.05 cela implique que les données ne sont pas normalement distribuées.