# Résultat des tests statistiques effectués #

Dans ce notebook, je vais expliquer les tests statistiques effectués sur les données récoltées afin de vérifier si les valeurs de l'AOP et le DOP suivent une loi normale après application d'un filtre médian pour les différents éléments d'une scène routière. Dans un premier temps, je vais m'intéresser aux voitures.

## Valeur moyenne ##

Ici, on va effectuer la série de tests sur la valeur moyenne du pixel.

### Test pour l'AOP lorsqu'il y a du brouillard en début de matinée ###

Pour effectuer ce test, j'ai sélectionné 36 voitures différentes (distances plus ou moins éloignées de la caméra, orientations différentes, modèles différents) parmi les acquisitions que j'ai effectuées avec la caméra polarimétrique. J'ai ensuite calculé l'AOP de ces voitures afin d'obtenir l'AOP moyen pour chacune des voitures. C'est sur cette liste de valeurs de l'AOP moyen que je vais effectuer les tests statistiques pour voir si les valeurs suivent une loi normale. Cette expérience a pour but de voir si les voitures peuvent être caractérisées une valeur spécifique de l'AOP.

Les valeurs de l'AOP moyen par voiture répertoriées sont les suivantes :
y = (101, 87, 105, 100, 82, 103, 93, 97, 101, 86, 92, 102, 98, 106, 92, 93, 108, 100, 104, 95, 115, 90, 92, 125, 91, 96, 105, 96, 103, 99, 108, 91, 98, 83, 99, 104)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (82, 83, 86, 87, 90, 91, 91, 92, 92, 92, 93, 93, 95, 96, 96, 97, 98, 98, 99, 99, 100, 100, 101, 101, 102, 103, 103, 104, 104, 105, 105, 106, 108, 108, 115, 125)

Cette série contient donc n = 36 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 98.33333333333333

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 8.540751983545972

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 0.6465431372270524

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 1.788255239431706

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 2626.0

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 2538.2653134399998

Les valeurs de alpha sont trouvables à ce lien : http://www.biostat.ulg.ac.be/pages/Site_r/normalite_files/Table-alpha.pdf

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.9665899898857577

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

La valeur de W_0.05 est trouvable au lien suivant : http://www.biostat.ulg.ac.be/pages/Site_r/normalite_files/table-W.png

Si W < W_0.05 cela implique que les données ne sont pas normalement distribuées.

W > W_0.05 cela implique que les données sont normalement distribuées.

### Test pour l'AOP lorsque le temps est ensoleillé en fin d'après-midi ###

Les valeurs de l'AOP moyen par voiture répertoriées sont les suivantes :
y = (79, 79, 84, 71, 81, 57, 69, 84, 72, 74, 92, 75, 75, 85, 80, 72, 75, 61, 95, 88, 76)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (57, 61, 69, 71, 72, 72, 74, 75, 75, 75, 76, 79, 79, 80, 81, 84, 84, 85, 88, 92, 95)

Cette série contient donc n = 21 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 77.33333333333333

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 8.972621495858192

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = -0.22755349840615857

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 0.8123445314855533

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant inférieur à 0, la distribution est étalée à gauche de la médiane, la moyenne de la distribution est donc inférieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 1690.6666666666665

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 1650.5775052900003

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.976287956598975

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W > W_0.05 cela implique que les données sont normalement distribuées.

### Test pour l'AOP lorsque le temps est couvert en fin de matinée ###

Les valeurs de l'AOP moyen par voiture répertoriées sont les suivantes :
y = (121, 131, 96, 109, 95, 103, 103, 103, 119, 119, 111, 110, 113, 142, 130, 116, 116, 125, 111, 119, 109, 105, 98, 116, 99, 114, 123, 146, 123, 96, 102, 98, 99, 112, 103)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (95, 96, 96, 98, 98, 99, 99, 102, 103, 103, 103, 103, 105, 109, 109, 110, 111, 111, 112, 113, 114, 116, 116, 116, 119, 119, 119, 121, 123, 123, 125, 130, 131, 142, 146)

Cette série contient donc n = 35 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 112.42857142857143

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 12.483785401839608

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 0.8255355596178974

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 0.6852673313717279

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 5454.571428571429

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 5113.036530250001

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.9373855668050391

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W > W_0.05 cela implique que les données sont normalement distribuées.

### Test pour le DOP lorsqu'il y a du brouillard en début de matinée ###

Les valeurs de l'AOP moyen par voiture répertoriées sont les suivantes :
y = (40, 33, 26, 25, 28, 27, 60, 26, 30, 27, 32, 25, 35, 43, 28, 26, 22, 34, 30, 27, 36, 27, 62, 19, 22, 35, 35, 24, 28, 32)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (19, 22, 22, 24, 25, 25, 26, 26, 26, 27, 27, 27, 27, 28, 28, 28, 30, 30, 32, 32, 33, 34, 35, 35, 35, 36, 40, 43, 60, 62)

Cette série contient donc n = 30 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 31.466666666666665

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 9.4929213393747

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 2.0958434844444307

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 5.059337641712222

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 2703.4666666666662

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 2145.468288640001

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.7935989428289608

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W < W_0.05 cela implique que les données ne sont pas normalement distribuées.

### Test pour le DOP lorsque le temps est brumeux en fin d'après-midi ###

Les valeurs du DOP moyen par voiture répertoriées sont les suivantes :
y = (36, 48, 31, 40, 37, 41, 43, 31, 39, 46, 32, 23, 26, 32, 30, 31, 34, 36, 42, 62, 60, 34, 59, 62, 26, 38, 28)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (23, 26, 26, 28, 30, 31, 31, 31, 32, 32, 34, 34, 36, 36, 37, 38, 39, 40, 41, 42, 43, 46, 48, 59, 60, 62, 62)

Cette série contient donc n = 27 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 38.77777777777778

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 10.91493483577139

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 1.0166679485582542

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 0.42087831581642643

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 3216.666666666667

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 2866.60655649

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.8911730227430051

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W < W_0.05 cela implique que les données ne sont pas normalement distribuées.

### Test pour le DOP lorsque le temps est couvert en début de matinée ###

Les valeurs du DOP moyen par voiture répertoriées sont les suivantes :
y = (24, 41, 77, 41, 39, 41, 46, 23, 61, 21, 23, 19, 28, 31, 30, 38, 37, 43, 44, 44, 63, 52, 38, 30, 33, 42, 27, 24, 37, 28, 34, 25, 29, 28, 43, 32)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (19, 21, 23, 23, 24, 24, 25, 27, 28, 28, 28, 29, 30, 30, 31, 32, 33, 34, 37, 37, 38, 38, 39, 41, 41, 41, 42, 43, 43, 44, 44, 46, 52, 61, 63, 77)

Cette série contient donc n = 36 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 36.55555555555556

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 12.298248394801877

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 1.331317520318314

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 2.5367923587534795

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 5444.8888888888905

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 4933.86832225

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.9061467410874621

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W < W_0.05 cela implique que les données ne sont pas normalement distribuées.

## Valeur médiane ##

Ici, on va effectuer la série de tests sur la valeur médiane du pixel.

### Test pour l'AOP lorsque le temps est couvert en fin de matinée ###

Les valeurs de l'AOP médian par voiture répertoriées sont les suivantes :
y = (127, 141, 87, 127, 95, 103, 107, 108, 127, 127, 127, 127, 127, 145, 127, 126, 127, 127, 120, 127, 127, 113, 98, 127, 102, 127, 127, 153, 127, 95, 108, 99, 98, 117, 107)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (87, 95, 95, 98, 98, 99, 102, 103, 107, 107, 108, 108, 113, 117, 120, 126, 127, 127, 127, 127, 127, 127, 127, 127, 127, 127, 127, 127, 127, 127, 127, 127, 141, 145, 153)

Cette série contient donc n = 35 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 118.68571428571428

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 15.080302059444355

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = -0.17026774644227613

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = -0.19700845688675495

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant inférieur à 0, la distribution est étalée à gauche de la médiane, la moyenne de la distribution est donc inférieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant inférieur à 0, cela montre que la distribution qui a un pic plus plat et des extrémités moins épaisses que la loi normale ;
* Au final les deux coefficients étant proches de 0, la loi est très susceptible d'être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 7959.542857142857

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 7154.266972409999

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.8988288775893445

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W < W_0.05 cela implique que les données ne sont pas normalement distribuées.

### Test pour l'AOP lorsque le temps est ensoleillé en fin d'après-midi ###

Les valeurs de l'AOP médian par voiture répertoriées sont les suivantes :
y = (63, 69, 74, 63, 73, 50, 63, 72, 63, 63, 84, 63, 67, 72, 72, 63, 71, 53, 95, 81, 71)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (50, 53, 63, 63, 63, 63, 63, 63, 63, 67, 69, 71, 71, 72, 72, 72, 73, 74, 81, 84, 95)

Cette série contient donc n = 21 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 68.80952380952381

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 9.742489403291268

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 0.6949817624395637

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 2.060720679093985

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 1993.2380952380956

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 1846.3349609999989

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.9262992541688558

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W > W_0.05 cela implique que les données sont normalement distribuées.

### Test pour l'AOP lorsqu'il y a du brouillard en début de matinée ###

Les valeurs de l'AOP médian par voiture répertoriées sont les suivantes :
y = (96, 84, 99, 99, 76, 103, 88, 94, 98, 82, 87, 99, 95, 104, 89, 86, 126, 97, 109, 93, 138, 83, 90, 141, 86, 89, 102, 94, 105, 98, 111, 82, 100, 78, 98, 102)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (76, 78, 82, 82, 83, 84, 86, 86, 87, 88, 89, 89, 90, 93, 94, 94, 95, 96, 97, 98, 98, 98, 99, 99, 99, 100, 102, 102, 103, 104, 105, 109, 111, 126, 138, 141)

Cette série contient donc n = 35 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 97.25

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 14.215357501269143

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 1.529023024604437

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 3.1632522547316153

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 7274.75

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 6348.7271052099995

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.8727072552610055

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W < W_0.05 cela implique que les données ne sont pas normalement distribuées.

### Test pour le DOP lorsqu'il y a du brouillard en début de matinée ###

Les valeurs du DOP médian par voiture répertoriées sont les suivantes :
y = (28, 29, 22, 25, 26, 26, 50, 24, 27, 25, 28, 25, 28, 32, 26, 25, 23, 29, 27, 25, 26, 26, 48, 21, 22, 27, 28, 24, 26, 26)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (21, 22, 22, 23, 24, 24, 25, 25, 25, 25, 25, 26, 26, 26, 26, 26, 26, 26, 27, 27, 27, 28, 28, 28, 28, 29, 29, 32, 48, 50)

Cette série contient donc n = 30 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 27.466666666666665

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 6.184568609764864

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 3.0194299528788564

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 9.433497459266958

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution qui a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 1147.466666666667

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 719.3284920899998

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.6268839984516613

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W < W_0.05 cela implique que les données ne sont pas normalement distribuées.

### Test pour le DOP lorsque le temps est brumeux en fin d'après-midi ###

Les valeurs du DOP médian par voiture répertoriées sont les suivantes :
y = (28, 36, 28, 24, 30, 25, 29, 27, 32, 35, 28, 19, 21, 27, 25, 25, 25, 31, 35, 37, 36, 30, 37, 41, 22, 31, 25)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (19, 21, 22, 24, 25, 25, 25, 25, 25, 27, 27, 28, 28, 28, 29, 30, 30, 31, 31, 32, 35, 35, 36, 36, 37, 37, 41)

Cette série contient donc n = 27 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 29.22222222222222

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 5.4046162253401375

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 0.2815201833364634

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = -0.33052717895878114

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant inférieur à 0, cela montre que la distribution qui a un pic plus plat et des extrémités moins épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 788.6666666666666

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 764.42296324

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.9692598857650042

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W > W_0.05 cela implique que les données sont normalement distribuées.

### Test pour le DOP lorsque le temps est couvert en début de matinée ###

Les valeurs du DOP médian par voiture répertoriées sont les suivantes :
y = (23, 32, 45, 28, 28, 32, 37, 23, 43, 21, 21, 18, 23, 26, 25, 27, 25, 29, 30, 33, 35, 35, 26, 23, 27, 33, 23, 23, 23, 25, 26, 23, 25, 27, 29, 26)

Lorsque cette liste est triée cela donne les valeurs suivantes :
y = (18, 21, 21, 23, 23, 23, 23, 23, 23, 23, 23, 25, 25, 25, 25, 26, 26, 26, 26, 27, 27, 27, 28, 28, 29, 29, 30, 32, 32, 33, 33, 35, 35, 37, 43, 45)

Cette série contient donc n = 36 valeurs

On va tout d'abord calculer la moyenne de la série :
mean = somme(yi)/n
mean = 27.72222222222222

On calcule ensuite la variance :
sd = sqrt(somme(yi-mean)²/(n-1))
sd = 5.848129383311437

On va maintenant calculer les coefficients d'assymétrie de d'applatissement permettant d'avoir une idée au préalable de si les données suivent une loi normale ou non :

On calcule d'abord le coeffcient d'assymétrie :
CA = n/((n-1)(n-2))xsomme(((yi-mean)/sd)^3)
CA = 1.253706176843028

On calcule ensuite le coefficient d'applatissement :
CApp = n(n+1)/((n-1)(n-2)(n-3))xsomme(((yi-mean)/sd)^4)-3(n-1)²/((n-2)(n-3))
CApp = 1.8318583002924544

En interprétant ces coefficients calculés on peut en tirer les conclusions suivantes :
* Le coeffcient d'assymétrie étant supérieur à 0, la distribution est étalée à droite de la médiane, la moyenne de la distribution est donc supérieure à la médiane de celle-ci ;
* Le coefficient d'applatissement étant supérieur à 0, cela montre que la distribution a un pic moins plat et des extrémités plus épaisses que la loi normale ;
* Au final les deux coefficients étant éloignés de 0, la loi est très susceptible de ne pas être normale.

Pour vérifier ou invalider cette conclusion, je vais procéder au test statistique de Shapiro-Wilk qui permet de tester si un jeu de données suit une loi normale. Ici ce test est applicable car n < 50.

La première étape consiste à trier les données par ordre croissant.

La deuxième étape consiste à calculer la moyenne des observations.

La troisième étape consiste à calculer la somme des écarts à la moyenne :
S² = somme(yi-mean)²
S² = 1231.222222222222

La quatrième étape consiste à calculer b² qui est un autre estimateur de la variance des données ce qui se fait en plusieurs parties :

1 - Calcul de d :
di = y(n-i+1) - y(i)

2 - Calcul de k :
Si n est pair alors k = n/2
Sinon k = (n-1)/2

3 - Calcul de b² :
b² = (somme(alpha(j)xd(j))²
b² = 1110.5089704900006

La cinquième étape consiste à calculer W :
W = b²/S²
W = 0.9019565683972572

La sixième et dernière étape consiste à comparer la valeur de W avec la valeur de W_0.05.

W < W_0.05 cela implique que les données ne sont pas normalement distribuées.