**EXERCICE 1**

In [1]:
import numpy as np
import scipy.stats as stats

In [2]:
# Étape 1 : Définition des données
experience = np.array([1.5, 3.2, 2.1, 4.5, 3.8, 5.6, 7.2, 6.3, 8.0, 9.5])
productivite = np.array([45, 60, 50, 75, 68, 80, 85, 78, 90, 95])

In [3]:
# Étape 2 : Calcul de la moyenne
mean_X = np.mean(experience)
mean_Y = np.mean(productivite)

In [4]:
# Étape 3 : Calcul des écarts à la moyenne
diff_X = experience - mean_X
diff_Y = productivite - mean_Y

In [5]:

# Étape 4 : Calcul des termes pour Pearson
num_pearson = np.sum(diff_X * diff_Y)
den_pearson = np.sqrt(np.sum(diff_X**2) * np.sum(diff_Y**2))
r_pearson = num_pearson / den_pearson

In [6]:

# Étape 5 : Calcul du coefficient de Spearman
r_spearman, _ = stats.spearmanr(experience, productivite)

In [7]:
print(f"Moyenne Expérience : {mean_X:.2f}, Moyenne Productivité : {mean_Y:.2f}")
print(f"Coefficient de corrélation de Pearson : {r_pearson:.4f}")
print(f"Coefficient de corrélation de Spearman : {r_spearman:.4f}")

Moyenne Expérience : 5.17, Moyenne Productivité : 72.60
Coefficient de corrélation de Pearson : 0.9717
Coefficient de corrélation de Spearman : 0.9879


**Exercice 2**

In [8]:
# Étape 1 : Définition des données
temps_formation = np.array([10, 12, 8, 15, 18, 20, 25, 30, 22, 27, 35, 40])
score_performance = np.array([55, 58, 53, 65, 72, 75, 80, 85, 78, 82, 90, 95])

In [9]:
# Étape 2 : Test de normalité (Shapiro-Wilk et Kolmogorov-Smirnov)
shapiro_temps = stats.shapiro(temps_formation)
shapiro_score = stats.shapiro(score_performance)
ks_temps = stats.kstest(temps_formation, 'norm', args=(np.mean(temps_formation), np.std(temps_formation)))
ks_score = stats.kstest(score_performance, 'norm', args=(np.mean(score_performance), np.std(score_performance)))

In [10]:
# Étape 3 : Choix du test de corrélation
test_correlation = "Pearson" if shapiro_temps.pvalue > 0.05 and shapiro_score.pvalue > 0.05 else "Spearman"

In [11]:
# Étape 4 : Calcul du coefficient de corrélation
if test_correlation == "Pearson":
    correlation, p_value = stats.pearsonr(temps_formation, score_performance)
else:
    correlation, p_value = stats.spearmanr(temps_formation, score_performance)

In [12]:
# Étape 5 : Affichage des résultats
print(f"Test de normalité Shapiro-Wilk : p-valeur (Temps) = {shapiro_temps.pvalue:.4f}, p-valeur (Score) = {shapiro_score.pvalue:.4f}")
print(f"Test de normalité Kolmogorov-Smirnov : p-valeur (Temps) = {ks_temps.pvalue:.4f}, p-valeur (Score) = {ks_score.pvalue:.4f}")
print(f"Test de corrélation choisi : {test_correlation}")
print(f"Coefficient de corrélation ({test_correlation}) : {correlation:.4f}")
print(f"P-valeur de la corrélation : {p_value:.4f}")

Test de normalité Shapiro-Wilk : p-valeur (Temps) = 0.9157, p-valeur (Score) = 0.6781
Test de normalité Kolmogorov-Smirnov : p-valeur (Temps) = 0.9990, p-valeur (Score) = 0.9528
Test de corrélation choisi : Pearson
Coefficient de corrélation (Pearson) : 0.9810
P-valeur de la corrélation : 0.0000


In [13]:
# Interprétation des résultats
if p_value < 0.05:
    print("La corrélation est significative au seuil de 5%.")
else:
    print("La corrélation n'est pas significative au seuil de 5%.")

La corrélation est significative au seuil de 5%.


**Exercie 3**

In [14]:
import pandas as pd
from scipy import stats

In [15]:
data = {
    'Employé': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10,
                11, 12, 13, 14, 15, 16, 17, 18, 19, 20],
    'Groupe': ['Traité']*10 + ['Contrôle']*10,
    'Productivité_Avant': [50, 48, 55, 52, 49, 51, 50, 53, 47, 46,
                           50, 48, 55, 52, 49, 51, 50, 53, 47, 46],
    'Productivité_Après': [65, 62, 70, 66, 64, 67, 68, 69, 63, 61,
                           52, 49, 56, 53, 51, 52, 51, 54, 48, 47]
}

df = pd.DataFrame(data)
df.head()

Unnamed: 0,Employé,Groupe,Productivité_Avant,Productivité_Après
0,1,Traité,50,65
1,2,Traité,48,62
2,3,Traité,55,70
3,4,Traité,52,66
4,5,Traité,49,64


In [16]:
# Calculer la variation de productivité
df['Variation'] = df['Productivité_Après'] - df['Productivité_Avant']

# Séparer les groupes
groupe_traite = df[df['Groupe'] == 'Traité']
groupe_controle = df[df['Groupe'] == 'Contrôle']

# Calcul des variations moyennes pour chaque groupe
variation_moyenne_traite = groupe_traite['Variation'].mean()
variation_moyenne_controle = groupe_controle['Variation'].mean()

print(f"Variation moyenne de productivité pour le groupe traité: {variation_moyenne_traite}")
print(f"Variation moyenne de productivité pour le groupe contrôle: {variation_moyenne_controle}")

Variation moyenne de productivité pour le groupe traité: 15.4
Variation moyenne de productivité pour le groupe contrôle: 1.2


In [17]:
# Calcul de l'effet causal (Différences-en-Différences)
effet_causal = variation_moyenne_traite - variation_moyenne_controle

print(f"Effet causal (Différences-en-Différences): {effet_causal:.2f}")

Effet causal (Différences-en-Différences): 14.20


In [18]:
# Calcul des gains de productivité pour chaque groupe
gains_traite = groupe_traite['Variation']
gains_controle = groupe_controle['Variation']

# Test de Student pour comparer les gains moyens
t_stat, p_value = stats.ttest_ind(gains_traite, gains_controle)

print(f"Valeur t: {t_stat:.4f}")
print(f"Valeur p: {p_value}")

Valeur t: 36.0036
Valeur p: 3.1644481732882757e-18


In [19]:
alpha = 0.05

if p_value < alpha:
    print("La différence est statistiquement significative (p < 0.05).")
else:
    print("La différence n'est pas statistiquement significative (p >= 0.05).")

La différence est statistiquement significative (p < 0.05).


In [20]:
if p_value < alpha:
    print("Conclusion : La formation a eu un effet causal sur la productivité des employés.")
else:
    print("Conclusion : Il n'y a pas suffisamment de preuves pour conclure que la formation a eu un effet causal sur la productivité.")
    
print("Analyse :")
print("Il est important de noter que l'expérience pourrait souffrir de biais de sélection si les employés traités n'étaient pas aléatoirement choisis.")
print("De plus, des facteurs externes non mesurés pourraient également affecter la productivité.")

Conclusion : La formation a eu un effet causal sur la productivité des employés.
Analyse :
Il est important de noter que l'expérience pourrait souffrir de biais de sélection si les employés traités n'étaient pas aléatoirement choisis.
De plus, des facteurs externes non mesurés pourraient également affecter la productivité.
