# Importation des bibliothèques

In [11]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import scipy, os
import random as rd
import seaborn as sns
import pyodbc # connection base de données access
rd.seed(123)

# Méthodologie Questionnaire de Karasek

In [12]:
http_karasek='https://travail-emploi.gouv.fr/IMG/pdf/dares-karasek.pdf'
wiki_karasek='https://fr.wikipedia.org/wiki/Mod%C3%A8le_de_Karasek'
print(f'lien_questionnaire: {http_karasek}\nlien_wikipedia: {wiki_karasek}')

lien_questionnaire: https://travail-emploi.gouv.fr/IMG/pdf/dares-karasek.pdf
lien_wikipedia: https://fr.wikipedia.org/wiki/Mod%C3%A8le_de_Karasek


# Vérification de l'existence des drivers pour Microsoft Access 

In [13]:
''' Docstring
Il s'agit ici de vérifier l'existence des pilotes
*.mdb, *.accdb permettant à python de communiquer avec
la base de données access
'''
[x for x in pyodbc.drivers() if x.startswith('Microsoft Access Driver')]

['Microsoft Access Driver (*.mdb, *.accdb)']

# Connection à la base de données

In [14]:
''' Docstring
Ici, vous pouvez changer le chemin d'accès <path> en
fonction de l'emplacement de votre base de données access.
Pour les paramètres de connections:
                        <UID>: identifiant
                        <PWD>: mot de passe
Ne rien saisir s'il n'y a pas de mot de passe et d'identifiant définis
et exécuter le code python tel qu'il est :) 
'''
# Chemin d'accès aux données
path=r"C:\Users\pc\Downloads\ENQUETE PREVALENCE STRESS\FatouAtegi\FatouAtegi.mdb"

# Saisie des Paramètres de connexion
connect_paras=(r'DRIVER={Microsoft Access Driver (*.mdb, *.accdb)};'
               fr'DBQ={path};'
               r'UID=;' # saisir un ID S'il existe un identifiant d'accès à la base de données
               r'PWD=;' # saisir le mot de passe d'accès à la base de données
              )

#Connexion aux données
connect=pyodbc.connect(connect_paras)
curseur=connect.cursor()
Tables=curseur.tables(tableType='TABLE').fetchall()

# Accès aux tables de données "PREVALENCESTRESS"
Datas={}
for table in Tables:
    name=table.table_name.strip() # Pour extraire correctement le nom de la table
    if name.startswith('PREVALENCESTRESS'):
        query=f'SELECT * FROM [{name}]'
        Datas[name]=pd.read_sql(query,connect)
del Datas['PREVALENCESTRESS'] # Supprimer cette table d'information 

  Datas[name]=pd.read_sql(query,connect)


# Analyse Exploratoire des Données (EDA)

## Description et Fusion des tables de données "PREVALENCESTRESS"

### Tables de données importées

In [15]:
for name, data in Datas.items():
    print(name) # Noms des tables
    globals()[name]=data # extraction de chaque table

PREVALENCESTRESS1
PREVALENCESTRESS2
PREVALENCESTRESS3
PREVALENCESTRESS4


### Fonction pour décrire le DataFrame

In [16]:
def Des(df):
    # Vérification si l'objet df est bien un DataFrame
    if isinstance(df, pd.DataFrame):
        print(f"Yes :) data is a pandas DataFrame")
    else:
        print(f"{type(df).__name__} n'est pas un DataFrame pandas")
    
    # Création du DataFrame 'Information' 
    Information = pd.DataFrame({
        'Variables': df.columns,
        'Dtype': df.dtypes,
        'NaN_values': df.isna().sum(),
        'Unique_values': df.nunique()
    }).reset_index(drop=True)
    
    # Affiche toutes les lignes et colonnes temporairement
    with pd.option_context('display.max_columns', None, 'display.max_rows', None):
        print(Information)


### Fusion des tables de données

In [17]:
# Fusion des tables avec 'left_join' à partir de PREVALENCESTRESS1
liste=[PREVALENCESTRESS1, PREVALENCESTRESS2, PREVALENCESTRESS3, PREVALENCESTRESS4]

Donnees=liste[0].sort_values(by='GlobalRecordId')

for table in liste[1:]:
    table.sort_values(by='GlobalRecordId')
    Donnees=pd.merge(Donnees, table, on='GlobalRecordId', how='left') 

In [18]:
#Vérification de la réussite de la fusion des tables
size=0
for name, table in Datas.items():
    print(f'{name}: {table.shape[1]} variables')
    size+=table.shape[1]

#Nombre de variables attendus après la fusion
N=size-3 # on retire 3 car la variable de fusion 'GlobalRecordId' apparait une fois dans la base finale
print(N)

if Donnees.shape[1]==N:
    print('Fusion réussie :)')
else:
    raise ValueError("Le nombre total de variables attendus n'est pas conforme :(")

PREVALENCESTRESS1: 19 variables
PREVALENCESTRESS2: 16 variables
PREVALENCESTRESS3: 15 variables
PREVALENCESTRESS4: 17 variables
64
Fusion réussie :)


### Exporter les données vers un emplacement ou répertoire de travail au format 'Excel'

In [19]:
# Mon répertoire
Répertoire = r'C:\Users\pc\Downloads\ENQUETE PREVALENCE STRESS\FatouAtegi'
nom_fichier = 'Données brutes.xlsx' # !! Avec son extension .xlsx
chemin_complet = os.path.join(Répertoire, nom_fichier)

# Exporter le DataFrame au format Excel vers le répertoire
import openpyxl
Donnees.to_excel(chemin_complet, index=False, sheet_name='Tableau_1', engine='openpyxl')

## Analyse de la nouvelle base 'Donnees'

In [20]:
# information sur les variables
Des(Donnees)

Yes :) data is a pandas DataFrame
                                            Variables    Dtype  NaN_values  \
0                                      GlobalRecordId   object           0   
1                                                sexe   object           0   
2                                        Arretmaladie   object           0   
3                                                 age  float64           0   
4                                      HaurairesTache   object           0   
5                               SituationMatrimoniale   object           0   
6                                   ArreteDtravailler   object           0   
7                                           TitrePost   object           0   
8                                         HyginedeVie   object          12   
9                                         statusalari   object           0   
10                                        Typecontrat   object           0   
11                            

### Recodage des Variables de Réponses relatives au STRESS

In [21]:
# Fonction pour récoder
def Recode(X, inverse=True):
    '''--Docstring--
    Cette fonction a pour but d'uniformiser les labels au niveau du questionnaire de Karasek.
    Les labels présentent des caractères différents d'une question à une autre en raison des accents
    et autres caractères.
    l'argument inverse='True' affiche les variables catégorielles ordinales
    en utilisant des nombres (1-2-3-4) conformément à la methode de Karasek
    si inverse='False', alors les labels originels sont affichés
    [1-'fortement en désaccord ', 2-'en désaccord ', 3-"d'accord ", 4-"tout à fait d'accord "]
     l'argument par défaut est 'True' 
    '''
    import unidecode # Pour supprimer les accents et autres caractères
    
    # Répertoire de Travail pour exporter les données transformées en Excel.xlsx
    Répertoire = r'C:\Users\pc\Downloads\ENQUETE PREVALENCE STRESS\FatouAtegi'
    
    # Créer une copie profonde du DataFrame 
    X_copie=X.copy(deep=True)
    
    # Créer un dictionnaire à partir de mes labels dans cat_order
    dict={"'":"", "’":""}

    cat_order=['fortement en desaccord','en desaccord','daccord', 'tout a fait daccord']    
    
    labels={j:(i+1) for i,j in enumerate(cat_order)}
    
    #Vérifier que X est bien un DataFrame
    if isinstance(X_copie, pd.DataFrame):
        pass
    else:
        raise TypeError(f"{type(X_copie).__name__} n'est pas un DataFrame pandas")

    # Itération sur les colonnes'type objet' pour convertir en catégorie
    for var in X_copie.iloc[:,1:].columns:
        
        #Pour toutes les variables catégorielles nominales
        if (X_copie[var].dtype=='object') and not (var in X_copie.columns.tolist()[19:61]):
            list_a=[label for label in X_copie[var].unique() if label != None]
            X_copie[var]=X_copie[var].astype('category')
            X_copie[var]=pd.Categorical(X_copie[var],
                                        categories=list_a,
                                        ordered=False)
            
        # pour les variables Catégorielles ordinales
        if (X_copie[var].dtype=='object') and (var in X_copie.columns.tolist()[19:61]):
             # supression des accents et caractères et espaces dans les labels
            X_copie[var]=X_copie[var].apply(
                lambda x: unidecode.unidecode(x).strip().translate(str.maketrans(dict))
                          if x!=None else x)
            X_copie[var]=X_copie[var].astype('category')
            X_copie[var]=pd.Categorical(X_copie[var],
                                        categories=cat_order,
                                        ordered=True)
            # Appliquer les transformations pour inverse='True' 
            if inverse:
                X_copie[var] = X_copie[var].map(labels)
                 
    #retourne la copie transformée du DataFrame
    return X_copie

### Application de la fonction recode() à mes données

In [22]:
# Traitement des données via notre fonction <recode()>
data=Recode(Donnees,True)

### Traitement des valeurs manquantes 'NA'

In [23]:
# Imputation des des variables ayant des 'NA'
data_imputed=data.loc[:,'sexe':] # exclusion de la variable 'GlobalRecordId'

for var in data_imputed.columns:
    if data_imputed[var].isna().any():
        mode=data_imputed[var].mode()[0] # mode de la série
        data_imputed[var]=data_imputed[var].fillna(mode) # remplacer les 'NA' par le mode


### Création de la variable groupe d'âge

In [24]:
# Statistiques descriptives de la variable Âge
(data_imputed['age']).describe()

count    65.000000
mean     36.015385
std      11.857872
min      18.000000
25%      26.000000
50%      33.000000
75%      48.000000
max      62.000000
Name: age, dtype: float64

In [25]:
# Création de la variable groupe d'âge
data_imputed['group_age']=pd.cut(data_imputed['age'],
                        bins=[17,31,41,51,100],
                        labels=['18-30 ans','31-40 ans','41-50 ans','+50 ans'])

## Calcul des Scores de Karasek

### Score pour la demande psychologique

In [26]:
"""--Docstring--
L’axe « Demande psychologique » regroupe:
>>Quantité - rapidité
Q10 - Mon travail me demande de travailler très vite
Q12 - On me demande d’effectuer une quantité de travail excessive
Q13 - Je dispose du temps pour exécuter correctement mon travail

>>Complexité - intensité
Q14 - Je reçois des ordres contradictoires de la part d’autres personnes
Q11 - Mon travail me demande de travailler intensément
Q15 - Mon travail demande de longues périodes de concentration intense

>>Morcellement, prévisibilité
Q16 - Mes tâches sont souvent interrompues avant d’être achevées, nécessitant de les reprendre plus tard
Q17 - Mon travail est très bousculé
Q18 - Attendre le travail de collègues ou d’autres départements ralentit souvent mon propre travail

>>Le score de demande psychologique est donné par la formule :
            Q10+Q11+Q12+(5-Q13)+Q14+Q15+Q16+Q17+Q18
"""

'--Docstring--\nL’axe « Demande psychologique » regroupe:\n>>Quantité - rapidité\nQ10 - Mon travail me demande de travailler très vite\nQ12 - On me demande d’effectuer une quantité de travail excessive\nQ13 - Je dispose du temps pour exécuter correctement mon travail\n\n>>Complexité - intensité\nQ14 - Je reçois des ordres contradictoires de la part d’autres personnes\nQ11 - Mon travail me demande de travailler intensément\nQ15 - Mon travail demande de longues périodes de concentration intense\n\n>>Morcellement, prévisibilité\nQ16 - Mes tâches sont souvent interrompues avant d’être achevées, nécessitant de les reprendre plus tard\nQ17 - Mon travail est très bousculé\nQ18 - Attendre le travail de collègues ou d’autres départements ralentit souvent mon propre travail\n\n>>Le score de demande psychologique est donné par la formule :\n            Q10+Q11+Q12+(5-Q13)+Q14+Q15+Q16+Q17+Q18\n'

In [27]:
#Création de la liste des variables concernées 
Psy=data.loc[:,'N10Montravailexigedallertrsvite':'N18JesuiRalentiTravailParceqJedoisAttendreAutres']
Psy=Psy.columns.tolist()
Psy.remove('N13JaiSuffisammentDtempsTravail')
Psy

['N10Montravailexigedallertrsvite',
 'N11TravaillerTrsfortMentalement',
 'N12OnNedemandepasDfaireQuantitExcessiveDtravail',
 'N14PasDdemandesContradictoires',
 'N15ConcentrerIntensmentPendLonguesPeriodes',
 'N16MatachtInterrompueAvanTerminJdoisRevenirPlusTard',
 'N17MonTravailTresSouvenMouvement',
 'N18JesuiRalentiTravailParceqJedoisAttendreAutres']

In [28]:
# Calcul du Score
data_imputed['Score_demande_psychologique']=(data_imputed.loc[:,Psy].astype('float').sum(axis=1) +
                            (5 - data_imputed['N13JaiSuffisammentDtempsTravail'].astype('float')))

### Score pour la latitude décisionnelle 

In [29]:
"""--docstring--
L’axe « latitude décisionnelle »» regroupe:
>>Latitude ou marges de manœuvre
Q4 - Mon travail me permet de prendre souvent des décisions moi-même
Q6 - Dans ma tâche, j’ai très peu de libertés pour décider comment je fais mon travail
Q8 - J’ai la possibilité d’influencer le déroulement de mon travail

>>Utilisation actuelle des compétences
Q2 - Dans mon travail, j’effectue des tâches répétitives
Q5 - Mon travail demande un haut niveau de compétence
Q7 - Dans mon travail, j’ai des activités variées

>>Développement des compétences
Q1 - Dans mon travail, je dois apprendre des choses nouvelles
Q3 - Mon travail me demande d’être créatif
Q9 - J’ai l’occasion de développer mes compétences professionnelles

>>Le score de latitude décisionnelle est donné par la formule :
                4*Q4+4*(5-Q6)+4*(Q8)+2*(5-Q2)+2*(Q5)+2*(Q7)+ 2*(Q1)+2*(Q3)+2*(Q9)
"""

'--docstring--\nL’axe « latitude décisionnelle »» regroupe:\n>>Latitude ou marges de manœuvre\nQ4 - Mon travail me permet de prendre souvent des décisions moi-même\nQ6 - Dans ma tâche, j’ai très peu de libertés pour décider comment je fais mon travail\nQ8 - J’ai la possibilité d’influencer le déroulement de mon travail\n\n>>Utilisation actuelle des compétences\nQ2 - Dans mon travail, j’effectue des tâches répétitives\nQ5 - Mon travail demande un haut niveau de compétence\nQ7 - Dans mon travail, j’ai des activités variées\n\n>>Développement des compétences\nQ1 - Dans mon travail, je dois apprendre des choses nouvelles\nQ3 - Mon travail me demande d’être créatif\nQ9 - J’ai l’occasion de développer mes compétences professionnelles\n\n>>Le score de latitude décisionnelle est donné par la formule :\n                4*Q4+4*(5-Q6)+4*(Q8)+2*(5-Q2)+2*(Q5)+2*(Q7)+ 2*(Q1)+2*(Q3)+2*(Q9)\n'

In [30]:
# Liste des variables concernées
latitude=["N6PrendrDcisionsDfaconAutonom","N5LibertDdciderComTravail","N8PeutDinfluencesTravail"]
utilisation=["N4RefairetoujoursMemChoses","NiveauEleveDqualifications","N7fairePlusieursChosesDifftes"]
competence=["ApprendreChosesNouvelles","PreuveDcreativit","N9DveloppHabiletsPerso"] 

In [31]:
# Calul du Score
data_imputed['Score_latitude_decisionnelle']=(data_imputed[latitude[0]].astype('float')*4 +
                                (5 - data_imputed[latitude[1]].astype('float'))*4 +
                                data_imputed[latitude[2]].astype('float')*4 +
                                (5 - data_imputed[utilisation[0]].astype('float'))*4 +
                                data_imputed[utilisation[1]].astype('float')*2 +
                                data_imputed[utilisation[2]].astype('float')*2 +
                                (data_imputed.loc[:,competence].astype('float').sum(axis=1))*2)

### Score pour le soutien social

In [32]:
"""--Docstring--
L’axe «soutien social» distingue le soutien professionnel ou émotionnel,
en provenance des supérieurs ou des collègues :

>>Le soutien professionnel- par les supérieurs :
Q22 - Mon supérieur réussit facilement à faire collaborer ses subordonnés
Q21 - Mon supérieur m’aide à mener ma tâche à bien- par les collègues :
Q23 - Les collègues avec qui je travaille sont des gens professionnellement compétents
Q26 - Les collègues avec qui je travaille m’aident à mener les tâches à bien

>>Le soutien émotionnel :- par les supérieurs
Q20 - Mon supérieur prête attention à ce que je dis
Q19 - Mon supérieur se sent concerné par le bien-être de ses subordonnés- par les collègues
Q25 - Les collègues avec qui je travaille sont amicaux
Q24 - Les collègues avec qui je travaille me manifestent de l’intérêt

>>Le score de soutien social est donné par la formule:
                            Q19+Q20+Q21+Q22+Q23+Q24+Q25+Q26
"""

'--Docstring--\nL’axe «soutien social» distingue le soutien professionnel ou émotionnel,\nen provenance des supérieurs ou des collègues :\n\n>>Le soutien professionnel- par les supérieurs :\nQ22 - Mon supérieur réussit facilement à faire collaborer ses subordonnés\nQ21 - Mon supérieur m’aide à mener ma tâche à bien- par les collègues :\nQ23 - Les collègues avec qui je travaille sont des gens professionnellement compétents\nQ26 - Les collègues avec qui je travaille m’aident à mener les tâches à bien\n\n>>Le soutien émotionnel :- par les supérieurs\nQ20 - Mon supérieur prête attention à ce que je dis\nQ19 - Mon supérieur se sent concerné par le bien-être de ses subordonnés- par les collègues\nQ25 - Les collègues avec qui je travaille sont amicaux\nQ24 - Les collègues avec qui je travaille me manifestent de l’intérêt\n\n>>Le score de soutien social est donné par la formule:\n                            Q19+Q20+Q21+Q22+Q23+Q24+Q25+Q26\n'

In [33]:
#Liste des variables concernées
soutien_prof=['N22MchefFaciliRealisationDuTravail','N23MchefRuessiFaireTavaillerGensEnsemble',
             'N24LesGensAvecQJTravailleSontQualifies','N29LesgenAcqjetravaillefacilitentlaralisationdutravail']

soutien_emo=['N20MchefprteAttentionCquejdis','N19MchefSeSoucieBientreTravailleurs',
            'N27Lesgensavecquijetravaillesontamicaux','N25LesGensAvecQjTravailleSintressentMoi']

liste_result = soutien_prof + soutien_emo

In [34]:
# Calcul du Score
data_imputed['Score_soutien_social'] = data_imputed.loc[:,liste_result].astype('float').sum(axis=1)

## Calcul des 4 Etats psychologiques de Karasek

In [35]:
"""--Docstring-- Les 4 Etats psychologiques de Karasek

Le travail actif : forte autonomie et forte exigence. 
Le salarié, même si une certaine pression est présente, 
dispose de suffisamment d’autonomie pour l’absorber et organiser son travail.

Le travail passif : faible autonomie et faible exigence. 
Le salarié n’a que peu de marge de manœuvre en termes d’organisation de son travail
mais ne subit pas de pression particulière.

Le travail détendu : forte autonomie et faible exigence. 
Dans ce cas, la pression est faible et le salarié a beaucoup de latitude 
pour s’organiser et faire le travail qui lui est demandé.

Le travail tendu : faible autonomie et forte exigence. La pire des situations. 
Le salarié subit une importante pression psychologique tout en n’ayant quasiment 
aucune marge de manœuvre pour s’adapter.

"""

'--Docstring-- Les 4 Etats psychologiques de Karasek\n\nLe travail actif : forte autonomie et forte exigence. \nLe salarié, même si une certaine pression est présente, \ndispose de suffisamment d’autonomie pour l’absorber et organiser son travail.\n\nLe travail passif : faible autonomie et faible exigence. \nLe salarié n’a que peu de marge de manœuvre en termes d’organisation de son travail\nmais ne subit pas de pression particulière.\n\nLe travail détendu : forte autonomie et faible exigence. \nDans ce cas, la pression est faible et le salarié a beaucoup de latitude \npour s’organiser et faire le travail qui lui est demandé.\n\nLe travail tendu : faible autonomie et forte exigence. La pire des situations. \nLe salarié subit une importante pression psychologique tout en n’ayant quasiment \naucune marge de manœuvre pour s’adapter.\n\n'

In [36]:
# Fonction de calcul des 4 états

def karasek_etat(row):
    # valeur de référence 'médiane' pour la demande psychologique
    demande_ref=data_imputed['Score_demande_psychologique'].median()
    
    # valeur de référence 'médiane' pour la latitude décisionnelle  
    latitude_ref=data_imputed['Score_latitude_decisionnelle'].median()
    
    if row['Score_demande_psychologique'] > demande_ref and row['Score_latitude_decisionnelle'] > latitude_ref:
        return 'Etat_Actif'
    elif row['Score_demande_psychologique'] > demande_ref and row['Score_latitude_decisionnelle'] <= latitude_ref:
        return 'Etat_Stress'
    elif row['Score_demande_psychologique'] <= demande_ref and row['Score_latitude_decisionnelle'] > latitude_ref:
        return 'Etat_Détendu'
    else:
        return 'Etat_Passif'

data_imputed['Etat_Karasek'] = data_imputed.apply(karasek_etat, axis=1)
data_imputed['Etat_Karasek'] = data_imputed['Etat_Karasek'].astype('category')

## Calcul des Scores Efforts/Récompenses suivant le modèle de SIGRIEST

In [37]:
# Documentation sur le modèle de SIEGRIST
lien_1="http://gemto.free.fr/qessiegrist.pdf"
print(lien_1)

http://gemto.free.fr/qessiegrist.pdf


In [38]:
# Définir les colonnes d'effort et de récompense
Efforts_items = ['N1JesuisConstPrisparLTempsCausChargeTravail',
                 'N10Montravailexigedallertrsvite',
                 'N11TravaillerTrsfortMentalement',
                 'N12MonTravaiEexigeDeffortsPhysiques',
                 'N13CesDernieresAnnesMTravailEstDevenuPlusExigeant']

Recompenses_items = ['N4JeRecoisRespectQjeMriteDmesSuprieurs',
                     'N7JeRecoisRespectQjeMeriteDmesCollgues',
                     'N10VuMesEffortsMesPerspectivDPromotionSatisfaisant',
                     'N11VuMesEffortMsalaireEstSatisfaisant',
                     'N5MaScuritDemploiEstLenace']

# Calculer la somme des scores d'effort et de récompense pour chaque ligne
data_imputed['Score_Efforts'] = data_imputed[Efforts_items].astype('float').sum(axis=1)
data_imputed['Score_Récompenses'] = data_imputed[Recompenses_items].astype('float').sum(axis=1)

# Facteur de correction basé sur le nombre d'items
correction = len(Recompenses_items) / len(Efforts_items)

# Calculer du rapport Equilibre_Efforts_Recompenses
data_imputed['Equilibre_Efforts_Récompenses'] = (data_imputed['Score_Efforts'] / data_imputed['Score_Récompenses']) * (correction)


## Renommer correctement certaines colonnes

In [39]:
data_imputed.rename(columns={'HaurairesTache':'Horaires_tâches',
                            'HyginedeVie':'Hygiène_vie',
                             'Arretmaladie':"Arrêt_maladie",
                            'ArreteDtravailler':"Arrêt_travail",
                            'TitrePost':'Titre_Post',
                            'statusalari':'Statut_salarié',
                            'conflitHierarchie':'Conflit_Hiérarchie',
                            'MaladiesProfl':'Maladies_Profil',
                            'Conflitcollgues':'Conflit_collègues',
                            'PasDproblmeSante':'Pas_de_problème_Santé',
                            'Conflitsubordonns':'Conflit_subordonnées',
                            'PasDconflit':'Pas_de_conflit'}, inplace=True)

# Remplacer salariré par salarié 
data_imputed['Statut_salarié'] = np.where(data_imputed['Statut_salarié'] == 'Salariré',
                                          'Salarié', data_imputed['Statut_salarié'])
data_imputed['Statut_salarié']=data_imputed['Statut_salarié'].astype('category')

## Exportation des données finales "avec les scores calculés"

In [40]:
data_imputed.to_excel(os.path.join(Répertoire,'Data_cleaned.xlsx'),
                      index=False, sheet_name='Tableau', engine='openpyxl')

#  Visualisation des données & Analyses Statistiques 

## Visualisation des Données

### Création de listes de variables pour les calculs

In [41]:
# Création de listes de variables pour les répartitions statistiques 
cat_list=data_imputed.loc[:,'sexe':'Pas_de_conflit'].columns.tolist()
cat_list.remove('age')
cat_list.insert(1,'group_age')

#Liste pour les scores de Karasek
var_list=data_imputed.loc[:,'Score_demande_psychologique':'Score_soutien_social'].columns.tolist()


### Répartition des caractéristiques sociodémographiques

In [42]:
from docx import Document
from docx.shared import Inches
from docx.enum.section import WD_ORIENT

# Créer un document Word
doc = Document()

# Mettre le document en format paysage
section = doc.sections[-1]
section.orientation = WD_ORIENT.LANDSCAPE
section.page_width, section.page_height = section.page_height, section.page_width

# Initialisation d'un dictionnaire pour stocker les tables de contingences
Pivot = {}

# Calcul des tables de contingence pour chaque variable catégorielle
for var in cat_list:
    if var not in ['Titre_Post', 'Hygiène_vie', 'Maladies_Profil']:
        pivot_table = data_imputed[var].astype('category').value_counts(normalize=True) * 100
        Pivot[var] = pivot_table

# Création et exportation des graphiques en barres
for var, value in Pivot.items():
    sns.set(style="whitegrid")
    palette = sns.color_palette("husl", len(value))
    
    table = pd.DataFrame({'Catégories': value.index, 'Pourcentage': value.values})
    
    plt.figure(figsize=(10, 6))
    ax = sns.barplot(x='Catégories', y='Pourcentage', hue='Catégories',
                     data=table, dodge=False)
    ax.set_xlabel('Catégories', fontsize=12, weight='bold')
    ax.set_ylabel('Pourcentage (%)', fontsize=12, weight='bold')
    ax.set_title(f'Répartition par {var}', fontsize=14, weight='bold')
    
    for p in ax.patches:
        percentage = p.get_height()
        text_offset = 10 if percentage > 5 else percentage / 2
        ax.annotate(f'{percentage:.1f}%',
                    (p.get_x() + p.get_width() / 2., p.get_height() - text_offset),
                    ha='center', va='center', 
                    fontsize=12, color='white', fontweight='bold')
    
    sns.despine(left=True, bottom=True)
    
    image_path = f'{var}_graphique.png'
    plt.savefig(image_path)
    plt.close()
    
    doc.add_picture(image_path, width=Inches(9))

# Création des camemberts pour les variables spécifiques
for var in ['Titre_Post', 'Hygiène_vie']:
    pivot_table = data_imputed[var].astype('category').value_counts(normalize=True) * 100
    
    plt.figure(figsize=(8, 8))
    plt.pie(pivot_table, labels=pivot_table.index, autopct='%1.1f%%', startangle=140,
            colors=sns.color_palette("husl", len(pivot_table)))
    plt.title(f'Répartition par {var}', fontsize=14, weight='bold')
    image_path = f'{var}_camembert.png'
    plt.savefig(image_path)
    plt.close()
    
    doc.add_picture(image_path, width=Inches(6))

# Sauvegarder le document Word
file_name = 'Caractéristiques Sociodémographiques graphiques.docx'
doc.save(os.path.join(Répertoire, file_name))


ModuleNotFoundError: No module named 'docx'

### Visualisation des Scores de Karasek en fonction des caractéristiques sociodémographiques

In [None]:
# Créer un document Word
doc_1 = Document()

# Mettre le document en format paysage
section = doc_1.sections[-1]
section.orientation = WD_ORIENT.LANDSCAPE
section.page_width, section.page_height = section.page_height, section.page_width
# Liste des variables à tracer
variables = cat_list[0:10]

# Tracer les données pour chaque variable
for var in variables:
    if var in data_imputed.columns:
        plt.figure(figsize=(10, 6))
        
        # Créer un scatter plot pour la variable en cours
        sns.scatterplot(data=data_imputed, x='Score_latitude_decisionnelle', y='Score_demande_psychologique',
                        hue=var, style=var, s=100)
        
        # Ajouter des lignes pour séparer les quadrants
        plt.axvline(x=data_imputed['Score_latitude_decisionnelle'].median(), color='gray', linestyle='--')
        plt.axhline(y=data_imputed['Score_demande_psychologique'].median(), color='gray', linestyle='--')

        # Ajouter des annotations pour chaque quadrant
        plt.text(data_imputed['Score_latitude_decisionnelle'].min(), data_imputed['Score_demande_psychologique'].max(),
                 'TENDUS', color='purple', fontsize=14)
        plt.text(data_imputed['Score_latitude_decisionnelle'].max(), data_imputed['Score_demande_psychologique'].max(),
                 'ACTIFS', color='teal', fontsize=14, ha='right')
        plt.text(data_imputed['Score_latitude_decisionnelle'].min(), data_imputed['Score_demande_psychologique'].min(),
                 'PASSIFS', color='teal', fontsize=14)
        plt.text(data_imputed['Score_latitude_decisionnelle'].max(), data_imputed['Score_demande_psychologique'].min(),
                 'DETENDUS', color='purple', fontsize=14, ha='right')

        # Labels et titre
        plt.title(f'Analyse par {var}')
        plt.xlabel('Latitude décisionnelle')
        plt.ylabel('Demande psychologique')

        # Ajouter une source au graphique
        plt.figtext(0.01, 0.01, "Source: Données d'enquêtes extraites de EPI", horizontalalignment='left', fontsize=8, color='black')
        plt.legend(title=var, loc='upper right')
        
        # Sauvegarder le graphique en tant que fichier PNG
        image_path = f'Analyse par {var}.png'
        plt.savefig(image_path)
        plt.close()
    
        doc_1.add_picture(image_path, width=Inches(9))

# Sauvegarder le document Word
file_name = 'Scores de Karasek et caractéristiques socio.docx'
doc_1.save(os.path.join(Répertoire, file_name))


## Analyses et tables statistiques 

### Tableaux statistiques Scores de Karasek et caractéristiques socio 

#### Fonction pour calculer tableau statistique Général sur l'échantillon 

In [None]:

def statistical_summary(data, variables_list):
    # Validation des données
    if not isinstance(data, pd.DataFrame):
        raise TypeError('data is not a pandas.DataFrame')

    summary_table = pd.DataFrame()

    # Calcul des statistiques pour chaque variable
    for var in variables_list:
        if not var in data.columns:
            raise ValueError(f'{var} not in data.columns')
        if not data[var].dtype in ['float','numeric']:
            raise TypeError(f'{var} is not a numeric/float dtype')

        summary = {
            'Min': data[var].min(),
            'Max': data[var].max(),
            'Mean': data[var].mean(),
            'Median': data[var].median(),
            'Variance': data[var].var(),
            'Std Dev': data[var].std(),
            'Total Observations': data[var].count()
        }

        summary_table[var] = pd.Series(summary)

    return summary_table.T  # Transposer pour avoir les variables en ligne


#### Fonction pour calculer Tableau Statistique Croisé avec variables catégorielles

In [None]:

def Cross_summary(data,targets_list,features_list):
    
    #librairie pour transformer une liste imbriquée en liste simple
    from itertools import chain
    
    # Validation des éléments d'entrée
    if not isinstance(data, pd.DataFrame):
        raise TypeError('data is not a pandas.DataFrame')
    
    for var in targets_list: # Variables continues ou numeriques
        if not (var in data.columns and data[var].dtype in ['float','numeric']):
            raise ValueError(f'{var} not in data.columns or not in dtype.["float","numeric"]')
    
    for var in features_list: # Variables catégorielles
        if not (var in data.columns and data[var].dtype in ['category']):
            raise ValueError(f'{var} not in data.columns or not in dtype.["category"]')

    labels = [data[var].unique() for var in features_list]
    labels = list(chain.from_iterable(labels)) # transformer les listes imbriquées en une liste unique
    a, b = labels.index('31-40 ans'), labels.index('41-50 ans')
    labels[a], labels[b]=labels[b],labels[a] # intervertir les places de deux labels 

    #Création d'un dictionnaire de mapping entre les labels et leur variable 
    Group_index={}
    
    for var in features_list:
        Group_index.update({label:f'{var}' for label in data[var].unique()})

    for score in targets_list:
        # Fusionner les catégories dans une colonne avec 'melt'
        data_melted = data.melt(id_vars=score, value_vars=features_list,
                          var_name=f'Statistiques: {score}', value_name='Categories')
    
        #Nombres d'observations par catégories
        obs=data_melted.groupby('Categories').size()
    
        # Calculer les statistiques descriptives pour chaque catégorie
        table_1 = data_melted.groupby('Categories')[score].agg(['min', 'max', 'mean', 'median', 'var','std'])
        table_1['obs']=obs

        #Les distributions de percentiles 1% 25% 50% 75% 99%
        table_2 = data_melted.groupby('Categories')[score].quantile([0.01,0.25,0.50,0.75,0.99]).unstack()
        table_2['obs']=obs
    
        # Renommer les colonnes
        table_1.columns = ['Minimum', 'Maximum', 'Mean', 'Median', 'Variance',
                       'Standart-deviation',"Observations par Categories"]
        table_2.columns = ['Percentile 1%','Percentile 25%', 'Percentile 50%', 
                       'Percentile 75%','Percentile 99%',"Observations par categories"]
    
        #Trier les valeurs des catégories 
        table_1.index=pd.Categorical(table_1.index, categories=labels, ordered=True)
        table_1=table_1.sort_index()
        table_2.index=pd.Categorical(table_2.index, categories=labels, ordered=True)
        table_2=table_2.sort_index()

        # Créer une nouvelle colonne qui contient les groupes en utilisant le mapping
        table_1['Caractéristiques'] = table_1.index.map(Group_index)
        table_2['Caractéristiques'] = table_2.index.map(Group_index)

        # Maintenant, créer un multi-index en utilisant le groupe et les index existants
        table_1 = table_1.set_index(['Caractéristiques', table_1.index])
        table_2 = table_2.set_index(['Caractéristiques', table_2.index])

        #Enregistrer les tables dans les dictionnaires correspondants
        print(f"TABLEAU STATISTIQUE DE {score} PAR CARACTERISTIQUES SOCIO-DEMOGRAPHIQUES")
        display(table_1)
        print(f"\n")
        print(f"TABLEAU DES DECILES DE {score} PAR CARACTERISTIQUES SOCIO-DEMOGRAPHIQUES")
        display(table_2)

#### Application des deux fonctions sur mes plages de valeurs

In [None]:
print(f"\n")
print("TABLEAU STATISTIQUE GENERAL SUR LES SCORES DE KARASEK DANS L'ECHANTILLON TOTAL")
display(statistical_summary(data_imputed, var_list))
print(f"\n")
Cross_summary(data_imputed,var_list,cat_list[0:10])



TABLEAU STATISTIQUE GENERAL SUR LES SCORES DE KARASEK DANS L'ECHANTILLON TOTAL


Unnamed: 0,Min,Max,Mean,Median,Variance,Std Dev,Total Observations
Score_demande_psychologique,15.0,31.0,25.538462,26.0,11.596154,3.405313,65.0
Score_latitude_decisionnelle,62.0,92.0,74.215385,74.0,48.015385,6.929313,65.0
Score_soutien_social,16.0,32.0,25.8,26.0,12.69375,3.562829,65.0




TABLEAU STATISTIQUE DE Score_demande_psychologique PAR CARACTERISTIQUES SOCIO-DEMOGRAPHIQUES


Unnamed: 0_level_0,Unnamed: 1_level_0,Minimum,Maximum,Mean,Median,Variance,Standart-deviation,Observations par Categories
Caractéristiques,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
sexe,Homme,23.0,31.0,27.0,27.0,8.521739,2.919202,24
sexe,Femme,15.0,31.0,24.682927,25.0,11.621951,3.409098,41
group_age,18-30 ans,15.0,31.0,24.892857,25.0,11.506614,3.39214,28
group_age,31-40 ans,22.0,31.0,26.875,27.0,8.916667,2.986079,16
group_age,41-50 ans,19.0,31.0,25.0,25.0,14.923077,3.86304,14
group_age,+50 ans,22.0,31.0,26.142857,25.0,9.47619,3.078342,7
Arrêt_maladie,Aucune fois,19.0,31.0,26.056604,26.0,9.323657,3.053466,53
Arrêt_maladie,Une fois,15.0,31.0,23.4,23.5,17.155556,4.141927,10
Arrêt_maladie,Deux fois ou plus,19.0,26.0,22.5,22.5,24.5,4.949747,2
Horaires_tâches,Le temps prescrit,15.0,29.0,24.962963,25.0,8.652422,2.9415,27




TABLEAU DES DECILES DE Score_demande_psychologique PAR CARACTERISTIQUES SOCIO-DEMOGRAPHIQUES


Unnamed: 0_level_0,Unnamed: 1_level_0,Percentile 1%,Percentile 25%,Percentile 50%,Percentile 75%,Percentile 99%,Observations par categories
Caractéristiques,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
sexe,Homme,23.0,25.0,27.0,30.0,31.0,24
sexe,Femme,16.6,22.0,25.0,27.0,30.2,41
group_age,18-30 ans,16.35,23.0,25.0,27.0,31.0,28
group_age,31-40 ans,22.0,25.5,27.0,29.0,31.0,16
group_age,41-50 ans,19.0,23.0,25.0,28.0,30.87,14
group_age,+50 ans,22.12,24.5,25.0,28.0,30.88,7
Arrêt_maladie,Aucune fois,19.52,24.0,26.0,28.0,31.0,53
Arrêt_maladie,Une fois,15.54,22.0,23.5,24.75,30.64,10
Arrêt_maladie,Deux fois ou plus,19.07,20.75,22.5,24.25,25.93,2
Horaires_tâches,Le temps prescrit,16.3,24.0,25.0,27.0,29.0,27


TABLEAU STATISTIQUE DE Score_latitude_decisionnelle PAR CARACTERISTIQUES SOCIO-DEMOGRAPHIQUES


Unnamed: 0_level_0,Unnamed: 1_level_0,Minimum,Maximum,Mean,Median,Variance,Standart-deviation,Observations par Categories
Caractéristiques,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
sexe,Homme,62.0,88.0,72.416667,70.0,55.297101,7.436202,24
sexe,Femme,64.0,92.0,75.268293,74.0,41.95122,6.476976,41
group_age,18-30 ans,66.0,92.0,74.357143,74.0,50.089947,7.077425,28
group_age,31-40 ans,62.0,86.0,74.0,73.0,59.2,7.694154,16
group_age,41-50 ans,64.0,88.0,74.857143,76.0,43.516484,6.596702,14
group_age,+50 ans,66.0,82.0,72.857143,70.0,41.142857,6.41427,7
Arrêt_maladie,Aucune fois,62.0,92.0,74.679245,74.0,51.683599,7.189131,53
Arrêt_maladie,Une fois,68.0,82.0,73.2,72.0,26.844444,5.181162,10
Arrêt_maladie,Deux fois ou plus,64.0,70.0,67.0,67.0,18.0,4.242641,2
Horaires_tâches,Le temps prescrit,66.0,92.0,74.37037,74.0,40.011396,6.325456,27




TABLEAU DES DECILES DE Score_latitude_decisionnelle PAR CARACTERISTIQUES SOCIO-DEMOGRAPHIQUES


Unnamed: 0_level_0,Unnamed: 1_level_0,Percentile 1%,Percentile 25%,Percentile 50%,Percentile 75%,Percentile 99%,Observations par categories
Caractéristiques,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
sexe,Homme,62.46,66.0,70.0,80.0,87.54,24
sexe,Femme,64.8,70.0,74.0,80.0,91.2,41
group_age,18-30 ans,66.0,69.5,74.0,76.0,91.46,28
group_age,31-40 ans,62.3,67.5,73.0,80.5,85.4,16
group_age,41-50 ans,64.26,70.0,76.0,79.5,86.96,14
group_age,+50 ans,66.12,68.0,70.0,78.0,81.88,7
Arrêt_maladie,Aucune fois,63.04,68.0,74.0,80.0,90.96,53
Arrêt_maladie,Une fois,68.0,70.0,72.0,75.0,82.0,10
Arrêt_maladie,Deux fois ou plus,64.06,65.5,67.0,68.5,69.94,2
Horaires_tâches,Le temps prescrit,66.52,70.0,74.0,76.0,91.48,27


TABLEAU STATISTIQUE DE Score_soutien_social PAR CARACTERISTIQUES SOCIO-DEMOGRAPHIQUES


Unnamed: 0_level_0,Unnamed: 1_level_0,Minimum,Maximum,Mean,Median,Variance,Standart-deviation,Observations par Categories
Caractéristiques,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
sexe,Homme,20.0,32.0,25.583333,25.0,13.818841,3.71737,24
sexe,Femme,16.0,32.0,25.926829,26.0,12.319512,3.509916,41
group_age,18-30 ans,20.0,32.0,26.178571,26.0,7.85582,2.802824,28
group_age,31-40 ans,20.0,32.0,27.5,28.5,12.8,3.577709,16
group_age,41-50 ans,17.0,30.0,25.071429,24.0,10.532967,3.245453,14
group_age,+50 ans,16.0,28.0,21.857143,22.0,17.47619,4.180453,7
Arrêt_maladie,Aucune fois,17.0,32.0,26.264151,26.0,10.082729,3.175331,53
Arrêt_maladie,Une fois,16.0,29.0,23.2,23.0,21.733333,4.661902,10
Arrêt_maladie,Deux fois ou plus,24.0,29.0,26.5,26.5,12.5,3.535534,2
Horaires_tâches,Le temps prescrit,16.0,32.0,26.37037,26.0,9.319088,3.052718,27




TABLEAU DES DECILES DE Score_soutien_social PAR CARACTERISTIQUES SOCIO-DEMOGRAPHIQUES


Unnamed: 0_level_0,Unnamed: 1_level_0,Percentile 1%,Percentile 25%,Percentile 50%,Percentile 75%,Percentile 99%,Observations par categories
Caractéristiques,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
sexe,Homme,20.0,24.0,25.0,27.75,32.0,24
sexe,Femme,16.4,24.0,26.0,28.0,31.6,41
group_age,18-30 ans,20.27,24.0,26.0,28.0,31.73,28
group_age,31-40 ans,20.3,25.5,28.5,30.0,32.0,16
group_age,41-50 ans,17.78,24.0,24.0,26.75,29.87,14
group_age,+50 ans,16.12,19.0,22.0,24.5,27.82,7
Arrêt_maladie,Aucune fois,18.56,24.0,26.0,29.0,32.0,53
Arrêt_maladie,Une fois,16.18,20.0,23.0,27.75,28.91,10
Arrêt_maladie,Deux fois ou plus,24.05,25.25,26.5,27.75,28.95,2
Horaires_tâches,Le temps prescrit,18.08,24.5,26.0,28.0,31.48,27


### Tableaux statistiques Etats Psychologiques et Caractéristiques socio 

#### Fonction pour calculer un tableau de répartition simple (%)

In [None]:

def category_distribution(data, var):
    # Validation des données
    if not isinstance(data, pd.DataFrame):
        raise TypeError('data is not a pandas.DataFrame')

    if var not in data.columns or data[var].dtype != 'category':
        raise TypeError(f'{var} not in data or not a <dtype.category>')
    
    # Calcul des fréquences et des pourcentages
    counts = data[var].value_counts()
    percentages = data[var].value_counts(normalize=True) * 100

    # Création du tableau
    distribution_table = pd.DataFrame({
        'Nombre d\'observations': counts,
        'Pourcentage (%)': percentages.round(2)
    })
        # Calcul des totaux
    total_counts = counts.sum()
    total_percentage = percentages.sum()

    # Ajout de la ligne des totaux
    distribution_table.loc['Total'] = [total_counts, total_percentage]
    
    print("REPARTITION GENERALE DES ETATS DE KARASEK DANS L'ECHANTILLON TOTAL")
    
    return distribution_table


#### Fonction pour calculer un tableau de répartition croisé avec d'autres variables (%)

In [None]:

def cross_table(data, target_var, features_list):
    
    # Initialisation d'une liste
    tables=[]
    
    #Validation des données
    if not isinstance(data,pd.DataFrame):
        raise TypeError('data is not a pandas.DataFrame')

    if not ((target_var in data.columns) and data[target_var].dtype=='category'):
        raise ValueError(f'{target_var} not in data or not a <dtype.category>')
    
    for var in features_list:
        if not (var in data.columns and data[var].dtype in ['category', 'bool']):
            raise TypeError(f'{var} not in data.columns or not in dtype.["category","bool"]')

    #Calcul des tables croisées pour différentes variables
    for var in data.loc[:,features_list].columns:
        cross= pd.crosstab(index=data[var], columns=data[target_var], normalize='index') * 100
        cross=cross.round(2)
        cross['Total %'] = np.round(cross.sum(axis=1),1)
        cross["Nombre d'observations"]=data[var].value_counts()
        tables.append(cross)

    Summary_table = pd.concat([cross_tab for cross_tab in tables], keys=features_list)

    print("REPARTITION DES 4 ETATS PSYCHOLOGIQUES PAR CARACTERISTIQUES SOCIO-DEMOGRAPHIQUES")
    return Summary_table

In [None]:
category_distribution(data_imputed,'Etat_Karasek')

REPARTITION GENERALE DES ETATS DE KARASEK DANS L'ECHANTILLON TOTAL


Unnamed: 0_level_0,Nombre d'observations,Pourcentage (%)
Etat_Karasek,Unnamed: 1_level_1,Unnamed: 2_level_1
Etat_Passif,22.0,33.85
Etat_Détendu,16.0,24.62
Etat_Stress,16.0,24.62
Etat_Actif,11.0,16.92
Total,65.0,100.0


In [None]:
cross_table(data_imputed,'Etat_Karasek',cat_list) 

REPARTITION DES 4 ETATS PSYCHOLOGIQUES PAR CARACTERISTIQUES SOCIO-DEMOGRAPHIQUES


Unnamed: 0,Etat_Karasek,Etat_Actif,Etat_Détendu,Etat_Passif,Etat_Stress,Total %,Nombre d'observations
sexe,Homme,16.67,16.67,29.17,37.5,100.0,24
sexe,Femme,17.07,29.27,36.59,17.07,100.0,41
group_age,18-30 ans,10.71,21.43,42.86,25.0,100.0,28
group_age,31-40 ans,25.0,18.75,31.25,25.0,100.0,16
group_age,41-50 ans,21.43,35.71,21.43,21.43,100.0,14
group_age,+50 ans,14.29,28.57,28.57,28.57,100.0,7
Arrêt_maladie,Aucune fois,20.75,24.53,28.3,26.42,100.0,53
Arrêt_maladie,Une fois,0.0,30.0,50.0,20.0,100.0,10
Arrêt_maladie,Deux fois ou plus,0.0,0.0,100.0,0.0,100.0,2
Horaires_tâches,Le temps prescrit,7.41,25.93,44.44,22.22,100.0,27


### Tableaux statistiques sur le Rapport Equilibre_Efforts_Récompenses de Siegrist

In [None]:
#liste de mes variables concernées
Siegrist_list=['Score_Efforts', 'Score_Récompenses', 'Equilibre_Efforts_Récompenses']

print(f"\n")
print("TABLEAU STATISTIQUE GENERAL SUR LES SCORES DE SIEGRIST DANS L'ECHANTILLON TOTAL")
display(statistical_summary(data_imputed, Siegrist_list))

print(f"\n")
Cross_summary(data_imputed,Siegrist_list,cat_list[0:10])



TABLEAU STATISTIQUE GENERAL SUR LES SCORES DE SIEGRIST DANS L'ECHANTILLON TOTAL


Unnamed: 0,Min,Max,Mean,Median,Variance,Std Dev,Total Observations
Score_Efforts,8.0,20.0,15.492308,16.0,6.660096,2.580716,65.0
Score_Récompenses,9.0,19.0,13.523077,13.0,3.753365,1.93736,65.0
Equilibre_Efforts_Récompenses,0.727273,1.9,1.167777,1.153846,0.06949,0.26361,65.0




TABLEAU STATISTIQUE DE Score_Efforts PAR CARACTERISTIQUES SOCIO-DEMOGRAPHIQUES


Unnamed: 0_level_0,Unnamed: 1_level_0,Minimum,Maximum,Mean,Median,Variance,Standart-deviation,Observations par Categories
Caractéristiques,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
sexe,Homme,12.0,19.0,16.791667,17.0,4.172101,2.042572,24
sexe,Femme,8.0,20.0,14.731707,14.0,6.65122,2.578996,41
group_age,18-30 ans,8.0,19.0,14.821429,15.0,6.744709,2.597058,28
group_age,31-40 ans,12.0,20.0,16.6875,17.0,5.429167,2.330057,16
group_age,41-50 ans,11.0,20.0,15.357143,15.5,7.17033,2.677747,14
group_age,+50 ans,12.0,19.0,15.714286,16.0,5.571429,2.360387,7
Arrêt_maladie,Aucune fois,8.0,20.0,15.566038,16.0,6.788824,2.605537,53
Arrêt_maladie,Une fois,10.0,19.0,15.3,16.0,7.788889,2.790858,10
Arrêt_maladie,Deux fois ou plus,14.0,15.0,14.5,14.5,0.5,0.707107,2
Horaires_tâches,Le temps prescrit,10.0,17.0,14.259259,14.0,3.507123,1.872731,27




TABLEAU DES DECILES DE Score_Efforts PAR CARACTERISTIQUES SOCIO-DEMOGRAPHIQUES


Unnamed: 0_level_0,Unnamed: 1_level_0,Percentile 1%,Percentile 25%,Percentile 50%,Percentile 75%,Percentile 99%,Observations par categories
Caractéristiques,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
sexe,Homme,12.23,15.0,17.0,18.25,19.0,24
sexe,Femme,8.8,13.0,14.0,17.0,20.0,41
group_age,18-30 ans,8.54,13.75,15.0,17.0,19.0,28
group_age,31-40 ans,12.15,16.0,17.0,18.25,19.85,16
group_age,41-50 ans,11.13,13.25,15.5,17.0,19.87,14
group_age,+50 ans,12.12,14.5,16.0,17.0,18.94,7
Arrêt_maladie,Aucune fois,9.56,14.0,16.0,17.0,20.0,53
Arrêt_maladie,Une fois,10.27,13.25,16.0,17.0,18.91,10
Arrêt_maladie,Deux fois ou plus,14.01,14.25,14.5,14.75,14.99,2
Horaires_tâches,Le temps prescrit,10.26,13.0,14.0,16.0,17.0,27


TABLEAU STATISTIQUE DE Score_Récompenses PAR CARACTERISTIQUES SOCIO-DEMOGRAPHIQUES


Unnamed: 0_level_0,Unnamed: 1_level_0,Minimum,Maximum,Mean,Median,Variance,Standart-deviation,Observations par Categories
Caractéristiques,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
sexe,Homme,10.0,17.0,13.416667,13.0,2.427536,1.558055,24
sexe,Femme,9.0,19.0,13.585366,13.0,4.59878,2.144477,41
group_age,18-30 ans,11.0,16.0,13.392857,13.0,1.80291,1.342725,28
group_age,31-40 ans,11.0,19.0,14.5,14.0,5.333333,2.309401,16
group_age,41-50 ans,9.0,17.0,13.428571,14.0,4.571429,2.13809,14
group_age,+50 ans,9.0,14.0,12.0,13.0,3.333333,1.825742,7
Arrêt_maladie,Aucune fois,9.0,19.0,13.679245,13.0,3.568215,1.888972,53
Arrêt_maladie,Une fois,9.0,16.0,12.6,13.0,4.711111,2.170509,10
Arrêt_maladie,Deux fois ou plus,13.0,15.0,14.0,14.0,2.0,1.414214,2
Horaires_tâches,Le temps prescrit,9.0,19.0,13.592593,13.0,3.558405,1.886373,27




TABLEAU DES DECILES DE Score_Récompenses PAR CARACTERISTIQUES SOCIO-DEMOGRAPHIQUES


Unnamed: 0_level_0,Unnamed: 1_level_0,Percentile 1%,Percentile 25%,Percentile 50%,Percentile 75%,Percentile 99%,Observations par categories
Caractéristiques,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
sexe,Homme,10.46,12.75,13.0,14.0,16.77,24
sexe,Femme,9.0,13.0,13.0,15.0,18.6,41
group_age,18-30 ans,11.27,12.75,13.0,14.0,16.0,28
group_age,31-40 ans,11.15,13.0,14.0,16.0,18.85,16
group_age,41-50 ans,9.13,12.25,14.0,15.0,16.74,14
group_age,+50 ans,9.06,11.0,13.0,13.0,13.94,7
Arrêt_maladie,Aucune fois,9.52,13.0,13.0,15.0,18.48,53
Arrêt_maladie,Une fois,9.09,11.25,13.0,13.75,15.91,10
Arrêt_maladie,Deux fois ou plus,13.02,13.5,14.0,14.5,14.98,2
Horaires_tâches,Le temps prescrit,9.78,13.0,13.0,14.0,18.48,27


TABLEAU STATISTIQUE DE Equilibre_Efforts_Récompenses PAR CARACTERISTIQUES SOCIO-DEMOGRAPHIQUES


Unnamed: 0_level_0,Unnamed: 1_level_0,Minimum,Maximum,Mean,Median,Variance,Standart-deviation,Observations par Categories
Caractéristiques,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
sexe,Homme,0.882353,1.9,1.26666,1.222527,0.04624,0.215035,24
sexe,Femme,0.727273,1.9,1.109893,1.0,0.075295,0.2744,41
group_age,18-30 ans,0.727273,1.461538,1.111312,1.076923,0.040415,0.201034,28
group_age,31-40 ans,0.842105,1.583333,1.172525,1.207143,0.049902,0.223387,16
group_age,41-50 ans,0.733333,1.9,1.188675,1.1,0.131318,0.362378,14
group_age,+50 ans,0.923077,1.9,1.340982,1.25,0.099128,0.314846,7
Arrêt_maladie,Aucune fois,0.727273,1.9,1.155588,1.166667,0.060542,0.246053,53
Arrêt_maladie,Une fois,0.769231,1.9,1.257212,1.228022,0.128463,0.358417,10
Arrêt_maladie,Deux fois ou plus,0.933333,1.153846,1.04359,1.04359,0.024313,0.155926,2
Horaires_tâches,Le temps prescrit,0.769231,1.555556,1.064738,1.0,0.035984,0.189694,27




TABLEAU DES DECILES DE Equilibre_Efforts_Récompenses PAR CARACTERISTIQUES SOCIO-DEMOGRAPHIQUES


Unnamed: 0_level_0,Unnamed: 1_level_0,Percentile 1%,Percentile 25%,Percentile 50%,Percentile 75%,Percentile 99%,Observations par categories
Caractéristiques,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
sexe,Homme,0.909412,1.153846,1.222527,1.384615,1.827167,24
sexe,Femme,0.729697,0.928571,1.0,1.25,1.851111,41
group_age,18-30 ans,0.738601,0.983333,1.076923,1.264423,1.449423,28
group_age,31-40 ans,0.849123,0.986111,1.207143,1.291209,1.577652,16
group_age,41-50 ans,0.750667,0.929762,1.1,1.288462,1.884111,14
group_age,+50 ans,0.936264,1.186813,1.25,1.470085,1.879333,7
Arrêt_maladie,Aucune fois,0.730424,0.944444,1.166667,1.285714,1.836444,53
Arrêt_maladie,Une fois,0.778,1.015625,1.228022,1.513258,1.869,10
Arrêt_maladie,Deux fois ou plus,0.935538,0.988462,1.04359,1.098718,1.151641,2
Horaires_tâches,Le temps prescrit,0.788178,0.925824,1.0,1.190476,1.519444,27
