# Étude de l'étique des données

Il s'agit dans un document mettant en évidence l'appropriation de la méthodologie proposée pour avoir une démarche éthique traçant des choix justifiés par rapport aussi aux échanges qu'il y a eu dans l'équipe pendant toutes les phases du projet de la préparation du jeu de données à la proposition de pistes d'amélioration à votre client. En plus de la démarche, voici la mise en évidence les décisions qui ont été prises dans l'équipe ainsi que les points de vigilance ou de contrôle à mettre en place par rapport aux problématiques éthiques rencontrées.

Les questions accessibles depuis ce [site](https://digital-strategy.ec.europa.eu/en/library/assessment-list-trustworthy-artificial-intelligence-altai-self-assessment) pourront guider cette démarche. Le fichier PDF téléchargeable donne les principales questions à se poser pour valider qu'un projet d'IA est éthique selon 7 exigences recommandées par la Commission Européenne :
* respect de l'autonomie humaine
* robustesse technique et sécurité
* confidentialité et gouvernance des données
* transparence
* diversité, non-discrimination et équité
* bien-être environnemental et sociétal
* responsabilité

## Données du service des ressources humaines

Pour chaque employé, le service des ressources humaines possède les informations suivantes :

### general_data.csv

|Label|Description|Type de data|Nullable|Exemple
|:--|:--|:--|:--|:--|
|Age|L'âge de l'employé en 2015|entier|Non|24, 51, 30, ...|
|Attrition|L'objet de notre étude, est-ce que l'employé a quitté l'entreprise durant l'année 2016 ?|booleen|Non| Yes ou No|
|BusinessTravel| A quel fréquence l'employé a été amené à se déplacer dans le cadre de son travail en 2015 ?| chaine de caractères |Non|Non-Travel = jamais, Travel_Rarely= rarement, Travel_Frequently = fréquemment|
|DistanceFromHome|Distance en km entre le logement de l'employé et l'entreprise|entier|Non|6, 10, ...|
|Education|Niveau d'étude|entier|Non|1=Avant College (équivalent niveau Bac), 2=College (équivalent Bac+2), 3=Bachelor (Bac+3), 4=Master (Bac+5) et 5=PhD (Thèse de doctorat)|
|EducationField| Domaine d'étude, matière principale|CdC|Non| Life Sciences, Medical, Other, ...|
|EmployeeCount|Si l'employé était compté dans les effectifs en 2015|booléen|Non|1 si l'employé était compté dans les effectifs en 2015|
|EmployeeId|l'identifiant d'un employé|entier|Non|1, 2, ...|
|Gender|Sexe de l'employé|CdC|Non|Female, Male|
|JobLevel| Niveau hiérarchique dans l'entreprise|entier|Non|De 1 à 5|
|JobRole|Métier dans l'entreprise|CdC|Non|Research Scientist, Sales Executive, ...|
|MaritalStatus|Statut marital du salarié|CdC|Non|Célibataire, Marié ou Divorcé|
|MonthlyIncome|Salaire brut en roupies par mois|entier|Non|23420, 193280, 103330, ...|
|NumCompaniesWorked|Nombre d'entreprises pour lequel le salarié a travaillé avant de rejoindre HumanForYou|entier|Non|0, 1, 2, ...|
|Over18|Est-ce que le salarié a plus de 18 ans ou non ?|caractère|Non|Y, N|
|PercentSalaryHike|% d'augmentation du salaire en 2015|entier|Non|11, 23, 15, ...|
|StandardHours|Nombre d'heures par jour dans le contrat du salarié|entier|Non|8, ...|
|StockOptionLevel|Niveau d'investissement en actions de l'entreprise par le salarié|entier|Non|0, 1, 2, ...|
|TotalWorkingYears|Nombre d'années d'expérience en entreprise du salarié pour le même type de poste|entier|Non|0, 1, 2, ...|
|TrainingTimesLastYear|Nombre de jours de formation en 2015|entier|Non|0, 1, 2, ...|
|YearsAtCompany|Ancienneté dans l'entreprise|entier|Non|0, 1, 2, ...|
|YearsSinceLastPromotion|Nombre d'années depuis la dernière augmentation individuelle|entier|Non|0, 1, 2, ...|
|YearsWithCurrManager|Nombre d'années de collaboration sous la responsabilité du manager actuel de l'employé|entier|Non|0, 1, 2, ...|

## Dernière évaluation du manager

Ce fichier contient la dernière évaluation de chaque employé faite pas son manager en février 2015.

### manager_survey_data.csv

|Label|Description|Type de data|Nullable|Exemple
|:--|:--|:--|:--|:--|
|EmployeeID|l'identifiant d'un employé|entier|Non|1, 2, ...|
|JobInvolvement|Une évaluation de son implication dans son travail|entier|Non| 1 ('Faible'), 2 ("Moyenne"), 3 ("Importante") ou 4 ("Très importante")|
|PerformanceRating|Une évaluation de son niveau de performance annuel pour l'entreprise|entier|Non| 1 ('Faible'), 2 ("Bon"), 3 ("Excellent") ou 4 ("Au delà des attentes")|

## Enquête qualité de vie au travail

Ce fichier provient d'une enquête soumise aux employés en juin 2015 par le service RH pour avoir un retour concernant leur qualité de vie au travail.

Une organisation avait été mise en place pour que chacun puisse répondre à ce questionnaire sur son lieu de travail en concertation avec les managers mais il n'y avait pas d'obligation.

### employee_survey_data.csv

|Label|Description|Type de data|Nullable|Exemple
|:--|:--|:--|:--|:--|
|EmployeeID|l'identifiant d'un employé|entier|Non|1, 2, ...|
|EnvironmentSatisfaction|Satisfaction de l'environnement de travail|entier|Oui| 1 ('Faible'), 2 ("Moyenne"), 3 ("Élevé") ou 4 ("Très élevé")|
|JobSatisfaction|Son travail|entier|Oui| De 1 à 4|
|WorkLifeBalance|Son équilibre entre vie professionnelle et vie privée|entier|Oui| 1 ("Mauvais"), 2 ("Satisfaisant"), 3 ("Très satisfaisant") ou 4 ("Excellent")|

## Horaires de travail

Des badgeuses sont installées et utilisées dans l'entreprise depuis quelques années. Il a été jugé opportun par la direction de vous transmettre les horaires d'entrée et de sortie des employés sur une période de l'année choisie représentative d'une activité moyenne pour l'ensemble des services.

Il y a donc 2 fichiers traçants les horaires d'arrivée à leur poste et de départ de leur poste de l'ensemble des employés par date sur une période allant du 1er janvier au 31 décembre 2015.

### in_out_time.zip

#### in_time.csv

|Label|Description|Type de data|Nullable|Exemple|
|:--|:--|:--|:--|:--|
|EmployeeID|l'identifiant d'un employé|entier|Non|1, 2, ...|
|2015-01-01 <br/>2015-01-02 <br/> ...|Date de l'entrée|date heure|Oui|2015-01-02 09:43:45, 2015-01-02 09:44:45, ...|

#### out_time.csv

|Label|Description|Type de data|Nullable|Exemple|
|:--|:--|:--|:--|:--|
|EmployeeID|l'identifiant d'un employé|entier|Non|1, 2, ...|
|2015-01-01 <br/>2015-01-02 <br/> ...|Date de l'entrée|date heure|Oui|2015-01-02 09:43:45, 2015-01-02 09:44:45, ...|