# Importando Bibliotecas

In [1]:
import pandas as pd # Manipulação de Dados
from random import * # Geração de números aleatórios
import names # Geração de Nomes Aleatórios

# Carregando o Conjunto de Dados

In [2]:
# Carregando CSV
df_conflitos = pd.read_csv('HR_Attrition.csv')

# Calculando a Taxa de Satisfação

In [3]:
# Média das outras avaliações 
df_conflitos['Satisfaction'] = (df_conflitos['EnvironmentSatisfaction'] + df_conflitos['JobInvolvement'] + df_conflitos['JobSatisfaction'] + 
                                df_conflitos['RelationshipSatisfaction']  + df_conflitos['WorkLifeBalance'])/5

# Criando novo Conjunto de Dados 
---


In [4]:
# Criando um novo conjunto de dados a partir da coluna do ID do funcionário
df_fatores_conflitos = pd.DataFrame(df_conflitos['EmployeeNumber'])

# Criando Colunas com Fatores de Risco

In [5]:
# Idade
df_fatores_conflitos['Age'] = df_conflitos['Age'].apply(lambda x: 1 if x < 35 else 0)

In [6]:
# Estado Civil
df_fatores_conflitos['Marital'] = df_conflitos['MaritalStatus'].apply(lambda x: 1 if x == 'Single' else 0)

In [7]:
# Anos de Trabalho
df_fatores_conflitos['YearWork'] = df_conflitos['TotalWorkingYears'].apply(lambda x: 1 if x < 3 else 0)

In [8]:
# Senioridade
df_fatores_conflitos['JobLevel'] = df_conflitos['JobLevel'].apply(lambda x: 1 if x == 1 else 0)

In [9]:
# Área de Atuação
df_fatores_conflitos['JobRole'] = df_conflitos['JobRole'].apply(lambda x: 1 if x == 'Sales Representative' or x == 'Laboratory Technician' or x == 'Human Resources' else 0)

In [10]:
# Hora-extra
df_fatores_conflitos['OverTime'] = df_conflitos['OverTime'].apply(lambda x: 1 if x == 'Yes' else 0)

In [11]:
# Anos com Gerente Atual
df_fatores_conflitos['YearWithManage'] = df_conflitos['YearsWithCurrManager'].apply(lambda x: 1 if x < 1 else 0)

In [12]:
# Taxa de Satisfação
df_fatores_conflitos['Satisfaction'] = df_conflitos['Satisfaction'].apply(lambda x: 1 if x < 2 else 0)

In [13]:
# Salário
df_fatores_conflitos['Salary'] = df_conflitos['MonthlyIncome'].apply(lambda x: 1 if x < 4000 else 0)

In [14]:
# Viagem a Trabalho
df_fatores_conflitos['Travel'] = df_conflitos['BusinessTravel'].apply(lambda x: 0 if x != 'Non-Travel' else 1)

# Calculando Risco de Conflito
---
Soma dos fatores de risco de conflito

In [15]:
df_fatores_conflitos['AttritionRisk'] = df_fatores_conflitos.loc[:, ['Age', 'Marital', 'YearWork', 'JobLevel', 'JobRole',
       'OverTime', 'YearWithManage', 'Satisfaction', 'Salary', 'Travel']].sum(axis=1)

# Adicionando dados dos funcionários
---

Para poder criar um painel de acompanhamento dos funcionários, serão adicionados fotos e nomes aleatórios para cada ID de funcionário simulando o as informações privadas de uma empresa.

## Extraindo o gênero de cada ID de Funcionários

In [16]:
df_fatores_conflitos['Gender'] = df_conflitos['Gender']

## Adicionando nomes aleatórios para cada Id de funcionário baseado no seu gênero

In [17]:
df_fatores_conflitos['Name'] = df_fatores_conflitos['Gender'].apply(lambda x: names.get_full_name(gender='male') if x == 'Male' else names.get_full_name(gender='female'))

## Adicionando fotos aleatórias para cada Id de funcionário baseado no seu gênero
---
Fotos retiradas do servidor da datatraining, link do projeto de referência: 
https://my.datatraining.io/course?courseid=howtopowerbifiles

In [18]:
male = [1,4,6,7,8,9] # Lista de id's das fotos masculinas
female = [2,3,5,10,11] # Lista de id's das fotos femininas

df_fatores_conflitos['Photo'] = df_fatores_conflitos['Gender'].apply(lambda x: 'https://datatraining.io/users/user{}_round.png'.format(choice(male)) if x == 'Male' else 'https://datatraining.io/users/user{}_round.png'.format(choice(female))) 

## Reordenando colunas do conjutno de dados

In [19]:
df_fatores_conflitos = df_fatores_conflitos[['EmployeeNumber', 'Name', 'Age', 'Marital', 'YearWork', 'JobLevel', 'JobRole',
       'OverTime', 'YearWithManage', 'Satisfaction', 'Salary', 'Travel',
       'Gender', 'Photo', 'AttritionRisk']]

# Criando CSV do novo conjunto de Dados

In [None]:
df_fatores_conflitos.to_csv('HR_staff.csv')