#<font color = darkblue> Análise Exploratória (Qual é o maior motivo dos funcionarios sairem da empresa?)




### Importando bibliotecas para uso

In [None]:
import pandas as pd
import numpy as np

### Importando arquivo para análise

In [None]:
#Importando o arquivo xlsx
df = pd.read_excel('Projeto_Individual.xlsx')
#Renomeando as colunas
df = df.rename(columns={'Unnamed: 0':'A','Unnamed: 1':'Causas de saída','Unnamed: 2':'Capacidade de Impactar','Unnamed: 3':'Parceiro RH', 'Unnamed: 4':'Entrevista de saída(ex-funcionario)'})
df

Unnamed: 0,A,Causas de saída,Capacidade de Impactar,Parceiro RH,Entrevista de saída(ex-funcionario)
0,,,,,
1,,Dados,,,
2,,,,,
3,,,Ability to impact,HRBP,Exit survey
4,,Training,11,31,23
5,,Conflict with others,10,11,15
6,,Lack of recognition,9,65,44
7,,Workload,8,14,39
8,,Career advancement,7,137,171
9,,Pay,6,16,24


- Tratando o arquivo para eliminar as linhas e colunas nulas

In [None]:
#Eliminar a coluna que só tem valores nulos
df = df.drop('A', axis=1)

In [None]:
#Eliminar as linhas com valores nulos, ou com valores que não vão ser utilizados na nossa análise
df = df.drop([0,1,2,3], axis=0)

In [None]:
#Traduzindo o nome das linhas
df.at[4,'Causas de saída'] = 'Treinamento'
df.at[5,'Causas de saída'] = 'Conflito com outros'
df.at[6,'Causas de saída'] = 'Falta de reconhecimento'
df.at[7,'Causas de saída'] = 'Carga horária'
df.at[8,'Causas de saída'] = 'Progressão de carreira'
df.at[9,'Causas de saída'] = 'Remuneração'
df.at[10,'Causas de saída'] = 'Tipo de trabalho'
df.at[11,'Causas de saída'] = 'Mudança de carreira'
df.at[12,'Causas de saída'] = 'Trajeto'
df.at[13,'Causas de saída'] = 'Realocação'
df.at[14,'Causas de saída'] = 'Doença'

In [None]:
df

Unnamed: 0,Causas de saída,Capacidade de Impactar,Parceiro RH,Entrevista de saída(ex-funcionario)
4,Treinamento,11,31,23
5,Conflito com outros,10,11,15
6,Falta de reconhecimento,9,65,44
7,Carga horária,8,14,39
8,Progressão de carreira,7,137,171
9,Remuneração,6,16,24
10,Tipo de trabalho,5,128,78
11,Mudança de carreira,4,18,30
12,Trajeto,3,31,22
13,Realocação,2,105,37


- Vamos verificar o qual é o tipo de valores no nosso DataFrame, para fazer a conversão se necessário.

In [None]:
df.dtypes

Causas de saída                        object
Capacidade de Impactar                 object
Parceiro RH                            object
Entrevista de saída(ex-funcionario)    object
dtype: object

- Com todas as colunas do tipo 'object' nós não conseguimos fazer determinadas funções, então precisamos mudar nas colunas e linhas que são números para o tipo 'int

In [None]:
#Convertendo o tipo de valor das colunas
df['Capacidade de Impactar'] = df['Capacidade de Impactar'].astype(int)
df['Parceiro RH'] = df['Parceiro RH'].astype(int)
df['Entrevista de saída(ex-funcionario)'] = df['Entrevista de saída(ex-funcionario)'].astype(int)

In [None]:
#Verificando se a conversão foi feita com sucesso
df.dtypes

Causas de saída                        object
Capacidade de Impactar                  int64
Parceiro RH                             int64
Entrevista de saída(ex-funcionario)     int64
dtype: object

###Análise

- Para nossa análise exploratória iremos utilizar o Parceiro RH(HRBP) que é uma empresa ou pessoa qualificada para análisar o fluxo de funcionarios, e a entrevista de saída que são feitas com os funcionarios que estão deixando a empresa

In [None]:
# Para isso vamos apagar a coluna Capacidade de Impactar
df = df.drop('Capacidade de Impactar', axis=1)

In [None]:
df

Unnamed: 0,Causas de saída,Parceiro RH,Entrevista de saída(ex-funcionario)
4,Treinamento,31,23
5,Conflito com outros,11,15
6,Falta de reconhecimento,65,44
7,Carga horária,14,39
8,Progressão de carreira,137,171
9,Remuneração,16,24
10,Tipo de trabalho,128,78
11,Mudança de carreira,18,30
12,Trajeto,31,22
13,Realocação,105,37


- Para verificar qual é o maior causador de saídas, segundo os ex-funcionarios vamos utilizar a função max(), que ela irá identificar o maior valor da coluna e para a nossa análise vai ser o suficiente para verificar o maior causador de saídas nessa primeira parte.

In [None]:
#Com o comando max, verificamos qual é o maior valor da coluna
df['Entrevista de saída(ex-funcionario)'].max()

171

- - O maior causador de saídas segundo os ex-funcionarios seria a progressão de carreira, a oportunidade de crescimento dentro da empresa.

- Agora vamos verificar segundo o Parceiro RH(HRBP) qual é o maior causador de saídas

In [None]:
df['Parceiro RH'].max()

137

- - Segundo o Parceiro RH, o maior causador de saídas da empresa também é a progressão de carreira

### Conclusão

- <font color = darkblue> Com base na análise exploratória realizada, concluímos que o principal motivo para a saída dos funcionários é a progressão de carreira. Isso indica que os funcionários estão buscando oportunidades de crescimento e desenvolvimento em suas carreiras, e podem não estar encontrando essas oportunidades dentro da empresa. É importante que a empresa avalie suas políticas de progressão de carreira e desenvolvimento profissional para garantir que os funcionários tenham oportunidades de crescimento e se sintam valorizados. Isso pode ajudar a reter talentos e reduzir a rotatividade de funcionários.

### Links para visualização dos gráficos e do dashboard


- Mapa de árvore:

https://public.tableau.com/app/profile/jo.o.vitor.cunha/viz/Mapadervore_16931680767340/Mapadervore

- Gráfico de barras duplas:

https://public.tableau.com/app/profile/jo.o.vitor.cunha/viz/GrficodeBarrasLadoaLado/GrficodeBarras

- Gráfico de barras horizontais:

https://public.tableau.com/app/profile/jo.o.vitor.cunha/viz/GrficodeBarrasHorizontais/GrficodeBarrasDeitadas

- Dashboard com interação no mapa de árvore:

https://public.tableau.com/app/profile/jo.o.vitor.cunha/viz/DashboardMdulo5/Dashboard