# Análise da Qualidade na Central de Atendimento

## Introdução

Uma empresa de Contact Center fez uma pesquisa no momento da contratação de um grupo de colaboradores (agentes de atendimento) através do <a href="https://pt.surveymonkey.com/">Survey Monkey</a>. Após 6 meses da contratação verificou se quais colaboradores atingiram um bom desempenho de Qualidade e dos indicadores operacionais.

Antes de criar um modelo que possa ser utilizado para entender os fatores mais associados a uma boa performance futura, o time de Atendimento ao Cliente precisa processar os dados brutos da ferramenta de pesquisa e realizar algumas análises exploratóri para a preparação dos dados.

## Objetivo

Preparar um plano de ação definindo quais iniciativas a empresa deve priorizar visando aumentar a performance dos times de atendimento e, consequentemente, tornar os resultados operacionais da empresa mais relevantes no médio prazo. 

### Perguntas de negócio a serem respondidas
- Quais fatores afetam a produtividade dos times?
- Quais fatores possuem maior correlação com a performance dos colaboradores?
- Quais as ações que a empresa deve tomar visando para aprimorar a performance dos seus colaboradores?

### Conhecendo as bases de dados
Para a execução deste projeto, serão utilizadas 3 bases de dados:
- **dados_contact_center_survey.csv:** contém as informações brutas extraídas do <a href="https://pt.surveymonkey.com/">Survey Monkey</a>;
- **dados_contact_center_survey_desempenho.csv:** contém as informações de desempenho dos funcionários;
- **dados_contact_center_survey_processado.csv:** contém o formato dos dados que o time de contact center esperar receber os dados para a análise exploratório.

## Execução do Projeto
Para a execução das atividades propostas neste estud serão necessárias 4 etapas:
- Importação de requisitos e bases de dados;
- Preparação dos dados;
- Análise exploratória dos dados (EDA);
- Definição de plano de ação.

### Importação de requisitos e base de dados
É é necessário realizar a importação de três bibliotecas Phython;
- Numpy;
- Pandas;
- Ydata Profiling;
- Sweetviz.

In [26]:
# Importando as bibliotecas necessárias para a realização deste estudo
import numpy as np
import pandas as pd
from ydata_profiling import ProfileReport
import sweetviz as sv

# Importando os dados brutos
df_bruto = pd.read_csv('dados_contact_center_survey.csv', 
                       sep = ";", 
                       low_memory=False, 
                       header=[0,1])
df_bruto.head()



Unnamed: 0_level_0,Unnamed: 0_level_0,Unnamed: 1_level_0,Você está trabalhando no Campus ou em Casa?,Unnamed: 3_level_0,Qual o tempo gasto no trajeto da sua residência até a empresa?,Unnamed: 5_level_0,Unnamed: 6_level_0,Unnamed: 7_level_0,Unnamed: 8_level_0,Qual a sua escolaridade?,...,Pessoas fortes vêm de ambientes competitivos.,Unnamed: 309_level_0,Unnamed: 310_level_0,Unnamed: 311_level_0,Unnamed: 312_level_0,Gosto de ter um trabalho exigente.,Unnamed: 314_level_0,Unnamed: 315_level_0,Unnamed: 316_level_0,Unnamed: 317_level_0
Unnamed: 0_level_1,Id_Agente,Cliente,1 - Campus,1 - Casa,2 - Até 30min,2 - De 30min à 1h,2 - De 1h à 1h30,2 - De 1h30 à 2h,2 - Acima de 2h,3 - Ensino Médio completo,...,64 - 5 - Concordo totalmente,64 - 4 - Concordo,64 - 3 - Indiferente,64 - 2 - Discordo,64 - 1 - Discordo totalmente,65 - 5 - Concordo totalmente,65 - 4 - Concordo,65 - 3 - Indiferente,65 - 2 - Discordo,65 - 1 - Discordo totalmente
0,1,Cliente 1,0,1,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
1,2,Cliente 2,0,1,0,0,0,0,0,1,...,0,0,0,0,0,0,0,0,0,0
2,3,Cliente 2,0,1,0,0,0,0,0,0,...,0,1,0,0,0,0,0,0,1,0
3,4,Cliente 3,0,1,0,0,0,0,0,0,...,0,0,0,1,0,0,0,1,0,0
4,5,Cliente 4,0,1,0,0,0,0,0,1,...,0,0,1,0,0,0,0,1,0,0


In [4]:
# Importando os dados de desempenho
df_desempenho = pd.read_csv('dados_contact_center_survey_desempenho.csv', 
                       sep = ";", 
                       low_memory=False)
df_desempenho.head()

Unnamed: 0,Id_Agente,Target
0,1,1
1,2,1
2,3,1
3,4,0
4,5,0


In [3]:
# Importando o formato esperado pelo time de Atendimento ao Cliente para a Análise Exploratória
df_processado = pd.read_csv('dados_contact_center_survey_processado.csv',
                           sep = ";")

df_processado.head()

Unnamed: 0,Id_Agente,P 01: Você está trabalhando no Campus ou em Casa?,P 02: Qual o tempo gasto no trajeto da sua residência até a empresa?,P 03: Qual a sua escolaridade?,P 04: Qual a sua área de estudo?,P 05: Você possui dependentes?,P 06: Quantos dependentes você possui?,P 07: Qual seu conhecimento em inglês?,P 08: Qual seu conhecimento em espanhol?,"P 09: Antes de trabalhar na empresa, você tinha experiência em Contact Center?",...,P 58: Os melhores resultados vêm do trabalho em equipe.,P 59: Baseio meu trabalho em relações interpessoais.,P 60: Fico tenso quando estou trabalhando.,P 61: Providencio soluções para os meus problemas com rapidez.,P 62: Demonstro meu valor nas horas difíceis.,P 63: Falta de tempo não me assusta.,P 64: Pessoas fortes vêm de ambientes competitivos.,P 65: Gosto de ter um trabalho exigente.,Cliente,Target
0,1,1 - Casa,0 - Sem resposta,3 - Ensino Superior incompleto,4 - Humanas,5 - Não,0 - Sem resposta,7 - Intermediário,8 - Intermediário,9 - Não,...,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,Cliente 1,1
1,2,1 - Casa,0 - Sem resposta,3 - Ensino Médio completo,0 - Sem resposta,5 - Não,0 - Sem resposta,7 - Não tenho conhecimento em inglês,8 - Não tenho conhecimento em espanhol,9 - Sim,...,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,Cliente 2,1
2,3,1 - Casa,0 - Sem resposta,3 - Ensino Superior cursando,4 - Gestão de Pessoas/Negócios,5 - Não,0 - Sem resposta,7 - Intermediário,8 - Não tenho conhecimento em espanhol,9 - Sim,...,58 - 4 - Concordo,59 - 2 - Discordo,60 - 3 - Indiferente,61 - 3 - Indiferente,62 - 4 - Concordo,63 - 3 - Indiferente,64 - 4 - Concordo,65 - 2 - Discordo,Cliente 2,1
3,4,1 - Casa,0 - Sem resposta,3 - Ensino Superior concluído,4 - Saúde,5 - Não,0 - Sem resposta,7 - Básico,8 - Não tenho conhecimento em espanhol,9 - Não,...,58 - 4 - Concordo,59 - 4 - Concordo,60 - 4 - Concordo,61 - 4 - Concordo,62 - 4 - Concordo,63 - 3 - Indiferente,64 - 2 - Discordo,65 - 3 - Indiferente,Cliente 3,0
4,5,1 - Casa,0 - Sem resposta,3 - Ensino Médio completo,0 - Sem resposta,5 - Não,0 - Sem resposta,7 - Avançado,8 - Básico,9 - Não,...,58 - 4 - Concordo,59 - 4 - Concordo,60 - 3 - Indiferente,61 - 4 - Concordo,62 - 4 - Concordo,63 - 4 - Concordo,64 - 3 - Indiferente,65 - 3 - Indiferente,Cliente 4,0


### Preparação dos dados

Perceba que para a base de dados bruta extraida do <a href="https://pt.surveymonkey.com/">Survey Monkey</a> está dividida em duas linhas de cabeçalho. Por isso, vamos ajustar o mesmo e, dessa forma, possamos atender ao formado esperado pela área de contact center.

In [18]:
# Identificação do índice dos textos das questões com problema de cabeçalho
indices = [i for i,c in enumerate(df_bruto.columns)
          if not c[0].startswith('Unnamed')]

# Obtenção do texto da questão

questoes = [c[0] for c in df_bruto.columns
           if not c[0].startswith('Unnamed')]

# Definição das fatias do DataFrame
fatias = [slice(i,j) for i,j in zip(indices, indices[1:] + [None])]

# Cria lista para armazenar cada fatia tratada do DataFrame
data = []

for i, q in enumerate(fatias):

    # Obtém a variável Id_Agente para utilizar como índice
    d = pd.concat([df_bruto.iloc[:,0], df_bruto.iloc[:,fatias[i]]], axis=1)
    
    # Empilha as diversas respostas possíveis em 1 variável
    d = d.melt(id_vars = 'Id_Agente', var_name=questoes[i], col_level=1)
    
    # Seleciona apenas os registros que tiveram resposta
    d = d.loc[d['value'] == 1]
    
    # Define Id_Agente como índice
    d.index = d['Id_Agente']
    
    # Elimina as variáveis Id_Agente e value para evita repetições
    d.drop(['Id_Agente', 'value'], axis=1, inplace=True)
    
    # Adiciona a fatia na lista
    data.append(d)

# Preparação das variáveis extra questões
df_prim = df_bruto.iloc[:,0:2].copy()
df_prim.columns = df_prim.columns.droplevel(0)
df_prim.index = df_prim['Id_Agente']

# Unificação dos dados
data.insert(0,df_prim)

df_corrigido = pd.concat(data, axis=1)
df_corrigido.fillna('0 - Sem resposta', inplace=True)
df_corrigido.reset_index(drop=True, inplace=True)
df_corrigido.head()


Unnamed: 0,Id_Agente,Cliente,Você está trabalhando no Campus ou em Casa?,Qual o tempo gasto no trajeto da sua residência até a empresa?,Qual a sua escolaridade?,Qual a sua área de estudo?,Você possui dependentes?,Quantos dependentes você possui?,Qual seu conhecimento em inglês?,Qual seu conhecimento em espanhol?,...,A maioria das pessoas precisam de algum tipo de apoio.,É bom trabalhar com meus colegas de trabalho.,Os melhores resultados vêm do trabalho em equipe.,Baseio meu trabalho em relações interpessoais.,Fico tenso quando estou trabalhando.,Providencio soluções para os meus problemas com rapidez.,Demonstro meu valor nas horas difíceis.,Falta de tempo não me assusta.,Pessoas fortes vêm de ambientes competitivos.,Gosto de ter um trabalho exigente.
0,1,Cliente 1,1 - Casa,0 - Sem resposta,3 - Ensino Superior incompleto,4 - Humanas,5 - Não,0 - Sem resposta,7 - Intermediário,8 - Intermediário,...,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta
1,2,Cliente 2,1 - Casa,0 - Sem resposta,3 - Ensino Médio completo,0 - Sem resposta,5 - Não,0 - Sem resposta,7 - Não tenho conhecimento em inglês,8 - Não tenho conhecimento em espanhol,...,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta
2,3,Cliente 2,1 - Casa,0 - Sem resposta,3 - Ensino Superior cursando,4 - Gestão de Pessoas/Negócios,5 - Não,0 - Sem resposta,7 - Intermediário,8 - Não tenho conhecimento em espanhol,...,56 - 5 - Concordo totalmente,57 - 4 - Concordo,58 - 4 - Concordo,59 - 2 - Discordo,60 - 3 - Indiferente,61 - 3 - Indiferente,62 - 4 - Concordo,63 - 3 - Indiferente,64 - 4 - Concordo,65 - 2 - Discordo
3,4,Cliente 3,1 - Casa,0 - Sem resposta,3 - Ensino Superior concluído,4 - Saúde,5 - Não,0 - Sem resposta,7 - Básico,8 - Não tenho conhecimento em espanhol,...,56 - 4 - Concordo,57 - 4 - Concordo,58 - 4 - Concordo,59 - 4 - Concordo,60 - 4 - Concordo,61 - 4 - Concordo,62 - 4 - Concordo,63 - 3 - Indiferente,64 - 2 - Discordo,65 - 3 - Indiferente
4,5,Cliente 4,1 - Casa,0 - Sem resposta,3 - Ensino Médio completo,0 - Sem resposta,5 - Não,0 - Sem resposta,7 - Avançado,8 - Básico,...,56 - 4 - Concordo,57 - 4 - Concordo,58 - 4 - Concordo,59 - 4 - Concordo,60 - 3 - Indiferente,61 - 4 - Concordo,62 - 4 - Concordo,63 - 4 - Concordo,64 - 3 - Indiferente,65 - 3 - Indiferente


### Verificação de dados duplicados

In [19]:
df_corrigido.duplicated().sum()

0

### Adição dos dados de desempenho

Utilizaremos a função Merge do Pandas para unificar a base de questões e a base de desempenho.

In [22]:
df_final = pd.merge(left = df_corrigido,
                   right = df_desempenho,
                   how = 'left',
                   left_on = 'Id_Agente', right_on = 'Id_Agente')

df_final.head()

Unnamed: 0,Id_Agente,Cliente,Você está trabalhando no Campus ou em Casa?,Qual o tempo gasto no trajeto da sua residência até a empresa?,Qual a sua escolaridade?,Qual a sua área de estudo?,Você possui dependentes?,Quantos dependentes você possui?,Qual seu conhecimento em inglês?,Qual seu conhecimento em espanhol?,...,É bom trabalhar com meus colegas de trabalho.,Os melhores resultados vêm do trabalho em equipe.,Baseio meu trabalho em relações interpessoais.,Fico tenso quando estou trabalhando.,Providencio soluções para os meus problemas com rapidez.,Demonstro meu valor nas horas difíceis.,Falta de tempo não me assusta.,Pessoas fortes vêm de ambientes competitivos.,Gosto de ter um trabalho exigente.,Target
0,1,Cliente 1,1 - Casa,0 - Sem resposta,3 - Ensino Superior incompleto,4 - Humanas,5 - Não,0 - Sem resposta,7 - Intermediário,8 - Intermediário,...,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,1
1,2,Cliente 2,1 - Casa,0 - Sem resposta,3 - Ensino Médio completo,0 - Sem resposta,5 - Não,0 - Sem resposta,7 - Não tenho conhecimento em inglês,8 - Não tenho conhecimento em espanhol,...,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,0 - Sem resposta,1
2,3,Cliente 2,1 - Casa,0 - Sem resposta,3 - Ensino Superior cursando,4 - Gestão de Pessoas/Negócios,5 - Não,0 - Sem resposta,7 - Intermediário,8 - Não tenho conhecimento em espanhol,...,57 - 4 - Concordo,58 - 4 - Concordo,59 - 2 - Discordo,60 - 3 - Indiferente,61 - 3 - Indiferente,62 - 4 - Concordo,63 - 3 - Indiferente,64 - 4 - Concordo,65 - 2 - Discordo,1
3,4,Cliente 3,1 - Casa,0 - Sem resposta,3 - Ensino Superior concluído,4 - Saúde,5 - Não,0 - Sem resposta,7 - Básico,8 - Não tenho conhecimento em espanhol,...,57 - 4 - Concordo,58 - 4 - Concordo,59 - 4 - Concordo,60 - 4 - Concordo,61 - 4 - Concordo,62 - 4 - Concordo,63 - 3 - Indiferente,64 - 2 - Discordo,65 - 3 - Indiferente,0
4,5,Cliente 4,1 - Casa,0 - Sem resposta,3 - Ensino Médio completo,0 - Sem resposta,5 - Não,0 - Sem resposta,7 - Avançado,8 - Básico,...,57 - 4 - Concordo,58 - 4 - Concordo,59 - 4 - Concordo,60 - 3 - Indiferente,61 - 4 - Concordo,62 - 4 - Concordo,63 - 4 - Concordo,64 - 3 - Indiferente,65 - 3 - Indiferente,0


## Análise Exploratória dos Dados (EDA)

### Utilizando o SweetViz

In [24]:
# Executa o Data Profiling
aed_sv = sv.analyze(df_final, 
                    target_feat='Target')

# Salva o arquivo HTML final com o relatório
aed_sv.show_html('aed_sv.html')

                                             |          | [  0%]   00:00 -> (? left)

Report aed_sv.html was generated! NOTEBOOK/COLAB USERS: the web browser MAY not pop up, regardless, the report IS saved in your notebook/colab files.


### Utilizando o Ydata Profiling

In [25]:
# Executa Data Profiling
aed_yp = ProfileReport(df_final, title="EDA CONTACT CENTER")

# Salva o arquivo HTML final com o relatório
aed_pp.to_file("aed_yp.html")

Summarize dataset:   0%|          | 0/5 [00:00<?, ?it/s]

  is_valid_dtype = pdt.is_categorical_dtype(series) and not pdt.is_bool_dtype(
  is_valid_dtype = pdt.is_categorical_dtype(series) and not pdt.is_bool_dtype(
  not pdt.is_categorical_dtype(series)
  not pdt.is_categorical_dtype(series)
  is_valid_dtype = pdt.is_categorical_dtype(series) and not pdt.is_bool_dtype(
  not pdt.is_categorical_dtype(series)
  is_valid_dtype = pdt.is_categorical_dtype(series) and not pdt.is_bool_dtype(
  not pdt.is_categorical_dtype(series)
  is_valid_dtype = pdt.is_categorical_dtype(series) and not pdt.is_bool_dtype(
  not pdt.is_categorical_dtype(series)
  is_valid_dtype = pdt.is_categorical_dtype(series) and not pdt.is_bool_dtype(
  not pdt.is_categorical_dtype(series)
  is_valid_dtype = pdt.is_categorical_dtype(series) and not pdt.is_bool_dtype(
  not pdt.is_categorical_dtype(series)
  is_valid_dtype = pdt.is_categorical_dtype(series) and not pdt.is_bool_dtype(
  not pdt.is_categorical_dtype(series)
  if pdt.is_categorical_dtype(series):
  if pdt.is_categ

Generate report structure:   0%|          | 0/1 [00:00<?, ?it/s]

Render HTML:   0%|          | 0/1 [00:00<?, ?it/s]

Export report to file:   0%|          | 0/1 [00:00<?, ?it/s]