# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# Step 1 --> Importar a base de dados
# Step 2 --> Analisar a base de dados
# Step 3 --> Corrigir a base de dados
# Step 4 --> Analisar os cancelamentos
# Step 5 --> Análise gráfica

In [2]:
# Step 1 --> Importar a base de dados
# !pip install pandas numpy openpyxl ipykernel plotly

import pandas as pd

tbl_cancel = pd.read_csv('cancelamentos.csv')

In [None]:
# Step 2 --> Analisar a base de dados
display(tbl_cancel)

display(tbl_cancel.info())

In [3]:
# Step 3 --> Corrigir problemas na base de dados
tbl_cancel = tbl_cancel.drop(columns='CustomerID') # Removendo a coluna CustomerID

tbl_cancel = tbl_cancel.dropna() # Removendo linhas com informações vazias

tbl_cancel = tbl_cancel.drop_duplicates() # Removendo informações duplicadas

In [None]:
# Step 4 --> Análise dos cancelamentos

# Exibindo a contagem de cancelamentos
display(tbl_cancel['cancelou'].value_counts())

# Exibindo percentual - normalizado - dos cancelamentos
display(tbl_cancel['cancelou'].value_counts(normalize=True))

# Formatando resultados percentuais
display(tbl_cancel['cancelou'].value_counts(normalize=True).map('{:.1%}'.format))

In [None]:
#!pip install nbformat==4.2.0


In [None]:
# Step 5 --> Análise gráfica
import plotly.express as plotx


# Gráfico da relação de cancelamentos com a duração do contrato
grafico = plotx.histogram(tbl_cancel, x='duracao_contrato', color='cancelou')

grafico.show()

In [None]:
# Step 5 --> Análise Gráfica

# Gerando gráficos para cada coluna da tablea de clientes
for column in tbl_cancel.columns:

    grafico = plotx.histogram(tbl_cancel, x=column, color='cancelou', text_auto=True)

    grafico.show()

In [None]:
# A primeira análise aponta que:
# --> Todos os clientes de contrato mensal, cancelaram.
# --> Todos os clientes com dias de atraso > 20, cancelaram.
# --> Todos os clientes com ligações ao call center > 4, cancelaram.

In [9]:
# Segunda análise: Verificar o comportamento dos cancelamentos casos os três problemas apontados acima sejam resolvidos

# Comportamento dos cancelamentos ao solucionar o problema de contrato mensal
tbl_cancel = tbl_cancel[tbl_cancel['duracao_contrato'] != 'Monthly']

# Verificando percentual de cancelamentos desconsiderando os cancelamentos de contrato mensal
display(tbl_cancel['cancelou'].value_counts(normalize=True).map('{:.1%}'.format)) # Reduz os cancelamentos para 46%

# Comportamento dos cancelamentos ao solucionar os atrasos superiores a 20 dias
tbl_cancel = tbl_cancel[tbl_cancel['dias_atraso'] <= 20]

# Verificando percentual de cancelamentos desconsiderando os cancelamentos de atrasos pós 20 dias
display(tbl_cancel['cancelou'].value_counts(normalize=True).map('{:.1%}'.format)) # Reduz os cancelamentos para 35%

# Comportamento dos cancelamentos ao solucionar as ligações ao call center
tbl_cancel = tbl_cancel[tbl_cancel['ligacoes_callcenter'] <= 4]

# Verificando percentual de cancelamentos desconsiderando os cancelamentos com mais de 4 ligações ao call center
display(tbl_cancel['cancelou'].value_counts(normalize=True).map('{:.1%}'.format)) # Reduz os cancelamentos para 18%

cancelou
0.0    64.1%
1.0    35.9%
Name: proportion, dtype: object

cancelou
0.0    64.1%
1.0    35.9%
Name: proportion, dtype: object

cancelou
0.0    81.6%
1.0    18.4%
Name: proportion, dtype: object