# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# 1. importar base de dados de clientes
import pandas as pd

tabela = pd.read_csv("cancelamentos.csv")


# 2. visualizar base de dados
display (tabela)
    #entender quais informações estão disponíveis
    #identificar erros da base de dados
# 3. tratar os dados
tabela=tabela.drop(columns="CustomerID")    #retirar informações que não estão ligados ao ato de cancelar
tabela=tabela.dropna()   #limpar valores vazios
display(tabela)
display(tabela.info())

In [50]:
# 4. análise dos cancelamentos
display(tabela["cancelou"].value_counts())
display(tabela["cancelou"].value_counts(normalize=True)) #percentual

cancelou
1.0    499993
0.0    381666
Name: count, dtype: int64

cancelou
1.0    0.567105
0.0    0.432895
Name: proportion, dtype: float64

In [None]:
# 5. causas de cancelamentos (impacto de cada informação no ato de cancelamento)
    #importar biblioteca de gráficos
import plotly.express as px

for coluna in tabela.columns:
    #criar o grafico
    graf=px.histogram(tabela, x=coluna, color="cancelou")    
    graf.show()    #exibir o grafico 

In [52]:
#com os graficos gerados no passo #5. tem-se as seguintes conclusões
#clientes de contrato mensal sempre cancelam
    #verificar viabilidade de dar desconto para aumentar contratos anuais e trimestrais

# clientes acima de 50 anos sempre cancelam
    #buscar causas 

# a proporção de mulheres que cancelam é de  62,87% enquanto homens é de 49,10%
    #buscar causas

# a partir da terceira liação para o call center maior parte dos clientes cancelam sendo que a partir de 6 ligações todos cancelam
    #gerar alerta máximo para resolver problema do cliente no terceiro contato pelo call center

# a partir de 20 dias de atrazo todos os clientes cancelam
    #criar sistema de cobrança ou negociação de dívida a partir de 10 dias para evitar que o cliente atrase mais de 20 dias

# a partir de 500 reais gastos grande parte dos clientes tendem a manter o serviço

# há um aumento da proporção de cancelamento dos clientes que ficam sem entrar contato por mais de 15 meses

In [53]:
#cenário 1: se não houvessem clientes com contrato mensal
tabela1=tabela[tabela["duracao_contrato"]!= "Monthly"]
display(tabela1["cancelou"].value_counts(normalize=True)) #percentual

cancelou
0.0    0.539492
1.0    0.460508
Name: proportion, dtype: float64

In [54]:
# cenário 2: se não houvessem clientes com mais de 4 ligações pro callcenter
tabela2=tabela[tabela["ligacoes_callcenter"]<=4]
display(tabela2["cancelou"].value_counts(normalize=True))

cancelou
0.0    0.637244
1.0    0.362756
Name: proportion, dtype: float64

In [55]:
# cenário 3: se não houvessem clientes com mais de 20 dias de atraso
tabela3= tabela[tabela["dias_atraso"]<=20]
display(tabela3["cancelou"].value_counts(normalize=True))

cancelou
0.0    0.534845
1.0    0.465155
Name: proportion, dtype: float64

In [56]:
# cenário 4: combinação dos 3 cenários anteriores
tabela4=tabela[tabela["duracao_contrato"]!= "Monthly"]
tabela4=tabela4[tabela4["ligacoes_callcenter"]<=4]
tabela4=tabela4[tabela4["dias_atraso"]<=20]
display(tabela4["cancelou"].value_counts(normalize=True))

cancelou
0.0    0.816037
1.0    0.183963
Name: proportion, dtype: float64