Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

In [20]:
#PASSO 1- Importar a base de dados
import pandas as pd

tabela = pd.read_csv("cancelamentos.csv")
#PASSO 2- Visualizar a base de dados
display(tabela) 

In [21]:
#PASSO 3- Corrigir eventuais erros/informacoes inuteis da base de dados

tabela = tabela.drop(columns="CustomerID") #A informação de ID de cada consumidor não agrega muito valor, então 
#é melhor liberar essa coluna para evitar confusões e libertar espaço

display(tabela)

In [22]:
display(tabela.info()) #Analisando as informações da tabela, foi possivel ver que existiam diversos campos com valores não
#preenchidos. Isso seria um problema ainda na analise inicial, então precisei tratar nesse momento

tabela = tabela.dropna() #Uma das alternativas é o uso desse método para remover as linhas da tabela que possuem algum campo 
#como NaN. Como foram apenas 5 linhas excluídas de quase 900 mil, não irá interferir nas análises

display(tabela.info())

In [23]:
#PASSO 4- Realizar uma Analise inicial dos cancelamentos
#Primeira parte:Quantos cancelaram(percentual e quantia)

display(tabela["cancelou"].value_counts())
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

cancelou
1.0    499993
0.0    381666
Name: count, dtype: int64

cancelou
1.0    56.7%
0.0    43.3%
Name: proportion, dtype: object

In [24]:
#PASSO 5- Análise detalhada do que é possível melhorar 
import plotly.express as px

#Para cada campo:
colunas = tabela.columns;
for col in colunas: 
    #Criar o grafico
    grafico = px.histogram(tabela, x=col, color="cancelou")
    #Exibir o grafico
    grafico.show()

ÚLTIMO PASSO: Após análises, quais seriam as principais causas dos cancelamentos

Pessoas com mais de 50 anos com certeza cancelam os serviços

    - Isso poderia ser do negócio em muitas empresas, pois poderia não se tratar do público alvo do serviço.
    - Porém, caso isso seja uma problemática a empresa, poderia ser interessante ter mais conteúdos a esse público, além de uma atenção maior com acessibilidade nessa faixa de idade (Eles conseguiam usar de modo independente?)
Pessoas que ligam mais de 5 vezes ao callcenter com certeza cancelam o serviço

    - Poderia ser criado um processo para que um problema com um consumidor possa ser resolvido em até 3 ligações
Clientes com mais de 20 dias de atraso com certeza cancelam

    - A comunicação com clientes em atraso poderia aumentar antes desse 20 dias, como uma tentativa de lembrá-lo de pagar seu plano antes desse período
Todos os clientes do plano mensal cancelam

    -Oferecer descontos os benefícios aos planos anuais e trimestrais poderia incentivar clientes do mensal a mudarem de plano

In [25]:
#E se não tivessemos clientes nessas condições? Em quanto seria nossa taxa de cancelamento?

grafAntes = px.histogram(tabela, x="cancelou")
grafAntes.show()

# tabela = tabela[tabela["idade"] < 51]
tabela = tabela[tabela["ligacoes_callcenter"] < 5]
tabela = tabela[tabela["dias_atraso"] < 21]
tabela = tabela[tabela["duracao_contrato"] != "Monthly"]

grafDepois = px.histogram(tabela, x="cancelou")
grafDepois.show()

.
