

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.



In [None]:
#Passo a Passo case_cancelamentos
# 1 -> Importar base de dados
import pandas as pd

tabela = pd.read_csv("cancelamentos.csv")


In [None]:

# 2 -> Vizualizar base de Dados
# - > Removendo colunas que não serão utilizadas 
# - > linha > axis = 0
# - > coluna > axis = 1
tabela = tabela.drop("CustomerID", axis=1)
display(tabela)

In [None]:
# 3 -> Tratamento de dados
# -> Removendo valores em branco
tabela = tabela.dropna()
display(tabela.info())


In [None]:
# 4 -> Analise Inicial (Entender como estão os cancelamentos)
display(tabela["cancelou"].value_counts())
# > Comando normalize=True passa os valores em %
# > Utilizando o ".map" e passando o formato correto ele realiza a transformação do número junto com o ".format"
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))


In [None]:
display(tabela["duracao_contrato"].value_counts())
display(tabela["duracao_contrato"].value_counts(normalize=True).map("{:.1%}".format))


In [None]:
# > numeric_only > está instruindo o pandas a considerar apenas as colunas numéricas ao executar a operação
display(tabela.groupby("duracao_contrato").mean(numeric_only=True))
display(tabela.groupby("assinatura").mean(numeric_only=True))

In [None]:
# Observação --> Contrato Mensal sempre cancela

# A linha de códig abaixo ignora os mensais
tabela = tabela[tabela["duracao_contrato"]!="Monthly"]

#Resultado sem os valores mensais cancelamentos caiu de 56,7% para 46,1% queda de 10% em cancelamento
#Solução retirar as assinaturas mensais e tentar converter os clientes para assinatura trimestral ou anual
display(tabela["cancelou"].value_counts())
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

In [None]:
# 5 -> Analise profunda da Base (Encontrando a causa dos cancelamentos)
# o loop for cria uma variavel coluna onde ela e utilizada o histograma para gerar um gráfico para cada coluna 
# e facilitar a analise
import plotly.express as px

for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="cancelou")
    grafico.show()



# RESOLUÇÃO FINAL

In [None]:
# Todas as pessoas com mais de 50 anos está cancelando 
# (Precisamos de algo que seja atrativo para essas pessoas se manterem)

coluna = "idade"
grafico = px.histogram(tabela, x=coluna, color="cancelou")
grafico.show()

In [None]:
#Apartir de 5 ligações no call center está tendo cancelamento
#Melhorar o atendimento no call center e proporcinonar uma boa experiência ao cliente 

coluna = "ligacoes_callcenter"
grafico = px.histogram(tabela, x=coluna, color="cancelou")
grafico.show()

In [None]:
#Apartir de 20 dias em atraso os clientes efetuam o cancelamento
#Oferecer alguma recompensa para quando o pagamento for efetuado na data correta isso fará com que o cliente seja pontual
coluna = "dias_atraso"
grafico = px.histogram(tabela, x=coluna, color="cancelou")
grafico.show()

In [None]:
#Clientes que gastam menos de 500 tem alta tendência de efetuar o cancelamento
#Descobrir o que faz ele desistir tão cedo 
coluna = "total_gasto"
grafico = px.histogram(tabela, x=coluna, color="cancelou")
grafico.show()