# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# Passo a passo do projeto
# Passo 1: Importar a base de dados

import pandas as pd

tabela = pd.read_csv("cancelamentos.csv")

#excluindo coluna que não precisa na analise de dados
tabela = tabela.drop("CustomerID", axis= 1) 

# Passo 2: Vizualizar a base de dados
display(tabela)

In [None]:
# Passo 3: Tratamento de erros
#tratar valores vazios (excluindo os conteúdos null)
tabela = tabela.dropna()
display(tabela.info())

In [None]:
# Passo 4: Análise inicial dos dados (entender como estão os cancelamentos)
display(tabela["cancelou"].value_counts())
display(tabela["cancelou"].value_counts(normalize=True))
display(tabela["cancelou"].value_counts(normalize=True).map("{:.2%}".format))


In [None]:
display(tabela["duracao_contrato"].value_counts())
display(tabela["duracao_contrato"].value_counts(normalize=True))
display(tabela["duracao_contrato"].value_counts(normalize=True).map("{:.2%}".format))

In [None]:
display(tabela["duracao_contrato"].value_counts())
display(tabela["duracao_contrato"].value_counts(normalize=True).map("{:.2%}".format))

In [None]:
#Contrato mensal sempre cancela
tabela = tabela[tabela["duracao_contrato"]!="Monthly"]
#Exibindo o cancelamento sem os contratos mensais
display(tabela["cancelou"].value_counts())
display(tabela["cancelou"].value_counts(normalize=True).map("{:.2%}".format))

In [None]:
# Passo 5: Análise profunda dos dados (encontrando a causa dos cancelamentos)
import plotly.express as px

for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="cancelou")
    grafico.show()
    


In [None]:
#Ligações call center a partir de 5, cancelam
tabela = tabela[tabela["ligacoes_callcenter"]<5]

#Dias de atrado, a partir de 21, cancelam
tabela = tabela[tabela["dias_atraso"]<=20]

#Observar os cancelamentos aplicando as duas restrições acima
display(tabela["cancelou"].value_counts(normalize=True).map("{:.2%}".format))


In [None]:
#Maiores motivos de cancelamento

#Forma de pagamento mensal
#Dias de atraso > 20
#Ligações de call center >= 5