# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# Passo 1: Importar a base de dados

import pandas as pd

tabela = pd.read_csv("cancelamentos.csv")
# Passo 2: Visualizar a base de dados

# Informação que não te ajuda, te atrapalha

# Linha - axis = 0
# Coluna - axis = 1
tabela = tabela.drop("CustomerID", axis=1)
display(tabela)

In [None]:
# Passo 3: Tratamento de erros
display(tabela.info())

# Tratar valores vazios
tabela = tabela.dropna()
display(tabela.info())

In [None]:
# Passo 4: Análise inicial dos dados
display(tabela['duracao_contrato'].value_counts())
display(tabela['duracao_contrato'].value_counts(normalize=True).map('{:.1%}'.format))

In [None]:
display(tabela.groupby(["duracao_contrato"])['idade'].mean())

In [None]:
# Contrato Mensal sempre cancela
[tabela["duracao_contrato"] != "Monthly"]

# Ver os cancelamentos tirando os caras do mensal
display(tabela['cancelou'].value_counts())
display(tabela['cancelou'].value_counts(normalize=True).map('{:.1%}'.format))

In [None]:
# Passo 5: Análise profunda da base de dados
import plotly.express as px

for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="cancelou")
    grafico.show()

In [None]:
# A partir de 5 ligações, cancelam
tabela = tabela[tabela["ligacoes_callcenter"]<5]

# A partir de 21 dias de atraso, cancelam
tabela = tabela[tabela["dias_atraso"]<=20]

# Ver o cancelamento tirando quem paga mensalmente
display(tabela["cancelou"].value_counts())
display(tabela["cancelou"].value_counts(normalize=True))

In [24]:
# Forma de pagamento mensal
# Dia de atraso maior que 20
# Ligações do call center maior ou igual a 5