# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# Passo 1: Importar a base de dados
import pandas as pd

tabela = pd.read_csv("cancelamentos_sample.csv")



# Passo 2: Visualizar a base de dados
    # Entender quais informações eu tenho disponíveis
    # procurar os problemas da base de dados

# colunas inúteis - excluindo 
tabela = tabela.drop(columns="CustomerID")
print(tabela)

In [None]:
# Passo 3: Corrigir os problemas da base de dados

# informações vazias ou no formato incorreto
display(tabela.info())
tabela = tabela.dropna()  #NaN - informação vazia
display(tabela.info())


In [None]:
# Passo 4: Análise dos cancelamentos
display(tabela["cancelou"].value_counts())

# em percentual = normalizado
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))


In [None]:
# Passo 5: Análise das causas dos cancelamentos dos clientes
import plotly.express as px

# para cada coluna da nossa tabela
for coluna in tabela.columns:
    #cria o gráfico
    grafico = px.histogram(tabela, x=coluna, color="cancelou", text_auto=True)
    #exibe o gráfico
    grafico.show()

In [29]:
# causas do cancelamento

# todos os clientes de contrato mensal, cancelaram
    # vamos dar desconto nos contratos anuais e trimestrais
tabela = tabela[tabela["duracao_contrato"]!= "Monthly"]


# todos os clientes com mais de 20 dias de atraso, cancelaram
    # criar um sistema de cobraça dos clientes que, com 10 dias de atraso, falamos todos os dias até a regularização
tabela = tabela[tabela["dias_atraso"]<= 20]

# todos os clientes que ligaram mais de 4x pro call center, cancelaram
    # criar um alerta para um cliente que ligou mais de 2x pro call center
tabela = tabela[tabela["ligacoes_callcenter"]<=4]


# analisar se eu resolver esses 3 problemas, quanto cai o cancelamento?
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))




cancelou
0.0    0.816462
1.0    0.183538
Name: proportion, dtype: float64