# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# passo 1: importar a base de dados
# !pip install pandas numpy openpyxl nbformat  ipykernel plotly
import pandas as pd

tabela = pd.read_csv("cancelamentos.csv")
display(tabela)

In [None]:
# passo 2: visualizar a base de dados
    # entender as informacoes disponiveis
    # procurar os problemas da base de dados

#problemas:
    # 1º: colunas inuteis (que nao ajudam na analise de dados)
tabela = tabela.drop(columns="CustomerID") # apaga uma das colunas
display(tabela)


In [None]:
# passo 3: corrigir os problemas da base de dados
display(tabela.info())
tabela = tabela.dropna() # joga fora todos os objetos com valores vazio
display(tabela.info())

In [None]:
# passo 4: analise dos cancelamentos (quantos cancelaram)

display(tabela["cancelou"].value_counts())

# em percentual = normalizado(termo estatistico, exibir de 0 a 100%)

display((tabela["cancelou"].value_counts(normalize=True)).map("{:0.1%}".format))

In [None]:
# passo 5: analise das causas dos cancelamentos (como cada coluna impacta na causa)
import plotly.express as px

# duas etapas para criar o grafico
    # 1º: primeiro cria o grafico
    # 2º: depois exibe o grafico

# 1º
# para cada coluna da tabela eu quero um grafico
for coluna in tabela.columns:
    # 1º: cria um grafico
    grafico = px.histogram(tabela, x=coluna, color="cancelou", text_auto=True)


    # 2º: exibe um grafico
    grafico.show()

In [None]:
# causas de cancelamento
    # todos os clientes de contrato mensal cancelaram
        # dica pra empresa: dar desconto no desconto anual e trimestral

    # todos os clientes com mais de 20 dias de atraso cancelaram o serviço
        # dica pra empresa: comecar cobrar 10 dias antes de dar 20 dias todos os dias

    # quase todos os clientes que fizeram mais de 4 ligacoes no call center cancelaram
        # dica pra empresa: tentar resolver o problema do cliente em menos de 4 ligacoes

    # todos os clientes que gastaram menos de 500 cancelaram
        # dica pra empresa: incentivar o gasto e manter o cliente pagando


# se eu resolver esses problemas acima, quanto cai o cancelamento?

# duracao do contrato nao pode ser mensal

tabela = tabela[tabela["duracao_contrato"] != "Monthly"]

# atrasos somente de ate 20 dias

tabela = tabela[tabela["dias_atraso"] <= 20]

# ligacoes no call center de ate 4 ligacoes

tabela = tabela[tabela["ligacoes_callcenter"] <= 4]

# incentivar o cliente a gastar mais

tabela = tabela[tabela["total_gasto"] >= 500]

# mostrar tabela percentual e normalizada
display((tabela["cancelou"].value_counts(normalize=True)).map("{:0.1%}".format))