# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# Passo a passo do projeto
# Passo 1: Importar a base de dados dos clientes.
# Passo 2: Visualizar a base de dados.
# Passo 3: Corrigir os problemas da base de dados.
# Passo 4: Análise dos cancelamentos.
# Passo 5: Análise da causa do cancelamento.

# Para trabalhar com base de dados --> pandas
# Para usar gráficos e dashboards --> ploty

#!pip install pandas numpy openpyxl nbformat ipykernel plotly

In [None]:
# Passo 1: Importar a base de dados dos clientes.

import pandas as pd

tabela = pd.read_csv("./cancelamentos.csv")

# Passo 2: Visualizar a base de dados.
    # display(tabela) // Mais bonito == print(tabela)

display(tabela)


In [None]:
# Passo 3: Corrigir os problemas da base de dados.

# Identificar colunas inúteis.
# Tratar valores vazios

    # tabela = tabela.drop(columns="CustomerID")
    # display(tabela.info())

tabela = tabela.dropna()

display(tabela)


In [None]:
# Passo 4: Análise dos cancelamentos.

# display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format)) // Para exibir a porcentagem correta.
display(tabela["cancelou"].value_counts(normalize=True))


In [None]:
# Passo 5: Análise da causa do cancelamento.

import plotly.express as px

# Criar gráfico
for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="cancelou")

    # Exibir gráfico
    grafico.show()


In [6]:
# Análise das causas de cancelamento

# Se um cliente ligar mais de cinco vezes para o call center, ele cancela
    # Se ele ligar três vezes, faz alguma coisa para resolver definitivo o problema.
    
# Se atrasar o pagamento mais de 20 dias, ele cancela
    # Com dez dias o pagamento deverá ser efetuado.
    
# Todos os clientes do contrato mensal cancelam.
    # Oferecer desconto nos planos anuais e trimestrais.
    
tabela = tabela[tabela["duracao_contrato"] != "Monthly"]
tabela = tabela[tabela["ligacoes_callcenter"] <= 4]
tabela = tabela[tabela["dias_atraso"] <= 20]
    
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

cancelou
0.0    81.6%
1.0    18.4%
Name: proportion, dtype: object