# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# Passo 1: Importar a base de dados de cliente
# Passo 2: Vizualizar a base de dados
# Passo 3: Corrigir erros da base de dados
# Passo 4: Análise dos cancelamentos 
# Passo 5: Análise da causa do cancelamento 

!pip3 install pandas numpy openpyxl nbformat ipykernel plotly --user

In [None]:
# Passo 1: Importar a base de dados de cliente
import pandas as pd

tabela = pd.read_csv("cancelamentos.csv")

# Excluindo informações inúteis
tabela = tabela.drop(columns="CustomerID")

# Passo 2: Vizualizar a base de dados
display(tabela)

In [None]:
# Passo 3: Corrigir erros da base de dados
# Identificando os erros (espaços vazios)
display(tabela.info())

# Tratando valores vazios - deletando linhas vazias
tabela = tabela.dropna()
display(tabela.info())

In [None]:
# Passo 4: Análise dos cancelamentos 
display(tabela["cancelou"].value_counts()) 

# Normalizar - porcentagem
display(tabela["cancelou"].value_counts(normalize=True))

# Formatação de percentual
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

In [None]:
# Passo 5: Análise da causa do cancelamento
import plotly.express as px

# Cria o gráfico
for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="cancelou")

    # Exige o gráfico
    grafico.show()

In [None]:
# Passo 5: Análise da causa do cancelamento

# Se um cliente ligar mais de 4 vezes para um call center, ele cancela. 
     # Criar uma forma de resolver o problema se o cliente tiver ligado mais de 3 vezes
tabela = tabela[tabela["duracao_contrato"] != "Monthly"]

# Se um cliente atrasar o pagamento mais de 20 dias, ele cancela
     # Criar um processo para não deixar o cliente atrasar mais de 15 dias
tabela = tabela[tabela["ligacoes_callcenter"] <= 4]

# Se o cliente for do contrato mensal, ele cancela
     # Criar um processo de descontos no planos anuais e trimestrais
tabela = tabela[tabela["dias_atraso"] <= 20]

display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))