# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# Passo a passo do projeto
# Passo 1: Importar a base de dados de clientes
# Passo 2: Visualizar a base de dados
# Passo 3: Corrigir os problemas da base de dados
# Passo 4: Análise dos cancelamentos
# Passo 5: Análise da causa do cancelamento

# trabalhar com base de dados -> pandas
# graficos e dashboards -> plotly
# !pip install openpyxl nbformat ipykernel plotly

In [None]:
# Passo 1: Importar a base de dados de clientes
import pandas as pd

tabela = pd.read_csv('cancelamentos.csv')

# Passo 2: Visualizar a base de dados
# Colunas inúteis -  informações que não te ajudam, te atrapalham
tabela = tabela.drop(columns="CustomerID") # excluíndo o ID dos clientes
display(tabela)

In [None]:
# Passo 3: Corrigir os problemas da base de dados
# valores vazios - erros de preenchimento

display(tabela.info())
tabela = tabela.dropna() # explui as linhas que tivem vazios
display(tabela.info())

In [None]:
# Passo 4: Análise dos cancelamentos

display(tabela["cancelou"].value_counts()) # conta os valores dessa coluna

display(tabela["cancelou"].value_counts(normalize=True)) # conta os valores dessa coluna em percentual (Normalizar)

display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format)) # conta os valores dessa coluna em percentual (Normalizar) e aplicando uma função de formatação



In [None]:
# Passo 5: Análise da causa do cancelamento
import plotly.express as px

# criar um gráfico
# para cada coluna da minha tabela
for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="cancelou")

    # exibe o gráfico
    grafico.show()

In [None]:
# Passo 5: Análise da causa do cancelamento

# se um clinete ligar mais de 4 vezes para o call center, ele vai cancelar
#     criar um processo que um cliente ligou 3 vezes, a gente faz de tudod para resolver  

# se um cliente atrsar o pagamento mais de 20 dias, ele cancela
#   criar um processo para não deixar o cliente atrasar o pagametno mais de 20 dias

# todos os clientes do contrato mensal cancelam
#   oferecer descontos nos planos anuais e trimestrais


# se eu resolver esses problemas como fica os cancelamentos
tabela = tabela[tabela["duracao_contrato"]!="Monthly"] # sem duração o contrato mensal

tabela = tabela[tabela["ligacoes_callcenter"]<=4] # sem ligação do call center acima de 4 vezes

tabela = tabela[tabela["dias_atraso"]<=20] # sem atraso de pagamento maior do que 20 dias

display(tabela["cancelou"].value_counts(normalize=True)) # conta os valores dessa coluna em percentual (Normalizar)