# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# Passo 1: Importar a base de dados
# %pip install pandas numpy openpyxl nbformat ipykernel plotly # instalando bibliotecas 
import pandas as pd

tabela = pd.read_csv("cancelamentos.csv")
#print(tabela)

# Passo 2: Visualizar a base de dados   
    # enteder quais as informações disponívies
    # procurar os problemas/erros da base de dados
    
# OBS: colunas inúteis - informações que não te ajudam, atrapalham.    
tabela = tabela.drop(columns="CustomerID")    

display(tabela)

In [None]:
# Passo 3: Corrigir os problemas/erros da base de dados
    # informações vazias ou formato errado
display(tabela.info())

# valores vazios - excluir as linhas que têm valores vazios ou jogar fora as informações vazias da tabela
tabela = tabela.dropna() # na = NaN => Not a Number -> informação vazia  
#tabela = tabela.drop_duplicates() # excluir os valores dupplicados
display(tabela.info())  

In [None]:
# Passo 4: Análise dos cancelamentos(Quantos cancelaram, quantos ativos, qual os %)
display(tabela["cancelou"].value_counts())

# em percentual = normalizado
display(tabela["cancelou"].value_counts(normalize=True))

# mostrando em porcentagem "%"
#display(tabela["cancelou"].value_counts(normalize=True).map("{:.2%}".format))


In [None]:
# Passo 5: Análise das causas dos cancelamentos dos clientes (como as colunas impactam no cancelamento)
import plotly.express as px

# Criar graficos em Python sempre em duas etapas:

# Criar o grafico
#grafico = px.histogram(tabela, x="duracao_contrato", color="cancelou",text_auto=True)

# para cada coluna da tabela
for coluna in tabela.columns:
    # cria o grafico
    grafico = px.histogram(tabela, x=coluna, color="cancelou",text_auto=True)
    # exibi o grafico
    grafico.show()

# Exibir o grafico
#grafico.show()


In [None]:
# Causas de cancelamento

# Todos os clientes de contrato mensal, cancelaram
    # Provavél solução: propor desconto nos contratos anuais e trimestrais para a empresa

# Todos os cliente com mais de 20 dias de atraso, cancelaram o  serviço    
    # Provavél solução: criar um sistema de cobrança para os clientes com 10 dias de atraso, 

# Todos os clientes que ligaram mais de 4 vezes para o call center, cancelaram
    # Provavél solução: criar um alerta para um cliente que ligou mais de 2 vezes para o call center

    
# Analise, se resolver esses 3 problemas, quantos diminuiu os cancelamentos ?

# duração do contrato não pode ser mensal
# tabela["duracao_contrato"] != "Monthly"  # condição
tabela = tabela[tabela["duracao_contrato"] != "Monthly"] # tabela = tabela[condição]

# atraso só podem ser de até 20 dias
# tabela["dias_atraso"] <= 20   # condição 
tabela = tabela[tabela["dias_atraso"] <= 20] # tabela = tabela[condição]

# ligações no call center até 4 ligações
#tabela["ligacoes_callcenter"] <= 4     # condição
tabela = tabela[tabela["ligacoes_callcenter"] <= 4]     # tabela = tabela[condição]

# Em percentual = normalizado
display(tabela["cancelou"].value_counts(normalize=True))


# Extra
    # total gasto menor que 500, cancelaram
        # Provavél solução: fidelização ?
#tabela["total_gasto"] <= 500   # condição
tabela = tabela[tabela["total_gasto"] <= 500]    # tabela = tabela[condição]
#display(tabela["cancelou"].value_counts(normalize=True))

