# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# Passo a Passo do projeto 
# Passo 1: Importar a base de dados
import pandas as pd

tabela = pd.read_csv("cancelamentos_sample.csv")
display(tabela)

# Passo 2: Visualizar a base de dados
    # Entender quais informações que você tem disponível
    # Identificar as cagadas da base de dados (Digitação, tipo de digitação, valores etc...)
tabela = tabela.drop(columns="CustomerID")
display(tabela)


In [None]:
# Passo 3: Tratamento de Dados = Corrigir as cagadas da base de dados
# valores vazios na base de dados
# formato das informações está correto
# NaN = Not a Number (Valor vazio, não number, não texto)
# drop -> excluir linhas ou colunas da tabela, de acordo com a informação da tabela
# dropna -> exclui linhas com valores vazios


tabela = tabela.dropna()
display(tabela.info()) 

In [None]:
# Passo 4: Analisar o cancelamento dos clientes
display(tabela["cancelou"].value_counts) # Apenas conta os valores 
display(tabela["cancelou"].value_counts(normalize=True)) # Conta o percentual dos valores

In [None]:
# Passo 5: Analisar a causa de cancelamento dos clientes (como as informações do cliente impactam no cancelamento

# Etapa 1 importar a biblioteca de gráficos (plotly)
import plotly.express as px

# variavel "coluna" recebendo valor das colunas do arquivo em questão de análise

coluna = "duracao_coluna"

for coluna in tabela.columns:
# Etapa Criar o gráfico
    grafico = px.histogram(tabela, x=coluna, color="cancelou", text_auto=True)


# Etapa Exibir o gráfico
    grafico.show()

In [None]:
# clientes do contrato mensal, sempre cancelam
    # podemos dar desconto para os contratos anuais e trimestrais

# neste caso de analise, se o cliente liga mais de 4x para o call center, ele vai cancelar
# se o cliente liga mais de 3x para o call center, ele vai cancelar
    # no momento que o cliente ligar para o call center 4x, o problema do cliente deve ser resolvido
    
# se o cliente atrasar mais de 20 dias o pagamento, ele cancela
    # podemos ligar um alerta com 10 dias de atraso de pagamento

# criar filtros na tabela
# se eu nao tivesse clientes de contrato mensal como seria o cancelamento
tabela = tabela[tabela["duracao_contrato"]!="Monthly"]
# se eu nao tivesse clientes com mais de 3 ligações pro call center
tabela = [tabela["ligacoes_callcenter"]<=4]
# se eu não tiver cliente com mais de 20 dias de atraso no pagamento
tabela = tabela[tabela["dias_atraso"]<=20]

display(tabela["cancelou"].value_counts(normalize=True))
# display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format)) !!!comando após "True" formata numero de exibição
