# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# Instalar os pacotes diretamente pelo nb
# !pip3 install pandas numpy openpyxl plotly nbformat==4.2.0
# !pip3 install ipykernel
# !pip3 install --upgrade nbformat

# Passo a passo do projeto
# Passo 1: Importar a base de dados
import pandas as pd

tabela = pd.read_csv("cancelamentos_sample.csv")
# display(tabela)

In [None]:
# Passo 2: Visualizar a base de dados
    # Entende quais informacoes tem disponivel e buscar problemas que vc tem que resolver
tabela = tabela.drop(columns="CustomerID")
display(tabela)

# remover colunas inuteis - informacoes que nao te ajudam, te atrapalham
# valores vazios


In [None]:
# Passo 3: Corrigir informacoes da base de dados
    # tabela.info mostra informacoes da tabela, como valores vazio, tipo de dados por coluna
print("### Tabela Info sem correcao das informacoes valores vazios ###")
display(tabela.info())
# valores vazios - excluir as linhas que tem valores vazios DROPNA
tabela = tabela.dropna()

# pode preencher com algum valor utilizando o FILLNA
print("### Tabela Info apos as correcoes ###")
display(tabela.info())

In [None]:
# Passo 4: Analise inicial dos cancelamentos
    # quantas pessoas cancelaram e quantas nao cancelaram
# display(tabela["cancelou"].value_counts()) # faz um count da coluna

# faz um count da coluna em percentual normalize
# formatar -> .map() toda formatacao vai estar entre:
    # - ASPAS e CHAVES "{}"
    # - DOIS PONTOS significa q vc quer formatar
    # - PONTO é pra dizer que tem casa decimal e o numero diz quantas casas
    # - % é pra dizer que vc quer formatar em percentual
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

In [None]:
# Passo 5: Analise das causas dos cancelamentos 
    # graficos / dashboards
# !pip3 install plotly

import plotly.express as px

# criar o grafico
for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="cancelou")
    # exibe o grafico
    grafico.show()

In [None]:
# clientes do contrato mensal sempre cancelam
    # oferecer desconto nos planos anuais e trimestrais
tabela = tabela[tabela["duracao_contrato"]!="Monthly"]
# Conclusao: 10% dos cancelamentos vem de clientes com assinatura mensal.
    # Valor sem a condicao = 56% = reducao de 10% nos cancelamentos

# clientes que ligam mais de 5x no call center cancelam
    # criar um processo para resolver o problema do cliente em no maximo 3 ligacoes
tabela = tabela[tabela["ligacoes_callcenter"]<=4]

# clientes que atrasaram mais de 20 dias, cancelaram
    # politica de resolver atraso em ate 10 dias (equipe financeira)
tabela = tabela[tabela["dias_atraso"]<=20]

display(tabela["cancelou"].value_counts())
# em percentual
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

# Conclusao: Utilizando essas 3 abordagens o total de cancelamento passaria de 56% para 18%.
