# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
#Passo a Passo
#Passo 1: Abrir/Importar a base de dados
#Passo 2: Visualizar a base de dados com 2 objetivos
# entender as informações e encontrar problemas na base de dados
#Passo 3: Resolver os problemas da base de dados
 #informações inuteis
 #informações no formato errado
 #informações vazias
#Passo 4: Analise inicial quantos clientes cancelaram e a porcentagem destes clientes
#Passo 5: Analise detalhada, entender a causa dos cancelamentos


In [None]:

#Passo 1: Abrir/Importar a base de dados
#pandas -> importa base
#plotly -> criar graficos dinâmicos
import pandas as pd #apelido para o pandas

tabela = pd.read_csv("cancelamentos.csv") #lendo a base de dados

#Passo 2: Visualizar a base de dados com 2 objetivos
# entender as informações e encontrar problemas na base de dados

#retirando informações inuteis
tabela = tabela.drop(columns="CustomerID") #retirando informações inuteis
display(tabela)






In [None]:
#Passo 3: Resolver os problemas da base de dados
 #informações no formato errado
 #informações vazias

display(tabela.info())
tabela = tabela.dropna() #exclui linhas vazias de todas as colunas
display(tabela.info())
#metodo tabela.fill e tabela.fillna para preencher, e o ffill() preenche a celula com o valor anterior



In [None]:
#Passo 4: Analise inicial quantos clientes 
# cancelaram e a porcentagem destes clientes
#contar na coluna cancelou e contar os 1 e os 0

display(tabela["cancelou"].value_counts())
#em percentual
display(tabela["cancelou"].value_counts(normalize=True)) #calcular a proporção!
#display(tabela["cancelou"].value_counts(normalize=True).map("{:.2%}".format))

In [None]:
#Passo 5: Analise detalhada, entender a causa dos 
# cancelamentos
#Entender como cada coluna da base de dados
# impacta no cancelamento do cliente.
#criando gráficos dinâmicos

#Cria e depois exibe
import plotly.express as px #importando a lib de gráficos

for coluna in tabela.columns: #percorrendo as colunas da base

    grafico = px.histogram(tabela, x=coluna, color="cancelou", text_auto=True)

    grafico.show() #exibindo gráfico para cada coluna
    



In [None]:
# clientes que ligaram mais de 5 callcenter cancelaram
    #criar um alerta  ligar pela 4 vez no callcenter
# clientes que assinam do mensal cancelaram todos
    # vamos dar desconto nos outros contratos
# clientes que atrasaram mais de 20 dias cancelaram
    # ligar alerta para o time de cobrança quando bater 10 dias de atraso.
# resolvendo os problemas, como fica a taxa de cancelamento

# call center -> olhar a base excluindo o problema do call center

tabela = tabela[tabela["ligacoes_callcenter"] <= 5]
display(tabela["cancelou"].value_counts(normalize=True))
display(tabela["cancelou"].value_counts(normalize=True).map("{:.2%}".format))

#dias de atraso
tabela = tabela[tabela["dias_atraso"] <= 20]
display(tabela["cancelou"].value_counts(normalize=True))
display(tabela["cancelou"].value_counts(normalize=True).map("{:.2%}".format))
#duracao_contrato excluindo contratos mensais

tabela = tabela[tabela["duracao_contrato"] != "Monthly"]
display(tabela["cancelou"].value_counts(normalize=True))
display(tabela["cancelou"].value_counts(normalize=True).map("{:.2%}".format))

In [None]:
for coluna in tabela.columns: #percorrendo as colunas da base

    grafico = px.histogram(tabela, x=coluna, color="cancelou", text_auto=True)

    grafico.show() #exibindo gráfico para cada coluna