# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
#Passo 1: Importar a base de dados

import pandas as pd


tabela = pd.read_csv("cancelamentos.csv")


#Passo 2: Vizualizar a base de dados (entender as informações + encontrar problemas)

tabela = tabela.drop(columns="CustomerID")
display(tabela)


In [None]:
#Passo 3: Resolver os problemas na base de dados
#informações inuteis (informações que não te ajudam te atrapalham.)
#informações no formato errado
#informações vazias

tabela = tabela.dropna()
display(tabela.info())

In [None]:
#Passo 4: Análise inicial: (quantos clientes cancelaram, porcentagem etc.)
#contar na coluna cancelou os valores
display(tabela["cancelou"].value_counts())
#em percentual
display(tabela["cancelou"].value_counts(normalize=True))
#display(tabela["cancelou"].value_counts(normalize=True).map("{:1%}".format))


In [None]:
#Passo 5: Analise a causa dos cancelamentos dos clientes.

#quero entender como cada coluna na base de dados interfere no cancelamento do cliente
#pode ser feito criando gráficos para facilitar a análise.
#duas etapas: 1 Crie o Grafico -> 2 Exiba o gráfico

import plotly.express as px

for coluna in tabela.columns:


    #crie o gráfico
    grafico = px.histogram(tabela, x = coluna, color="cancelou", text_auto=True)

    #Exiba o Gráfico
    grafico.show()


In [None]:
#clientes que ligaram mais de 4 vezes pro callcenter cancelam
 #solução: quando ligar pela 3 vez, alertar pra resolver urgente

#todos os clientes no contrato mensal cancelaram
 #solucao: vamos dar desconto nos outros contratos.

#todos os clientes que atrasaram mais de vinte dias de pagamento cancelam
 #solução: ligar um alerta para o time de cobrança quando o cliente bater 10 dias de atraso ou algo semelhante.

#se esses 3 problemas forem solucionados, como ficaria a taxa de cancelamento?

# callcenter -> olhar a base excluindo o problema do callcenter
tabela = tabela[tabela["ligacoes_callcenter"]<=4]

#dias_atraso -> olhar a minha base excluindo o problema de dias atraso
condicao =tabela["dias_atraso"]<=20
tabela = tabela[condicao]

#duracao_contrato -> olhar a minha base excluindo os contratos mensais
 
tabela = tabela[tabela["duracao_contrato"]!="Monthly"]



display(tabela["cancelou"].value_counts(normalize=True))
