# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# Passo 1: Abrir a base de dados
import pandas as pd

tabela = pd.read_csv("cancelamentos.csv")

# Passo 2: Visualizar a base de dados (2 objetivos: entender as inforrmações e encontrar problemas)

# remover colunas inuteis
tabela = tabela.drop(columns="CustomerID")

display(tabela)


In [None]:

# Passo 3: Limpar a base de dados
    # informacoes no formato errado
    # informacoes vazias
tabela = tabela.dropna()# remove valores nulos
display(tabela.info())# mostra informacoes sobre a tabela

In [None]:
# Passo 4: Análise inicial (quantos clientes cancelaram, qual a % de clientes)
# Passo 4.1: Quantos clientes cancelaram e quantos nao cancelaram?

display(tabela["cancelou"].value_counts())# mostra a quantidade de clientes que cancelaram e não cancelaram

# Passo 4.2: Qual a porcentagem de clientes que cancelaram?
display(tabela["cancelou"].value_counts(normalize=True).map("{:.2%}".format))# mostra a porcentagem de clientes que cancelaram e não cancelaram formatado em porcentagem


In [None]:
# Passo 5: Analise detalhada (causa dos cancelamentos)
import plotly.express as px

for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="cancelou", text_auto=True)
    #exibe o grafico
    grafico.show()


In [None]:
# clientes que ligam mais de 4x cancelam
    #Criar alertas quando cliente ligar a 3 vez
    
tabela = tabela[tabela["ligacoes_callcenter"]<=4]

display(tabela["cancelou"].value_counts(normalize=True).map("{:.2%}".format))# mostra a porcentagem de clientes que cancelaram e não cancelaram formatado em porcentagem

In [None]:
# contratos mensais cancelam
    #Descontos para contratos anuais
tabela = tabela[tabela["duracao_contrato"]!="Monthly"]
display(tabela["cancelou"].value_counts(normalize=True).map("{:.2%}".format))# mostra a porcentagem de clientes que cancelaram e não cancelaram formatado em porcentagem

In [None]:
# todos clientes que atrasam mais de 20 dias cancelam
    # Criar alertas quando cliente atrasar mais de 10 dias

tabela = tabela[tabela["dias_atraso"]<=20]
display(tabela["cancelou"].value_counts(normalize=True).map("{:.2%}".format))# mostra a porcentagem de clientes que cancelaram e não cancelaram formatado em porcentagem