# Analise de Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

In [None]:
# Passo a passo do projeto
# Passo 1: Importar a base de dados de clientes
# Passo 2: Vizualizar a base de dados
# Passo 3: Corrigir os problemas da base de dados
# Passo 4: Análise dos cancelamentos
# Passo 5: Análise da causa dos cancelamentos

!pip install pandas numpy openpyxl nbformat ipykernel plotly

# trabalhar com base de dados -> pandas
# gráficos e dashboards -> plotly

In [None]:
# Passo 1: Importar a base de dados de clientes

import pandas as pd

tabela = pd.read_csv("cancelamentos.csv")

# Passo 2: Vizualizar a base de dados

# print(tabela)
# display(tabela)

# identificar colunas inúteis -> informações que não te ajudam, te atrapalham
tabela = tabela.drop(columns="CustomerID")
display(tabela)

In [None]:
# Passo 3: Corrigir os problemas da base de dados

# valores vazios -> erros de preenchimento
# display(tabela.info())

tabela = tabela.dropna()
display(tabela.info())

In [None]:
# Passo 4: Análise dos cancelamentos

display(tabela["cancelou"].value_counts())

display(tabela["cancelou"].value_counts(normalize=True))

In [None]:
import plotly.express as px
# plotly.com/python

# criar o gráfico
# para cada coluna da minha tabela

for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="cancelou")
    # plotly.com/python/histograms

    # exibir o gráfico
    grafico.show()

In [None]:
# Passo 5: Análise da causa dos cancelamentos

# se um cliente ligar mais de 4 vezes para o call center, ele irá cancelar
    # criar um processo que caso o cliente ligue 4 vezes, resolver seu problema imediatamente

# se um cliente atrasar o pagamento mais de 20 dias, ele irá cancelar
    # ir atrás dos clientes que estejam próximos de atrasar o pagamento em 20 dias

# todos os clientes do contrato mensal cancelam
    # oferecer desconto nos planos anual e trimestral

tabela = tabela[tabela["duracao_contrato"]!="Monthly"] # sem duração do contrato mensal
tabela = tabela[tabela["ligacoes_callcenter"]<=4] # sem ligação do call center acima de 4 vezes
tabela = tabela[tabela["dias_atraso"]<=20] # sem atraso de pagamento maior que 20 dias

# exibindo a nova porcentagem, considerando que as causas de cancelamento levantadas foram sanadas
display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))