# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [28]:
# Passo a passo do projeto
# Passo 1: Importar a base de dados de clientes
# Passo 2: Visualizzar a base de dados
# Passo 3: Corrigir as cagadas da base de dados
# Passo 4: Análise dos cancelamentos
# Passo 5: Análise da causa do cancelamento

In [None]:
# Trabalhar com base de dados -> pandas
# graficos e dashboards -> plotly

# Importações necessárias do projeto
!pip install pandas numpy openpyxl nbformat ipykernel plotly

In [None]:
# Passo 1: Importar a base de dados de clientes
import pandas as pd

tabela = pd.read_csv('documentos/cancelamentos_sample.csv')

# Passo 2: Visualizzar a base de dados
# colunas inuteis - informações que não te ajudam, te atrapalham
tabela = tabela.drop(columns='CustomerID')
display(tabela)

In [None]:
# Passo 3: Corrigir as cagadas da base de dados
# Valores vazios -> Erros de preenchimento
display(tabela.info())
tabela = tabela.dropna()
display(tabela.info())

In [None]:
# Passo 4: Análise dos cancelamentos
display(tabela['cancelou'].value_counts())
display(tabela['cancelou'].value_counts(normalize=True))
# display(tabela['cancelou'].value_counts(normalize=True).map('{:.1%}'.format))

In [None]:
# Passo 5: Análise da causa do cancelamento
import plotly.express as px

# para cada coluna na minha tabela
for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color='cancelou') # Criar o gráfico
    grafico.show() # Exibe o Gráfico

In [38]:
# Análise das causas de cancelamento

# Se um cliente ligar mais de 4 vezes para o call center, ele cancela
    # Criar um processo que se um cliente ligou 3 vezes, a gente faz de tudo para resolver o problema

# Se um cliente atrasar oo pagamento mais de 20 dias, ele cancela
    # Criar um processo para não deixar o cliente atrasar o pagamento mais de 20 dias

# Todos os cliente do contrato mensal cancelam
    # Oferecer desconto nos planos anuais e trimestrais

# Mostrando uma análise do resultado de resolução dos problemas
tabela = tabela[tabela['duracao_contrato'] != 'Monthly'] # sem duração do contrato mensal
tabela = tabela[tabela['ligacoes_callcenter'] <= 4] # sem ligação do call center acima de 4 vezes
tabela = tabela[tabela['dias_atraso'] <= 20] # sem atraso de pagamento maior que 20 dias

display(tabela['cancelou'].value_counts(normalize=True).map('{:.1%}'.format))


cancelou
0.0    81.6%
1.0    18.4%
Name: proportion, dtype: object