# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [1]:
# step by step of the project
# Pass 1: Importing the database of the clients
# Pass 2: Visualizing the database of the clients
# Pass 3: Correct the problems of the database
# Pass 4: Analyzing of the cancellations
# Pass 5: Analyzing the cause of the cancellation

# Passo a passo do projeto
# Passo 1: Importar a base de dados dos clientes
# Passo 2: Visualizar a base de dados dos clientes
# Passo 3: Corrigir os problemas da base de dados
# Passo 4: Analise dos cancelamentos
# Passo 5: Analise da causa do cancelamento

In [2]:

# Step 1: Importing the database of the clients
# Passo 1: Importar a base de dados dos clientes
import pandas as pd

tabela = pd.read_csv('cancelamentos_sample.csv')
# Step 2: Visualizing the database of the clients
# Passo 2: Visualizar a base de dados dos clientes
# Inuseless columns - informations that don't help you, hinder you
# colunas inúteis - informações que não te ajudam, te atrapalham
tabela = tabela.drop(columns='CustomerID')


In [3]:
# Step 3: Correct the problems of the database
# Passo 3: Corrigir os erros da base de dados
# empty values - errors of preenchiment
# valores vazios - erros de preenchimento
tabela = tabela.dropna()
display(tabela)

Unnamed: 0,idade,sexo,tempo_como_cliente,frequencia_uso,ligacoes_callcenter,dias_atraso,assinatura,duracao_contrato,total_gasto,meses_ultima_interacao,cancelou
0,23.0,Male,13.0,22.0,2.0,1.0,Standard,Annual,909.58,23.0,0.0
1,49.0,Male,55.0,16.0,3.0,6.0,Premium,Monthly,207.00,29.0,1.0
2,30.0,Male,7.0,1.0,0.0,8.0,Basic,Annual,768.78,7.0,0.0
3,26.0,Male,40.0,5.0,3.0,8.0,Premium,Annual,398.00,12.0,1.0
4,27.0,Female,17.0,30.0,5.0,6.0,Basic,Annual,507.00,15.0,1.0
...,...,...,...,...,...,...,...,...,...,...,...
49995,62.0,Female,35.0,7.0,2.0,8.0,Basic,Annual,232.00,15.0,1.0
49996,36.0,Male,43.0,21.0,2.0,30.0,Basic,Quarterly,928.00,30.0,1.0
49997,55.0,Male,42.0,8.0,1.0,12.0,Basic,Monthly,326.00,27.0,1.0
49998,40.0,Female,14.0,19.0,1.0,17.0,Premium,Quarterly,826.76,12.0,0.0


In [None]:
# Step 4: Analysing of the cancellations
# Passo 4: Analise dos cancelamentos

# How many peaple canceled and how many didn't canceled
# quantas pessoas cancelaram e quantas não cancelaram
display(tabela["cancelou"].value_counts())

# In percentage
# Em percentual
display(tabela['cancelou'].value_counts(normalize=True))

In [None]:
# Step 5: Analysing the cause of the cancellation
# Passo 5: Analise da causa do cancelamento
import plotly.express as px

# Create the graphic
# Criar o grafico
# For every column of my schedule
# para cada coluna da minha tabela
for coluna in tabela.columns:  
    grafico = px.histogram(tabela, x=coluna, color='cancelou')
    # It shows the graphic
    # Exibe o grafico
    grafico.show()

In [None]:
# Analysis of the causes of cancellation
# Analise das causas de cancelamento

# If a client calls more than 4 times to the call center, he cancels
# se um cliente ligar mais de 4 vezes para o call center, ele cancela
    # Create a process that if a client called 3 times, we do every we can for resolve his problem
    # criar um processo que se um cliente ligou 3 vezes, a gente faz de tudo para resolver o problema
    
# If a client late the payment more than 20 days, he cancels
# se um cliente atrasar o pagamento mais de 20 dias, ele cancela
    # Create a process for don't let the client late the payment more than 20 days
    # criar um processo para não deixar o cliente atrasar o pagamento mais de 20 dias
    
# Every client of the montly contract has canceled
# todos os clientes do contrato mensal cancelam
    # oferecer desconto nos planos anuais e trimestrais
    
tabela = tabela[tabela['duracao_contrato']!='monthly'] # sem a duração do contrato mensal
tabela = tabela[tabela['ligacoes_callcenter']<=4] # sem duração do callcenter acima de 4 vezes
tabela = tabela[tabela['dias_atraso']<=20] # sem atraso de pagamento acima de 20 dias

# How much get better than before
# Quanto melhorou após as mudanças
display(tabela["cancelou"].value_counts())
# In percentage
# Em percentual
display(tabela['cancelou'].value_counts(normalize=True))
