# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# Passo a passo 

# Passo 1: Abrir a base de dados 

import pandas as pd

tabela = pd.read_csv('cancelamentos.csv')
# Passo 2: Visualizar a base de dados - Entendê-le e procurar problemas
# informações inúteis - que não ajudam em nada

# tirando as informações inúteis:
tabela = tabela.drop(columns='CustomerID')
display(tabela)




Unnamed: 0,idade,sexo,tempo_como_cliente,frequencia_uso,ligacoes_callcenter,dias_atraso,assinatura,duracao_contrato,total_gasto,meses_ultima_interacao,cancelou
0,30.0,Female,39.0,14.0,5.0,18.0,Standard,Annual,932.00,17.0,1.0
1,65.0,Female,49.0,1.0,10.0,8.0,Basic,Monthly,557.00,6.0,1.0
2,55.0,Female,14.0,4.0,6.0,18.0,Basic,Quarterly,185.00,3.0,1.0
3,58.0,Male,38.0,21.0,7.0,7.0,Standard,Monthly,396.00,29.0,1.0
4,23.0,Male,32.0,20.0,5.0,8.0,Basic,Monthly,617.00,20.0,1.0
...,...,...,...,...,...,...,...,...,...,...,...
881661,42.0,Male,54.0,15.0,1.0,3.0,Premium,Annual,716.38,8.0,0.0
881662,25.0,Female,8.0,13.0,1.0,20.0,Premium,Annual,745.38,2.0,0.0
881663,26.0,Male,35.0,27.0,1.0,5.0,Standard,Quarterly,977.31,9.0,0.0
881664,28.0,Male,55.0,14.0,2.0,0.0,Standard,Quarterly,602.55,2.0,0.0


In [None]:
# Passo 3: Resolver os problemas da base de dados 
# Informações no formato errado 
# Informações vazias
display(tabela.info())
# excluindo informações vazias:
tabela = tabela.dropna()
display(tabela.info())
 

In [None]:
# Passo 4: Análise Inicial (quantos cancelaram, percentual de clientes que cancelaram) 
# contar na coluna cancelou os valores 
# normalizar - calculo da proporção
# display(tabela['cancelou'].value_counts(normalize=True).map('{:.1%}'.format)) - formatação em percentual

display(tabela['cancelou'].value_counts())
display(tabela['cancelou'].value_counts(normalize=True))


cancelou
1.0    499993
0.0    381666
Name: count, dtype: int64

cancelou
1.0    56.7%
0.0    43.3%
Name: proportion, dtype: object

In [None]:
# Passo 5: Análise detalhada (causa dos cancelamentos)
# Como cada coluna da base de dados impacta nos cancelamentos 
# histograma comparação de valores y sempre a quantidade e x o outro para metro que vc quer

import plotly.express as px

for coluna in tabela.columns:

    # Cria o gráfico
    grafico = px.histogram(tabela, x=coluna, color='cancelou', text_auto=True)
    # Exibe o gráfico
    grafico.show()

