# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
%pip install pandas numpy openpyxl nbformat ipykernel plotly

In [None]:
# Importar a base de dados
import pandas as pd

tabela = pd.read_csv(r"D:\Backup\Documents\Backend\hashtag\jornada-python\aula_2\cancelamentos.csv")
tabela = tabela.drop(columns="CustomerID")

In [None]:
# Visualizar a base de dados ( entender a base + identificar problemas)
display(tabela)

In [None]:
# Corrigir os problemas da base de dados ( tratamento de dados )
display(tabela.info())

tabela = tabela.dropna() # NaN -> Valores vazios

display(tabela.info())

In [12]:
# Anáslise inicial -> quantos clientes cancelaram e qual a % de clientes
display(tabela["cancelou"].value_counts())

# Percentual
display(tabela["cancelou"].value_counts(normalize=True))

cancelou
1.0    499993
0.0    381666
Name: count, dtype: int64

cancelou
1.0    0.567105
0.0    0.432895
Name: proportion, dtype: float64

In [None]:
# Análise da causa de cancelamento 
# ( comparar as outras colunas com a colunas de cancelamento )
import plotly.express as px

for coluna in tabela.columns:
	# Criar o Gráficos
	grafico = px.histogram(tabela, x=coluna, color="cancelou" )

	# Exibir o Gráficos
	grafico.show()


In [20]:
# duracao_contrato -> diferente de mensal
condicao = tabela["duracao_contrato"] != "Monthly"

tabela = tabela[condicao]

In [16]:
# ligacoes_callcenter -> menor ou igual a 4
tabela = tabela[tabela["ligacoes_callcenter"] <= 4]

In [18]:
# atraso_pagamento <= 20 dias 
tabela = tabela[tabela["dias_atraso"] <= 20]

In [21]:
display(tabela["cancelou"].value_counts(normalize=True))

cancelou
0.0    0.816037
1.0    0.183963
Name: proportion, dtype: float64