# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# 1 - Carregar base de dados
import pandas as pd

tabela = pd.read_csv("Dados/cancelamentos.csv")


In [None]:
# 2 - Remover dados inuteis para analise - Mandamento Analise de Dados: Todo dados que nao ajuda, ele atrapalha
tabela = tabela.drop(columns="CustomerID")
display(tabela)

In [None]:
# 3 - Remover campos vazios que atrapalharam analise de dados - Caso tenha campos vazios
tabela = tabela.dropna()
display(tabela.info())

In [None]:
# 4 - Analisar os cancelamos
display(tabela['cancelou'].value_counts())

display(tabela['cancelou'].value_counts(normalize=True)) #Trasnformar me porcentagem

In [None]:
# 5 - Colocar em graficos para análise - Mandamento de criação graficos: Sempre Cria e depois exite o gráfico
import plotly.express as px

#Cria o gráfico
for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color='cancelou')
    #Mostra o grafico
    grafico.show()

In [None]:
# 6 - Analisando os graficos acima para relatorio

    #se um cliente ligar mais de 4 vezes para o callcente, ele cancela

    #se o cliente atrasar o pagamento mais de 20 dias, ele cancela

    #todos os clientes do contrato mensal cancelam

#Vamos gerar um relatorio para verificar como será a parcentagem caso atuamos nesses problemas

tabela = tabela[tabela['duracao_contrato'] != 'Monthly'] #sem durcao de contrato mensal
tabela = tabela[tabela['ligacoes_callcenter'] <= 4] #sem ligacoes do call center acima de 4
tabela = tabela[tabela['dias_atraso'] <= 20] #sem atrado de pagamento mais que 20 dias

display(tabela['cancelou'].value_counts(normalize=True))