# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [3]:
# passo a passo do projeto

# 1 - importar a base de dados
import pandas as pd

tabela = pd.read_csv("cancelamentos_sample.csv")

In [None]:
# 2 - vizualizar a base de dados
tabela = tabela.drop(columns="CustomerID")
display(tabela)


# procurar as cagadas ->
# colunas inuteis - informacoes que nao te ajudam, atrapalham
# valores vazio


In [None]:
# 3 - corrigir as bases de dados
# pode usar o print ou display, (display fica mais bonito no jupyter notebook)
display(tabela.info()) #monstra quais colunas estao vazias
tabela = tabela.dropna() # exclui valores vazios de ambas colunas
display(tabela.info())

In [None]:
# 4 - analise inicial dos cancelamentos

#quantas pessoas cancelaram e quntas nao cancelaram?
display(tabela["cancelou"].value_counts())

# em percentual?
display(tabela["cancelou"].value_counts(normalize=True))
#display(tabela["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

In [None]:
# 5 - analise das causas dos cancelamentos
# criar graficos/ dashboard

import plotly.express as px

# criar grafico
for coluna in tabela.columns:
    
    grafico = px.histogram(tabela, x=coluna, color="cancelou")
    
    # exibir o grafico
    grafico.show()

In [None]:
# clientes do contrato mensal TODOS cancelam
# -> oferecer desconto nos planos anuais e trimestrais
# clientes que ligam mais do que 4 vezes para o call center, cancelam
# -> criar um processo para resolver o problema em no maximo 3 ligaçoes
# clientes que atrasaram mais de 20 dias, cancelam
# -> politica de resolver atrasos em ate 10 dias (equipe financeira)

#sabendo das condiçoes, colocamos os problemas nas tabelas a seguir
#ou seja, todos os clientes mensais, os clientes que ligam acima de 4x, e os clientes que atrasam acima de 20dias

# tabela normal, para saber o valor 
tabela = tabela[tabela["duracao_contrato"]!="Monthly"]
tabela = tabela[tabela["ligacoes_callcenter"]<=4]
tabela = tabela[tabela["dias_atraso"]<=20]
display(tabela["cancelou"].value_counts())
#em percentual
display(tabela["cancelou"].value_counts(normalize=True))

