# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos:  https://drive.google.com/drive/folders/1bhC7Bf5FEEWzEWaB2xMPORuVW1Zysebl?usp=drive_link


In [None]:
# Passo a passo para análise de cancelamento de clientes:
#! pip install pandas openpyxl numpy nbformat plotly ipykernel
# plotly histogram vericar documentação para mais detalhes



# 1. Carregar os dados da base fornecida.
import pandas as pd

tabela = pd.read_csv("cancelamentos_sample.csv")

# 2. Visualizar a base de dados (2 objetivos: entender as informações e identificar problemas).
#informações inúteis - informações que não te ajudam, te atrapalham
tabela = tabela.drop(columns="CustomerID") #remover coluna inútil
display(tabela.head())


In [None]:

# 3. Limpar e tratar os dados (valores nulos, tipos, etc).
# informações no fotmato errado
# informações nulas
display(tabela.info())
tabela = tabela.dropna() #remover linhas com informações nulas
display(tabela.info())



In [None]:
# 4. Análise inicial (quantos clientes cancelaram, qual o % de clientes )
#contar na coluna cancelou os valores 
display(tabela["cancelou"].value_counts() )
#Em percentual
display(tabela["cancelou"].value_counts(normalize=True)) #.map("{:.2%}".format))

In [None]:
# 5.Identificar padrões e perfis de clientes que cancelam.
#Criando graficos
#%pip install nbformat
import plotly.express as px

#Criando gráficos para todas as colunas
for caluna in tabela.columns:
#criar grafico 
    grafico = px.histogram(tabela, x=caluna, color="cancelou", text_auto=True)
    grafico.show()
# 6. Sugerir ações para reduzir o número de cancelamentos.

In [None]:

#1-Clientes que ligam mais de 4 vezes para o suporte, tem mais chances de cancelar
# Sugestão: melhorar o atendimento do suporte e priorizar clientes que ligam mais de 3 vezes
#Callcenter - Olhar a minha base de dados e tirar os clientes que ligaram mais de 4 vezes 
tabela = tabela[tabela["ligacoes_callcenter"]<=4]


#2-Todos os clientes que mais de 20 dias de atraso cancelaram
# Sugestão: rever a política de cobrança, oferecer descontos para quem está com mais de 10 dias de atraso.
#dias_atraso - Olhar a minha base de dados e tirar os clientes que estão com mais de 20 dias de atraso
tabela = tabela[tabela["dias_atraso"]<=20]


#2-Todos os clientes do contrato mensal cancelaram
# Sugestão: rever o contrato mensal, melhorar o custo benefício, oferecer vantagens para quem  utliza.
#duracao_contrato - Olhar a minha base de dados e tirar os clientes que estão no contrato mensal
tabela = tabela[tabela["duracao_contrato"]!="Monthly"]


display(tabela["cancelou"].value_counts(normalize=True))


# Se eu resolver esses 3 problemas, como fica minha taxa de cancelamento?

