# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# !pip install pandas numpy openpyxl nbformat ipykernel plotly
# pandas -> base de dados
# plotly -> criar gráficos dinâmicos

# Passo a passo
# Passo 1: Importar base de dados
import pandas as pd

tabela = pd.read_csv("cancelamentos_sample.csv")

# Passo 2: Visualizar a base de dados (2 objetivos: entender as informações + encontrar problemas)

# informações inúteis - informações que não te ajudam, te atrapalham
tabela = tabela.drop(columns="CustomerID")
display(tabela)

In [None]:
# Passo 3: Corrigir as cagadas da base de dados
display(tabela.info())
# valores vazios - excluir as linhas que têm valores vazios
tabela = tabela.dropna()

display(tabela.info())

In [None]:
# Passo 4: Análise dos cancelamentos
# contar na coluna cancelou os valores
display(tabela['cancelou'].value_counts())
# em percentual
display(tabela['cancelou'].value_counts(normalize=True))
# display(tabela['cancelou'].value_counts(normalize=True)).map('{:.1%}'.format)


In [None]:
# Passo 5: Análise da causa dos cancelamentos (como as colunas impactam no cancelamento?)

# quero entender como cada coluna da base de dados impacta no cancelamento do cliente
# criando gráfico

import plotly.express as px

for coluna in tabela.columns:
    # cria o gráfico
    grafico = px.histogram(tabela, x=coluna, color='cancelou')
    # exibe o gráfico
    grafico.show(renderer='notebook')



In [None]:
# clientes que ligaram mais de 4x pro callcenter cancelam
    # vamos criar um alerta quando o cliente ligar a 3ª vez pro callcenter

# todos os clientes do contrato mensal cancelaram
    # vamos dar desconto nos outros contratos

# todos os clientes que atrasaram mais de 20 dias, cancelaram
    # ligar um alerta pro time de cobrança quando o cliente bater 10 dias de atraso

# se eu resolver esses 3 problemas, como fica a taxa de cancelamento

# callcenter -> olhar a minha base excluindo o problema do callcenter
tabela = tabela

tabela = tabela[tabela['ligacoes_callcenter']<=4]

#dias_atraso -> olhar a minha base excluindo o problema de dias_atraso
tabela = tabela[tabela['dias_atraso']<=20]

# ducao_contrato -> olhar minha base excluido contratos mensais (Monthly)
tabela = tabela[tabela['duracao_contrato']!='Monthly']

display(tabela['cancelou'].value_counts(normalize=True))
