# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# Passo a Passo
# Passo 1: Importar a base de dados
import pandas as pd

tabela = pd.read_csv('cancelamentos_sample.csv')
# Passo 2: Visualizar a base de dados
    # entender o que tem na base de dados
    # encontraras cagadas da base de dados

# colunas inuteis - informação que não te ajuda, te atrapalha
# tirar a coluna de CustomerID

tabela = tabela.drop(columns='CustomerID')
display(tabela)


In [None]:

tabela = pd.read_csv('cancelamentos_sample.csv')
# Passo 2: Visualizar a base de dados
    # entender o que tem na base de dados
    # encontraras cagadas da base de dados

# colunas inuteis - informação que não te ajuda, te atrapalha
# tirar a coluna de CustomerID

tabela = tabela.drop(columns='CustomerID')
display(tabela)


In [None]:
# Passo 3: Tratamento de Dados -> Corrigir as cagadas da base de dados
# informações no formato errado

display(tabela.info())
    #Analisar tipos de dados e conferir se estão corretos

# valores vazios 
    # Como temos poucos valoresvazios, então vamos excluir as linhas que têm valores vazios
    # Se tivessimos muitos valores vazios, poderiamos usar a função tabela.fillna([valor a ser colocado no lugar de null])
tabela = tabela.dropna()

display(tabela.info())


In [None]:
# Passo 4: Análise Inicial dos cancelamentos
    # Contando o número de cancelamentos e de clientes ativos
display(tabela['cancelou'].value_counts())

    # Para obter o percentual, basta adicionar o paramêtro normalize=True
display(tabela['cancelou'].value_counts(normalize=True))

    # Para formatar
display(tabela['cancelou'].value_counts(normalize=True).map('{:.2%}'.format))


In [None]:
# Passo 5: Análise de causas do cancelamento do clientes
import plotly.express as px


for coluna in tabela.columns:

    # Cria o grafico
    grafico = px.histogram(tabela, x=coluna, color='cancelou')

    # Exibe o grafico
    grafico.show()


In [None]:
# Todos os clientesque ligaram mais de 4 vezes cancelaram
    # Criar um processo interno pra resolver problemas dos clientes em no máximo 3 ligações
# Todos os clientes que atrasaram mais que 20 dias cancelaram
    # Criar um proesso interno pra ligar um alerta quando um cliente atrasar mais de 10 dias
# Todos os clientes de contrato mensal, cancelaram
    # Oferecer um desconto no contrato anual/trimestral

#  Filtrar uma base de dados

# Se eu resolver o call center, pra quanto cai o cancelamento?
filtro = tabela['ligacoes_callcenter']<=4
tabela = tabela[filtro]

# E o atraso?
filtro = tabela['dias_atraso']<=20
tabela = tabela[filtro]

# E o contrato mensall?
filtro = tabela['duracao_contrato']!='Monthly'
tabela = tabela[filtro]

display(tabela['cancelou'].value_counts(normalize=True))
