# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

In [None]:
# !pip install pandas openpyxl numpy ipykernel nbformat plotly

### Passo a passo
## Passo 1: Importar a base de dados
import pandas as pd

tabela = pd.read_csv('cancelamentos_sample.csv')

## Passo 2: Visualizar a base de dados
    # endenter o que tem na base de dados 
    # e encontrar erros na base de dados

# colunas inuteis - informação que não ajudam e atrapalham
# tirar coluna de CustomerID
tabela = tabela.drop(columns='CustomerID')
display(tabela)



In [None]:
## Passo 3: Tratamento de Dados - Corrigir os erros na base de dados
# informações no formato errado
display(tabela.info())

# valores vazios - excluir as linhas com valores vazios
tabela = tabela.dropna()
    # tabela = tabela.fillna() - preencher
display(tabela.info())


In [None]:
## Passo 4: Analise Inicial dos cancelamentos
display(tabela['cancelou'].value_counts()) # contagem

display(tabela['cancelou'].value_counts(normalize = True)) # percentual

display(tabela['cancelou'].value_counts(normalize = True).map('{:.1%}'.format)) # percentual formatado

In [None]:
## Passo 5: Analise de causas do cancelamento dos clientes
import plotly.express as px

coluna = 'duracao_contrato'
for coluna in tabela.columns:   
    # criar grafico
    grafico = px.histogram(tabela, x=coluna, color='cancelou')

    # exibir o grafico
    grafico.show()

In [None]:
# Todos os clientes que ligaram mais de 4x para o call center, cancelaram
    # Criar um processo interno para resolver os problemas do cliente em no máximo 2 - 3 ligações
# Todos os clientes que atrasaram mais de 20 dias o pagamento, cancelaram
    # Criar um processo que quando atinge 10 dias de atraso no pagamento que seja um alerta
# Todos os clientes de contrato mensal cancelaram
    # oferecer um desconto no contrato anual/trimestral

## Filtrar uma base de dados
# se resolver o call center, para quanto cai o cancelamento?
filtro = tabela['ligacoes_callcenter'] <= 4
tabela = tabela[filtro]
# e o atraso?

filtro = tabela['dias_atraso'] <= 20
tabela = tabela[filtro]
# e o contrato mensal?
filtro = tabela['duracao_contrato'] != 'Monthly'
tabela = tabela[filtro]

display(tabela['cancelou'].value_counts(normalize = True).map('{:.1%}'.format))
