# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:

# Passo a passo do projeto
# base de dados tirada do site "kaggle"

# Passo 1: Abrir a base de dados (Importar a base de dados)
import pandas as pd

tabela = pd.read_csv('cancelamentos.csv')

# Passo 2: Visualizar a base de dados
    # entender as informações disponiveis
    # possiveis problemas/erros na base de dados
    # informações que não te ajudam te atrapalham
    
tabela = tabela.drop(columns = 'CustomerID')

display(tabela)


In [None]:
# Passo 3: Corrigir os problemas da base de dados (tratamento de dados)
display(tabela.info())


# - informações vazias
tabela = tabela.dropna() # NaN - not a number


display (tabela.info())    
 

In [None]:
# Passo 4: Analise Inicial (entender quantos clientes cancelaram)

# quantidade - contar quantos clientes são 0 e quantos são 1 na coluna cancelou
display(tabela['cancelou'].value_counts()) #conta os valores

# porcentagem
display(tabela['cancelou'].value_counts(normalize=True))
#recomendado o arredondamento somente quando terminar o projeto - display(tabela['cancelou'].value_counts(normalize=True).map("{:.1%}".format))



In [None]:
# Passo 5: Analise detalhada (causa do cancelamento dos clientes, como cada coluna impacta no cancelamento)
import plotly.express as px
#todo o grafico no python é criado em duas etapas

print(tabela.columns)

for coluna in tabela.columns:
    # cria o grafico
    grafico = px.histogram(tabela, x=coluna, color='cancelou', text_auto=True)
    # exibe o grafico 
    grafico.show()


In [None]:
#anotar as conclusões do graficos para podermos saber o que temos que rosolver aqui na empresa

# Todo mundo do contrato mensal, cancelou o serviço
    # vamos dar desconto no contrato anual e quadrimestral para fazer com que o cliente que assina mensalmente migre para o plano anual ou quadrimestral 

# ligacoes_callcenter acima de 4, todo mundo cancelou   
    # tem algum problema que não estamos conseguindo resolver   
    # se o cliente ligar 3x pro callcenter, alerta vermelho

# atraso no pagamento acima de 20 dias, o cliente cancela
    # se o cliente atrasar 15 dias no pagamento, alerta vermelho



# filtrar a base de dados: cancelamento = 56%


# duracao_contrato -> diferente do Monthly
condicao = tabela['duracao_contrato'] != 'Monthly'
tabela = tabela[condicao]

# ligacoes_callcenter -> menores ou iguais a 4
condicao = tabela['ligacoes_callcenter'] <= 4
tabela = tabela[condicao]

# dias_atraso -> menores ou iguais a 20
condicao = tabela['dias_atraso'] <= 20
tabela = tabela[condicao]

display(tabela['cancelou'].value_counts(normalize=True))
display(tabela['cancelou'].value_counts(normalize=True).map("{:.1%}".format))


# Se esses tres problemas forem resolvidos conseguimos diminuir a taxa de cancelamento de 56% para 18%

