# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
#passo a passo
# 1: importar a base de dados
import pandas as pd

tabela = pd.read_csv("cancelamentos.csv")

# 2: visualização da base de dados (entender as informações e encontrar problemas)
display(tabela)




In [None]:

# 3: resolver os problemas da base de dados
# 1 problema = entender as informações inuteis ("informação que não ajuda, te atrapalha")
# 2 problema = informações no formato incorreto 
# 3 problema = informação vazias 

tabela = tabela.drop(columns="CustomerID")

tabela = tabela.dropna()


# 4: analise inicial (quantos cancelaram, qual o %)
display(tabela["cancelou"].value_counts(normalize=True))




In [None]:
# 5: analise detalhada  (analise da causa do cancelamento)
#criacao de graficos
# etapa 1: cria o grafico
# etapa 2: exibir o grafico
import plotly.express as px

# histogram -> mostra a quantidade de valores em cada situação
grafico_idade = px.histogram(tabela, x="idade", color="cancelou")
grafico_duracao = px.histogram(tabela, x="duracao_contrato", color="cancelou", text_auto=True)
grafico_idade.show()
grafico_duracao.show()


# criação de um grafico para cada coluna da tabela

for coluna in tabela.columns: 
    grafico = px.histogram(tabela, x=coluna, color="cancelou", text_auto=True)
    grafico.show()



In [None]:
# alguns problemas que surgiram conforme a analise dos graficos:

    # clientes que ligaram mais de 4x pro callcenter cancelaram
        # solução: criação de um alerta para o cliente que estiver ligando pela 3 vez

    # todos os clientes de contrato mensal cancelaram
        # aplicação de desconto nos outros tipos de contrato

    # todos os clientes que atrasaram o pagamento por mais de 20 dias, cancelaram
        # ligar um alerta para o time de cobrança quando bater 15 dias de atraso 

In [None]:

# META 1: OLHAR A MINHA BASE EXCLUINDO O PROBLEMA DO CALL CENTER
    # olhar a minhna tabela e retirar todo mundo com o problema do call center
tabela = tabela[tabela["ligacoes_callcenter"] < 5]
display(tabela["cancelou"].value_counts(normalize=True)) #diminuição de 56% para 36%

In [None]:
# META 2: OLHAR A MINHA BASE EXCLUINDO O PROBLEMA DOS DIAS DE ATRASO DE PAGAMENTO
tabela = tabela [tabela["dias_atraso"] <= 20]
display(tabela["cancelou"].value_counts(normalize=True))

In [None]:
# META 3: OLHAR A MINHA BASE EXCLUINDO OS CONTRATOS MENSAIS
tabela = tabela[tabela["duracao_contrato"] != "Monthly"]
display(tabela["cancelou"].value_counts(normalize=True))