# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# !pip install pandas openpyxl numpy nbformat plotly ipykernel
# pandas -> base de dados
# plotly -> criar gráficos dinâmicos
import pandas as pd
import plotly.express as px

In [None]:
# Passo 1: Importar a base de dados
tabela = pd.read_csv("cancelamentos.csv")

In [None]:
# Passo 2: Visualizar a base de dados (2 objetivos: entender as informações + encontrar problemas)
display(tabela)

In [None]:
# Passo 3: Corrigir os problemas da base de dados
    # Informações inuteis (informação que não te ajuda, te atrapalha)
tabela = tabela.drop(columns="CustomerID")
    # Verificar as informações da base de dados (int -> inteiro | float -> com casa decimal  object -> texto)
display(tabela.info())
    # Excluir as linhas que têm valores vazios
tabela = tabela.dropna()
display(tabela.info())

In [None]:
# Passo 4: Análise Inicial (quantos clientes concelara,. qual o % de clientes)
    # Quantos cancelaram
display(tabela["cancelou"].value_counts())
    # Percentual de quantos cancelaram
display(tabela["cancelou"].value_counts(normalize=True)) # .map("{:.2%}".format) -> mostra formatado em % com 2 casas decimais

In [None]:
# Passo 5: Análise a causa dos cencelamentos dos clientes
    # Entender como cada coluna da base de dados impacta no cancelamento do cliente criando gráficos

        # Criar o gráfico
for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="cancelou") # histogram -> tipo de gráfico
        # Exibir o gráfico
    grafico.show()

In [None]:
# Clientes com contrato MENSAl cancelam em 100% das vezes
    # oferencer descontos em planos anuais e trimestrais
# Clientes que LIGAM AO CALLCENTER mais de 4 vezes, cencelam 100% das vezes
    # criar um processo para resolver problemas
# Clientes com ATRASO NA FATURA com mais de 20 dias, cancelam 100% das vezes
    # politica de resolver atrasos em menos dias

# Clientes com GASTOS TOTAIS menores que 500, calcelam 100% das vezes
# Clientes com IDADE acima de 50 anos, cancelam 100% das vezes

# Previsão com resolução dos problemas:
tabela = tabela[tabela["duracao_contrato"] != "Monthly"]
tabela = tabela[tabela["ligacoes_callcenter"] <= 4]
tabela = tabela[tabela["dias_atraso"] <= 20]
    # Exibir cancelamentos sem: CONTRATO MENSAL | 4+ LIGAÇÕES CALLCENTER | 20- DIAS DE ATRASO
display(tabela["cancelou"].value_counts())
    # Exibir em porcentagem
display(tabela["cancelou"].value_counts(normalize=True))


# ANTES DA RESOLUÇÃO DOS PROBLEMAS:
    # 1.0    56.79%
    # 0.0    43.21%

# APÓS AS RESOLUÇÕES:
    # 0.0    81.65%
    # 1.0    18.35%