# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# Passo a passo do projeto
# Passo 1: Importar a base de dados
    # !pip install pandas numpy openpyxl
import pandas as pd

tabela = pd.read_csv("cancelamentos_sample.csv")

In [None]:
# Passo 2: Visualizar a base de dados
display(tabela)

In [None]:
# Passo 3: Corrigir os problemas da base de dados
    # Identificar e remover colunas inúteis (ex.: CustomerID) - "Informações que não te ajudam te atrapalham"
tabela = tabela.drop(columns=["CustomerId"])
    # Identificar e remover linhas com valores vazios 
print(tabela.info())
tabela = tabela.dropna()

In [None]:
# Passo 4: Análise inicial dos cancelamentos
    # Identificar quantas pessoas cancelaram e quantas não cancelaram
display(tabela["cancelou"].value_counts())
    # em porcentagem
display(tabela["cancelou"].value_counts(normalize=True))

In [None]:
# Passo 5: Análise das causas dos cancelamentos (como as colunas da base impactam no cancelamento)
    # gráficos/dashboards
%pip install plotly
import plotly.express as px

    # criar o gráfico
for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="cancelou")
        #exibir o gráfico
    grafico.show()

In [None]:
# clientes do contrato mensais TODOS cancelam
    # oferecer desconto nos planos anuais e trimestrais
tabela = tabela[tabela["duracao_contrato"] != "Monthly"]

# clientes que ligam mais do que 4 vezes para o call center, cancelam
    # criar um processo para resolver o problema do cliente em no máximo 3 ligações
tabela = tabela[tabela["ligacoes_callcenter"] <= 4]

# cliente que atrasaram mais de 20 dias, cancelaram
    # política de resolver atrasos em até 10 dias (equipe financeira)
tabela = tabela[tabela["dias_atraso"] <= 20]


display(tabela["cancelou"].value_counts())
# em porcentagem
display(tabela["cancelou"].value_counts(normalize=True))