# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# instalar
# !pip install pandas
# !pip install openpyxl
# !pip install plotly    # rodar graficos

In [None]:
# Passo a Passo
# Passo 1: Importar a base de dados

import pandas as pd # pacote de codigo (ferramenta, biblioteca) # 
tabela = pandas.read.csv("cancelamentos.sample.csv")
tabela = tabela.drop(columns = "CustomerID")
# Passo 2: Visualizar a base de dados
display(tabela)


In [None]:
# Passo 3: Corrigir as cagadas da base de dados
# valores vazios
display(tabela.info())
tabela = tabela.dropna() # `dropna` metodo do python que elimina as linhas que possuem dados vazios

In [None]:
# Passo 4: Primeira analise do cancelamento dos clientes (Qual o % de clientes que cancelou)
display(tabela["cancelou"].value_counts()) # coluna cancelou da nossa tabela; colchetes do panda
display(tabela["cancelou"].value_counts(normalize=True)) # identifica o percentual # `normalize divide o valor pelo total`

In [None]:
display(tabela["duracao_contrato"].value_counts())
display(tabela["duracao_contrato"].value_counts(normalize=True))

# agrupamento
# duracao_contrato
# anual - 50%
# trimestral - 35%
# mensal - 90%

agrupamento = tabela.groupby("duracao_contrato").mean(numeric_only=True) # pegar a media

In [None]:
# todos os clientes do contrato mensal cancelaram   
# sugestao: oferecer desconto nos contratos anuais/trimestrais
tabela = tabela["duracao_contrato"] != "Monthly" # vai excluir o mensal da tabela
display(tabela["duracao_contrato"].value_counts(normalize=True))

In [None]:
# Passo 5: Analise a causa do cancelamento dos clientes
# criar graficos para fazer a analise
import plotly.express as px

# Ordem de apresentacao de graficos no Python: 1-Cria o grafico; 2-Exibe o grafico

# cria o grafico
for column in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="cancelou")
    # exibe o grafico
    grafico.show()

In [None]:
# pagagmentos mensais
# ligacoes para call center acima de 4, cancelam
# dias de atraso maior que 20, todos os clientes cancelam

# voce nunca vai resolver 100% dos problemas de cancelamento

tabela = tabela[tabela["ligacoes_callcenter"] < 5]
tabela = tabela[tabela["dias_atraso"] <= 20]

display(tabela["duracao_contrato"].value_counts())
display(tabela["duracao_contrato"].value_counts(normalize=True))