# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.


In [None]:
#passo a passo do projeto
#passo 1: importa base de dados
#passo 2: visualizar base de dados
#passo 3: corrigir problemas na base de dados
#passo 4: analise inicial de cancelamentos
#passo 5: analise das causa e possiveis ajustes

In [None]:
#passo 1: importar base de dados
import pandas as pd

In [None]:
#passo 2: visualizar base de dados
tabela = pd.read_excel("produtos_ficticios.xlsx")
display(tabela)


In [None]:
#mostra todas as infos importantes
display(tabela.info())

In [None]:
#passo 3: corrigir problemas na base de dados
#removendo a coluna inutil customerID
tabela = tabela.drop( columns = "CustomerID")
display(tabela)
#removendo todas as linhas que contem valores nulos NAN
tabela = tabela.dropna()


In [None]:
#passo 4: analise inicial de cancelamentos
#quantas pessoas cancelaram e quantas nao cancelaram 
display(tabela["cancelou"].value_counts())
#em porcentagem                                        numero de casa decimais          
display(tabela["cancelou"].value_counts(normalize= True).map("{:.2%}".format))

In [None]:
#passo 5: analise das causa e possiveis ajustes
#instalar a labery para tabelas
#!pip install plotly
import plotly.express as px

for colunas in tabela.columns:
    #criar o grafico
    grafico = px.histogram(tabela, x=colunas, color = "cancelou")
    #mostrar o grafico
    grafico.show()

In [None]:
# com os graficos a gente consegue descobrir muita coisa:
# dias atraso acima de 20 dias, 100% cancela
# ligações call center acima de 5 todo mundo cancela
# praticamente todos os contratos mensais cancelaram (ou todos)

tabela = tabela[tabela['duracao_contrato']!="Monthly"]
tabela = tabela[tabela['dias_atraso']<= 20]
tabela = tabela[tabela['ligacoes_callcenter']<=4]
display(tabela["cancelou"].value_counts(normalize= True).map("{:.2%}".format))
