# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
import pandas as pd

# Importando base de dados
tab = pd.read_csv("cancelamentos_sample.csv")
display(tab) # mostrando a tabela original

# Deletando coluna inútil para análise
tab = tab.drop(columns="CustomerID")
display(tab) # mostrando a tabela sem os Ids

In [None]:
# Resumo das informações da base de dados
display(tab.info()) # informações dos dados sem drop

# Tratar dados vazios
tab = tab.dropna() # se a linha possui um item vazio, ela é dropada (ja que poucas linhas são null)
display(tab.info())


In [None]:
# Análise Inicial - percentual e quantidade de clientes cancelaram
display(tab["cancelou"].value_counts()) # contagem de qnts vezes cada valor aparece
display(tab["cancelou"].value_counts(normalize=True)) # porcentagem de qnts vezes cada valor aparece

display(tab["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

In [None]:
# Análise de contrato - que tipo de contrato é mais provavel de ser cancelado
                      # ou seja, como impacta

import plotly.express as px # .express - graficos do plotly

grafico = px.histogram(tab, x="duracao_contrato") # passar a bd e a coluna
grafico.show()

# separar os cancelados por cor
grafico = px.histogram(tab, x="duracao_contrato", color="cancelou")
grafico.show()

In [None]:
# Gerar gráficos para cada coluna da tabela (visualizar o que implica no problema para pensar em solucoes)
for coluna in tab.columns:
    grafico = px.histogram(tab, x=coluna, color="cancelou")
    grafico.show()

In [None]:

# Possibilitando entender como solucionar os problemas ira diminuir o problema (cancelamentos)
filtro = tab["ligacoes_callcenter"]<=4 # nome da coluna ou condicoes
tab = tab[filtro]
display(tab["cancelou"].value_counts(normalize=True))

filtro = tab["dias_atraso"]<=20 # nome da coluna ou condicoes
tab = tab[filtro]
display(tab["cancelou"].value_counts(normalize=True))

filtro = tab["duracao_contrato"]!="Monthly" # nome da coluna ou condicoes
tab = tab[filtro]
display(tab["cancelou"].value_counts(normalize=True))