# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

In [None]:
import pandas as pd
import plotly.express as px

df_clientes = pd.read_csv('cancelamentos.csv')
#Remover coluna não relevante para facilitar a análise
df_clientes = df_clientes.drop(columns='CustomerID')

In [None]:
#Verificar valores nulos
df_clientes.isna().sum()

In [None]:
#Como houveram poucas aparições de valores nulos, remover as linhas não irá impactar na análise final
df_clientes = df_clientes.dropna()
df_clientes.isna().sum()

In [None]:
#Verificar os tipos de dados
df_clientes.dtypes

In [None]:
#Alteração dos tipos de dados, para melhorar a análise. Basicamente todos os dados float podem ser int.
df_clientes['idade'] = df_clientes['idade'].astype(int)
df_clientes['tempo_como_cliente'] = df_clientes['tempo_como_cliente'].astype(int)
df_clientes['frequencia_uso'] = df_clientes['frequencia_uso'].astype(int)
df_clientes['ligacoes_callcenter'] = df_clientes['ligacoes_callcenter'].astype(int)
df_clientes['dias_atraso'] = df_clientes['dias_atraso'].astype(int)
df_clientes['meses_ultima_interacao'] = df_clientes['meses_ultima_interacao'].astype(int)
df_clientes['cancelou'] = df_clientes['cancelou'].astype(int)

In [None]:
#Simplificar a idade de clientes por faixa etária
fe = []
for i in df_clientes['idade']:
    if i > 60:
        fe.append('Idoso')
    elif i > 50 and i <= 60:
        fe.append('Meia Idade')
    elif i > 24 and i <= 50:
        fe.append('Adulto')
    else:
        fe.append('Jovem')
df_clientes['faixa_etaria'] = fe

#Eliminar a coluna idade
df_clientes = df_clientes.drop(columns='idade')

In [None]:
#Simplificar o valor gasto, para entender melhor por meio de faixas de valor
vg = []
for i in df_clientes['total_gasto']:
    if i < 250:
        vg.append('1-250')
    elif i >= 250 and i < 500:
        vg.append('250-500')
    elif i >= 500 and i < 750:
        vg.append('500-750')
    else:
        vg.append('750+')
df_clientes['faixa_gasto'] = vg

df_clientes = df_clientes.drop(columns='total_gasto')

In [None]:
#Comparação de cancelamento
df_clientes['cancelou'].value_counts(normalize=True)

In [None]:
df_clientes.columns

In [None]:
#Gráficos de análise
for coluna in df_clientes.columns:
    grafico = px.histogram(df_clientes, x=coluna, color="cancelou", text_auto=True)
    grafico.show()

### Analisando os gráficos podemos concluir que:
    
1.  Usuários que tem seus problemas resolvidos mais rapidamente através de callcenter não precisando ligar mais vezes, tendem a cancelar menos. Uma solução seria emitir um alerta no sistema para usuários que já ligaram 3 vezes e não tiveram seus problemas resolvidos. Tendo em vista que a partir da quinta ligação a taxa de cancelamento é massivamente maior.

2.  Usuários que contratam o plano mensal sempre cancelam. Ou seja, seria interessante tornar atrativo os outros tipos de assinatura, utilizando de benefícios a mais ou até descontos equivalentes a quantidade de tempo de plano assinada, trimestral ou anual.
    Incentivar o usuário mensal a aderir os outros tipos de plano através de promoções e benefícios adicionais.

3.  Usuários que atrasam por mais de 20 dias a conta, sempre cancelam. Uma solução seria sempre alertar o usuário quando estiver próximo ao pagamento e também conforme os dias de atraso se passam, lembrando-o de pagar e evitando o atraso, para que assim não acumule um pagamento em cima do outro, o que, geralmente, gera o cancelamento.

4. Clientes que gastam abaixo de 500 sempre cancelam. Durante a adesão sempre incentivar ao consumo indicando de acordo com o perfil do cliente, para que torne mais suscetível a compra.