# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados, ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos se encontram na pasta do projeto

## Importando e visualizando a base de dados

In [None]:
import pandas as pd

df = pd.read_csv('cancelamentos.csv')
display(df)


## Excluindo colunas desnecessárias para a análise

In [None]:
df_atualizado = df.drop('CustomerID', axis=1)
display(df_atualizado)


## Tratando erros

In [None]:
# verificando se há valores vazios
display(df_atualizado.info())

# excluindo linhas com valores vazios
df_tratado = df_atualizado.dropna()
display(df_tratado.info())


## Análise incial dos dados(entender como estão os cancelamentos)

In [None]:
# verificando a taxa de cancelamento
display(df_tratado['cancelou'].value_counts(normalize=True).map('{:.1%}'.format))

# taxa de cancelamento se encontra em 56.7%


In [None]:
# verificando a taxa de cancelamento por tipo de assintura
display(df_tratado[['duracao_contrato', 'cancelou']].groupby('duracao_contrato').mean())

# primeiro problema detectado, 100% dos contratos mensais são cancelados

In [None]:
# Analisando as estatísticas de cancelamento sem o plano mensal
df_filtrado = df_tratado[df_tratado['duracao_contrato'] != 'Monthly']

display(df_filtrado['cancelou'].value_counts(normalize=True).map('{:.1%}'.format))

# A taxa de cancelamento cai de 56.7% para 46.1%


## Análise mais aprofundada dos dados(encontrando as causas dos cancelamentos)

In [None]:
import plotly.express as px

# Plotando gráficos para análises mais precisas
for coluna in df_filtrado.columns:
    gf = px.histogram(df_filtrado, x = coluna, color = 'cancelou')
    gf.show()

## Observações:
### 100% dos clientes com idade superior a 50 anos cancelam a assinatura;
### a partir da quarta ligação, a assinatura é cancelada
### clientes com planos atrasados num período superior a 20 dias acabam cancelando a assinatura

In [None]:
# Filtando a base de dados de acordo com as observações mencionadas
df_final = df_filtrado[(df_filtrado['idade'] <= 50) & (df_filtrado['ligacoes_callcenter'] < 5) & (df_filtrado['dias_atraso'] < 21)]
display(df_final['cancelou'].value_counts(normalize = True).map('{:.1%}'.format))


### Feitas as alterações, a taxa de cancelamento cai de 46%.1 para 12.1%

# Conclusão -  Pontos a serem trabalhados
## 1. Plano mensal 
### - preços mais acessíveis, dias experimentais para cada plano.
## 2. Clientes com idade superior a 50 anos;
### - Adequação de conteúdo para clientes nessa faixa de idade.
## 3. Clientes com atrazo maior que 20 dias;
### - Controle automatizado de inadiplência, mensagens automáticas enviadas por e-mail e/ou número de celular para clientes com atraso igual ou maior que três dias.
## 4. Clientes que não tem seu problema resolvido em até 4 ligações.
### - Investimento na área de Telemarketing, capacitação contínua dos funcionários.