## Python Insights | analisando dados com Python

---
### Case | cancelamento de clientes

Você foi contrato por uma empresa com mais de 800mil clientes para um projeto de análise de dados.
Recentemente esta empresa percebeu que no seu banco de dados de clientes, a maioria são de clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados, ela resolveu entender os motivos que levam a esses cancelamentos, e assim, achar as soluções mais eficientes para reduzir este número.

[Download do material auxiliar](https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link).

---
### Dependências

```cmd
pip install pandas numpy openpyxl nbformat ipykernel plotly
```

---
### Fluxograma

```python
# 1 importar base de dados
# 2 visualizar (entender) a base de dados 
# 3 corrigir erros da base de dados e prepará-la para análise
# 4 analisar os cancelamentos
# 5 mostrar a análise dos cancelamentos de forma visual com gráficos
    # como as colunas impactam no cancelamento?
# 6 mostrar como as soluções propostam podem melhorar as estatísticas
```

In [None]:
# 1 importar a base de dados

import pandas as pd
import plotly.express as px

table = pd.read_csv("cancellations_sample.csv")
display(table)

In [None]:
# 2 visualizar (entender) a base de dados
# remover informações desnecessárias para este projeto

table = table.drop(columns="CustomerID")  # coluna ID não impacta na análise
display(table)

In [None]:
# 3 corrigir erros da base de dados

display(table.info())  # informações da tabela

table = table.dropna()  # eliminar linhas vazias
display(table.info())

In [None]:
# 4 iniciar a análise dos cancelamos

# quantidade de pessoas que cancelaram (valores reais)
display(table["cancelou"].value_counts())
# quantidade de pessoas que cancelaram (porcentagem)
display(table["cancelou"].value_counts(normalize=True))
display(table["cancelou"].value_counts(normalize=True).map("{:.1%}".format))

In [None]:
# 5 como cada coluna impacta nos cancelamentos?
# visualizar de forma gráfica

for column in table.columns:
    graphic = px.histogram(table, x=column, color="cancelou")
    graphic.show()

In [None]:
# 6 análise final

# principais causas dos cancelamentos
    # 1. todos os clientes com contrato mensal cancelaram
    # 2. clientes que ligam para o call center mais de quantro vezes cancelam
    # 3. clientes que atrasam mais de vinte dias cancelam

# possíveis soluções
    # 1. oferecer desconto nos planos trimestral e anual
    # 2. resolver o problema do cliente antes de ele ligar quatro vezes pro call center
    # 3. cobrar ao clientes para não atrasar mais de vinte dias

# aplicar a primeira solução
table = table[table["duracao_contrato"] != "Monthly"]
display(table["cancelou"].value_counts())
display(table["cancelou"].value_counts(normalize=True))

# aplicar a segunda solução
table = table[table["ligacoes_callcenter"] <= 4]
display(table["cancelou"].value_counts())
display(table["cancelou"].value_counts(normalize=True))

# aplicar a terceira solução
table = table[table["dias_atraso"] <= 20]
display(table["cancelou"].value_counts())
display(table["cancelou"].value_counts(normalize=True))

# resolvendo todos os três principais problemas
display(table["cancelou"].value_counts(normalize=True).map("{:.1%}".format))