# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
import pandas as pd
import plotly.express as px

### Carregando e Visualizando os Dados

In [None]:
tabela = pd.read_csv("cancelamentos_sample.csv")
tabela = tabela.drop(columns="CustomerID")

display(tabela)

### Tratando Valores Nulos

In [None]:
tabela = tabela.dropna()
display(tabela.info())

### Análise Inicial de Cancelamento

In [None]:
display(tabela["cancelou"].value_counts())
display(tabela["cancelou"].value_counts(normalize=True))

### Análise de Duração do Contrato

In [None]:
display(tabela["duracao_contrato"].value_counts())
display(tabela["duracao_contrato"].value_counts(normalize=True))

### Agrupamento por Duração do Contrato

In [None]:
agrupamento = tabela.groupby("duracao_contrato").mean(numeric_only=True)
display(agrupamento)

### Removendo Contratos Mensais da Análise
#### Todos os clintes do contrato mensal cancelaram
#### Retirando os contratos mensais da análise


In [None]:
tabela = tabela[tabela["duracao_contrato"] != "Monthly"]
display(tabela["cancelou"].value_counts())
display(tabela["cancelou"].value_counts(normalize=True))

### Criar gráficos para a análise

In [None]:
for coluna in tabela.columns:
    grafico = px.histogram(tabela, x=coluna, color="cancelou", width=600)
    grafico.show()

### Filtrando Dados Adicionais
#### Ligações para o call center acima de 4, cancelam
#### Dias de atraso maior que 20, todos os clientes cancelam


In [None]:
tabela = tabela[tabela["ligacoes_callcenter"] < 5]
tabela = tabela[tabela["dias_atraso"] <= 20]

display(tabela["cancelou"].value_counts())
display(tabela["cancelou"].value_counts(normalize=True))