# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# Importar a base de dados
# Ve os tipos de arquivos
# Limpar arquivos e excluir arquivos desnecessários
# Tentar descobrir os principais motivos dos cancelamentos
# Verificar quanto fica a porcentagem de cancelamento sem esses motivos

# Importar a base de dados
import pandas as pd

dados = pd.read_csv('cancelamentos.csv')

# Vê os tipos de arquivos       
dados.head()

In [None]:
dados.info()
display(dados['cancelou'].value_counts(normalize=True))

# Excluindo valores vazios (Já que são poucos)
dados = dados.dropna()

dados.info()

In [8]:
# Excluíndo dados inúteis
excluir = ['CustomerID','sexo']
dados = dados.drop(excluir, axis=1)


In [None]:
dados.info()
display(dados)

In [None]:
# Formando gráficos
import plotly.express as px

for coluna in dados.columns:
    grafico = px.histogram(dados, x=coluna, color="cancelou")
    grafico.show()

In [None]:
# -- Depois da 4º ligação de atendimento, não possui mais clientes
        # Tentar resolver o problema no cliente até no máximo 3 ligações

# -- Todos dos planos mensais cancelaram
        # Fazer propostas interessantes para o clientes para assinarem planos anuis e trimestrais

# -- Depois de 20 dias de atrasos, todos cancelam
        # Tentar resolver os todos os atrasos até em 10 dias (Política de empresa)

In [None]:
# Analisando possível diminuição na taxa de cancelamento

dados = dados[dados['duracao_contrato']!='Monthly'] # tabela sem o contrato mensal
dados = dados[dados['ligacoes_callcenter']<=4]      # tabela sem ligações +4 vezes
dados = dados[dados['dias_atraso']<=20]             # sem atrasos no pagamento +20 dias

display(dados['cancelou'].value_counts(normalize=True))
