# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
# instalar as bibliotecas
# !pip install pandas numpy openpyxl nbformat ipykernel plotly

# passo a passo
# 1 . importar base de dados
import pandas as pd

tabela = pd.read_csv("cancelamentos.csv")



# 2 . visualizar a base de dados para entender o que tem nela + identificar problemas

# informaçoes que nao te ajudam te atrapalham

tabela = tabela.drop(columns="CustomerID")
display(tabela)


In [None]:
# 3 . tratamento da base de dados
# - valores que estão vazios
display(tabela.info())

tabela = tabela.dropna()

display(tabela.info())

In [None]:
# 4 . analise de dados inicial => quantos clientes cancelaram o servico? e qual a porcentagem de cancelamento de clientes?

display(tabela["cancelou"].value_counts())

display(tabela["cancelou"].value_counts(normalize=True))





In [None]:
# 5 . analise de causa dos cancelamentos dos clientes
# (compararas outras colunas da tabela com a coluna de cancelamento)

import plotly.express as px

#for item in lista:
    # todos os codigos aqui dentro
    # serao executados para cada item na lista

for coluna in tabela.columns:
    
    #Criar grafico
    grafico = px.histogram(tabela, x=coluna, color="cancelou", text_auto=True)

    # exibir grafico

    grafico.show()

In [None]:
# usuarios do contrato mensal cancelam sempre
    # evitar o contrato mensal e incentivar com descontos os contratos anuais e trimestrais

#todos os usuarios que ligaram para o callcenter mais de 4x cancelaram 
    # criar um processo quando um usuario ligar mais de 4x para o callcenter para tentar reter o usuario

# usuarios que atrasaram o pagamento mais de 20 dias cancelaram
    # criar um alerta para quando o atraso for maior que 15 dia

#duracao_contrato -> difernte de mensal
tabela = tabela[tabela["duracao_contrato"]!="Monthly"]

# ligacoes_de_callcenter -> menor ou igual a 4

tabela = tabela[tabela["ligacoes_callcenter"]<= 4]

# atraso_pagamento = <= 20 dias

tabela = tabela[tabela["dias_atraso"]<= 20]

display(tabela["cancelou"].value_counts(normalize=True))

