# Python Insights - Analisando Dados 

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

In [None]:
# passo 1 - Importar a base de dados 
# pandas - trabalhar com base de dados 
# plotly - trabalhar com graficos dinamicos no Python
# !pip install pandas numpy openpyxl nbformat ipykernel plotly - instalando biblioteca 
# as pd no import pandas é um apelido dado para agilizar na hora de codar
# main inicial .ipynb sendo ultilizado para ter uma vantagem. visual como "ex: Display()"
import pandas as pd 

tabela = pd.read_csv("cancelamentos_sample.csv")

# passo 2 - Visualizar a base de dados 
    # entender quais informações eu tenho disponivel 
    # procurar os problemas / as cagadas da base de dados
# colunas inuteis - indormações que nao te ajuda, te atrapalha
# tabela.drop(columns="CustomerID") - server para tirar da tabela a linha expecifica
tabela = tabela.drop(columns="CustomerID")
display(tabela)

In [None]:

# passo 3 - corrigir as cagadas da base de dados
# tabela = tabela.drop_duplicates()- tirar informações duplicadas 
# identificando informações vazias ou formato errado
display(tabela.info())

# tirar da tabela informações vazias 
tabela = tabela.dropna()
display(tabela.info())

# int - numero inteiro
# float - que pode ter casa decimal (numero quebrado)

In [None]:

# passo 4 - Analise dos cancelamentos (quantos cancelaram, quantos não cancelaram qual o %)
# selecionar uma coluna da tabela e contando os 
display(tabela["cancelou"].value_counts())

# em porcentual = normalizado
display(tabela["cancelou"].value_counts(normalize=True))


In [None]:
# passo 5 - analise das causas do cancelamento dos clientes
# express  graficos semi prontos / agilidade 
import plotly.express as px # type: ignore

#para cada coluna da nossa tabela
for coluna in tabela.columns:
    # criar grafico
    grafico = px.histogram(tabela, x=coluna, color="cancelou", text_auto=True)
    # exibe o grafico
    grafico.show()

In [None]:
#causas de cancelamento

# todos os clientes de contrato mensal, cancelaram
    #vamos dar desconto nos contratos anuis e trimestrais
# todos os clientes com mais de 20 dias de atraso cancelaram o serviço
    #criar um sistemas de cobraça dos clientes que com 10 dias de atraso a gente fala todo dia com eles
# todos os clientes que ligaram mas de 4x pro call center, cancelaram
    #criar um alerta para um cliente que ligou mais de 2x pro call center

# analisar se eu resolver esses 3 problemas, quanto cai o cencelamento?
#Condição 
#tabela = tabela[condição]
# duração do contrato nao pode ser mensal 
tabela = tabela[tabela["duracao_contrato"]!="Monthly"]

# atraso só podem ser de até 20 dias
tabela = tabela[tabela["dias_atraso"]<=20]

# ligações no call center só pode ser de até 4 ligações
tabela = tabela[tabela["ligacoes_callcenter"]<=4]

# em porcentual = normalizado
display(tabela["cancelou"].value_counts(normalize=True))
