# Python Insights - Analisando Dados com Python

### Case - Cancelamento de Clientes

Você foi contratado por uma empresa com mais de 800 mil clientes para um projeto de Dados. Recentemente a empresa percebeu que da sua base total de clientes, a maioria são clientes inativos, ou seja, que já cancelaram o serviço.

Precisando melhorar seus resultados ela quer conseguir entender os principais motivos desses cancelamentos e quais as ações mais eficientes para reduzir esse número.

Base de dados e arquivos: https://drive.google.com/drive/folders/1uDesZePdkhiraJmiyeZ-w5tfc8XsNYFZ?usp=drive_link

In [None]:
#Passo a passo do projeto
#Passo 1: Importar a base de dados de clientes
#Passo 2 : Visualizar a base de dados
#Passo 3 : Corrigir os problemas da base de dados 
#Passo 4 : Analise de cancelamentos
#Passo 5 : Analise de causa doscancelamentos

###        DESAFIOS - instalacao dos pacotes  ###
#trabalhar com base de dados -> pandas 
#trabalhar com graficos e dashbords -> plotly
#codigo dentro do terminal -> pip install pandas numpy openpyxl nbformat ipykernel plotly

In [None]:
#Passo 1: Importar a base de dados de clientes
import pandas 
tabela = pandas.read_csv("cancelamentos_sample.csv") #tabela recebe biblioteca pandas e le base de dados("cancelamentos_sample.csv") 

#Passo 2 : Visualizar a base de dados

#display(tabela)

#Passo 3 : Corrigir os problemas da base de dados
#identificar colunas inuteis para analise de dados -> informações que não te ajudam, te atrapalham, tornam a base de dados mais pesada

#deletando coluna -> sem deletar na base original
tabela = tabela.drop(columns ="CustomerID")
display(tabela)
#Exemplo ->deletando uma lista de colunas 
#tabela = tabela.drop(columns =["CustomerID",'Idade','Sexo'])

#Tratando valores vazios -> valores vazios causam erros de preenchimento
#1- exibir quantas informacoes vazias existem dentro da tabela




In [None]:
#Tratando valores vazios -> valores vazios causam erros de preenchimento
#1- exibir quantas informacoes vazias existem dentro da tabela
display(tabela.info()) #-> mostra dentro da base de dados quantas informações estao non-null 

#Excluindo linhas linhas com valores vazios 
tabela = tabela.dropna() #-> dropna = comando que identifica as linhas vazias e joga fora

#Acessando a tabela com as linhas excluidas - todas elas apresentam a mesma qtd de linhas 
display(tabela.info())

In [None]:
#Passo 4 : Analise de cancelamentos

#selecionando uma coluna especifica 
    #tabela['cancelou']
#selecionando uma coluna especifica, contando os valores da coluna especifica
display(tabela['cancelou'].value_counts())

#contando o percentual(processo de normalizar-tranformar em percentual)
display(tabela['cancelou'].value_counts(normalize=True))

#Formatando os valores com funcao .map 
#display(tabela['cancelou'].value_counts(normalize=True).map("{:.1%}".format))

In [None]:
###### Criando gráficos com Python ######
#Passo 5 : Analise das principais causas doscancelamentos 
#Comparando colunas da base de dados com o cancelamento 

#importando plotly - biblioteca de gráficos
import plotly.express as px #-> renoemando plotly como px

#passo1 - criando gráfico de barra -> bar
#grafico =  px.bar()
#riando gráfico de histograma, passando tres infos(base de dados, eixo x - coluna,diferenciacao de cor com a "coluna escolhida" )

#grafico =  px.histogram(tabela,x="idade", color="cancelou")

#passo 2 - exibição de gráfico
#grafico.show()


#Mudando o valor x da coluna de forma dinamica para cada coluna da tabela 

#para cada coluna nas colunas da minha tabela, crie o grafico e execute o grafico 
for coluna in tabela.columns:
    #cria o grafico
    grafico =px.histogram(tabela, x=coluna, color="cancelou")
    #exibe o grafico 
    grafico.show()

In [29]:
#Analise das causas de cancelamento - olhando os graficos exibidos

#se um cliente ligar mais de 4x para o call center, ele cancela 
    #criar processo que se o cliente ligou 3x, a gente faz de tudo para resolver o problema dele 

#Se um cliente atrasar o pagamento mais 20 dias, ele cancela
    #Criar um processo para não deixar ele atrasar o pagamento mais de 20 dias 

#Todos os clientes do contrato mensal cancelaram
    #oferecer desconto nos planos anuais e trimestrais


#####filtrando tabela, passando filtro de condicao#####

#tabela - igual a antiga tabela só que só pegando os valores diferente de mensal -> monthly

tabela = tabela[tabela['duracao_contrato']!='Monthly'] #sem duracao do contrato mensal


#tabela é iguala  antiga tabela, traz a tabela em que a coluna ligacao é menor = a 4
tabela = tabela[tabela['ligacoes_callcenter']<=4] #sem ligação do call center acima de 4x



#pegando os valores menor = 20
tabela = tabela[tabela['dias_atraso']<=20] #sematraso de pagamento > 20dias 


tabela 
display(tabela['cancelou'].value_counts(normalize=True))


cancelou
0.0    0.816462
1.0    0.183538
Name: proportion, dtype: float64