# Desafio Aula 02 - Análise de dados com Python

Você trabalha em uma empresa de telecom e tem clientes de vários serviços diferentes, entre os principais: internet e telefone.

O problema é que, analisando o histórico dos clientes dos últimos anos, você percebeu que a empresa está com Churn de mais de 26% dos clientes.

Isso representa uma perda de milhões para a empresa.

O que a empresa precisa fazer para resolver isso?



In [None]:
#Primeiro passo: Importar a base de dados da empresa que nesse caso é uma tabela em csv.

import pandas as pd 

tabela = pd.read_csv("telecom_users.csv")
display(tabela)

#Segundo passo: Visualizar a base de dados e entender quais os dados relevantes e não relevantes para a análise

tabela= tabela.drop ("Unnamed: 0",axis=1)
#Por a coluna "Unnamed: 0" não possuir nome e portanto, não consigo afirmar quais os dados que estavam inseridos nessa
#coluna, foi definido excluir essa coluna inteira.

display(tabela)


In [None]:
#Terceiro passo: É realizar o tratamento de dados. 
# É preciso ver observar na tabela se os tipos de dados associados aos dados estão corretos
# É necessário também, verificar se existem colunas vazias e linhas vazias que podem ser descartadas para a análise
#Assim como, procurar se existem valores vazios inseridos;

print(tabela.info())


A partir da visualização da tabela com as colunas e tipos de dados, é possível verificar que a coluna número 19 TotalGasto, o tipo de dado dela está como object(texto), porém o tipo de dado correto que deveria ser atribuido a ele é o tipo float64, pois os dados inseridos nessa coluna são números e com casas decimais. 
 É possível verificar também a existência da coluna 21 Codigo, em que todos os dados inseridos na coluna são nulos, então é necessário excluir essa coluna por inteiro.

In [None]:
#Etapa01: Mudar o tipo de dado relacionado a coluna 19 Total Gasto;
#Etapa02: Excluir a coluna 21 Codigo, por inteiro;

tabela["TotalGasto"]=pd.to_numeric(tabela["TotalGasto"],errors="coerce")

tabela=tabela.dropna(how="all",axis=1)
#Esse comando vai excluir/largar, a coluna que tiver todos os dados nulos inseridos nela;

tabela=tabela.dropna(how="any",axis=0)
#Esse comando vai excluir, a linha que tiver pelo menos um dado nulo,vazio. Se a linha tiver um dado faltando, vai ser excluída.

print(tabela.info())


In [None]:
#Tratamento dos dados feitos, agora é hora de realizar a análise inicial. 
#Para responder a pergunta, porque 26% dos clientes estão cancelando o serviço de assinatura, é necessário analisar a coluna
#Churn

print(tabela["Churn"].value_counts())

print(tabela["Churn"].value_counts(normalize=True).map("{:.1%}".format))

Então, com essa informação, temos que 26.6% dos clientes estão cancelando as assinaturas de fato e 73.4% estão com as assinaturas ainda ativas, a partir da base de dados que tivemos acesso. 

In [None]:
#Passo 05: Realizar a análise completa, como cada coluna da nossa base de dados pode impactar na coluna Churn. 
#Para isso, vamos criar gráficos para uma melhor visualização dessas comparações
#Antes dos gráficos, vamos instalar a biblioteca que usaremos para construir os gráficos.

!pip install plotly

In [None]:
#Importar a biblioteca 

import plotly.express as px 

#Os gráficos são construídos em 2 etapas.
#Etapa01: Construção do gráfico 

#grafico=px.histogram(tabela,x="coluna",color="Churn",text_auto=True)

#Etapa02: Visualizar o gráfico
#grafico.show()

#Como é necessário comparar cada coluna da nossa base de dados com a coluna, Churn, vamos usar um laço de repetição For. Para isso.

for coluna in tabela.columns: 
    if coluna!="Churn"and coluna!="IDCliente":
        grafico=px.histogram(tabela,x=coluna,color="Churn",text_auto=True)
        grafico.show()
#Se quiser por uma tabela no final de cada gráfico, relacionando com o IDCliente:
        display(tabela.pivot_table(index="Churn",columns=coluna,aggfunc="count")["IDCliente"])

#### Considerações finais/Análise completa com sugestões do que fazer:
 A chance do cliente cancelar nos primeiros meses é muito alta:
 - isso pode significar que a empresa tá deixando de ofertar alguma promoção que segure o cliente nos primeiros meses ou a primeira experiência do cliente está sendo ruim com a empresa;
   - Uma sugestão: Ofertar descontos nos primeiros/dar bônus aos clientes nos primeiros meses e melhorar o setor de atendimento ao cliente;
 Clientes com familias maiores, tendem a cancelar menos;
  - Uma sugestão: Oferecer uma 2° linha de graça ou com desconto; 
 Esta acontecendo algum problema no serviço de fibra, pois a taxa de cancelamento tá muito alta;
 Quanto mais serviços o cliente tem, menor a chance dele cancelar;
  -  Sugestão: Oferecer serviços de bônus ou com descontos;
	Oferecer desconto para pagamento anual, pois quase todos os cancelamentos estão no plano mensal;
	Boleto tem muito mais cancelamento do que as outras formas de pagamento;
- Sugestão: Ofertar desconto nas outras formas de pagamento;