# Análise de Dados com Python

### Desafio:

Você trabalha em uma empresa de telecom e tem clientes de vários serviços diferentes, entre os principais: internet e telefone.

O problema é que, analisando o histórico dos clientes dos últimos anos, você percebeu que a empresa está com Churn de mais de 26% dos clientes.

Isso representa uma perda de milhões para a empresa.

O que a empresa precisa fazer para resolver isso?

Base de Dados: https://drive.google.com/drive/folders/1T7D0BlWkNuy_MDpUHuBG44kT80EmRYIs?usp=sharing <br>
Link Original do Kaggle: https://www.kaggle.com/radmirzosimov/telecom-users-dataset

In [None]:
# Passo 1: Importar os dados

# Passo 2: Visualizar os dados
# - Entender as informações que estão disponiveis
# - Descobrir possiveis erros

# Passo 3: Tratamento de dados
# - Valores que estão sendo reconhecidos de forma errada
# - Valores vazios

# Passo 4: Análise inicial
# Passo 5: Análise mais completa


In [9]:
# Passo 1: importar dados
table = pd.read_csv("telecom_users.csv")

# Passo 2
# display(table)
# Unnamed: 0 e IDCliente são informações inuteis
table = table.drop("Unnamed: 0", axis=1)
table = table.drop("IDCliente", axis=1)
# axis = 0 (linha), axis = 1 (coluna)
display(table.info())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5986 entries, 0 to 5985
Data columns (total 21 columns):
 #   Column                  Non-Null Count  Dtype  
---  ------                  --------------  -----  
 0   Genero                  5986 non-null   object 
 1   Aposentado              5986 non-null   int64  
 2   Casado                  5986 non-null   object 
 3   Dependentes             5985 non-null   object 
 4   MesesComoCliente        5986 non-null   int64  
 5   ServicoTelefone         5986 non-null   object 
 6   MultiplasLinhas         5986 non-null   object 
 7   ServicoInternet         5986 non-null   object 
 8   ServicoSegurancaOnline  5986 non-null   object 
 9   ServicoBackupOnline     5986 non-null   object 
 10  ProtecaoEquipamento     5986 non-null   object 
 11  ServicoSuporteTecnico   5986 non-null   object 
 12  ServicoStreamingTV      5986 non-null   object 
 13  ServicoFilmes           5986 non-null   object 
 14  TipoContrato            5986 non-null   

None

In [16]:
# Passo 3: Tratamento de dados
# - Valores que estão sendo reconhecidos de forma errada
# Para converter o tipo de alguma coluna para outro tipo
# tabela["Coluna"] = pd.to_numeric(Coluna, erro)

# TotalGasto está recebendo um onject (string) enquanto deveria estar recebendo um float
table["TotalGasto"] = pd.to_numeric(table["TotalGasto"], errors="coerce")
# ,errors="coerce". Quando encontrar um erro, deletar a informação

# - Valores vazios
# Preciso selecionar as melhores linhas e colunas para apagar
# Se uma coluna tem todos dados nulos, ela é inutil
# Se um cliente (linha) tiver algum dado nulo, o cliente se torna inválido
# table = table.dropna(how,axis)

table = table.dropna(how="all", axis=1)
# deletar todas as colunas que tenham todos valores vazios

table = table.dropna(how="any", axis=0)
# deletar qualquer linha que quenha pelo menos um valor vazio

# any = algum valor vazio, all = todos os valores
display(table.info())

<class 'pandas.core.frame.DataFrame'>
Int64Index: 5974 entries, 0 to 5985
Data columns (total 20 columns):
 #   Column                  Non-Null Count  Dtype  
---  ------                  --------------  -----  
 0   Genero                  5974 non-null   object 
 1   Aposentado              5974 non-null   int64  
 2   Casado                  5974 non-null   object 
 3   Dependentes             5974 non-null   object 
 4   MesesComoCliente        5974 non-null   int64  
 5   ServicoTelefone         5974 non-null   object 
 6   MultiplasLinhas         5974 non-null   object 
 7   ServicoInternet         5974 non-null   object 
 8   ServicoSegurancaOnline  5974 non-null   object 
 9   ServicoBackupOnline     5974 non-null   object 
 10  ProtecaoEquipamento     5974 non-null   object 
 11  ServicoSuporteTecnico   5974 non-null   object 
 12  ServicoStreamingTV      5974 non-null   object 
 13  ServicoFilmes           5974 non-null   object 
 14  TipoContrato            5974 non-null   

None

In [24]:
# Passo 4: Análise inicial

# Etapa 1, criar o gráfico
# grafico = px.histogram(tabela, coluna)
# grafico de histograma (conta valores)

grafico = px.histogram(table, x="Dependentes")
# Mostra o grafico da coluna Dependentes

grafico2 = px.histogram(table, x="Dependentes", color="Churn")
# Mostra o grafico da coluna Dependentes em relação a coluna Churn

# Posso estilizar as cores ,color_discrete_sequence=["blue", "green"]

# Etapa 2, exibir o gráfico
grafico2.show()

In [None]:
# Passo 5: Análise mais completa


In [17]:
!pip install plotly

Collecting plotly
  Downloading plotly-5.3.1-py2.py3-none-any.whl (23.9 MB)
Collecting tenacity>=6.2.0
  Downloading tenacity-8.0.1-py3-none-any.whl (24 kB)
Installing collected packages: tenacity, plotly
Successfully installed plotly-5.3.1 tenacity-8.0.1


In [19]:
import pandas as pd
import plotly.express as px

### Conclusões e Ações

Escreva aqui suas conclusões: