<a href="https://colab.research.google.com/github/brodyandre/analise_de_disponibilidade_vagas_moveis/blob/main/analise_de_disponibilidade_vagas_moveis.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#📌 1. Introdução

Esta análise tem como objetivo explorar os dados de móveis disponíveis, realizar o tratamento das informações e criar uma visualização interativa para identificar a quantidade de vagas disponíveis por mês. Além disso, a análise busca realizar as devidas operações para que os dados estejam bem dispostos e apresentados de forma que possam gerar valor. Reforça-se a necessidade de gerar um DataFrame de qualidade para análises futuras, garantindo maior confiabilidade e clareza nos processos de decisão. A abordagem utilizada envolve técnicas de manipulação de dados com Pandas e visualização com Plotly.

###🔍 2. Instalação de Bibliotecas Necessárias

Para a execução do projeto, é necessário instalar as bibliotecas pandas, numpy, json, re e plotly. Abaixo está o comando para instalação:

In [3]:
!pip install pandas



###📂 3. Leitura e Estruturação dos Dados

Inicialmente, os dados são carregados a partir de um arquivo JSON e convertidos para um DataFrame do Pandas:

In [4]:
import numpy as np
import json
import pandas as pd
import re
import unicodedata

In [5]:
with open('/content/moveis_disponiveis.json', 'r') as file:
    dados = json.load(file)

dados = pd.DataFrame(dados)
dados

Unnamed: 0,id,data,vaga_disponivel,preco
0,857,2016-01-04,False,
1,857,2016-01-05,False,
2,857,2016-01-06,False,
3,857,2016-01-07,False,
4,857,2016-01-08,False,
...,...,...,...,...
364995,3279,2016-12-29,True,$140.00
364996,3279,2016-12-30,True,$140.00
364997,3279,2016-12-31,True,$140.00
364998,3279,2017-01-01,True,$140.00


###🛠 4. Limpeza e Transformação dos Dados

Os seguintes passos foram realizados para a limpeza dos dados:

1. Preenchimento de valores nulos no campo preco:

In [6]:
dados['preco'] = dados['preco'].fillna(0.0)
dados

Unnamed: 0,id,data,vaga_disponivel,preco
0,857,2016-01-04,False,0.0
1,857,2016-01-05,False,0.0
2,857,2016-01-06,False,0.0
3,857,2016-01-07,False,0.0
4,857,2016-01-08,False,0.0
...,...,...,...,...
364995,3279,2016-12-29,True,$140.00
364996,3279,2016-12-30,True,$140.00
364997,3279,2016-12-31,True,$140.00
364998,3279,2017-01-01,True,$140.00


2. Conversão do campo data para o formato de data:

In [18]:
dados['data'] = pd.to_datetime(dados['data'])
dados.info()

<class 'pandas.core.frame.DataFrame'>
Index: 365000 entries, 0 to 364999
Data columns (total 4 columns):
 #   Column           Non-Null Count   Dtype         
---  ------           --------------   -----         
 0   id               365000 non-null  int64         
 1   data             365000 non-null  datetime64[ns]
 2   vaga_disponivel  365000 non-null  bool          
 3   preco            365000 non-null  float64       
dtypes: bool(1), datetime64[ns](1), float64(1), int64(1)
memory usage: 19.5+ MB


3. Remoção de caracteres especiais do campo preco e conversão para tipo numérico:
4. Verificação dos tipos dos dados após transformação:

In [20]:
dados['preco'] = dados['preco'].apply(lambda x: re.sub(r'[R$\s,]', '', str(x)))
dados['preco'] = dados['preco'].astype(float)
dados.info()

<class 'pandas.core.frame.DataFrame'>
Index: 365000 entries, 0 to 364999
Data columns (total 4 columns):
 #   Column           Non-Null Count   Dtype         
---  ------           --------------   -----         
 0   id               365000 non-null  int64         
 1   data             365000 non-null  datetime64[ns]
 2   vaga_disponivel  365000 non-null  bool          
 3   preco            365000 non-null  float64       
dtypes: bool(1), datetime64[ns](1), float64(1), int64(1)
memory usage: 19.5+ MB


###📊 5. Análise Exploratória

Para identificar a quantidade de vagas disponíveis por mês, foi realizada uma agregação dos dados:

In [25]:
dados.groupby(dados['data'].dt.strftime('%Y-%m'))['vaga_disponivel'].sum()

Unnamed: 0_level_0,vaga_disponivel
data,Unnamed: 1_level_1
2016-01,16543
2016-02,20128
2016-03,23357
2016-04,22597
2016-05,23842
2016-06,23651
2016-07,22329
2016-08,22529
2016-09,22471
2016-10,23765


###📈 6. Visualização Interativa com Plotly

Um gráfico de barras interativo foi criado para representar as vagas disponíveis por mês. A visualização conta com uma paleta de cores degradê (Viridis) e um tema escuro para maior elegância.

In [35]:
!pip install plotly
import plotly.graph_objects as go
import plotly.express as px

# Group by month and count available spots
df_grouped = dados.groupby(dados['data'].dt.strftime('%Y-%m'))['vaga_disponivel'].sum().reset_index()
df_grouped = df_grouped.rename(columns={'data': 'Mes', 'vaga_disponivel': 'Vagas Disponíveis'})

# Create the bar chart
fig = px.bar(df_grouped, x='Mes', y='Vagas Disponíveis',
             title='Vagas Disponíveis por Mês',
             color='Vagas Disponíveis', # Color based on the value
             color_continuous_scale='Viridis', # Gradient color scale
             template='plotly_dark') # Dark background template

# Update layout for elegance
fig.update_layout(
    title_font_size=24,
    xaxis_title_font_size=16,
    yaxis_title_font_size=16,
    hovermode='x unified' # Improve hover interaction
)

# Show the interactive plot
fig.show()




###✅ 7. Conclusão e Insights

* O gráfico interativo permite identificar claramente os meses com maior e menor disponibilidade de vagas.

* A paleta de cores degradê facilita a visualização dos picos e vales de disponibilidade.

* A interface responsiva e elegante oferece uma experiência fluida para análise dos dados.