# Análise Preditiva do Índice Ibovespa

## 1. Preparação e Limpeza dos Dados (1970 - 2025)

Nesta seção inicial, o foco foi a consolidação e o tratamento dos dados históricos do Ibovespa. O processo, conhecido como *Data Wrangling*, é fundamental para garantir a qualidade e a consistência das informações que servirão de base para a análise exploratória e a construção do nosso modelo preditivo.

O objetivo foi unificar múltiplos arquivos `.csv` e transformar os dados brutos em um _dataset_ limpo, estruturado e confiável.

### Principais Etapas do Tratamento de Dados

As seguintes transformações foram aplicadas ao conjunto de dados:

* **Unificação dos Dados:**
    * Três conjuntos de dados foram mesclados em um único DataFrame para criar uma série histórica contínua.

* **Conversão de Tipos:**
    * **`Data`**: A coluna foi convertida de `string`  para o formato `datetime`, essencial para a manipulação de séries temporais.
    * **`Valores Numéricos`**: As colunas de preços (`Último`, `Abertura`, `Máxima`, `Mínima`) foram convertidas de `string` para `float`, após a remoção de separadores de milhar.
    * **`Volume (Vol.)`**: Os valores, que utilizavam abreviações como `M` (milhões) e `B` (bilhões), foram padronizados para seu formato numérico completo (ex: `8,50B` tornou-se `8500000000.0`).
    * **`Variação (Var%)`**: A coluna foi convertida de `string` com o símbolo `%` para um valor `float` decimal (ex: `"-0,48%"` tornou-se `-0.0048`), permitindo cálculos diretos.

* **Limpeza e Consistência:**
    * **`Dados Faltantes (NaN)`**: Valores ausentes foram tratados utilizando a estratégia de preenchimento progressivo (`forward fill`), que repete a última observação válida.
    * **`Datas Duplicadas`**: Foi realizada uma verificação para identificar e remover registros duplicados, mantendo-se apenas a última entrada de cada dia para garantir a unicidade dos dados.

* **Organização e Salvamento:**
    * O DataFrame foi finalmente organizado em ordem cronológica e a coluna `Data` foi definida como seu índice. O resultado foi salvo no arquivo **`Ibovespa_Consolidado_Limpo.csv`**, que será a fonte de dados para as próximas etapas do projeto.

---

## 2. Início do Projeto de Análise e Modelagem

Com o _dataset_ devidamente limpo e estruturado, estamos prontos para iniciar a fase de análise exploratória, visualização de dados e, subsequentemente, a construção do modelo preditivo.