# Exploração Inicial — Dataset Orders (Olist)

Este notebook faz parte do projeto **olist-orders-analysis**, cujo objetivo é analisar
o comportamento dos pedidos da base pública da Olist, aplicando conceitos fundamentais
de análise de dados com **Python, Pandas e Numpy**.

Neste primeiro notebook, o foco está exclusivamente no dataset **orders**, realizando:
- entendimento da estrutura dos dados
- análise exploratória inicial
- identificação de padrões, assimetrias e possíveis problemas de qualidade
- geração de hipóteses que serão exploradas nos próximos notebooks

## Objetivo deste notebook

O objetivo deste notebook é realizar uma **análise exploratória inicial (EDA)** do dataset
`orders.csv`, respondendo perguntas como:

- Quantos pedidos existem no dataset?
- Qual o status mais comum dos pedidos?
- Como os pedidos se distribuem ao longo do tempo?
- Existem indícios de assimetria ou caudas longas nos dados?
- Há dados ausentes ou inconsistências relevantes?

As respostas a essas perguntas servirão de base para a definição das métricas
que serão construídas nos próximos notebooks.

## Dataset utilizado

Neste notebook utilizamos o arquivo:

- `data/raw/olist_orders_dataset.csv`

Este dataset contém informações a nível de pedido, incluindo:
- identificador do pedido
- identificador do cliente
- status do pedido
- datas relacionadas ao ciclo do pedido (compra, aprovação, envio, entrega)

Neste estágio, os dados são utilizados **sem qualquer tratamento prévio**,
respeitando a camada *raw* do pipeline analítico.


## Abordagem de análise

A exploração dos dados seguirá os seguintes passos:

1. Leitura do dataset e inspeção inicial da estrutura
2. Análise dos tipos de dados e valores ausentes
3. Exploração das variáveis categóricas (ex: status do pedido)
4. Análise temporal básica dos pedidos
5. Observação de estatísticas descritivas relevantes
6. Registro de insights e hipóteses iniciais

Nenhuma transformação definitiva será aplicada neste notebook.
O objetivo é **entender os dados antes de modelá-los**.


## Observações importantes

- Este notebook não tem como objetivo gerar métricas finais
- Nenhuma decisão de negócio será tomada aqui
- Possíveis problemas ou inconsistências serão apenas identificados, não corrigidos

Correções, tratamentos e métricas serão implementados
nos notebooks seguintes, respeitando o pipeline analítico do projeto.


## Checklist da exploração

Ao final deste notebook, esperamos ter clareza sobre:

- [ ] Estrutura geral do dataset
- [ ] Volume total de pedidos
- [ ] Distribuição dos status
- [ ] Cobertura temporal dos dados
- [ ] Presença de dados ausentes
- [ ] Possíveis assimetrias ou padrões relevantes
