
# 🛒 Análise Exploratória e Pré-Processamento de Dados
**Projeto:** Fatores que influenciam a avaliação do cliente em pedidos online  
**Fonte dos Dados:** [Brazilian E-Commerce Public Dataset by Olist - Kaggle](https://www.kaggle.com/datasets/olistbr/brazilian-ecommerce)  
**Autor:** Abraão Nazário



## 🎯 Definição do Problema
O objetivo deste projeto é investigar os fatores que influenciam as avaliações feitas pelos clientes no contexto de uma plataforma de e-commerce brasileira. 

**Tipo de problema:** Classificação (supervisionado)  
**Hipóteses iniciais:** Tempo de entrega, categoria do produto e número de itens podem impactar a avaliação.  
**Restrições:** Foram considerados apenas pedidos com avaliação registrada e dados completos.


In [None]:

import pandas as pd

# Leitura dos arquivos principais diretamente do GitHub
url_orders = 'https://raw.githubusercontent.com/abraaonazario/mvp-analise-dados/main/olist_orders_dataset.csv'
url_reviews = 'https://raw.githubusercontent.com/abraaonazario/mvp-analise-dados/main/olist_order_reviews_dataset.csv'

orders = pd.read_csv(url_orders)
reviews = pd.read_csv(url_reviews)


In [None]:

# Visualizar os dados
orders.head()


In [None]:

# Informações sobre o dataset
orders.info()
reviews.info()


In [None]:

# Resumo estatístico das datas dos pedidos
orders.describe(include='all')


In [None]:

# Verificar valores ausentes
orders.isnull().sum()
reviews.isnull().sum()


In [None]:

# Unir dados de pedidos com avaliações
df = pd.merge(orders, reviews, on='order_id')
df.head()


In [None]:

import matplotlib.pyplot as plt
import seaborn as sns

# Distribuição das notas
sns.countplot(data=df, x='review_score')
plt.title("Distribuição das Avaliações dos Clientes")
plt.show()



## ⚙️ Pré-processamento de Dados
Aqui foram aplicadas as operações de limpeza, transformação e preparação dos dados.


In [None]:

# Exemplo de pré-processamento: eliminar colunas irrelevantes
df = df[['order_status', 'order_purchase_timestamp', 'review_score']]
df.dropna(inplace=True)



## ✅ Checklist
- [x] Definição do problema
- [x] Tipo de problema identificado
- [x] Leitura dos dados e visualização inicial
- [x] Estatísticas descritivas
- [x] Valores ausentes tratados
- [x] Visualizações criadas
- [x] Pré-processamento iniciado



## 📝 Conclusão
Este notebook iniciou a análise dos dados de e-commerce do Brasil, focando na relação entre características do pedido e a avaliação do cliente. Etapas futuras podem incluir modelagem preditiva e análise mais aprofundada dos dados de produtos e logística.
