# Download dos Dados do Olist (Kaggle)

Este notebook utiliza a biblioteca `kagglehub` para baixar o dataset **Brazilian E-Commerce Public Dataset by Olist** e organizar os arquivos na pasta `data/`, onde o Agente espera encontrá-los.

Links úteis:
- [Documentação KaggleHub](https://github.com/Kaggle/kagglehub)
- [Dataset no Kaggle](https://www.kaggle.com/datasets/olistbr/brazilian-ecommerce)

In [None]:
# Instalação da biblioteca necessária
!pip install kagglehub

In [None]:
import kagglehub
import os
import shutil

print("Iniciando download do dataset...")

# Baixa a versão mais recente do dataset
# Isso salva os arquivos num diretório de cache local gerenciado pelo kagglehub
path = kagglehub.dataset_download("olistbr/brazilian-ecommerce")

print(f"Dataset baixado em: {path}")

In [None]:
# Configuração do diretório de destino do projeto
TARGET_DIR = "data"

# Garante que a pasta 'data' existe
os.makedirs(TARGET_DIR, exist_ok=True)

print(f"Movendo arquivos para a pasta do projeto: {os.path.abspath(TARGET_DIR)}...\n")

# Lista e move os arquivos CSV
files_moved = 0
for filename in os.listdir(path):
    if filename.endswith(".csv"):
        source_file = os.path.join(path, filename)
        destination_file = os.path.join(TARGET_DIR, filename)
        
        # Copia o arquivo (usamos copy para manter o cache original intacto se necessário)
        shutil.copy(source_file, destination_file)
        print(f" [OK] {filename} copiado.")
        files_moved += 1

if files_moved == 0:
    print("\n[AVISO] Nenhum arquivo CSV encontrado.")
else:
    print(f"\nSucesso! {files_moved} arquivos foram copiados para '{TARGET_DIR}'.")
    print("Agora você pode executar o notebook 'setup_data_mesh.ipynb' para criar as tabelas.")