# Ingestão de Dados - Cosmolume

Este notebook realiza a ingestão dos dados brutos para o banco de dados MySQL da Cosmolume.  
As etapas incluem leitura dos arquivos CSV, tratamento de dados e inserção no banco.

In [None]:
# Importação das bibliotecas necessárias
import json
import os
import pandas as pd
from dotenv import load_dotenv
from sqlalchemy import create_engine
from urllib.parse import quote_plus

## Carregamento da configuração de ingestão

O arquivo `ingestion.json` define quais tabelas e arquivos serão processados.

In [None]:
with open("../config/ingestion.json", "r") as open_json:
    ingestions = json.load(open_json)

## Leitura dos arquivos CSV

Cada tabela definida na configuração é lida e armazenada em um dicionário de DataFrames.

In [None]:
# Leitura do arquivo
dfs = {}

for item in ingestions:
    table = item["table"]
    path = item["path"]

    try:
        df = pd.read_csv(path, encoding="utf-8", sep=";")
        dfs[table] = df
        print(f"Tabela {table} lida.")
    except Exception as e:
        print(f"Erro ao ler a tabela {table}.")

## Seleção e tratamento dos dados de Itens de Devolução

Seleciona a tabela escolhida e realiza o tratamento necessário nas datas, se necessário.

In [None]:
df = dfs["itens_devolucao"]

In [None]:
# Tratamento de data
df["data_devolucao"] = pd.to_datetime(df["data_devolucao"], dayfirst=True)

## Visualização dos dados tratados

Exibe as primeiras linhas do DataFrame para conferência.

In [None]:
df.head()

## Configuração da conexão com o banco de dados

Carrega a senha do banco de dados a partir do arquivo `.env`.

In [None]:
# Senha do MySQL
load_dotenv()
password = quote_plus(os.getenv("DB_PASSWORD"))

## Criação da engine de conexão

Usamos a engine SQLAlchemy para conexão com o MySQL.

In [None]:
# Criando a engine
engine = create_engine(f"mysql+pymysql://root:{password}@localhost/cosmolume")

## Inserção dos dados no banco

Carrega os dados tratados para a tabela selecionada no banco de dados.

In [None]:
# Carregar dados no banco
df.to_sql("itens_devolucao", con=engine, if_exists="append", index=False)

### Checklist de tabelas adicionadas ao banco

- [x] Clientes
- [x] Devoluções
- [x] Itens Devolução
- [x] Itens Venda
- [x] Produtos
- [x] Vendas
