# Execução do projeto

--------

Para executar o projeto, siga os passos a seguir.

## Instalar bibliotecas

Primeiro, caso não as tenha, instale todas as bibliotecas para que seja possível utilizar as funções de comunicação com o banco de dados. 
Execute a célula abaixo para instalá-las:

In [None]:
%pip install psycopg2-binary pandas matplotlib seaborn sqlalchemy

Agora, execute a célula abaixo para importar as bibliotecas ao projeto:

In [7]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sqlalchemy import create_engine


## Conexão com o banco

É necessário ter uma conexão criada com o banco ```ecommerce```. Para isso,  é preciso ter um usuário chamado **postgres** criado e inserir a senha. O nome do banco precisa **necessariamente** ser "ecommerce". Execute a célula abaixo para realizar a conexão:

In [9]:
senha = input("Digite sua senha do usuário postgres: ")

# string de conexão com o banco de dados ecommerce
engine = create_engine(f'postgresql://postgres:{senha}@localhost:5432/ecommerce')

--------

## Ingerindo os dados no banco



Agora, para consumir os arquivos CSV e transformá-los em tabelas. O script ```create_tables.py``` forecido pelo professor facilita boa parte do trabalho, mas não faz uma inserção semanticamente correta dos dados e colunas. 

Por exemplo, as colunas ficam com caracteres maiúsculos, dados que teoricamente não podem ficar nulos podem ser vazios e identificadores únicos podem ser repetidos. Por isso, foi preferível criar as tabelas com sql puro. 

Execute a query abaixo no DBeaver, num script conectado ao banco ecommerce, para criar as tabelas:

```sql
-- Cria tabela de produtos
CREATE TABLE produtos (
    code VARCHAR(20) NOT NULL UNIQUE PRIMARY KEY,
    product VARCHAR(100) NOT NULL,
    price VARCHAR(20)
);
```

```sql
-- Cria tablea de vendas
CREATE TABLE vendas (
    order_id VARCHAR(40) NOT NULL,
    date VARCHAR(16),
    ship_service_level VARCHAR(20),
    style VARCHAR(20),
    code CHAR(8) NOT NULL,
    courier_status VARCHAR(20),
    quantity INTEGER,
    ship_country CHAR(2),
    fulfillment BOOLEAN
);
```

Com isso, todas as colunas ficam com nomes adequados e coerentes, limitados por quantidade de caracteres e com chaves primárias criadas, também garantindo que estas não sejam nulas

Agora, para inserir os dados das tabelas em csv para o banco, basta executar:

```sql
COPY produtos FROM '{caminho do arquivo}/produtos.csv' DELIMITER ',' CSV HEADER;
COPY vendas FROM '{caminho do arquivo}/vendas.csv' DELIMITER ',' CSV HEADER;
```

Lembre-se de substituir ```{caminho do arquivo}``` pelo caminho correto no seu computador.

--------