# Projeto de Bases de Dados - Parte 3

### Docente Responsável

Prof. FirstName LastName

### Grupo GG
<dl>
    <dt>HH horas (33.3%)</dt>
    <dd>istxxxxxxxx FirstName LastName</dd>
    <dt>HH horas (33.3%)</dt>
    <dd>istxxxxxxxx FirstName LastName</dd>
    <dt>HH horas (33.3%)</dt>
    <dd>istxxxxxxxx FirstName LastName</dd>
<dl>

In [1]:
%load_ext sql
%sql postgresql://db:db@postgres/db

# Empresa de comércio online

## 0. Carregamento da Base de Dados

Carregue o esquema de Base de Dados apresentado no Anexo A.

In [8]:
%sql --file schema.sql



Crie as instruções para o seu preenchimento de forma consistente, garantindo que todas as consultas SQL e OLAP, apresentadas mais adiante, produzam um resultado não vazio. 

In [9]:
%sql --file populate.sql



## 1. Restrições de Integridade

Apresente o código para implementar as seguintes restrições de integridade, se necessário, com recurso a extensões procedimentais SQL (Stored Procedures e Triggers):

(RI-1) Nenhum empregado pode ter menos de 18 anos de idade

In [None]:
%%sql
ALTER TABLE employee 
ADD CONSTRAINT check_employee_age 
CHECK (EXTRACT(YEAR FROM age(bdate)) >= 18); 


(RI-2) Um 'Workplace' é obrigatoriamente um 'Office' ou 'Warehouse' mas não pode ser ambos

In [None]:
%%sql
CREATE OR REPLACE FUNCTION check_workplace() RETURNS TRIGGER AS $$
BEGIN
    IF (NEW.address NOT IN (SELECT address FROM office) AND NEW.address NOT IN (SELECT address FROM warehouse)) THEN
        RAISE EXCEPTION 'A workplace must be either an Office or a Warehouse.';
    END IF;
    IF (NEW.address IN (SELECT address FROM office)) AND (NEW.address IN (SELECT address FROM warehouse)) THEN
        RAISE EXCEPTION 'A workplace cant be an Office and a Warehouse at the same time.';
    END IF;
    
    RETURN NEW;
END;
$$ LANGUAGE plpgsql;

CREATE OR REPLACE TRIGGER workplace_checker BEFORE INSERT OR UPDATE ON workplace
    FOR EACH ROW EXECUTE FUNCTION check_workplace(); 


(RI-3) Uma 'Order' tem de figurar obrigatoriamente em 'Contains'.

In [None]:
%%sql

-- Verifica a constraint de foreign key na tabela conntains apenas no final da transação
ALTER TABLE contains
ALTER CONSTRAINT contains_order_no_fkey DEFERRABLE INITIALLY DEFERRED;

-- SELECT 1, uma vez que basta existir uma row em contains para satisfazer a condição
CREATE OR REPLACE FUNCTION check_order_contains() RETURNS TRIGGER AS $$
BEGIN
    IF NOT EXISTS (SELECT 1 FROM contains WHERE order_no = NEW.order_no) THEN
        RAISE EXCEPTION 'Order must appear in Contains table.';
    END IF;

    RETURN NEW;
END;
$$ LANGUAGE plpgsql;

CREATE OR REPLACE TRIGGER ensure_contains_trigger
AFTER INSERT OR UPDATE ON orders
FOR EACH ROW
EXECUTE FUNCTION check_order_contains();

## 2. Consultas SQL

Apresente a consulta SQL mais sucinta para cada uma das seguintes questões

1) Qual o número e nome do(s) cliente(s) com maior valor total de encomendas pagas?  

In [None]:
%%sql

SELECT c.cust_no, c.name
FROM customer c
JOIN pay USING(cust_no)
JOIN orders USING(order_no)
JOIN contains USING(order_no)
JOIN product USING(SKU)
GROUP BY c.cust_no HAVING SUM(qty*price) >=ALL(
    SELECT SUM(qty*price)
    FROM customer c
    JOIN pay USING(cust_no)
    JOIN orders USING(order_no)
    JOIN contains USING(order_no)
    JOIN product USING(SKU)
    GROUP BY c.cust_no
);


2. Qual o nome dos empregados que processaram encomendas em todos os dias de 2022 em que houve encomendas?

In [None]:
%%sql

SELECT DISTINCT e.name
FROM employee e
JOIN process USING(ssn)
JOIN orders USING(order_no)
WHERE NOT EXISTS(
    SELECT o1.date
    FROM orders o1
    WHERE EXTRACT(YEAR FROM o1.date) = 2022
    EXCEPT
    SELECT o2.date
    FROM orders o2
    JOIN process p USING(order_no)
    WHERE e.ssn = p.ssn
);


3. Quantas encomendas foram realizadas mas não pagas em cada mês de 2022?

In [None]:
%%sql

SELECT to_char(o.date, 'Month') AS month, COUNT(*)
FROM orders o
WHERE EXTRACT(YEAR FROM o.date) = 2022
AND o.order_no NOT IN (
    SELECT p.order_no 
    FROM pay p
)
GROUP BY month;


## 3. Vistas

Crie uma vista que resuma as informações mais importantes sobre as vendas de produtos, combinando informações de diferentes tabelas do esquema de base de dados. A vista deve ter o seguinte esquema:

product_sales(sku, order_no, qty, total_price, year, month, day_of_month, day_of_week, city)

In [None]:
%%sql
CREATE OR REPLACE VIEW product_sales AS
SELECT
    p.SKU,
    o.order_no,
    c.qty,
    (c.qty * p.price) AS total_price,
    EXTRACT (YEAR FROM o.date) AS year,
    EXTRACT (MONTH FROM o.date) AS month,
    EXTRACT (DAY FROM o.date) AS day_of_month,
    EXTRACT (DOW FROM o.date) + 1  AS day_of_week,
    SUBSTRING(cust.address FROM '____-___\s+(.*)$') AS city 
    
FROM
    orders o
    JOIN contains c ON o.order_no = c.order_no
    JOIN product p ON c.SKU = p.SKU
    JOIN customer cust ON o.cust_no = cust.cust_no;

SELECT * FROM product_sales; 

## 4. Desenvolvimento de Aplicação

### Explicação da arquitetura da aplicação web, incluindo um link para uma versão de trabalho e as relações entre os vários ficheiros na pasta web/arquivos

...

## 5. Consultas OLAP

Usando a vista desenvolvida para a Questão 3, escreva duas consultas SQL que permitam analisar:

1. As quantidade e valores totais de venda de cada produto em 2022, globalmente, por cidade, por mês, dia do mês e dia da semana

In [None]:
%%sql
CREATE TABLE IF NOT EXISTS data_dim AS
SELECT
    EXTRACT(YEAR FROM dd) AS year,
    EXTRACT(MONTH FROM dd) AS month,
    EXTRACT(DAY FROM dd) AS day_of_month,
    EXTRACT(DOW FROM dd) AS day_of_week
FROM
    GENERATE_SERIES(
        '2022-01-01'::DATE,
        '2022-12-31'::DATE,
        '1 day'::INTERVAL
    ) dd;


SELECT
    dd.year,
    dd.month,
    dd.day_of_month,
    dd.day_of_week,
    ps.sku,
    ps.city,
    SUM(ps.qty) AS total_qty,
    SUM(ps.total_price) AS total_value
FROM
    data_dim dd
LEFT JOIN product_sales ps ON dd.year = 2022
    AND dd.month = ps.month
    AND dd.day_of_month = ps.day_of_month
    AND dd.day_of_week = ps.day_of_week
GROUP BY
    dd.year,
    dd.month,
    dd.day_of_month,
    dd.day_of_week,
    ps.sku,
    ps.city
ORDER BY
    dd.year,
    dd.month,
    dd.day_of_month,
    dd.day_of_week,
    ps.sku,
    ps.city;

2. O valor médio diário das vendas de todos os produtos em 2022, globalmente, por mês e dia da semana

In [None]:
%%sql
-- SELECT ...

## 6. Índices

Indique, com a devida justificação, que tipo de índice(s), sobre qual(is) atributo(s) e sobre qual(is) tabela(s) faria sentido criar, de forma a agilizar a execução de cada uma das seguintes consultas: 

### 6.1
SELECT order_no
FROM orders 
JOIN contains USING (order_no) 
JOIN product USING (SKU) 
WHERE price > 50 AND 
EXTRACT(YEAR FROM date) = 2023

### Tipo de Índice, Atributos & Justificação

...

### 6.2
SELECT order_no, SUM(qty*price)
FROM contains 
JOIN product USING (SKU) 
WHERE name LIKE ‘A%’ 
GROUP BY order_no;

### Tipo de Índice, Atributos & Justificação

...