# Projeto de Bases de Dados - Parte 2

### Grupo GG
<dl>
    <dt>15 horas (33.3%)</dt>
    <dd>ist1109685 João Viegas</dd>
    <dt>15 horas (33.3%)</dt>
    <dd>ist1109803 Hugo Pereira</dd>
    <dt>15 horas (33.3%)</dt>
    <dd>ist1109293 Diogo Lobo</dd>
<dl>

In [None]:
%load_ext sql
%config SqlMagic.displaycon = 0
%config SqlMagic.displaylimit = 100
%sql postgresql+psycopg://postgres:postgres@postgres/postgres

## 0. Carregamento da Base de Dados

Crie a base de dados “Aviacao” no PostgreSQL e execute os comandos para criação das tabelas desta base de dados apresentados no ficheiro “aviacao.sql”

## 1. Restrições de Integridade [3 valores]

Implemente na base de dados “Aviacao” as seguintes restrições de integridade, podendo recorrer a Triggers caso estritamente necessário:

(RI-1) Aquando do check-in (i.e. quando se define o assento em bilhete) a classe do bilhete tem de corresponder à classe do assento e o aviao do assento tem de corresponder ao aviao do voo

In [None]:
%%sql
-- (RI-1)

CREATE OR REPLACE FUNCTION verificar_checkin_bilhete()
RETURNS TRIGGER AS $$
DECLARE
    voo_no_serie VARCHAR;
    assento_prim BOOLEAN;
BEGIN
    -- Só verifica se estiver a fazer check-in (lugar e no_serie definidos)
    IF NEW.lugar IS NOT NULL AND NEW.no_serie IS NOT NULL THEN

        -- Obter o avião do voo
        SELECT no_serie INTO voo_no_serie
        FROM voo
        WHERE id = NEW.voo_id;

        -- Verificar se o avião do assento é o mesmo do voo
        IF voo_no_serie IS DISTINCT FROM NEW.no_serie THEN
            RAISE EXCEPTION 'Avião do assento (%), não corresponde ao avião do voo (%).',
                NEW.no_serie, voo_no_serie;
        END IF;

        -- Agora que o avião é válido, verificar se o assento existe
        IF NOT EXISTS (
            SELECT 1
            FROM assento
            WHERE lugar = NEW.lugar AND no_serie = NEW.no_serie
        ) THEN
            RAISE EXCEPTION 'O assento (%) não existe no avião %.', NEW.lugar, NEW.no_serie;
        END IF;

        -- Obter se o assento é de 1ª classe
        SELECT prim_classe INTO assento_prim
        FROM assento
        WHERE lugar = NEW.lugar AND no_serie = NEW.no_serie;

        -- Verificar se a classe do bilhete corresponde à do assento
        IF assento_prim IS DISTINCT FROM NEW.prim_classe THEN
            RAISE EXCEPTION 'Classe do bilhete (%), não corresponde à classe do assento (%).',
                NEW.prim_classe, assento_prim;
        END IF;
    END IF;

    RETURN NEW;
END;
$$ LANGUAGE plpgsql;


DROP TRIGGER IF EXISTS trg_verificar_checkin_bilhete ON bilhete;

CREATE TRIGGER trg_verificar_checkin_bilhete
BEFORE INSERT OR UPDATE ON bilhete
FOR EACH ROW
EXECUTE FUNCTION verificar_checkin_bilhete();



(RI-2) O número de bilhetes de cada classe vendidos para cada voo não pode exceder a capacidade (i.e., número de assentos) do avião para essa classe

In [None]:
%%sql
-- (RI-2)

CREATE OR REPLACE FUNCTION evitar_double_booking()
RETURNS TRIGGER AS $$
BEGIN
    -- Só verifica se o lugar está definido (i.e., foi feito check-in)
    IF NEW.lugar IS NOT NULL THEN
        IF EXISTS (
            SELECT 1
            FROM bilhete b
            WHERE b.voo_id = NEW.voo_id
              AND b.lugar = NEW.lugar
              AND (TG_OP = 'INSERT' OR b.id <> NEW.id)
        ) THEN
            RAISE EXCEPTION 'Lugar % já está ocupado no voo %.', NEW.lugar, NEW.voo_id;
        END IF;
    END IF;

    RETURN NEW;
END;
$$ LANGUAGE plpgsql;

DROP TRIGGER IF EXISTS trg_evitar_double_booking ON bilhete;

CREATE TRIGGER trg_evitar_double_booking
BEFORE INSERT OR UPDATE ON bilhete
FOR EACH ROW
EXECUTE FUNCTION evitar_double_booking();




(RI-3) A hora da venda tem de ser anterior à hora de partida de todos os voos para os quais foram comprados bilhetes na venda

In [None]:
%%sql
-- (RI-3)
    
-- Função: Garante que a hora da venda é anterior à partida de todos os voos dos bilhetes dessa venda
CREATE OR REPLACE FUNCTION validar_bilhete_antes_partida()
RETURNS TRIGGER AS $$
DECLARE
    venda_hora TIMESTAMP;
    partida TIMESTAMP;
BEGIN
    SELECT v.hora_partida, ve.hora INTO partida, venda_hora
    FROM voo v
    JOIN venda ve ON ve.codigo_reserva = NEW.codigo_reserva
    WHERE v.id = NEW.voo_id;

    IF venda_hora >= partida THEN
        RAISE EXCEPTION 'A venda foi feita depois da partida do voo.';
    END IF;

    RETURN NEW;
END;
$$ LANGUAGE plpgsql;

DROP TRIGGER IF EXISTS trg_validar_bilhete_antes_partida ON bilhete;

CREATE TRIGGER trg_validar_bilhete_antes_partida
AFTER INSERT ON bilhete
FOR EACH ROW
EXECUTE FUNCTION validar_bilhete_antes_partida();


UsageError: Cell magic `%%sql` not found.


## 2. Preenchimento da Base de Dados [2 valores]

Preencha todas as tabelas da base de dados de forma consistente (após execução do ponto anterior) com os seguintes requisitos adicionais de cobertura:
- ≥10 aeroportos internacionais (reais) localizados na Europa, com pelo menos 2 cidades tendo 2 aeroportos
- ≥10 aviões de ≥3 modelos distintos (reais), com um número de assentos realista; assuma que as primeiras ~10% filas são de 1a classe
- ≥5 voos por dia entre 1 de Janeiro e 31 de Julho de 2025, cobrindo todos os aeroportos e todos os aviões; garanta que para cada voo entre dois aeroportos se segue um voo no sentido oposto; garanta ainda que cada avião tem partida no aeroporto da sua chegada anterior
- ≥30.000 bilhetes vendidos até à data presente, correspondendo a ≥10.000 vendas, com todo os bilhetes de voos já realizados tendo feito check-in, e com todos os voos tendo bilhetes de primeira e segunda classe vendidos
Deve ainda garantir que todas as consultas necessárias para a realização dos pontos seguintes do projeto produzem um resultado não vazio.

O código para preenchimento da base de dados deve ser compilado num ficheiro "populate.sql", anexado ao relatório, que contém com comandos INSERT ou alternativamente comandos COPY que populam as tabelas a partir de ficheiros de texto, também eles anexados ao relatório.

## 3. Desenvolvimento de Aplicação [5 valores]

Crie um protótipo de RESTful web service para gestão de consultas por acesso programático à base de dados ‘Aviacao’ através de uma API que devolve respostas em JSON, implementando os seguintes endpoints REST:

|Endpoint|Descrição|
|--------|---------|
|/|Lista todos os aeroportos (nome e cidade).|
|/voos/\<partida>/|Lista todos os voos (número de série do avião,  hora de partida e aeroporto de chegada) que partem do aeroporto de \<partida> até 12h após o momento da consulta.|
|/voos/\<partida>/\<chegada>/|Lista os próximos três voos (número de série do avião e hora de partida) entre o aeroporto de \<partida> e o aeroporto de \<chegada> para os quais ainda há bilhetes disponíveis.|
|/compra/\<voo>/|Faz uma compra de um ou mais bilhetes para o \<voo>, populando as tabelas \<venda> e \<bilhete>. Recebe como argumentos o nif do cliente, e uma lista de pares (nome de passageiro, classe de bilhete) especificando os bilhetes a comprar.|
|/checkin/\<bilhete>/|Faz o check-in de um bilhete, atribuindo-lhe automaticamente um assento da classe correspondente.|

## 3. Vistas [2 valores]

Crie uma vista materializada que detalhe as informações mais importantes sobre os voos, combinando a informação de várias tabelas da base de dados. A vista deve ter o seguinte esquema:

 *estatisticas_voos(no_serie, hora_partida, cidade_partida, pais_partida, cidade_chegada, pais_chegada, ano, mes, dia_do_mes, dia_da_semana, passageiros_1c, passageiros_2c, vendas_1c, vendas_2c)*

em que:
- *no_serie, hora_partida*: correspondem aos atributos homónimos da tabela *voo*
- *cidade_partida, pais_partida, cidade_chegada, pais_chegada*: correspondem aos atributos *cidade* e *pais* da tabela *aeroporto*, para o aeroporto de *partida* e *chegada* do *voo*
- *ano, mes, dia_do_mes* e *dia_da_semana*: são derivados do atributo *hora_partida* da tabela *voo*
- *passageiros_1c, passageiros_2c:*: correspondem ao número total de bilhetes vendidos para o voo, de primeira e segunda classe respectivamente
- *vendas_1c, vendas_2c*: correspondem ao somatório total dos preços dos bilhetes vendidos para o voo, de primeira e segunda classe respectivamente

In [None]:
%%sql
-- CREATE MATERIALIZED VIEW ...

CREATE MATERIALIZED VIEW estatisticas_voos AS
SELECT
    v.no_serie,
    v.hora_partida,
    a1.cidade AS cidade_partida,
    a1.pais AS pais_partida,
    a2.cidade AS cidade_chegada,
    a2.pais AS pais_chegada,
    EXTRACT(YEAR FROM v.hora_partida) AS ano,
    EXTRACT(MONTH FROM v.hora_partida) AS mes,
    EXTRACT(DAY FROM v.hora_partida) AS dia_do_mes,
    EXTRACT(DOW FROM v.hora_partida) AS dia_da_semana,

    COUNT(CASE WHEN b.prim_classe THEN 1 END) AS passageiros_1c,
    COUNT(CASE WHEN NOT b.prim_classe THEN 1 END) AS passageiros_2c,

    SUM(CASE WHEN b.prim_classe THEN b.preco ELSE 0 END) AS vendas_1c,
    SUM(CASE WHEN NOT b.prim_classe THEN b.preco ELSE 0 END) AS vendas_2c

FROM voo v
JOIN aeroporto a1 ON v.partida = a1.codigo
JOIN aeroporto a2 ON v.chegada = a2.codigo
LEFT JOIN bilhete b ON b.voo_id = v.id

GROUP BY
    v.no_serie, v.hora_partida,
    a1.cidade, a1.pais,
    a2.cidade, a2.pais;


## 5. Análise de Dados SQL e OLAP [5 valores]

Usando apenas a vista *estatisticas_voos* desenvolvida no ponto anterior, e *sem recurso a declarações WITH ou LIMIT*, apresente a consulta SQL mais sucinta para cada um dos seguintes objetivos analíticos da empresa. Pode usar agregações OLAP para os objetivos em que lhe parecer adequado.

1. Determinar a(s) rota(s) que tem/têm a maior procura para efeitos de aumentar a frequência de voos dessa(s) rota(s). Entende-se por rota um trajeto aéreo entre quaisquer duas cidades,  independentemente do sentido (e.g., voos Lisboa-Paris e Paris-Lisboa contam para a mesma rota). Considera-se como indicador da procura de uma rota o preenchimento médio dos aviões (i.e., o rácio entre o número total de passageiros e a capacidade total do avião) no último ano.

In [None]:
%%sql
-- SELECT ...

SELECT 
  LEAST(cidade_partida, cidade_chegada) AS cidade1,
  GREATEST(cidade_partida, cidade_chegada) AS cidade2,
  SUM(passageiros_1c + passageiros_2c)::FLOAT / SUM(
    CASE 
      WHEN no_serie LIKE 'A320%' THEN 180
      WHEN no_serie LIKE 'B737%' THEN 186
      WHEN no_serie LIKE 'B787%' THEN 400
      ELSE 1
    END
  ) AS taxa_ocupacao
FROM estatisticas_voos
WHERE EXTRACT(YEAR FROM hora_partida) = EXTRACT(YEAR FROM CURRENT_DATE)
GROUP BY 
  LEAST(cidade_partida, cidade_chegada),
  GREATEST(cidade_partida, cidade_chegada)
HAVING 
  SUM(passageiros_1c + passageiros_2c)::FLOAT / SUM(
    CASE 
      WHEN no_serie LIKE 'A320%' THEN 180
      WHEN no_serie LIKE 'B737%' THEN 186
      WHEN no_serie LIKE 'B787%' THEN 400
      ELSE 1
    END
  ) = (
    SELECT MAX(taxa)
    FROM (
      SELECT 
        SUM(passageiros_1c + passageiros_2c)::FLOAT / SUM(
          CASE 
            WHEN no_serie LIKE 'A320%' THEN 180
            WHEN no_serie LIKE 'B737%' THEN 186
            WHEN no_serie LIKE 'B787%' THEN 400
            ELSE 1
          END
        ) AS taxa
      FROM estatisticas_voos
      WHERE EXTRACT(YEAR FROM hora_partida) = EXTRACT(YEAR FROM CURRENT_DATE)
      GROUP BY 
        LEAST(cidade_partida, cidade_chegada),
        GREATEST(cidade_partida, cidade_chegada)
    ) AS subquery
  );


2. Determinar as rotas pelas quais nos últimos 3 meses passaram todos os aviões da empresa, para efeitos de melhorar a gestão da frota.

In [None]:
%%sql
-- SELECT ...

3. Explorar a rentabilidade da empresa (vendas globais e por classe) nas dimensões espaço (global > pais > cidade, para a partida e chegada em simultâneo) e tempo (global > ano > mes > dia_do_mes), como apoio a um relatório executivo.

In [None]:
%%sql
-- SELECT ...

4. Descobrir se há algum padrão ao longo da semana no rácio entre passageiros de primeira e segunda classe, com drill down na dimensão espaço (global > pais > cidade), que justifique uma abordagem mais flexível à divisão das classes.

In [None]:
%%sql
-- SELECT ...

## 6. Índices [3 valores]

É expectável que seja necessário executar consultas semelhantes ao colectivo das consultas do ponto anterior diversas vezes ao longo do tempo, e pretendemos otimizar o desempenho da vista estatisticas_voos para esse efeito. Crie sobre a vista o(s) índice(s) que achar mais indicados para fazer essa otimização, justificando a sua escolha com argumentos teóricos e com demonstração prática do ganho em eficiência do índice por meio do comando EXPLAIN ANALYSE. Deve procurar uma otimização coletiva das consultas, evitando criar índices excessivos, particularmente se estes trazem apenas ganhos incrementais a uma das consultas.

Código para criação dos índices

In [None]:
%%sql
-- CREATE INDEX ...

Justificação teórica e prática (sumarizando observações com EXPLAIN ANALYSE)