# Projeto de Bases de Dados - Parte 2

### Docente Responsável

Prof. Daniela Machado

### Grupo 58
<dl>
    <dt>20 horas (33.3%)</dt>
    <dd>ist1106022 João Fernandes</dd>
    <dt>18 horas (33.3%)</dt>
    <dd>ist1106720 Rafael Cruz</dd>
    <dt>10 horas (33.3%)</dt>
    <dd>ist1105887 Henrique Santos</dd>
<dl>

In [1]:
%load_ext sql
%config SqlMagic.displaycon = 0
%config SqlMagic.displaylimit = 100
%config SqlMagic.named_parameters="enabled"
%sql postgresql+psycopg://postgres:postgres@postgres/postgres

## 0. Carregamento da Base de Dados

Crie a base de dados “Saude” no PostgreSQL e execute os comandos para criação das tabelas desta base de dados apresentados de seguida

In [None]:
%%sql

DROP TABLE IF EXISTS clinica CASCADE;
DROP TABLE IF EXISTS enfermeiro CASCADE;
DROP TABLE IF EXISTS medico CASCADE;
DROP TABLE IF EXISTS trabalha CASCADE;
DROP TABLE IF EXISTS paciente CASCADE;
DROP TABLE IF EXISTS receita CASCADE;
DROP TABLE IF EXISTS consulta CASCADE;
DROP TABLE IF EXISTS observacao CASCADE;

CREATE TABLE clinica(
	nome VARCHAR(80) PRIMARY KEY,
	telefone VARCHAR(15) UNIQUE NOT NULL CHECK (telefone ~ '^[0-9]+$'),
	morada VARCHAR(255) UNIQUE NOT NULL
);

CREATE TABLE enfermeiro(
	nif CHAR(9) PRIMARY KEY CHECK (nif ~ '^[0-9]+$'),
	nome VARCHAR(80) UNIQUE NOT NULL,
	telefone VARCHAR(15) NOT NULL CHECK (telefone ~ '^[0-9]+$'),
	morada VARCHAR(255) NOT NULL,
	nome_clinica VARCHAR(80) NOT NULL REFERENCES clinica (nome)
);

CREATE TABLE medico(
	nif CHAR(9) PRIMARY KEY CHECK (nif ~ '^[0-9]+$'),
	nome VARCHAR(80) UNIQUE NOT NULL,
	telefone VARCHAR(15) NOT NULL CHECK (telefone ~ '^[0-9]+$'),
	morada VARCHAR(255) NOT NULL,
	especialidade VARCHAR(80) NOT NULL
);

CREATE TABLE trabalha(
nif CHAR(9) NOT NULL REFERENCES medico,
nome VARCHAR(80) NOT NULL REFERENCES clinica,
dia_da_semana SMALLINT,
PRIMARY KEY (nif, dia_da_semana)
);

CREATE TABLE paciente(
	ssn CHAR(11) PRIMARY KEY CHECK (ssn ~ '^[0-9]+$'),
nif CHAR(9) UNIQUE NOT NULL CHECK (nif ~ '^[0-9]+$'),
	nome VARCHAR(80) NOT NULL,
	telefone VARCHAR(15) NOT NULL CHECK (telefone ~ '^[0-9]+$'),
	morada VARCHAR(255) NOT NULL,
	data_nasc DATE NOT NULL
);

CREATE TABLE consulta(
	id SERIAL PRIMARY KEY,
	ssn CHAR(11) NOT NULL REFERENCES paciente,
	nif CHAR(9) NOT NULL REFERENCES medico,
	nome VARCHAR(80) NOT NULL REFERENCES clinica,
	data DATE NOT NULL,
	hora TIME NOT NULL,
	codigo_sns CHAR(12) UNIQUE CHECK (codigo_sns ~ '^[0-9]+$'),
	UNIQUE(ssn, data, hora),
	UNIQUE(nif, data, hora)
);

CREATE TABLE receita(
	codigo_sns VARCHAR(12) NOT NULL REFERENCES consulta (codigo_sns),
	medicamento VARCHAR(155) NOT NULL,
	quantidade SMALLINT NOT NULL CHECK (quantidade > 0),
	PRIMARY KEY (codigo_sns, medicamento)
);

CREATE TABLE observacao(
	id INTEGER NOT NULL REFERENCES consulta,
	parametro VARCHAR(155) NOT NULL,
	valor FLOAT,
PRIMARY KEY (id, parametro)
);


## 1. Restrições de Integridade

Apresente o código para implementar as seguintes restrições de integridade, se necessário, com recurso a extensões procedimentais SQL (Stored Procedures e Triggers):

(RI-1) Os horários das consultas são à hora exata ou meia-hora no horário 8-13h e 14-19h

In [None]:
%%sql
-- (RI-1)
-- Ensure the consultation time is valid
ALTER TABLE consulta
ADD CONSTRAINT valid_time CHECK (
    (EXTRACT(HOUR FROM hora) BETWEEN 8 AND 12 OR EXTRACT(HOUR FROM hora) BETWEEN 14 AND 18) AND
    (EXTRACT(MINUTE FROM hora) = 0 OR EXTRACT(MINUTE FROM hora) = 30) AND
    EXTRACT(SECOND FROM hora) = 0
);

(RI-2) Um médico não se pode consultar a si próprio, embora possa ser paciente de outros médicos no sistema

In [None]:
%%sql
-- (RI-2)
-- Create function to prevent self-consultation
CREATE OR REPLACE FUNCTION prevent_self_consultation() RETURNS TRIGGER AS $$
BEGIN
    -- Check if the doctor is trying to consult themselves
    IF EXISTS (SELECT 1 FROM medico WHERE NEW.nif = medico.nif AND NEW.ssn = medico.nif) THEN
        RAISE EXCEPTION 'A doctor cannot consult themselves.';
    END IF;
    RETURN NEW;
END;
$$ LANGUAGE plpgsql;

-- Create trigger to enforce the rule
CREATE TRIGGER trigger_prevent_self_consultation
BEFORE INSERT OR UPDATE ON consulta
FOR EACH ROW
EXECUTE FUNCTION prevent_self_consultation();

(RI-3) Um médico só pode dar consultas na clínica em que trabalha no dia da semana correspondente à data da consulta

In [None]:
%%sql
-- (RI-3)
CREATE OR REPLACE FUNCTION check_doctor_availability() RETURNS TRIGGER AS $$
BEGIN
    -- Check if the doctor works at the clinic on the consultation day
    IF NOT EXISTS (
        SELECT 1
        FROM trabalha
        WHERE trabalha.nif = NEW.nif
        AND trabalha.nome = NEW.nome
        AND trabalha.dia_da_semana = EXTRACT(DOW FROM NEW.data)
    ) THEN
        RAISE EXCEPTION 'Doctor % does not work at clinic % on %', NEW.nif, NEW.nome, NEW.data;
    END IF;
    RETURN NEW;
END;
$$ LANGUAGE plpgsql;

CREATE TRIGGER trigger_check_doctor_availability
BEFORE INSERT OR UPDATE ON consulta
FOR EACH ROW
EXECUTE FUNCTION check_doctor_availability();

## 2. Preenchimento da Base de Dados

Preencha todas as tabelas da base de dados de forma consistente (após execução do ponto anterior) com os seguintes requisitos adicionais de cobertura:
- 5 clínicas, de pelo menos 3 localidades diferentes do distrito de Lisboa
- 5-6 enfermeiros por clínica
- 20 médicos de especialidade ‘clínica geral’ e 40 outros distribuídos como entender por até 5 outras especialidades médicas (incluindo pelo menos, ‘ortopedia’ e ‘cardiologia’). Cada médico deve trabalhar em pelo menos duas clínicas, e em cada clínica a cada dia da semana (incluindo fins de semana), devem estar pelo menos 8 médicos
- Cerca de 5.000 pacientes
- Um número mínimo de consultas em 2023 e 2024 tais que cada paciente tem pelo menos uma consulta, e em cada dia há pelo menos 20 consultas por clínica, e pelo menos 2 consultas por médico
- ~80% das consultas tem receita médica associada, e as receitas têm 1 a 6 medicamentos em quantidades entre 1 e 3
- Todas as consultas têm 1 a 5 observações de sintomas (com parâmetro mas sem valor) e 0 a 3 observações métricas (com parâmetro e valor). Deve haver ~50 parâmetros diferentes para os sintomas (sem valor) e ~20 parâmetros diferentes para as observações métricas (com valor) e os dois conjuntos devem ser disjuntos. 
- Todas as moradas são nacionais e seguem o formato Português, terminando com código postal: XXXX-XXX e de seguida a localidade.
Deve ainda garantir que todas as consultas necessárias para a realização dos pontos seguintes do projeto produzem um resultado não vazio.

O código para preenchimento da base de dados deve ser compilado num ficheiro "populate.sql", anexado ao relatório, que contém com comandos INSERT ou alternativamente comandos COPY que populam as tabelas a partir de ficheiros de texto, também eles anexados ao relatório. 

In [None]:
%%sql
-- Correr num terminal postgres nesta base de dados: \i data/populate.sql seguido de \i data/appointments.sql
-- Os paths podem mudar consoante posição na hierarquia onde o terminal se encontra
-- O appointments.sql corresponde à tabela acessória para facilitar marcação de consultas no RESTful web service

## 3. Desenvolvimento de Aplicação

Crie um protótipo de RESTful web service para gestão de consultas por acesso programático à base de dados ‘Saude’ através de uma API que devolve respostas em JSON, implementando os seguintes endpoints REST:

|Endpoint|Descrição|
|--------|---------|
|/|Lista todas as clínicas (nome e morada).|
|/c/\<clinica>/|Lista todas as especialidades oferecidas na \<clinica>.|
|/c/\<clinica>/\<especialidade>/|Lista todos os médicos (nome) da \<especialidade> que trabalham na <clínica> e os primeiros três horários disponíveis para consulta de cada um deles (data e hora).|
|/a/\<clinica>/registar/|Registra uma marcação de consulta na \<clinica> na base de dados (populando a respectiva tabela). Recebe como argumentos um paciente, um médico, e uma data e hora (posteriores ao momento de agendamento).|
|/a/\<clinica>/cancelar/|Cancela uma marcação de consulta que ainda não se realizou na \<clinica> (o seu horário é posterior ao momento do cancelamento), removendo a entrada da respectiva tabela na base de dados. Recebe como argumentos um paciente, um médico, e uma data e hora.|

### Explicação da arquitetura da aplicação web, indicando a correspondência entre as funções app.py e os endpoints pedidos

#### / com método GET -> show_clinics()
- Retorna o nome e morada de todos os registos de clínicas

Os próximos *endpoints* recorrem a *prepared statements*, interpretando como literais os argumentos, para evitar *SQL Injections*

#### /c/\<clinica\>/ com método GET -> clinic_show_speciality(clinica)
- Retorna as especialidades distintas de entre os médicos que trabalham na clínica

Os próximos *endpoints* recorrem a uma tabela auxiliar *horarios* (que deve ser populado usadon o ficheiro appointments.sql posteriormente à população das tabelas anteriores).
Nesta tabela, por dia do ano de 2024, a partir do mês de Maio, são guardados os *slots* disponíveis para consulta para todos os médicos, consoante a clínica em que trabalham nesse mesmo dia.
Estes slots respeitam ainda as restrições de integridade relativamente às horas das consultas.

#### /c/\<clinica\>/\<especialidade\>/ com método GET -> list_first_3_available_slots_per_medic(clinica, especialidade)
- Retorna os 3 primeiros horários disponíveis para consulta na clínica indicada para cada médico da especialidade que nela trabalham
- Recorre à tabela *horarios* para filtrar os horários por médico para apenas aqueles que são depois do momento do pedido
- Agrupando as entradas por cada médico, cria um *array* com os 3 primeiros horários disponíveis, sendo estes os mais próximos do momento do pedido

Os próximos *endpoints* verificam os argumentos do request antes de começarem qualquer *query*
Também recorrem a transações para garantir atomicidade das operações.

#### /a/\<clinica\>/registar/ com métodos PUT ou POST -> registra_consulta(clinica)
- Regista uma marcação de consulta na clínica desejada se possível
- Uma primeira *query* que insere na tabela *consulta* a marcação se esta for válida
- Uma segunda *query* que remove da tabela *horarios* o horário que acabou de ser ocupado
- Se o horário não for válido, as queries não alteram *rows* nas tabelas, sendo assim esta possibilidade verificada
                  
#### /a/\<clinica\>/cancelar/ com métodos DELETE ou POST -> cancelar_consulta(clinica)
- O inverso do anterior, cancela uma marcação de uma consulta na clínica se existir tal consulta
- Uma primeira *query* que verifica se existe uma consulta com os argumentos do pedido
    - Se não existir, levanta uma exceção, verificando assim a possibilidade
- Caso exista uma consulta, uma segunda *query* remove-a da tabela *consultas* e uma terceira insere o horário libertado na tabela *horarios*

No *bruno* estão presentes *requests* que testam os *endpoints* do *webservice*

## 3. Vistas

Crie uma vista materializada que detalhe as informações mais importantes sobre as consultas dos pacientes, combinando a informação de várias tabelas da base de dados. A vista deve ter o seguinte esquema:

### *historial_paciente(id, ssn, nif, nome, data, ano, mes, dia_do_mes, localidade, especialidade, tipo, chave, valor)*

em que:
- *id, ssn, nif, nome* e *data*: correspondem ao atributos homónimos da tabela **consulta**
- *ano*, *mes* e *dia_do_mes*: são derivados do atributo *data* da tabela **consulta**
- *localidade*: é derivado do atributo *morada* da tabela **clinica**
- *especialidade*: corresponde ao atributo homónimo da tabela **medico**
- *tipo*: toma os valores ‘observacao’ ou ‘receita’ consoante o preenchimento dos campos seguintes
- *chave*: corresponde ao atributo *parametro* da tabela **observacao** ou ao atributo *medicamento* da tabela **receita**
- *valor*: corresponde ao atributo *valor* da tabela **observacao** ou ao atributo *quantidade* da tabela **receita**


In [68]:
%%sql
-- CREATE MATERIALIZED VIEW ...
DROP MATERIALIZED VIEW IF EXISTS historial_paciente;

CREATE MATERIALIZED VIEW historial_paciente AS
SELECT
    c.id,
    c.ssn,
    c.nif,
    c.nome,
    c.data,
    EXTRACT(YEAR FROM c.data) AS ano,
    EXTRACT(MONTH FROM c.data) AS mes,
    EXTRACT(DAY FROM c.data) AS dia_do_mes,
    SPLIT_PART(cl.morada, ',', 4) AS localidade,
    m.especialidade,
    'observacao' AS tipo,
    o.parametro AS chave,
    o.valor
FROM
    consulta c
JOIN
    clinica cl ON c.nome = cl.nome
JOIN
    medico m ON c.nif = m.nif
LEFT JOIN
    observacao o ON c.id = o.id

UNION ALL

SELECT
    c.id,
    c.ssn,
    c.nif,
    c.nome,
    c.data,
    EXTRACT(YEAR FROM c.data) AS ano,
    EXTRACT(MONTH FROM c.data) AS mes,
    EXTRACT(DAY FROM c.data) AS dia_do_mes,
    SPLIT_PART(cl.morada, ',', 3) AS localidade,
    m.especialidade,
    'receita' AS tipo,
    r.medicamento AS chave,
    r.quantidade AS valor
FROM
    consulta c
JOIN
    clinica cl ON c.nome = cl.nome
JOIN
    medico m ON c.nif = m.nif
LEFT JOIN
    receita r ON c.codigo_sns = r.codigo_sns;

## 5. Análise de Dados (SQL e OLAP

Usando a vista desenvolvida no ponto anterior, complementada com outras tabelas da base de dados ‘Saude’ quando necessário, apresente a consulta SQL mais sucinta para cada um dos seguintes objetivos analíticos. Pode usar as instruções ROLLUP, CUBE, GROUPING SETS ou as cláusulas UNION of GROUP BY para os objetivos em que lhe parecer adequado.

1. Determinar que paciente(s) tiveram menos progresso no tratamento das suas doenças do foro ortopédico para atribuição de uma consulta gratuita. Considera-se que o indicador de falta de progresso é o intervalo temporal máximo entre duas observações do mesmo sintoma (i.e. registos de tipo ‘observacao’ com a mesma chave e com valor NULL) em consultas de ortopedia.

In [69]:
%%sql
WITH ortho_observations AS (
    SELECT
        h.ssn,
        h.chave,
        h.data,
        LAG(h.data) OVER (PARTITION BY h.ssn, h.chave ORDER BY h.data) AS prev_data
    FROM
        historial_paciente h
    JOIN
        medico m ON h.nif = m.nif
    WHERE
        h.especialidade = 'ortopedia'
        AND h.tipo = 'observacao'
        AND h.valor IS NULL
),
observation_intervals AS (
    SELECT
        ssn,
        chave,
        data,
        prev_data,
        DATE_PART('day', data::timestamp - prev_data::timestamp) AS interval_days
    FROM
        ortho_observations
    WHERE
        prev_data IS NOT NULL
),
cumulative_intervals AS (
    SELECT
        ssn,
        chave,
        SUM(interval_days) AS total_interval_days
    FROM
        observation_intervals
    GROUP BY
        ssn, chave
),
max_cumulative_intervals AS (
    SELECT
        ssn,
        MAX(total_interval_days) AS max_total_interval
    FROM
        cumulative_intervals
    GROUP BY
        ssn
)

SELECT
    ssn,
    max_total_interval
FROM
    max_cumulative_intervals
WHERE
    max_total_interval = (SELECT MAX(max_total_interval) FROM max_cumulative_intervals);

ssn,max_total_interval
98,700.0
1220,700.0


2. Determinar que medicamentos estão a ser usados para tratar doenças crónicas do foro cardiológico. Considera-se que qualificam quaisquer medicamentos receitados ao mesmo paciente (qualquer que ele seja) pelo menos uma vez por mês durante os últimos doze meses, em consultas de cardiologia.

In [70]:
%%sql
WITH cardiology_consultations AS (
    SELECT DISTINCT ssn
    FROM historial_paciente
    WHERE especialidade = 'cardiologia'
),
monthly_consultations AS (
    SELECT
        ssn,
        TO_CHAR(data, 'YYYY-MM') AS month
    FROM historial_paciente
    WHERE especialidade = 'cardiologia'
        AND data >= CURRENT_DATE - INTERVAL '1 year' AND data <= CURRENT_DATE
    GROUP BY ssn, TO_CHAR(data, 'YYYY-MM')
),
patients_with_monthly_consultations AS (
    SELECT ssn
    FROM monthly_consultations
    GROUP BY ssn
    HAVING COUNT(DISTINCT month) >= 12
)
SELECT DISTINCT 
    h.chave AS medicamento, COUNT(*)
FROM historial_paciente h
JOIN patients_with_monthly_consultations p ON h.ssn = p.ssn
WHERE h.especialidade = 'cardiologia'
  AND h.tipo = 'receita'
  AND h.data >= CURRENT_DATE - INTERVAL '1 year'
  AND h.chave IS NOT NULL
GROUP BY medicamento
HAVING COUNT(*) >= 12;

medicamento,count
Atorvastatina,13


3. Explorar as quantidades totais receitadas de cada medicamento em 2023, globalmente, e com drill down nas dimensões espaço (localidade > clinica), tempo (mes > dia_do_mes), e médico  (especialidade > nome \[do médico]), separadamente.

In [71]:
%%sql
WITH consulta_2023 AS (
    SELECT
        h.nome AS clinica,
        m.especialidade,
        h.chave AS medicamento,
        h.valor::numeric AS quantidade,
        EXTRACT(YEAR FROM h.data) AS ano,
        EXTRACT(MONTH FROM h.data) AS mes,
        EXTRACT(DAY FROM h.data) AS dia_do_mes,
        SPLIT_PART(cl.morada, ',', 4) AS localidade,
        m.nome AS medico
    FROM
        historial_paciente h
    JOIN
        clinica cl ON h.nome = cl.nome
    JOIN
        medico m ON h.nif = m.nif
    WHERE
        h.tipo = 'receita'
        AND EXTRACT(YEAR FROM h.data) = 2023
)
SELECT
    medicamento,
    localidade,
    clinica,
    ano,
    mes,
    dia_do_mes,
    especialidade,
    medico,
    SUM(quantidade) AS quantidade
FROM consulta_2023
WHERE
    medicamento IS NOT NULL
GROUP BY
    GROUPING SETS (
        (medicamento),
        (medicamento, localidade),
        (medicamento, localidade, clinica),
        (medicamento, ano, mes),
        (medicamento, ano, mes, dia_do_mes),
        (medicamento, especialidade),
        (medicamento, especialidade, medico)
    )
ORDER BY
    medicamento,
    CASE 
        WHEN localidade IS NULL 
            AND clinica IS NULL 
            AND ano IS NULL 
            AND mes IS NULL 
            AND dia_do_mes IS NULL 
            AND especialidade IS NULL 
            AND medico IS NULL THEN 0 
        ELSE 1 
    END,
    localidade,
    clinica NULLS FIRST,
    ano,
    mes,
    dia_do_mes NULLS FIRST,
    especialidade,
    medico NULLS FIRST;

medicamento,localidade,clinica,ano,mes,dia_do_mes,especialidade,medico,quantidade
Alprazolam,,,,,,,,6615
Alprazolam,Coimbra,,,,,,,1262
Alprazolam,Coimbra,Clinica B,,,,,,1262
Alprazolam,Lisboa,,,,,,,4013
Alprazolam,Lisboa,Clinica C,,,,,,1335
Alprazolam,Lisboa,Clinica D,,,,,,1383
Alprazolam,Lisboa,Clinica E,,,,,,1295
Alprazolam,Porto,,,,,,,1340
Alprazolam,Porto,Clinica A,,,,,,1340
Alprazolam,,,2023.0,1.0,,,,551


4. Determinar se há enviesamento na medição de algum parâmetros entre clínicas, especialidades médicas ou médicos, sendo para isso necessário listar o valor médio e desvio padrão de todos os parâmetros de observações métricas (i.e. com valor não NULL) com drill down na dimensão médico (globalmente > especialidade > nome \[do médico]) e drill down adicional (sobre o anterior) por clínica.

In [72]:
%%sql
WITH observations AS (
    SELECT
        h.nome AS clinica,
        m.especialidade,
        h.chave AS parametro,
        h.valor::numeric AS valor,
        m.nome AS medico
    FROM
        historial_paciente h
    JOIN
        clinica cl ON h.nome = cl.nome
    JOIN
        medico m ON h.nif = m.nif
    WHERE
        h.tipo = 'observacao'
        AND h.valor IS NOT NULL
),
statistics AS (
    SELECT
        parametro,
        especialidade,
        medico,
        clinica,
        AVG(valor) AS media_valor,
        STDDEV(valor) AS desvio_padrao_valor
    FROM observations
    GROUP BY GROUPING SETS (
        (parametro),
        (parametro, especialidade),
        (parametro, especialidade, medico),
        (parametro, especialidade, medico, clinica)
    )
)
SELECT *
FROM statistics
ORDER BY
    parametro,
    CASE 
        WHEN especialidade IS NULL AND medico IS NULL AND clinica IS NULL THEN 0
        WHEN medico IS NULL AND clinica IS NULL THEN 1
        WHEN clinica IS NULL THEN 2
        ELSE 3
    END,
    especialidade,
    medico,
    clinica;

parametro,especialidade,medico,clinica,media_valor,desvio_padrao_valor
Altura,,,,1.2619133448567739,0.7272311999851094
Altura,cardiologia,,,1.190293543029901,0.7413607961743177
Altura,clínica geral,,,1.2961530812630655,0.7244453269513293
Altura,dermatologia,,,1.263092948766305,0.7210209567741951
Altura,neurologia,,,1.22779277746605,0.7208221603937164
Altura,ortopedia,,,1.2875328359554925,0.7561229182338401
Altura,pediatria,,,1.262683630407084,0.702223484652388
Altura,cardiologia,Medico C1,,1.1996663833751564,0.7803296547868392
Altura,cardiologia,Medico C2,,1.1450483795378148,0.7253597809084129
Altura,cardiologia,Medico C3,,1.2445156154432833,0.7526803707820842


## 6. Índices

Apresente as instruções SQL para criação de índices para melhorar os tempos de cada uma das consultas listadas abaixo sobre a base de dados ‘Saude’. Justifique a sua escolha de tabela(s), atributo(s) e tipo(s) de índice, explicando que operações seriam otimizadas e como. Considere que não existam índices nas tabelas, além daqueles implícitos ao declarar chaves primárias e estrangeiras, e para efeitos deste exercício, suponha que o tamanho das tabelas excede a memória disponível em várias ordens de magnitude.

### 6.1
SELECT nome 
FROM paciente 
JOIN consulta USING (ssn) 
JOIN observacao USING (id) 
WHERE parametro = ‘pressão diastólica’ 
AND valor >= 9;

In [7]:
%%sql
CREATE INDEX CONCURRENTLY parametro_idx ON observacao (parametro, valor);

### Justificação
- Como os joins das tabelas é sempre efetuado por um atributo que faz parte da primary key da tabela que é joint, ou seja, é um nested loop join eficiente devido ao índice, não é necessário nenhum índice adicional à operação.
- A opção CONCURRENTLY serve apenas para permitir que outras operações corram enquanto se cria o índice, demorando mais tempo, mas apenas uma vez, na sua criação, pois tem de ler a tabela completa duas vezes.
- Cria-se um índice secundário B-tree sobre a tabela "observacao" e os atributos "parametro" e "valor". Este índice é criado sobre estas especificações pois esta é onde ocorrem as procuras e é útil a reduzir o tempo de procura da consulta na tabela devido à sua ordenação interna baseada numa árvore binária. Ambos filtros, um = e um >=, beneficiam de um índice com esta estrutura pois os valores são ordenados e indexados de maneira sequencial, ficando pois muito mais eficiente procurar valores que são maiores ou iguais aos valores passados nos filtros, já que podemos excluir todas as entradas da tabela que se encontram para trás, neste caso, do valor a corresponder ou podemos apenas procurar no índice pelo valor exato. Tudo isto resulta em não ter de procurar na árvore inteira, que demoraria bastante tempo, procura-se utilizando uma árvore de procura as correspondências numa versão reduzida da tabela.

### 6.2
SELECT especialidade, SUM(quantidade) AS qtd
FROM medico 
JOIN consulta USING (nif)
JOIN receita USING (codigo_sns) 
WHERE data BETWEEN ‘2023-01-01’ AND ‘2023-12-31’ 
GROUP BY especialidade
ORDER BY qtd;

In [8]:
%%sql
CREATE INDEX CONCURRENTLY consulta_idx ON consulta (data);
CREATE INDEX CONCURRENTLY medico_idx ON medico (especialidade);

### Justificação
- Tal como na alínea anterior, como os joins das tabelas é sempre efetuado por um atributo que faz parte da primary key, não é necessário nenhum índice adicional à operação.
- A opção CONCURRENTLY aparece pela mesma razão da alínea anterior.
- Criam-se dois índices secundários B-tree sobre as tabelas "consulta" e "medico". Mais uma vez, estes índices são criados para estas especificações visto que são nestas tabelas e sobre estes atributos que são efetuados a procura e o agrupamento, respetivamente. Em ambos casos beneficiam de um índice pois na procura estamos perante um intervalo de valores que é trivialmente resolvido pelo índice como na alínea anterior, especialmente neste exercício pois o intervalo é majorado, e porque o índice ordena os dados do atributo que acelera o processo de agrupamento pois não vai ter de ordenar pois já foi feito pelo índice. Toda a lógica de porque é que estas ações resultam numa maior eficiência é a mesma da alínea anterior, há menos valores a ler das tabelas.
- Não é criado um índice para o "SORT BY qtd" pois o valor "qtd", sendo um SUM, vai ter sempre de ler todos os campos do atributo que está a somar, deixando assim de fazer sentido usar um índice.