# Projeto de Bases de Dados - Parte 2

### Docente Responsável

Prof. Flávio Martins

### Grupo GG
<dl>
    <dt>35 horas (33.3%)</dt>
    <dd>ist1106204 João  Tomás de Almeida Santos Antunes Gomes</dd>
    <dt>35 horas (33.3%)</dt>
    <dd>ist1106001 Manuel Soares Eleutério da Silva</dd>
    <dt>35 horas (33.3%)</dt>
    <dd>ist1106194 Sofia Dinis Pinto Piteira</dd>
<dl>

In [4]:
%load_ext sql
%config SqlMagic.displaycon = 0
%config SqlMagic.displaylimit = 100
%sql postgresql+psycopg://postgres:postgres@postgres/saude

The sql extension is already loaded. To reload it, use:
  %reload_ext sql


## 0. Carregamento da Base de Dados

Crie a base de dados “Saude” no PostgreSQL e execute os comandos para criação das tabelas desta base de dados apresentados de seguida

In [5]:
%%sql

DROP TABLE IF EXISTS clinica CASCADE;
DROP TABLE IF EXISTS enfermeiro CASCADE;
DROP TABLE IF EXISTS medico CASCADE;
DROP TABLE IF EXISTS trabalha CASCADE;
DROP TABLE IF EXISTS paciente CASCADE;
DROP TABLE IF EXISTS receita CASCADE;
DROP TABLE IF EXISTS consulta CASCADE;
DROP TABLE IF EXISTS observacao CASCADE;
DROP TABLE IF EXISTS horario CASCADE;

CREATE TABLE clinica(
	nome VARCHAR(80) PRIMARY KEY,
	telefone VARCHAR(15) UNIQUE NOT NULL CHECK (telefone ~ '^[0-9]+$'),
	morada VARCHAR(255) UNIQUE NOT NULL
);

CREATE TABLE enfermeiro(
	nif CHAR(9) PRIMARY KEY CHECK (nif ~ '^[0-9]+$'),
	nome VARCHAR(80) UNIQUE NOT NULL,
	telefone VARCHAR(15) NOT NULL CHECK (telefone ~ '^[0-9]+$'),
	morada VARCHAR(255) NOT NULL,
	nome_clinica VARCHAR(80) NOT NULL REFERENCES clinica (nome)
);

CREATE TABLE medico(
	nif CHAR(9) PRIMARY KEY CHECK (nif ~ '^[0-9]+$'),
	nome VARCHAR(80) UNIQUE NOT NULL,
	telefone VARCHAR(15) NOT NULL CHECK (telefone ~ '^[0-9]+$'),
	morada VARCHAR(255) NOT NULL,
	especialidade VARCHAR(80) NOT NULL
);

CREATE TABLE trabalha(
nif CHAR(9) NOT NULL REFERENCES medico,
nome VARCHAR(80) NOT NULL REFERENCES clinica,
dia_da_semana SMALLINT,
PRIMARY KEY (nif, dia_da_semana)
);

CREATE TABLE paciente(
	ssn CHAR(11) PRIMARY KEY CHECK (ssn ~ '^[0-9]+$'),
nif CHAR(9) UNIQUE NOT NULL CHECK (nif ~ '^[0-9]+$'),
	nome VARCHAR(80) NOT NULL,
	telefone VARCHAR(15) NOT NULL CHECK (telefone ~ '^[0-9]+$'),
	morada VARCHAR(255) NOT NULL,
	data_nasc DATE NOT NULL
);

CREATE TABLE consulta(
	id SERIAL PRIMARY KEY,
	ssn CHAR(11) NOT NULL REFERENCES paciente,
	nif CHAR(9) NOT NULL REFERENCES medico,
	nome VARCHAR(80) NOT NULL REFERENCES clinica,
	data DATE NOT NULL,
	hora TIME NOT NULL,
	codigo_sns CHAR(12) UNIQUE CHECK (codigo_sns ~ '^[0-9]+$'),
	UNIQUE(ssn, data, hora),
	UNIQUE(nif, data, hora)
);

CREATE TABLE receita(
	codigo_sns VARCHAR(12) NOT NULL REFERENCES consulta (codigo_sns),
	medicamento VARCHAR(155) NOT NULL,
	quantidade SMALLINT NOT NULL CHECK (quantidade > 0),
	PRIMARY KEY (codigo_sns, medicamento)
);

CREATE TABLE observacao(
	id INTEGER NOT NULL REFERENCES consulta,
	parametro VARCHAR(155) NOT NULL,
	valor FLOAT,
PRIMARY KEY (id, parametro)
);

CREATE TABLE horario(
    data DATE NOT NULL,
	hora TIME NOT NULL,
    PRIMARY KEY (data, hora)
);

## 1. Restrições de Integridade

Apresente o código para implementar as seguintes restrições de integridade, se necessário, com recurso a extensões procedimentais SQL (Stored Procedures e Triggers):

(RI-1) Os horários das consultas são à hora exata ou meia-hora no horário 8-13h e 14-19h

In [6]:
%%sql
-- (RI-1)
CREATE OR REPLACE FUNCTION check_time() RETURNS TRIGGER AS $$
    BEGIN
        IF NOT (
            (NEW.hora >= '08:00:00' AND NEW.hora < '13:30:00' AND date_part('minute', NEW.hora) IN (0, 30)) OR
            (NEW.hora >= '14:00:00' AND NEW.hora < '19:30:00' AND date_part('minute', NEW.hora) IN (0, 30))
        ) THEN
                RAISE EXCEPTION 'Horário de consulta inválido. As consultas são a horas exatas ou meia-hora no horário 8-13h e 14-19h.';
        END IF;
        RETURN NEW;
    END
$$ LANGUAGE plpgsql;
CREATE OR REPLACE TRIGGER check_time_trigger Before INSERT ON Consulta
  FOR EACH ROW EXECUTE FUNCTION check_time();


(RI-2) Um médico não se pode consultar a si próprio, embora possa ser paciente de outros médicos no sistema

In [7]:
%%sql
-- (RI-2)
CREATE OR REPLACE FUNCTION consulta_no_self_medico()
RETURNS TRIGGER AS $$
BEGIN
    -- Verificar se o médico está a tentar consultar-se a si mesmo
    IF NEW.nif = NEW.ssn THEN
        RAISE EXCEPTION 'Um médico não se pode consultar a si próprio.';
    END IF;

    RETURN NEW;
END;
$$ LANGUAGE plpgsql;

CREATE TRIGGER consulta_no_self_medico_trigger
BEFORE INSERT ON consulta
FOR EACH ROW
EXECUTE FUNCTION consulta_no_self_medico();


(RI-3) Um médico só pode dar consultas na clínica em que trabalha no dia da semana correspondente à data da consulta

In [8]:
%%sql
-- (RI-3)
CREATE OR REPLACE FUNCTION consulta_clinica_dia_semana()
RETURNS TRIGGER AS $$
DECLARE
    dia_semana_consulta INTEGER;
    dia_semana_trabalha INTEGER;
BEGIN
    -- Obter o dia da semana da data da consulta
    dia_semana_consulta := EXTRACT(DOW FROM NEW.data);

    -- Obter o dia da semana em que o médico trabalha na clínica
    SELECT dia_da_semana INTO dia_semana_trabalha
    FROM trabalha
    WHERE nif = NEW.nif AND nome = NEW.nome AND dia_semana_consulta = dia_da_semana;

    -- Verificar se o dia da semana da consulta coincide com o dia de trabalho do médico na clínica
    IF dia_semana_consulta <> dia_semana_trabalha THEN
        RAISE EXCEPTION 'O médico só pode dar consultas na clínica em que trabalha no dia da semana correspondente à data da consulta.';
    END IF;

    RETURN NEW;
END;
$$ LANGUAGE plpgsql;

CREATE TRIGGER consulta_clinica_dia_semana_trigger
BEFORE INSERT ON consulta
FOR EACH ROW
EXECUTE FUNCTION consulta_clinica_dia_semana();


## 2. Preenchimento da Base de Dados

Preencha todas as tabelas da base de dados de forma consistente (após execução do ponto anterior) com os seguintes requisitos adicionais de cobertura:
- 5 clínicas, de pelo menos 3 localidades diferentes do distrito de Lisboa
- 5-6 enfermeiros por clínica
- 20 médicos de especialidade ‘clínica geral’ e 40 outros distribuídos como entender por até 5 outras especialidades médicas (incluindo pelo menos, ‘ortopedia’ e ‘cardiologia’). Cada médico deve trabalhar em pelo menos duas clínicas, e em cada clínica a cada dia da semana (incluindo fins de semana), devem estar pelo menos 8 médicos
- Cerca de 5.000 pacientes
- Um número mínimo de consultas em 2023 e 2024 tais que cada paciente tem pelo menos uma consulta, e em cada dia há pelo menos 20 consultas por clínica, e pelo menos 2 consultas por médico
- ~80% das consultas tem receita médica associada, e as receitas têm 1 a 6 medicamentos em quantidades entre 1 e 3
- Todas as consultas têm 1 a 5 observações de sintomas (com parâmetro mas sem valor) e 0 a 3 observações métricas (com parâmetro e valor). Deve haver ~50 parâmetros diferentes para os sintomas (sem valor) e ~20 parâmetros diferentes para as observações métricas (com valor) e os dois conjuntos devem ser disjuntos. 
- Todas as moradas são nacionais e seguem o formato Português, terminando com código postal: XXXX-XXX e de seguida a localidade.
Deve ainda garantir que todas as consultas necessárias para a realização dos pontos seguintes do projeto produzem um resultado não vazio.

O código para preenchimento da base de dados deve ser compilado num ficheiro "populate.sql", anexado ao relatório, que contém com comandos INSERT ou alternativamente comandos COPY que populam as tabelas a partir de ficheiros de texto, também eles anexados ao relatório. 

## 3. Desenvolvimento de Aplicação

Crie um protótipo de RESTful web service para gestão de consultas por acesso programático à base de dados ‘Saude’ através de uma API que devolve respostas em JSON, implementando os seguintes endpoints REST:

|Endpoint|Descrição|
|--------|---------|
|/|Lista todas as clínicas (nome e morada).|
|/c/\<clinica>/|Lista todas as especialidades oferecidas na \<clinica>.|
|/c/\<clinica>/\<especialidade>/|Lista todos os médicos (nome) da \<especialidade> que trabalham na <clínica> e os primeiros três horários disponíveis para consulta de cada um deles (data e hora).|
|/a/\<clinica>/registar/|Registra uma marcação de consulta na \<clinica> na base de dados (populando a respectiva tabela). Recebe como argumentos um paciente, um médico, e uma data e hora (posteriores ao momento de agendamento).|
|/a/\<clinica>/cancelar/|Cancela uma marcação de consulta que ainda não se realizou na \<clinica> (o seu horário é posterior ao momento do cancelamento), removendo a entrada da respectiva tabela na base de dados. Recebe como argumentos um paciente, um médico, e uma data e hora.|

### Explicação da arquitetura da aplicação web, incluindo a descrição dos vários ficheiros na pasta web/arquivos e a relação entre eles

...

## 3. Vistas

Crie uma vista materializada que detalhe as informações mais importantes sobre as consultas dos pacientes, combinando a informação de várias tabelas da base de dados. A vista deve ter o seguinte esquema:

### *historial_paciente(id, ssn, nif, nome, data, ano, mes, dia_do_mes, localidade, especialidade, tipo, chave, valor)*

em que:
- *id, ssn, nif, nome* e *data*: correspondem ao atributos homónimos da tabela **consulta**
- *ano, mes, dia_do_mes* e *dia_da_semana*: são derivados do atributo *data* da tabela **consulta**
- *localidade*: é derivado do atributo *morada* da tabela **clinica**
- *especialidade*: corresponde ao atributo homónimo da tabela **medico**
- *tipo*: toma os valores ‘observacao’ ou ‘receita’ consoante o preenchimento dos campos seguintes
- *chave*: corresponde ao atributo *parametro* da tabela **observacao** ou ao atributo *medicamento* da tabela **receita**
- *valor*: corresponde ao atributo *valor* da tabela **observacao** ou ao atributo *quantidade* da tabela **receita**


In [9]:
%%sql
-- CREATE MATERIALIZED VIEW ...

-- Drop the existing materialized view if it exists
DROP MATERIALIZED VIEW IF EXISTS historial_paciente;

-- Create the materialized view
CREATE MATERIALIZED VIEW historial_paciente AS
SELECT 
    c.id,
    c.ssn,
    c.nif,
    c.nome,
    c.data,
    EXTRACT(YEAR FROM c.data) AS ano,
    EXTRACT(MONTH FROM c.data) AS mes,
    EXTRACT(DAY FROM c.data) AS dia_do_mes,
    EXTRACT(DOW FROM c.data) AS dia_da_semana,
    SUBSTRING(cl.morada FROM '([^ ]+)$') AS localidade,
    m.especialidade,
    'observacao' AS tipo,
    o.parametro AS chave,
    o.valor
FROM 
    consulta c
JOIN 
    clinica cl ON c.nome = cl.nome
JOIN 
    medico m ON c.nif = m.nif
LEFT JOIN 
    observacao o ON c.id = o.id

UNION ALL

SELECT 
    c.id,
    c.ssn,
    c.nif,
    c.nome,
    c.data,
    EXTRACT(YEAR FROM c.data) AS ano,
    EXTRACT(MONTH FROM c.data) AS mes,
    EXTRACT(DAY FROM c.data) AS dia_do_mes,
    EXTRACT(DOW FROM c.data) AS dia_da_semana,
    cl.morada AS localidade,
    m.especialidade,
    'receita' AS tipo,
    r.medicamento AS chave,
    r.quantidade AS valor
FROM 
    consulta c
JOIN 
    clinica cl ON c.nome = cl.nome
JOIN 
    medico m ON c.nif = m.nif
LEFT JOIN 
    receita r ON c.codigo_sns = r.codigo_sns;

## 5. Análise de Dados (SQL e OLAP

Usando a vista desenvolvida no ponto anterior, complementada com outras tabelas da base de dados ‘Saude’ quando necessário, apresente a consulta SQL mais sucinta para cada um dos seguintes objetivos analíticos. Pode usar as instruções ROLLUP, CUBE, GROUPING SETS ou as cláusulas UNION of GROUP BY para os objetivos em que lhe parecer adequado.

1. Determinar que paciente(s) tiveram menos progresso no tratamento das suas doenças do foro ortopédico para atribuição de uma consulta gratuita. Considera-se que o indicador de falta de progresso é o intervalo temporal máximo entre duas observações do mesmo sintoma (i.e. registos de tipo ‘observacao’ com a mesma chave e com valor NULL) em consultas de ortopedia.

In [11]:
%%sql
-- SELECT ...
WITH ortopedia_observacoes AS (
    SELECT 
        hp.ssn,
        hp.data,
        hp.chave
    FROM 
        historial_paciente hp
    WHERE 
        hp.tipo = 'observacao'
        AND hp.especialidade = 'Ortopedia'
),

intervalos_temporais AS (
    SELECT 
        ssn,
        chave,
        EXTRACT(EPOCH FROM MAX(data)) - EXTRACT(EPOCH FROM MIN(data)) AS max_intervalo
    FROM 
        ortopedia_observacoes
    GROUP BY 
        ssn, chave
),

intervalo_maximo AS (
    SELECT 
        MAX(max_intervalo) AS intervalo_maximo
    FROM 
        intervalos_temporais
),

pacientes_com_maior_intervalo AS (
    SELECT 
        it.ssn,
        it.max_intervalo
    FROM 
        intervalos_temporais it
    JOIN 
        intervalo_maximo im ON it.max_intervalo = im.intervalo_maximo
)

SELECT 
    DISTINCT p.ssn,
    p.nome,
    pcm.max_intervalo
FROM 
    paciente p
JOIN 
    pacientes_com_maior_intervalo pcm ON p.ssn = pcm.ssn;


ssn,nome,max_intervalo
23028483,Carolina Ana,60480000
175461688,Ramon Gustavo,60480000
2620409309,Ines Laura,60480000
2659797341,Eduarda Toni,60480000
3658964315,Eduarda Vanessa,60480000
9654493742,Luis Ramon,60480000
10254747813,Rodrigo Arminda,60480000
13224425792,Francisca Ricardo,60480000
13226815494,Renata Fabio,60480000
14588792316,Antonio Katia,60480000


2. Determinar que medicamentos estão a ser usados para tratar doenças crónicas do foro cardiológico. Considera-se que qualificam quaisquer medicamentos receitados ao mesmo paciente (qualquer que ele seja) pelo menos uma vez por mês durante pelo menos doze meses consecutivos, em consultas de cardiologia.

In [12]:
%%sql
-- SELECT ...
WITH MonthlyMedication AS (
    SELECT
        hp.ssn,
        hp.chave AS medicamento,
        hp.ano,
        hp.mes
    FROM
        historial_paciente hp
    WHERE
        hp.tipo = 'receita'
        AND hp.especialidade = 'Cardiologia'
        AND (hp.ano * 12 + hp.mes) >= (EXTRACT(YEAR FROM CURRENT_DATE) * 12 + EXTRACT(MONTH FROM CURRENT_DATE) - 12)
        AND (hp.ano * 12 + hp.mes) < (EXTRACT(YEAR FROM CURRENT_DATE) * 12 + EXTRACT(MONTH FROM CURRENT_DATE))
    GROUP BY
        hp.ssn, hp.chave, hp.ano, hp.mes
),
ConsecutiveMonthlyMedication AS (
    SELECT
        ssn,
        medicamento,
        COUNT(DISTINCT ano * 12 + mes) AS meses_consecutivos
    FROM
        MonthlyMedication
    GROUP BY
        ssn, medicamento
    HAVING
        COUNT(DISTINCT ano * 12 + mes) = 12
)
SELECT DISTINCT
    medicamento
FROM
    ConsecutiveMonthlyMedication;


medicamento
Paracetamol


3. Explorar as quantidades totais receitadas de cada medicamento em 2023, globalmente, e com drill down nas dimensões espaço (localidade > clinica), tempo (mes > dia_do_mes), e médico  (especialidade > nome \[do médico]), separadamente.

In [13]:
%%sql
WITH clinic_data AS (
    SELECT
        hp.chave AS medicamento,
        hp.localidade,
        hp.nome AS clinica,
        NULL::INTEGER AS mes,
        NULL::INTEGER AS dia_do_mes,
        NULL::TEXT AS nome,
        NULL::TEXT AS especialidade,
        SUM(hp.valor) AS total_quantidade
    FROM historial_paciente hp
    JOIN medico m ON m.nif = hp.nif
    WHERE tipo = 'receita' AND ano = 2023
    GROUP BY GROUPING SETS((medicamento, hp.localidade), (medicamento, hp.localidade, hp.nome))
),
date_data AS (
    SELECT
        hp.chave AS medicamento,
        NULL::TEXT AS localidade,
        NULL::TEXT AS clinica,
        hp.mes,
        hp.dia_do_mes,
        NULL::TEXT AS nome,
        NULL::TEXT AS especialidade,
        SUM(hp.valor) AS total_quantidade
    FROM historial_paciente hp
    JOIN medico m ON m.nif = hp.nif
    WHERE tipo = 'receita' AND ano = 2023
    GROUP BY GROUPING SETS((medicamento,hp.mes), (medicamento,hp.mes, hp.dia_do_mes))
),
medico_data AS (
    SELECT
        hp.chave AS medicamento,
        NULL::TEXT AS localidade,
        NULL::TEXT AS clinica,
        NULL::INTEGER AS mes,
        NULL::INTEGER AS dia_do_mes,
        m.nome AS nome,
        hp.especialidade,
        SUM(hp.valor) AS total_quantidade
    FROM historial_paciente hp
    JOIN medico m ON m.nif = hp.nif
    WHERE tipo = 'receita' AND ano = 2023
    GROUP BY GROUPING SETS((medicamento,hp.especialidade), (medicamento,hp.especialidade, m.nome))
)
SELECT * FROM clinic_data
UNION ALL
SELECT * FROM date_data
UNION ALL
SELECT * FROM medico_data;

medicamento,localidade,clinica,mes,dia_do_mes,nome,especialidade,total_quantidade
Amoxicilina,Largo Lua Cheia 9 4 1 2 - 4 7 8 Amadora,Hospital Beatriz Angelo,,,,,8413.0
Amoxicilina,Largo Lua Cheia 9 4 1 2 - 4 7 8 Amadora,,,,,,8413.0
Amoxicilina,Praceta Encanto 5 4 8 8 - 1 6 5 Oeiras,Clinica Sao Francisco Xavier,,,,,8467.0
Amoxicilina,Praceta Encanto 5 4 8 8 - 1 6 5 Oeiras,,,,,,8467.0
Amoxicilina,Praceta Primavera 3 2 4 1 - 6 6 7 Cascais,Hospital de Santa Maria,,,,,8615.0
Amoxicilina,Praceta Primavera 3 2 4 1 - 6 6 7 Cascais,,,,,,8615.0
Amoxicilina,Rua Sao Joao 9 9 8 4 - 7 2 3 Amadora,Hospital de Cascais,,,,,8557.0
Amoxicilina,Rua Sao Joao 9 9 8 4 - 7 2 3 Amadora,,,,,,8557.0
Amoxicilina,Travessa Lua Cheia 5 8 0 8 - 8 0 6 Oeiras,Hospital da Luz,,,,,8345.0
Amoxicilina,Travessa Lua Cheia 5 8 0 8 - 8 0 6 Oeiras,,,,,,8345.0


4. Determinar se há enviesamento na medição de algum parâmetros entre clínicas, especialidades médicas ou médicos, sendo para isso necessário listar o valor médio e desvio padrão de todos os parâmetros de observações métricas (i.e. com valor não NULL) com drill down na dimensão médico (globalmente > especialidade > nome \[do médico]) e drill down adicional (sobre o anterior) por clínica.

In [14]:
%%sql
WITH ObservacoesMetricas AS (
    SELECT
        hp.chave AS parametro,
        hp.valor,
        hp.especialidade,
        m.nome AS medico_nome,
        hp.nome AS clinica_nome
    FROM
        historial_paciente hp
    JOIN medico m ON hp.nif = m.nif
    WHERE
        hp.valor IS NOT NULL and hp.tipo = 'observacao'
)
SELECT
    parametro,
    especialidade,
    medico_nome,
    clinica_nome,
    AVG(valor) AS media_valor,
    STDDEV(valor) AS desvio_padrao_valor
FROM
    ObservacoesMetricas
GROUP BY GROUPING SETS((parametro), (parametro, especialidade), (parametro, especialidade, medico_nome),(parametro, especialidade, medico_nome, clinica_nome));

parametro,especialidade,medico_nome,clinica_nome,media_valor,desvio_padrao_valor
Altura,Cardiologia,Kowi Adebola,Hospital da Luz,41.92407407407408,27.318900932287672
Altura,Cardiologia,Kowi Adebola,Hospital de Cascais,44.51622641509433,28.774007316059983
Altura,Cardiologia,Kowi Adebola,Hospital de Santa Maria,54.85531250000001,32.14104510659781
Altura,Cardiologia,Kowi Adebola,,46.84535714285714,29.633865486214983
Altura,Cardiologia,Kowi Eshe,Clinica Sao Francisco Xavier,39.74888888888889,30.37420517263424
Altura,Cardiologia,Kowi Eshe,Hospital Beatriz Angelo,46.42416666666667,32.636760773518546
Altura,Cardiologia,Kowi Eshe,Hospital de Cascais,46.15296296296297,30.32231388527421
Altura,Cardiologia,Kowi Eshe,Hospital de Santa Maria,63.17791666666667,22.79785840040524
Altura,Cardiologia,Kowi Eshe,,48.89907407407408,29.791547554242715
Altura,Cardiologia,Kowi Lulu,Clinica Sao Francisco Xavier,46.114,28.833758613636785


## 6. Índices

Apresente as instruções SQL para criação de índices para melhorar os tempos de cada uma das consultas listadas abaixo sobre a base de dados ‘Saude’. Justifique a sua escolha de tabela(s), atributo(s) e tipo(s) de índice, explicando que operações seriam otimizadas e como. Considere que não existam índices nas tabelas, além daqueles implícitos ao declarar chaves primárias e estrangeiras, e para efeitos deste exercício, suponha que o tamanho das tabelas excede a memória disponível em várias ordens de magnitude.

### 6.1
SELECT nome 
FROM paciente 
JOIN consulta USING (ssn) 
JOIN observacao USING (id) 
WHERE parametro = ‘pressão diastólica’ 
AND valor >= 9;

In [20]:
%%sql
DROP INDEX IF EXISTS index_parametro_valor CASCADE;
DROP INDEX IF EXISTS index_ssn CASCADE;

CREATE INDEX index_parametro_valor
ON observacao (valor);

CREATE INDEX index_ssn
ON consulta (ssn);

### Justificação
A utilização do index_parametro_valor tem como objetivo otimizar a cláusula 'WHERE', que filtra os resgistos na tabela 'observacao' segundo as condições indicadas. Assim, conseguimos reduzir o número de leituras de disco necessárias, uma vez que a base de dados pode utilizar o índice para encontrar rapidamente os registos desejados.
Para além do objetivo de otimizar a cláusula 'JOIN', a criação do índice ssn foi criado pois, por ser chave primária de outras entidade, é aconcelhado criar índice.
Inicialmente, ao testar os tempos do código sem a criação dos índices observámos um execution time de aproximadamente o dobro do que quando fomos testar com os índices, concluindo que os índices efetivamente otimizaram a procura dos dados. 

...

### 6.2
SELECT especialidade, SUM(quantidade) AS qtd
FROM medico 
JOIN consulta USING (nif)
JOIN receita USING (codigo_sns) 
WHERE data BETWEEN ‘2023-01-01’ AND ‘2023-12-31’ 
GROUP BY especialidade
ORDER BY qtd;

In [19]:
%%sql
DROP INDEX IF EXISTS index_consulta_nif_data CASCADE;
DROP INDEX IF EXISTS index_receita_codigo_sns CASCADE;
DROP INDEX IF EXISTS index_medico_especialidade CASCADE;

CREATE INDEX index_consulta_nif_data
ON consulta (nif, data, codigo_sns);

CREATE INDEX index_receita_codigo_sns
ON receita (quantidade);

CREATE INDEX index_medico_especialidade
ON medico (especialidade);

### Justificação
nif: Foi utilizado para a junção entre as tabelas 'consulta' e 'medico'.

data: Foi utilizado na cláusula 'WHERE' para filtrar registos no intervalo de datas.

codigo_sns: Foi utilizado para a junção entre as tabelas 'consulta' e 'receita'.

quantidade: Foi necessário para calcular a soma (SUM(quantidade)) na cláusula 'SELECT'.

especialidade: Foi utilizado na cláusula 'SELECT' e 'GROUP BY'.

...