# Projeto de Bases de Dados - Parte 2

### Docente Responsável

Prof. Alessandro Gianola

### Grupo 12 - BD25L07
<dl>
    <dt>35 horas (33.3%)</dt>
    <dd>ist102373 Afonso Calinas</dd>
    <dt>35 horas (33.3%)</dt>
    <dd>ist103206 Guilherme Gomes</dd>
    <dt>35 horas (33.3%)</dt>
    <dd>ist106543 Tiago Antunes</dd>
<dl>

In [1]:
%load_ext sql
%config SqlMagic.displaycon = 0
%config SqlMagic.displaylimit = 100
%sql postgresql+psycopg://postgres:postgres@postgres/saude

## 0. Carregamento da Base de Dados

Crie a base de dados “Saude” no PostgreSQL e execute os comandos para criação das tabelas desta base de dados apresentados de seguida

In [None]:
%%sql

DROP TABLE IF EXISTS clinica CASCADE;
DROP TABLE IF EXISTS enfermeiro CASCADE;
DROP TABLE IF EXISTS medico CASCADE;
DROP TABLE IF EXISTS trabalha CASCADE;
DROP TABLE IF EXISTS paciente CASCADE;
DROP TABLE IF EXISTS receita CASCADE;
DROP TABLE IF EXISTS consulta CASCADE;
DROP TABLE IF EXISTS observacao CASCADE;

CREATE TABLE clinica(
	nome VARCHAR(80) PRIMARY KEY,
	telefone VARCHAR(15) UNIQUE NOT NULL CHECK (telefone ~ '^[0-9]+$'),
	morada VARCHAR(255) UNIQUE NOT NULL
);

CREATE TABLE enfermeiro(
	nif CHAR(9) PRIMARY KEY CHECK (nif ~ '^[0-9]+$'),
	nome VARCHAR(80) UNIQUE NOT NULL,
	telefone VARCHAR(15) NOT NULL CHECK (telefone ~ '^[0-9]+$'),
	morada VARCHAR(255) NOT NULL,
	nome_clinica VARCHAR(80) NOT NULL REFERENCES clinica (nome)
);

CREATE TABLE medico(
	nif CHAR(9) PRIMARY KEY CHECK (nif ~ '^[0-9]+$'),
	nome VARCHAR(80) UNIQUE NOT NULL,
	telefone VARCHAR(15) NOT NULL CHECK (telefone ~ '^[0-9]+$'),
	morada VARCHAR(255) NOT NULL,
	especialidade VARCHAR(80) NOT NULL
);

CREATE TABLE trabalha(
nif CHAR(9) NOT NULL REFERENCES medico,
nome VARCHAR(80) NOT NULL REFERENCES clinica,
dia_da_semana SMALLINT,
PRIMARY KEY (nif, dia_da_semana)
);

CREATE TABLE paciente(
	ssn CHAR(11) PRIMARY KEY CHECK (ssn ~ '^[0-9]+$'),
nif CHAR(9) UNIQUE NOT NULL CHECK (nif ~ '^[0-9]+$'),
	nome VARCHAR(80) NOT NULL,
	telefone VARCHAR(15) NOT NULL CHECK (telefone ~ '^[0-9]+$'),
	morada VARCHAR(255) NOT NULL,
	data_nasc DATE NOT NULL
);

CREATE TABLE consulta(
	id SERIAL PRIMARY KEY,
	ssn CHAR(11) NOT NULL REFERENCES paciente,
	nif CHAR(9) NOT NULL REFERENCES medico,
	nome VARCHAR(80) NOT NULL REFERENCES clinica,
	data DATE NOT NULL,
	hora TIME NOT NULL,
	codigo_sns CHAR(12) UNIQUE CHECK (codigo_sns ~ '^[0-9]+$'),
	UNIQUE(ssn, data, hora),
	UNIQUE(nif, data, hora)
);

CREATE TABLE receita(
	codigo_sns VARCHAR(12) NOT NULL REFERENCES consulta (codigo_sns),
	medicamento VARCHAR(155) NOT NULL,
	quantidade SMALLINT NOT NULL CHECK (quantidade > 0),
	PRIMARY KEY (codigo_sns, medicamento)
);

CREATE TABLE observacao(
	id INTEGER NOT NULL REFERENCES consulta,
	parametro VARCHAR(155) NOT NULL,
	valor FLOAT,
PRIMARY KEY (id, parametro)
);


## 1. Restrições de Integridade

Apresente o código para implementar as seguintes restrições de integridade, se necessário, com recurso a extensões procedimentais SQL (Stored Procedures e Triggers):

(RI-1) Os horários das consultas são à hora exata ou meia-hora no horário 8-13h e 14-19h

In [None]:
%%sql
-- (RI-1)
    
CHECK (
    (EXTRACT(HOUR FROM hora) BETWEEN 8 AND 12 OR EXTRACT(HOUR FROM hora) BETWEEN 14 AND 18) 
    AND
    (EXTRACT(MINUTE FROM hora) = 0 OR EXTRACT(MINUTE FROM hora) = 30)
)


(RI-2) Um médico não se pode consultar a si próprio, embora possa ser paciente de outros médicos no sistema

In [None]:
%%sql
-- (RI-2)

-- Função que aplica a restrição de integridade
CREATE OR REPLACE FUNCTION medico_paciente_diferentes() 
RETURNS TRIGGER AS $$
BEGIN
    -- Verifica se o paciente é o mesmo que o médico
    IF (SELECT nif FROM paciente WHERE ssn = NEW.ssn) = NEW.nif THEN
        RAISE EXCEPTION 'Um médico não pode consultar-se a si próprio!';
    END IF;
    RETURN NEW;
END;
$$ LANGUAGE plpgsql;

-- Trigger para a função
CREATE TRIGGER trigger_medico_paciente_diferentes
BEFORE INSERT OR UPDATE ON consulta
FOR EACH ROW
EXECUTE FUNCTION medico_paciente_diferentes();


(RI-3) Um médico só pode dar consultas na clínica em que trabalha no dia da semana correspondente à data da consulta

In [None]:
%%sql
-- (RI-3)
    
-- Função que aplica a restrição de integridade
CREATE OR REPLACE FUNCTION agenda_medico()
RETURNS TRIGGER AS $$
BEGIN
    -- Dia da semana para a consulta (0=2a-feira, 6=Domingo)
    IF NOT EXISTS (
        SELECT 1
        FROM trabalha
        WHERE nif = NEW.nif
          AND nome = NEW.nome
          AND EXTRACT(DOW FROM NEW.d) = trabalha.dia_da_semana
    ) THEN
        RAISE EXCEPTION 'Médico com NIF % não trabalha na clínica % a %', NEW.nif, NEW.nome, NEW.d;
    END IF;

    RETURN NEW;
END;
$$ LANGUAGE plpgsql;

-- Trigger para a função
CREATE TRIGGER trigger_agenda_medico
BEFORE INSERT OR UPDATE ON consulta
FOR EACH ROW
EXECUTE FUNCTION agenda_medico();


## 2. Preenchimento da Base de Dados

Preencha todas as tabelas da base de dados de forma consistente (após execução do ponto anterior) com os seguintes requisitos adicionais de cobertura:
- 5 clínicas, de pelo menos 3 localidades diferentes do distrito de Lisboa
- 5-6 enfermeiros por clínica
- 20 médicos de especialidade ‘clínica geral’ e 40 outros distribuídos como entender por até 5 outras especialidades médicas (incluindo pelo menos, ‘ortopedia’ e ‘cardiologia’). Cada médico deve trabalhar em pelo menos duas clínicas, e em cada clínica a cada dia da semana (incluindo fins de semana), devem estar pelo menos 8 médicos
- Cerca de 5.000 pacientes
- Um número mínimo de consultas em 2023 e 2024 tais que cada paciente tem pelo menos uma consulta, e em cada dia há pelo menos 20 consultas por clínica, e pelo menos 2 consultas por médico
- ~80% das consultas tem receita médica associada, e as receitas têm 1 a 6 medicamentos em quantidades entre 1 e 3
- Todas as consultas têm 1 a 5 observações de sintomas (com parâmetro mas sem valor) e 0 a 3 observações métricas (com parâmetro e valor). Deve haver ~50 parâmetros diferentes para os sintomas (sem valor) e ~20 parâmetros diferentes para as observações métricas (com valor) e os dois conjuntos devem ser disjuntos. 
- Todas as moradas são nacionais e seguem o formato Português, terminando com código postal: XXXX-XXX e de seguida a localidade.
Deve ainda garantir que todas as consultas necessárias para a realização dos pontos seguintes do projeto produzem um resultado não vazio.

O código para preenchimento da base de dados deve ser compilado num ficheiro "populate.sql", anexado ao relatório, que contém com comandos INSERT ou alternativamente comandos COPY que populam as tabelas a partir de ficheiros de texto, também eles anexados ao relatório. 

## 3. Desenvolvimento de Aplicação

Crie um protótipo de RESTful web service para gestão de consultas por acesso programático à base de dados ‘Saude’ através de uma API que devolve respostas em JSON, implementando os seguintes endpoints REST:

|Endpoint|Descrição|
|--------|---------|
|/|Lista todas as clínicas (nome e morada).|
|/c/\<clinica>/|Lista todas as especialidades oferecidas na \<clinica>.|
|/c/\<clinica>/\<especialidade>/|Lista todos os médicos (nome) da \<especialidade> que trabalham na <clínica> e os primeiros três horários disponíveis para consulta de cada um deles (data e hora).|
|/a/\<clinica>/registar/|Registra uma marcação de consulta na \<clinica> na base de dados (populando a respectiva tabela). Recebe como argumentos um paciente, um médico, e uma data e hora (posteriores ao momento de agendamento).|
|/a/\<clinica>/cancelar/|Cancela uma marcação de consulta que ainda não se realizou na \<clinica> (o seu horário é posterior ao momento do cancelamento), removendo a entrada da respectiva tabela na base de dados. Recebe como argumentos um paciente, um médico, e uma data e hora.|

### Explicação da arquitetura da aplicação web, indicando a correspondência entre as funções app.py e os endpoints pedidos

A nossa aplicação tem como objetivo primário ser a ponte entre a nossa base de dados e o utilizador. Criámos vários endpoints, com o intuito de conseguirmos, adicionar e retirar informações na base de dados como também podermos consultá-las.
De seguida apresentamos cada end-point criado e o seu propósito:

#### Endpoint - / - clinic_index():
- Com este endpoint, conseguimos consultar o nome e morada de todas as clínicas que existem na nossa base de dados.

#### Endpoint - /c/&lt;clinica&gt;/ - clinic_view(clinica):
- Este ao contrário do anterior, acede à clinica descrita no endpoint para retornar todas as especialidades que lá são prestadas.

#### Endpoint - /c/&lt;clinica&gt;/&lt;especialidade&gt;/ - doctor_clinic_specialty_view(clinica, especialidade):
- Criámos este endpoint para termos acesso ao nome e aos três próximos horários disponíveis dos médicos que trabalham na clínica descrita no endpoint e na especialidade descrita no mesmo.

#### Endpoint - /a/&lt;clinica&gt;/registar/ - create_appointment(clinica):
- Neste endpoint, somos capazes de criar uma consulta numa clínica à nossa escolha. No entanto somos obrigados a enviar como argumentos o número de segurança social do paciente(ssn), o NIF do médico pretendido(nif), uma data e hora. É necessário que o médico esteja a trabalhar nesse dia de semana nessa clínica pretendida e que esse horário esteja livre.

#### Endpoint - /a/&lt;clinica&gt;/cancelar/ - cancel_appointment(clinica):
- E por fim, com este endpoint conseguimos cancelar uma consulta futura, dando de novo os mesmos argumentos ao endpoint que o endpoint anterior.


## 4. Vistas

Crie uma vista materializada que detalhe as informações mais importantes sobre as consultas dos pacientes, combinando a informação de várias tabelas da base de dados. A vista deve ter o seguinte esquema:

### *historial_paciente(id, ssn, nif, nome, data, ano, mes, dia_do_mes, localidade, especialidade, tipo, chave, valor)*

em que:
- *id, ssn, nif, nome* e *data*: correspondem ao atributos homónimos da tabela **consulta**
- *ano*, *mes* e *dia_do_mes*: são derivados do atributo *data* da tabela **consulta**
- *localidade*: é derivado do atributo *morada* da tabela **clinica**
- *especialidade*: corresponde ao atributo homónimo da tabela **medico**
- *tipo*: toma os valores ‘observacao’ ou ‘receita’ consoante o preenchimento dos campos seguintes
- *chave*: corresponde ao atributo *parametro* da tabela **observacao** ou ao atributo *medicamento* da tabela **receita**
- *valor*: corresponde ao atributo *valor* da tabela **observacao** ou ao atributo *quantidade* da tabela **receita**


In [None]:
%%sql
-- MATERIALIZED VIEW "historial_paciente"

-- Elimina a vista "historial_paciente" se esta já existir
DROP MATERIALIZED VIEW IF EXISTS historial_paciente;

CREATE MATERIALIZED VIEW historial_paciente AS
    
-- "observacao"
SELECT 
    c.id,
    c.ssn,                               
    c.nif,
    c.nome,
    c.data,
    EXTRACT(YEAR FROM c.data) AS ano,
    EXTRACT(MONTH FROM c.data) AS mes,
    EXTRACT(DAY FROM c.data) AS dia_do_mes,
    cl.morada AS localidade,
    m.especialidade,
    'observacao' AS tipo,
    o.parametro AS chave,
    o.valor
FROM 
    consulta c
JOIN 
    medico m ON c.nif = m.nif
JOIN 
    clinica cl ON c.nome = cl.nome
LEFT JOIN 
    observacao o ON c.id = o.id

UNION ALL

-- "receita"
SELECT 
    c.id,
    c.ssn,
    c.nif,
    c.nome,
    c.data,
    EXTRACT(YEAR FROM c.data) AS ano,
    EXTRACT(MONTH FROM c.data) AS mes,
    EXTRACT(DAY FROM c.data) AS dia_do_mes,
    cl.morada AS localidade,
    m.especialidade,
    'receita' AS tipo,
    r.medicamento AS chave,
    r.quantidade AS valor
FROM 
    consulta c
JOIN 
    medico m ON c.nif = m.nif
JOIN 
    clinica cl ON c.nome = cl.nome
LEFT JOIN 
    receita r ON c.codigo_sns = r.codigo_sns;


## 5. Análise de Dados (SQL e OLAP

Usando a vista desenvolvida no ponto anterior, complementada com outras tabelas da base de dados ‘Saude’ quando necessário, apresente a consulta SQL mais sucinta para cada um dos seguintes objetivos analíticos. Pode usar as instruções ROLLUP, CUBE, GROUPING SETS ou as cláusulas UNION of GROUP BY para os objetivos em que lhe parecer adequado.

1. Determinar que paciente(s) tiveram menos progresso no tratamento das suas doenças do foro ortopédico para atribuição de uma consulta gratuita. Considera-se que o indicador de falta de progresso é o intervalo temporal máximo entre duas observações do mesmo sintoma (i.e. registos de tipo ‘observacao’ com a mesma chave e com valor NULL) em consultas de ortopedia.

In [None]:
%%sql
-- ALTERAR NOMES PARA PORTUGUÊS!!!
-- VERIFICAR SE OS NULLs CAUSAM ALGUM PROBLEMA!!! (ver slides)
-- INTERVALO TEMPORAL CONTA COM A HORA OU APENAS DIAS?????
    
-- Consultas de ortopedia
WITH consultas_ortopedia AS (
    SELECT c.id AS consulta_id, c.ssn, c.data, c.hora
    FROM consulta c
    JOIN medico m ON c.nif = m.nif
    WHERE m.especialidade = 'ortopedia'
),

-- Observações relevantes (valor is NULL)
observacoes_com_nulls AS (
    SELECT o.id, o.parametro, o.valor, c.ssn, c.data, c.hora
    FROM observacao o
    JOIN consultas_ortopedia c ON o.id = c.consulta_id
    WHERE o.valor IS NULL
),

-- Intervalos de tempo entre observações consecutivas
intervalos AS (
    SELECT
        o1.ssn,
        o1.parametro,
        o1.data AS data1,
        o2.data AS data2,
        EXTRACT(EPOCH FROM (o2.data - o1.data)) / 86400 AS intervalo_dias
    FROM observacoes_com_nulls o1
    JOIN observacoes_com_nulls o2
    ON o1.ssn = o2.ssn AND o1.parametro = o2.parametro AND o1.data < o2.data
),

-- Step 4: Find the maximum interval for each patient
max_intervalos AS (
    SELECT
        ssn,
        MAX(intervalo_dias) AS max_intervalo_dias
    FROM intervalos
    GROUP BY ssn
),

-- Step 5: Identify the patients with the overall maximum interval
max_intervalo_pacientes AS (
    SELECT MAX(max_intervalo_dias) AS geral_max_intervalo
    FROM max_intervalos
)

SELECT
    mi.ssn,
    mi.max_intervalo_dias AS max_intervalo_dias
FROM max_intervalos mi
JOIN max_intervalo_pacientes mip
ON mi.max_intervalo_dias = mip.geral_max_intervalo;


2. Determinar que medicamentos estão a ser usados para tratar doenças crónicas do foro cardiológico. Considera-se que qualificam quaisquer medicamentos receitados ao mesmo paciente (qualquer que ele seja) pelo menos uma vez por mês durante os últimos doze meses, em consultas de cardiologia.

In [None]:
%%sql

WITH CardiologiaConsultas AS (
    SELECT
        c.id AS consulta_id,
        c.ssn,
        c.data,
        c.codigo_sns
    FROM
        consulta c
        JOIN medico m ON c.nif = m.nif
    WHERE
        m.especialidade = 'Cardiologia'
        AND c.data >= CURRENT_DATE - INTERVAL '1 year'
),
    
PrescricoesMensais AS (
    SELECT
        r.codigo_sns,
        r.medicamento,
        c.ssn,
        DATE_TRUNC('month', c.data) AS mes_da_prescricao
    FROM
        receita r
        JOIN CardiologiaConsultas c ON r.codigo_sns = c.codigo_sns
),
    
NMedicacaoPaciente AS (
    SELECT
        ssn,
        medicamento,
        COUNT(DISTINCT mes_da_prescricao) AS n_meses
    FROM
        PrescricoesMensais
    GROUP BY
        ssn, medicamento
    HAVING
        COUNT(DISTINCT mes_da_prescricao) >= 12
)
    
SELECT
    DISTINCT medicamento
FROM
    NMedicacaoPaciente;


3. Explorar as quantidades totais receitadas de cada medicamento em 2023, globalmente, e com drill down nas dimensões espaço (localidade > clinica), tempo (mes > dia_do_mes), e médico  (especialidade > nome \[do médico]), separadamente.

In [None]:
%%sql
WITH split_medicamentos AS (
    SELECT
        split_part(cl.morada, ' ', -1) AS localidade,
        cl.nome AS clinica,
        EXTRACT(MONTH FROM c.data) AS mes,
        EXTRACT(DAY FROM c.data) AS dia_do_mes,
        m.especialidade,
        m.nome AS medico,
        TRIM(medicamento_split) AS medicamento,
        r.quantidade
    FROM
        receita r
    JOIN
        consulta c ON r.codigo_sns = c.codigo_sns
    JOIN
        clinica cl ON c.nome = cl.nome
    JOIN
        medico m ON c.nif = m.nif,
        LATERAL unnest(string_to_array(r.medicamento, ',')) AS medicamento_split
    WHERE
        EXTRACT(YEAR FROM c.data) = 2023
)
SELECT
    COALESCE(medicamento, 'All Medication') AS medicamento,
    localidade,
    COALESCE(clinica, 'All Clinics') as clinica,
    mes,
    dia_do_mes,
    especialidade,
    COALESCE(medico, 'All Doctors') as medico,
    SUM(quantidade) AS total_quantidade
FROM
    split_medicamentos
GROUP BY
    ROLLUP (
        medicamento,
        (localidade, clinica),
        (mes, dia_do_mes),
        (especialidade, medico)
    )
ORDER BY
    medicamento NULLS FIRST,
    localidade NULLS FIRST,
    clinica NULLS FIRST,
    mes NULLS FIRST,
    dia_do_mes NULLS FIRST,
    especialidade NULLS FIRST,
    medico NULLS FIRST;


4. Determinar se há enviesamento na medição de algum parâmetros entre clínicas, especialidades médicas ou médicos, sendo para isso necessário listar o valor médio e desvio padrão de todos os parâmetros de observações métricas (i.e. com valor não NULL) com drill down na dimensão médico (globalmente > especialidade > nome \[do médico]) e drill down adicional (sobre o anterior) por clínica.

In [None]:
%%sql
SELECT
    parametro,
    COALESCE(m.especialidade, 'All Specialties') AS especialidade,
    COALESCE(m.nome, 'All Doctors') AS nome_medico,
    COALESCE(cl.nome, 'All Clinics') AS nome_clinica,
    AVG(o.valor) AS media,
    STDDEV(o.valor) AS desvio_padrao
FROM
    observacao o
JOIN consulta c ON o.id = c.id
JOIN medico m ON c.nif = m.nif
JOIN clinica cl ON c.nome = cl.nome
WHERE
    o.valor IS NOT NULL
GROUP BY
    GROUPING SETS (
        (parametro, cl.nome, m.especialidade, m.nome),
        (parametro, m.especialidade, m.nome),
        (parametro, m.especialidade),
        (parametro, cl.nome),
        (parametro)
    )
ORDER BY
    parametro NULLS FIRST ,
    especialidade NULLS FIRST,
    nome_medico NULLS FIRST,
    nome_clinica NULLS FIRST;


## 6. Índices

Apresente as instruções SQL para criação de índices para melhorar os tempos de cada uma das consultas listadas abaixo sobre a base de dados ‘Saude’. Justifique a sua escolha de tabela(s), atributo(s) e tipo(s) de índice, explicando que operações seriam otimizadas e como. Considere que não existam índices nas tabelas, além daqueles implícitos ao declarar chaves primárias e estrangeiras, e para efeitos deste exercício, suponha que o tamanho das tabelas excede a memória disponível em várias ordens de magnitude.

### 6.1
SELECT nome 
FROM paciente 
JOIN consulta USING (ssn) 
JOIN observacao USING (id) 
WHERE parametro = ‘pressão diastólica’ 
AND valor >= 9;

In [None]:
%%sql
CREATE INDEX idx_observacao_parametro ON observacao USING HASH("parametro");
CREATE INDEX idx_observacao_valor_id ON observacao(valor, id);
CREATE INDEX idx_consulta_ssn ON consulta(ssn);

### Justificação

Utilizamos 3 indexes para este query. Os indexes `idx_consulta_ssn` e `idx_observacao_valor_id` aceleram as operações JOIN, usando os atributos que são utilizados para estas operações (`ssn` de `consulta` e `id` de `obervacao`). Não existe necessidade de criar um index para o atributo `ssn` da relação `paciente`, pois este atributo é chave primária da relação, sendo indexado implicitamente.

Utilizamos também o index `idx_observacao_parametro`, que, em conjunto com o index `idx_observacao_valor_id` reduzirá significativamente o tempo de execução da operação de filtragem, acelerando o acesso aos atributos a serem filtrados, `parametro` e `valor`, ambos da relação `observacao`.

Usámos o tipo B-Tree para os indexes `idx_consulta_ssn` e `idx_observacao_valor_id`, por ser o tipo de index mais versátil, e o tipo Hash para o index `idx_observacao_parametro`, visto este ser particularmente indicado para operações de igualdade. Pensámos em utilizar também o tipo Hash para `idx_consulta_ssn` pelo mesmo motivo, mas obtivemos melhores resultados com B-Tree. 


### 6.2
SELECT especialidade, SUM(quantidade) AS qtd
FROM medico 
JOIN consulta USING (nif)
JOIN receita USING (codigo_sns) 
WHERE data BETWEEN ‘2023-01-01’ AND ‘2023-12-31’ 
GROUP BY especialidade
ORDER BY qtd;

In [None]:
%%sql
CREATE INDEX idx_consulta_nif_data ON consulta (nif, data);
CREATE INDEX idx_receita_codigo_sns ON receita (codigo_sns);
CREATE INDEX idx_medico_especialidade ON medico (especialidade);

### Justificação

Assim como na query anterior, para esta, utilizámos 3 indexes. Para facilitação das operações JOIN, utilizámos os indexes `idx_consulta_nif_data`, e `idx_receita_codigo_sns`, que ordenam os atributos `nif` da relação `consulta` e `codigo_sns` da relação `receita`, respetivamente. Não é necessário criar indexes para os atributos nas relações com que estas efetuam a operação de JOIN, visto serem as respetivas chaves primárias, sendo portanto implicitamente indexadas.

O index `idx_consulta_nif_data` ordena também o atributo `data` da relação `consulta`, sendo portanto adequado também para acelerar a operação de range que é efetuada sobre este atributo na filtragem.

Finalmente, temos também o index `idx_medico_especialidade`, que ordena o atributo `especialidade` da relação `médico`. Este index tem o propósito de acelerar a operação GROUP BY da query.

Todos os indexes são do tipo B-Tree, por ser o mais versátil e adequado para todas as operações efetuadas. Indexes Hash poderiam ter sido utilizados para os atributos `nif` e `codigo_sns`, devido a estes sofrerem operações de igualdade, para as quais estes indexes são adequados, mas obtivemos melhores tempos de execução com os indexes B-Tree.