# Projeto de Bases de Dados - Parte 2

### Docente Responsável

Prof. Flávio Martins

### Grupo 108
<dl>
    <dt>70 horas (50.0%)</dt>
    <dd>ist1103976 Diogo Pinto</dd>
    <dt>55 horas (40.0%)</dt>
    <dd>ist1104111 Tomás Santos</dd>
    <dt>12 horas (10.0%)</dt>
    <dd>ist1104114 Rodrigo Gregores</dd>
<dl>

In [None]:
%load_ext sql
%config SqlMagic.displaycon = 0
%config SqlMagic.displaylimit = 100
%sql postgresql+psycopg://postgres:postgres@postgres/postgres

## 0. Carregamento da Base de Dados

Crie a base de dados “Saude” no PostgreSQL e execute os comandos para criação das tabelas desta base de dados apresentados de seguida

In [None]:
%%sql

DROP TABLE IF EXISTS clinica CASCADE;
DROP TABLE IF EXISTS enfermeiro CASCADE;
DROP TABLE IF EXISTS medico CASCADE;
DROP TABLE IF EXISTS trabalha CASCADE;
DROP TABLE IF EXISTS paciente CASCADE;
DROP TABLE IF EXISTS receita CASCADE;
DROP TABLE IF EXISTS consulta CASCADE;
DROP TABLE IF EXISTS observacao CASCADE;

CREATE TABLE clinica(
	nome VARCHAR(80) PRIMARY KEY,
	telefone VARCHAR(15) UNIQUE NOT NULL CHECK (telefone ~ '^[0-9]+$'),
	morada VARCHAR(255) UNIQUE NOT NULL
);

CREATE TABLE enfermeiro(
	nif CHAR(9) PRIMARY KEY CHECK (nif ~ '^[0-9]+$'),
	nome VARCHAR(80) UNIQUE NOT NULL,
	telefone VARCHAR(15) NOT NULL CHECK (telefone ~ '^[0-9]+$'),
	morada VARCHAR(255) NOT NULL,
	nome_clinica VARCHAR(80) NOT NULL REFERENCES clinica (nome)
);

CREATE TABLE medico(
	nif CHAR(9) PRIMARY KEY CHECK (nif ~ '^[0-9]+$'),
	nome VARCHAR(80) UNIQUE NOT NULL,
	telefone VARCHAR(15) NOT NULL CHECK (telefone ~ '^[0-9]+$'),
	morada VARCHAR(255) NOT NULL,
	especialidade VARCHAR(80) NOT NULL
);

CREATE TABLE trabalha(
nif CHAR(9) NOT NULL REFERENCES medico,
nome VARCHAR(80) NOT NULL REFERENCES clinica,
dia_da_semana SMALLINT,
PRIMARY KEY (nif, dia_da_semana)
);

CREATE TABLE paciente(
	ssn CHAR(11) PRIMARY KEY CHECK (ssn ~ '^[0-9]+$'),
nif CHAR(9) UNIQUE NOT NULL CHECK (nif ~ '^[0-9]+$'),
	nome VARCHAR(80) NOT NULL,
	telefone VARCHAR(15) NOT NULL CHECK (telefone ~ '^[0-9]+$'),
	morada VARCHAR(255) NOT NULL,
	data_nasc DATE NOT NULL
);

CREATE TABLE consulta(
	id SERIAL PRIMARY KEY,
	ssn CHAR(11) NOT NULL REFERENCES paciente,
	nif CHAR(9) NOT NULL REFERENCES medico,
	nome VARCHAR(80) NOT NULL REFERENCES clinica,
	data DATE NOT NULL,
	hora TIME NOT NULL,
	codigo_sns CHAR(12) UNIQUE CHECK (codigo_sns ~ '^[0-9]+$'),
	UNIQUE(ssn, data, hora),
	UNIQUE(nif, data, hora)
);

CREATE TABLE receita(
	codigo_sns VARCHAR(12) NOT NULL REFERENCES consulta (codigo_sns),
	medicamento VARCHAR(155) NOT NULL,
	quantidade SMALLINT NOT NULL CHECK (quantidade > 0),
	PRIMARY KEY (codigo_sns, medicamento)
);

CREATE TABLE observacao(
	id INTEGER NOT NULL REFERENCES consulta,
	parametro VARCHAR(155) NOT NULL,
	valor FLOAT,
PRIMARY KEY (id, parametro)
);

## 1. Restrições de Integridade

Apresente o código para implementar as seguintes restrições de integridade, se necessário, com recurso a extensões procedimentais SQL (Stored Procedures e Triggers):

(RI-1) Os horários das consultas são à hora exata ou meia-hora no horário 8-13h e 14-19h

In [None]:
%%sql
CREATE OR REPLACE FUNCTION check_hora_consulta() RETURNS TRIGGER AS 
$$
BEGIN
    IF (EXTRACT(MINUTE FROM NEW.hora) <> 0 AND EXTRACT(MINUTE FROM NEW.hora) <> 30)
       OR (NEW.hora < TIME '08:00' OR (NEW.hora >= TIME '13:00' AND NEW.hora < TIME '14:00') OR NEW.hora >= TIME '19:00') THEN 
       RAISE EXCEPTION 'Esta hora não pode ser atribuída a uma consulta.';
    END IF;
    RETURN NEW;
END;
$$ LANGUAGE plpgsql;
CREATE TRIGGER trigger_check_hora_consulta
BEFORE INSERT OR UPDATE ON consulta
FOR EACH ROW EXECUTE FUNCTION check_hora_consulta();

(RI-2) Um médico não se pode consultar a si próprio, embora possa ser paciente de outros médicos no sistema

In [None]:
%%sql
CREATE OR REPLACE FUNCTION check_consulta_de_medico() RETURNS TRIGGER AS
$$
BEGIN
    IF NEW.nif = (SELECT nif FROM paciente WHERE ssn = NEW.ssn) THEN RAISE EXCEPTION 'Um médico não se pode consultar a si próprio.';
    END IF;
    RETURN NEW;
END;
$$ LANGUAGE plpgsql;
CREATE TRIGGER trigger_check_consulta_de_medico
BEFORE INSERT OR UPDATE ON consulta
FOR EACH ROW EXECUTE FUNCTION check_consulta_de_medico();

(RI-3) Um médico só pode dar consultas na clínica em que trabalha no dia da semana correspondente à data da consulta

In [None]:
%%sql
CREATE OR REPLACE FUNCTION check_medico_clinica() RETURNS TRIGGER AS $$
BEGIN
    IF NOT EXISTS (SELECT 1 FROM trabalha WHERE nif = NEW.nif AND nome = NEW.nome AND dia_da_semana = EXTRACT(DOW FROM NEW.data)) THEN
        RAISE EXCEPTION 'Nesta semana o médico não trabalha nesta clinica';
    END IF;
    RETURN NEW;
END;
$$ LANGUAGE plpgsql;

CREATE TRIGGER trg_check_medico_clinica
BEFORE INSERT OR UPDATE ON consulta
FOR EACH ROW EXECUTE FUNCTION check_medico_clinica();

## 2. Preenchimento da Base de Dados

Preencha todas as tabelas da base de dados de forma consistente (após execução do ponto anterior) com os seguintes requisitos adicionais de cobertura:
- 5 clínicas, de pelo menos 3 localidades diferentes do distrito de Lisboa
- 5-6 enfermeiros por clínica
- 20 médicos de especialidade ‘clínica geral’ e 40 outros distribuídos como entender por até 5 outras especialidades médicas (incluindo pelo menos, ‘ortopedia’ e ‘cardiologia’). Cada médico deve trabalhar em pelo menos duas clínicas, e em cada clínica a cada dia da semana (incluindo fins de semana), devem estar pelo menos 8 médicos
- Cerca de 5.000 pacientes
- Um número mínimo de consultas em 2023 e 2024 tais que cada paciente tem pelo menos uma consulta, e em cada dia há pelo menos 20 consultas por clínica, e pelo menos 2 consultas por médico
- ~80% das consultas tem receita médica associada, e as receitas têm 1 a 6 medicamentos em quantidades entre 1 e 3
- Todas as consultas têm 1 a 5 observações de sintomas (com parâmetro mas sem valor) e 0 a 3 observações métricas (com parâmetro e valor). Deve haver ~50 parâmetros diferentes para os sintomas (sem valor) e ~20 parâmetros diferentes para as observações métricas (com valor) e os dois conjuntos devem ser disjuntos. 
- Todas as moradas são nacionais e seguem o formato Português, terminando com código postal: XXXX-XXX e de seguida a localidade.
Deve ainda garantir que todas as consultas necessárias para a realização dos pontos seguintes do projeto produzem um resultado não vazio.

O código para preenchimento da base de dados deve ser compilado num ficheiro "populate.sql", anexado ao relatório, que contém com comandos INSERT ou alternativamente comandos COPY que populam as tabelas a partir de ficheiros de texto, também eles anexados ao relatório. 

## 3. Desenvolvimento de Aplicação

Crie um protótipo de RESTful web service para gestão de consultas por acesso programático à base de dados ‘Saude’ através de uma API que devolve respostas em JSON, implementando os seguintes endpoints REST:

|Endpoint|Descrição|
|--------|---------|
|/|Lista todas as clínicas (nome e morada).|
|/c/\<clinica>/|Lista todas as especialidades oferecidas na \<clinica>.|
|/c/\<clinica>/\<especialidade>/|Lista todos os médicos (nome) da \<especialidade> que trabalham na <clínica> e os primeiros três horários disponíveis para consulta de cada um deles (data e hora).|
|/a/\<clinica>/registar/|Registra uma marcação de consulta na \<clinica> na base de dados (populando a respectiva tabela). Recebe como argumentos um paciente, um médico, e uma data e hora (posteriores ao momento de agendamento).|
|/a/\<clinica>/cancelar/|Cancela uma marcação de consulta que ainda não se realizou na \<clinica> (o seu horário é posterior ao momento do cancelamento), removendo a entrada da respectiva tabela na base de dados. Recebe como argumentos um paciente, um médico, e uma data e hora.|

### Explicação da arquitetura da aplicação web, indicando a correspondência entre as funções app.py e os endpoints pedidos

O nosso ficheiro app.py não está 100% correto, devido ao facto de não termos conseguido preeencher por completo a base de dados e também porque quando testamos há alguns erros com as intalações do flask e do psycopg.
Contudo, a aplicação WEB é uma API RESTful, desenvolvida em python utilizando o framework Flask.
A aplicação desenvolvida deve interagir com a nossa base de dados PostgreSQL para armazenar e recuperar informações sobre clínicas, especialidades, médicos e consultas.
A arquitetura da aplicação é composta pelos seguintes componentes principais:
-> Framework Flask.
-> Banco de Dados PostgreSQL.
-> Pool de conexões.
-> Configuração e Logging.
-> Endpoints da API.

A aplicação WEB em flask possui vários endpoints, cada um corresponde a uma função no arquivo app.py.

A primeira função tem como objetivo verificar o primerio endpoint, que é listar todas as clinicas, com a colocação do caratér '/'.
Para isso fazemos a seleção do nome e da morada, a partir da tabela clinica.
Isto irá resultar numa apresentação de todas as clinicas, assim que é colocado o carater '/'.

A segunda função tem como objetivo verificar o segundo endpoint, que é listar todas as especialidades oferecidas na clinica, com a colocação de /c/<clinica>/.
Para isso fazemos a seleção da especialidade, de maneira a que não hajam especialidades duplicadas, através da tabela clinica.
Fazemos o JOIN entre a tabela clinica e a tabela trabalha e juntamos as tabelas onde o nome da clinica na tabela 'clinica' corresponde ao nome da clinica na tabela 'trabalha'.
Precisamos dessa relação para obter os médicos que trabalham na clínica específica.
Depois realizamos um JOIN entre a tabela trabalha e a tabela medico.
Juntamos as duas tabelas onde o nif do médico na tabela  trabalha corresponde ao nif do médico na tabela medico.
Precisamos dessas informações para saber quais especialidades estão associadas aos médicos que trabalham na clínica específica.
Na condição WHERE filtramos os resultados da consulta para incluir apenas as linhas onde o nome da clínica corresponde ao nome da clínica fornecido como parâmetro.
Filtramos os resultados para a clínica específica passada na URL do endpoint. Este filtro é crucial para garantir que a consulta retorne especialidades apenas da clínica de interesse.

A terceira função tem como objetivo verificar o terceiro endpoint, que é listar todos os médicos da especialidade que trabalham na clínica e os primeiros três horários disponíveis para consulta de cada um deles, com a colocação de /c/<clinica>/<especialidade>/.
Para isso fazemos a seleção do nome do medico, a partir da tabela medico.
Selecionamos a data e a hora do horário disponível da tabela horario.
Fazemos um JOIN entre a tabela medico e a tabela trabalha.
Juntamos as duas tabelas onde o nif do médico na tabela medico corresponde ao nif do médico na tabela trabalha.
Fazemos um JOIN entre a tabela trabalha e a tabela horario.
Juntamos as duas tabelas onde o dia da semana em que o médico trabalha corresponde ao dia da semana extraído da data do horário na tabela horario, para saber os horários disponíveis para consulta e verificar se coincidem com os dias em que os médicos trabalham.
Realizamos um LEFT JOIN entre a tabela medico e a tabela consulta para incluir todos os horários, mesmo aqueles que não têm uma consulta marcada, de modo a identificar horários disponíveis.
O WHERE filtra os resultados da consulta especificando que queremos apenas as linhas onde a especialidade do médico corresponde à especialidade fornecida como parâmetro.
Adicionámos ainda uma condição de filtragem para incluir apenas horários cuja data é maior que a data atual ou, se for a mesma data, a hora é maior ou igual à hora atual.
Limitamos depois de maneira a termos apenas os primeiros três horários disponíveis para cada médico.

A quarta função tem como objetivo verificar o quarto endpoint, que é registrar uma marcação de consulta na <clinica> na base de dados. Recebe como argumentos um paciente, um médico, e uma data e hora (posteriores ao momento de agendamento), com a colocação de /a/<clinica>/registar/.

A quinta função tem como objetivo Cancelar uma marcação de consulta que ainda não se realizou na <clinica>, removendo a entrada da respectiva tabela na base de dados. Recebe como argumentos um paciente, um médico, e uma data e hora, com a colocação de /a/<clinica>/cancelar/.






## 3. Vistas

Crie uma vista materializada que detalhe as informações mais importantes sobre as consultas dos pacientes, combinando a informação de várias tabelas da base de dados. A vista deve ter o seguinte esquema:

### *historial_paciente(id, ssn, nif, nome, data, ano, mes, dia_do_mes, localidade, especialidade, tipo, chave, valor)*

em que:
- *id, ssn, nif, nome* e *data*: correspondem ao atributos homónimos da tabela **consulta**
- *ano*, *mes* e *dia_do_mes*: são derivados do atributo *data* da tabela **consulta**
- *localidade*: é derivado do atributo *morada* da tabela **clinica**
- *especialidade*: corresponde ao atributo homónimo da tabela **medico**
- *tipo*: toma os valores ‘observacao’ ou ‘receita’ consoante o preenchimento dos campos seguintes
- *chave*: corresponde ao atributo *parametro* da tabela **observacao** ou ao atributo *medicamento* da tabela **receita**
- *valor*: corresponde ao atributo *valor* da tabela **observacao** ou ao atributo *quantidade* da tabela **receita**


In [None]:
%%sql
CREATE MATERIALIZED VIEW historial_paciente AS
SELECT
    c.id,
    c.ssn,
    c.nif,  
    p.nome,  
    c.data,
    EXTRACT(YEAR FROM c.data) AS ano,
    EXTRACT(MONTH FROM c.data) AS mes,
    EXTRACT(DAY FROM c.data) AS dia_do_mes,
    SUBSTRING(cl.morada FROM '.* ([^ ]+)$') AS localidade,  
    m.especialidade,
    'observacao' AS tipo,
    o.parametro AS chave,
    o.valor AS valor
FROM
    consulta c
JOIN
    paciente p ON c.ssn = p.ssn
JOIN
    medico m ON c.nif = m.nif
JOIN
    clinica cl ON c.nome = cl.nome
LEFT JOIN
    observacao o ON c.id = o.id
UNION
SELECT  
    c.id,
    c.ssn,
    c.nif,  
    p.nome,  
    c.data,
    EXTRACT(YEAR FROM c.data) AS ano,
    EXTRACT(MONTH FROM c.data) AS mes,
    EXTRACT(DAY FROM c.data) AS dia_do_mes,
    SUBSTRING(cl.morada FROM '.* ([^ ]+)$') AS localidade, 
    m.especialidade,
    'receita' AS tipo,
    r.medicamento AS chave,
    r.quantidade AS valor
FROM
    consulta c
JOIN
    paciente p ON c.ssn = p.ssn
JOIN
    medico m ON c.nif = m.nif
JOIN
    clinica cl ON c.nome = cl.nome
LEFT JOIN 
    receita r ON c.codigo_sns = r.codigo_sns;

## 5. Análise de Dados (SQL e OLAP

Usando a vista desenvolvida no ponto anterior, complementada com outras tabelas da base de dados ‘Saude’ quando necessário, apresente a consulta SQL mais sucinta para cada um dos seguintes objetivos analíticos. Pode usar as instruções ROLLUP, CUBE, GROUPING SETS ou as cláusulas UNION of GROUP BY para os objetivos em que lhe parecer adequado.

1. Determinar que paciente(s) tiveram menos progresso no tratamento das suas doenças do foro ortopédico para atribuição de uma consulta gratuita. Considera-se que o indicador de falta de progresso é o intervalo temporal máximo entre duas observações do mesmo sintoma (i.e. registos de tipo ‘observacao’ com a mesma chave e com valor NULL) em consultas de ortopedia.

In [None]:
%%sql
SELECT 
    ssn,
    MAX(EXTRACT(DAY FROM AGE(data, data_anterior))) AS max_intervalo
FROM (
    SELECT 
        ssn, 
        data,
        LAG(data) OVER (PARTITION BY ssn, chave ORDER BY data) AS data_anterior
    FROM historial_paciente
    WHERE especialidade = 'ortopedia' 
      AND tipo = 'observacao' 
      AND valor IS NULL
) AS observacoes_ortopedia
WHERE data_anterior IS NOT NULL
GROUP BY ssn
ORDER BY max_intervalo DESC
LIMIT 1;

2. Determinar que medicamentos estão a ser usados para tratar doenças crónicas do foro cardiológico. Considera-se que qualificam quaisquer medicamentos receitados ao mesmo paciente (qualquer que ele seja) pelo menos uma vez por mês durante os últimos doze meses, em consultas de cardiologia.

In [None]:
%%sql
WITH mensal_receitas AS (
    SELECT 
        r.medicamento,
        r.codigo_sns,
        c.ssn,
        DATE_TRUNC('month', c.data) AS mes
    FROM receita r
    JOIN consulta c ON r.codigo_sns = c.codigo_sns
    JOIN medico m ON c.nif = m.nif 
    WHERE m.especialidade = 'cardiologia' 
      AND c.data >= DATE_TRUNC('month', CURRENT_DATE) - INTERVAL '12 months'
),
meses_consecutivos AS (
    SELECT 
        medicamento,
        ssn,
        COUNT(DISTINCT mes) AS meses_consecutivos
    FROM mensal_receitas
    GROUP BY medicamento, ssn
    HAVING COUNT(DISTINCT mes) = 12
)
SELECT DISTINCT medicamento
FROM meses_consecutivos;

3. Explorar as quantidades totais receitadas de cada medicamento em 2023, globalmente, e com drill down nas dimensões espaço (localidade > clinica), tempo (mes > dia_do_mes), e médico  (especialidade > nome \[do médico]), separadamente.

In [None]:
%%sql
SELECT
    hp.chave AS medicamento,
    hp.localidade,
    cl.nome AS clinica,
    hp.mes,
    hp.dia_do_mes,
    hp.especialidade,
    m.nome AS medico,
    SUM(hp.valor) AS total_quantidade
FROM
    historial_paciente hp
JOIN
    clinica cl ON hp.localidade = SUBSTRING(cl.morada FROM '.* ([^ ]+)$')
JOIN
    medico m ON hp.nif = m.nif
WHERE
    hp.tipo = 'receita' AND
    hp.ano = 2023
GROUP BY
    GROUPING SETS (
        (hp.chave),
        (hp.chave, hp.localidade),
        (hp.chave, hp.localidade, cl.nome),
        (hp.chave, hp.mes),
        (hp.chave, hp.mes, hp.dia_do_mes),
        (hp.chave, hp.especialidade),
        (hp.chave, hp.especialidade, m.nome)
    )
ORDER BY
    medicamento,
    localidade,
    clinica,
    mes,
    dia_do_mes,
    especialidade,
    medico;

4. Determinar se há enviesamento na medição de algum parâmetros entre clínicas, especialidades médicas ou médicos, sendo para isso necessário listar o valor médio e desvio padrão de todos os parâmetros de observações métricas (i.e. com valor não NULL) com drill down na dimensão médico (globalmente > especialidade > nome \[do médico]) e drill down adicional (sobre o anterior) por clínica.

In [None]:
%%sql
SELECT
    hp.chave AS parametro,
    hp.especialidade,
    m.nome AS medico,
    cl.nome AS clinica,
    AVG(hp.valor) AS valor_medio,
    STDDEV(hp.valor) AS desvio_padrao
FROM
    historial_paciente hp
JOIN
    medico m ON hp.nif = m.nif
JOIN
    clinica cl ON hp.localidade = SUBSTRING(cl.morada FROM '.* ([^ ]+)$')
WHERE
    hp.tipo = 'observacao' AND
    hp.valor IS NOT NULL
GROUP BY
    GROUPING SETS (
        (hp.chave),
        (hp.chave, hp.especialidade),
        (hp.chave, hp.especialidade, m.nome),
        (hp.chave, hp.especialidade, m.nome, cl.nome)
    )
ORDER BY
    parametro,
    especialidade,
    medico,
    clinica;

## 6. Índices

Apresente as instruções SQL para criação de índices para melhorar os tempos de cada uma das consultas listadas abaixo sobre a base de dados ‘Saude’. Justifique a sua escolha de tabela(s), atributo(s) e tipo(s) de índice, explicando que operações seriam otimizadas e como. Considere que não existam índices nas tabelas, além daqueles implícitos ao declarar chaves primárias e estrangeiras, e para efeitos deste exercício, suponha que o tamanho das tabelas excede a memória disponível em várias ordens de magnitude.

### 6.1
SELECT nome 
FROM paciente 
JOIN consulta USING (ssn) 
JOIN observacao USING (id) 
WHERE parametro = ‘pressão diastólica’ 
AND valor >= 9;

In [None]:
%%sql
DROP INDEX IF EXISTS idx_observacao_parametro;
DROP INDEX IF EXISTS idx_observacao_valor;
DROP INDEX IF EXISTS idx_consulta_ssn;
DROP INDEX IF EXISTS idx_paciente_ssn;
DROP INDEX IF EXISTS idx_consulta_id;
DROP INDEX IF EXISTS idx_observacao_id;
CREATE INDEX idx_observacao_parametro ON observacao(parametro);
CREATE INDEX idx_observacao_valor ON observacao(valor);
CREATE INDEX idx_consulta_ssn ON consulta(ssn);
CREATE INDEX idx_paciente_ssn ON paciente(ssn);
CREATE INDEX idx_consulta_id ON consulta(id);
CREATE INDEX idx_observacao_id ON observacao(id);

### Justificação

## 1) CREATE INDEX idx_observacao_parametro ON observacao(parametro);

#### TABELA

Escolhemos a tabela observacao pois é onde os registros de observações médicas são armazenados.

#### ATRIBUTO

Escolhemos a coluna parametro pois é usada para filtrar registros específicos, como pressão diastólica.

#### TIPO DE INDICE

Os índices B-tree são eficientes para buscas de igualdade, que é o caso para parametro = pressão diastólica. 

#### OTIMIZAÇÃO

A operação otimizada será a busca por igualdade em parametro.


## 2) CREATE INDEX idx_observacao_valor ON observacao(valor);

#### TABELA

Escolhemos a tabela observacao pois é onde os registros de observações médicas são armazenados.

#### ATRIBUTO

Escolhemos a coluna valor que vai ser usada para filtrar registos com valores maiores ou iguais a 9.
Um índice nesta coluna acelera a seleção dos registros que atendem a esta condição.

#### TIPO DE INDICE

Os índices B-tree são eficientes para buscas por intervalo, como valor >= 9.

#### OTIMIZAÇÃO

A operação otimizada será a comparação e filtragem por valor.

## 3) CREATE INDEX idx_consulta_ssn ON consulta(ssn);
## 4) CREATE INDEX idx_paciente_ssn ON paciente(ssn);

#### TABELA

Escolhemos as tabelas consulta e paciente devido ao facto de precisarem de ser unidas, usando a coluna ssn.

#### ATRIBUTO

A coluna ssn é usada para realizar joins entre consulta e paciente. Um índice nesta coluna otimiza essas operações de junção.

#### TIPO DE INDICE 

Os índices B-tree são eficientes para junções baseadas em igualdade de valores.

#### OTIMIZAÇÃO

Permite que o banco de dados encontre rapidamente os registos correspondentes em ambas as tabelas.

## 5) CREATE INDEX idx_consulta_id ON consulta(id);
## 6) CREATE INDEX idx_observacao_id ON observacao(id);

#### TABELA

Escolhemos as tabelas consulta e observacao devido ao facto de precisarem de ser unidas, usando a coluna id.

#### ATRIBUTO

A coluna id é usada para realizar joins entre consulta e observacao. Um índice nesta coluna otimiza essas operações de junção.

#### TIPO DE INDICE 

Os índices B-tree são eficientes para junções baseadas em igualdade de valores.

#### OTIMIZAÇÃO

Permite que o banco de dados encontre rapidamente os registros correspondentes em ambas as tabelas.

### 6.2
SELECT especialidade, SUM(quantidade) AS qtd
FROM medico 
JOIN consulta USING (nif)
JOIN receita USING (codigo_sns) 
WHERE data BETWEEN ‘2023-01-01’ AND ‘2023-12-31’ 
GROUP BY especialidade
ORDER BY qtd;

In [None]:
%%sql
DROP INDEX IF EXISTS idx_medico_nif;
DROP INDEX IF EXISTS idx_consulta_nif;
DROP INDEX IF EXISTS idx_consulta_codigo_sns;
DROP INDEX IF EXISTS idx_receita_codigo_sns;
DROP INDEX IF EXISTS idx_consulta_data;
CREATE INDEX idx_medico_nif ON medico(nif);
CREATE INDEX idx_consulta_nif ON consulta(nif);
CREATE INDEX idx_consulta_codigo_sns ON consulta(codigo_sns);
CREATE INDEX idx_receita_codigo_sns ON receita(codigo_sns);
CREATE INDEX idx_consulta_data ON consulta(data);

### Justificação

## 1) CREATE INDEX idx_medico_nif ON medico(nif);
## 2) CREATE INDEX idx_consulta_nif ON consulta(nif);

#### TABELA

Escolhemos as tabelas consulta e medico pois precisam de ser unidas usando a coluna nif.

#### ATRIBUTO

A coluna nif é usada para realizar joins entre consulta e medico. Um índice nesta coluna otimiza essas operações de junção.

#### TIPO DE INDICE

Os índices B-tree são eficientes para junções baseadas em igualdade de valores.

#### OTIMIZAÇÃO

Permite que o banco de dados encontre rapidamente os registros correspondentes em ambas as tabelas.

## 3) CREATE INDEX idx_consulta_codigo_sns ON consulta(codigo_sns);
## 4) CREATE INDEX idx_receita_codigo_sns ON receita(codigo_sns);

#### TABELA

Escolhemos as tabelas consulta e receita pois precisam de ser unidas usando a coluna codigo_sns.

#### ATRIBUTO

A coluna codigo_sns é usada para realizar joins entre consulta e receita. Um índice nesta coluna otimiza essas operações de junção.

#### TIPO DE INDICE 

Os índices B-tree são eficientes para junções baseadas em igualdade de valores.

#### OTIMIZAÇÃO

Permite que o banco de dados encontre rapidamente os registros correspondentes em ambas as tabelas.

## 5) CREATE INDEX idx_consulta_data ON consulta(data);

#### TABELA

A tabela consulta é onde os registros de consultas são armazenados. Filtrar por data é crucial para esta consulta.

#### ATRIBUTO

A coluna data é usada na condição de filtro para selecionar registros entre duas datas. 

#### TIPO DE INDICE 

Os índices B-tree são eficientes para buscas por intervalo, como data BETWEEN '2023-01-01' AND '2023-12-31'.

#### OTIMIZAÇÃO

Na operação filtragem de registros por intervalo de datas.