# NOSQL - Trabalho prátrico

Autores: Amindo Machado (pg52170), Duarte Velho (pg53481), Mariana Oliveira (pg52648), Ricardo Oliveira (pg53501) e Rodrigo Esperança (pg50923)

<p align="justify">
Este trabalho foi desenvolvido no âmbito da UC Bases de Dados NoSQL (2023/24), do Mestrado em Bioinformática da Escola de Engenharia da Universidade do Minho, e tem como objetivo explorar diferentes paradigmas de base de dados, tendo como referências dois tipos de modelos, um modelo relacional e um modelo não relacional. 
</p>

<p align="justify">
As bases de dados SQL são utilizadas para organizar e gerenciar grandes volumes de dados, utilizando a linguagem SQL para interagir com os dados, permitindo consultas, manipulações e análises complexas. Embora estas bases de dados possuam várias vantagens tais como padronização, maturidade, escalabilidade, flexibilidade e segurança também apresentam algumas desvantagens e problemas que podem levar a que não seja o tipo de base de dados ideal para algumas aplicações devido: à sua complexidade, à necessidade de manutenção regular e a elevados custos de implementação juntamente com
 as limitações em termos de escabilidade horizontal. Tendo em conta os problemas enfrentados aquando da utilização de bases de dados SQL e devido às demandas das aplicações modernas que lidam com dados não estruturados ou semiestruturados, surgiu uma nova categoria denominada de bases de dados **NoSQL** (Not Only SQL). Estas novas bases de dados não se baseiam no modelo relacional tradicional utilizado nas bases de dados SQL, onde a rigidez e a complexidade do modelo relacional podem ser um obstaculo à sua utilização em aplicações modernas.
</p>

De entre as várias características associadas às bases de dados NOSQL destacam-se a seguintes:

- **Flexibilidade do esquema**: Permite o armazenamento dos dados sem necessidade de um esquema predefinido, adptando-se às necessidades da aplicação;

- **Escabilidade Horizontal**: Possibilita a distribuição de dados em vários servidores, facilitando o aumento da capacidade conforme o crescimento da demanda. Além disso, a distribuição dos dados em vários servidores garante a disponibilidade do sistema mesmo em caso de falhas;

- **Alto desempenho**: Estas bases de dados estão otimizadas para grandes volumes de dados e consultas complexas;

- **Diversos modelos**: Suportam diversos modelos de dados;

- **Agilidade de desenvolvimento**: Possibilitam um desenvolvimento mais rápido e ágil de aplicações devido à flexibilidade dos modelos de dados;

- **Escabilidade superior**: Suportam o crescimento exponencial dos dados sem existir comprometimento do desempenho;

- **Baixo custo** : Geralmente possuem custos de infraestrutura e licenciamento mais baixo do que as bases de dados SQL.


Embora as bases de dados NOSQL tenham surgido para culmatar alguns dos problemas inerentes à utilização de bases SQL existem ainda alguns desafios face à sua utilização que podem difultar a sua implementação em alguns cenários:

- **Falta de padronização**: A ausência de um padrão universal pode dificultar a interoperabilildade entre diferentes bases de dados NOSQL;

- **Consistência dos dados**: A consistência dos dados distribuídos em vários servidores é um desafio;

- **Maturidade relativa**: Como estas bases de dados ainda se encontram em desenvolvimento, existe menor disponibilidade de soluções maduras em comparação com as bases de dados SQL;

- **Curva de aprendizagem**: Necessidade de conhecimento específico para modelar, gerenciar e consultar dados.


Esta nova categoria de bases de dados é utilizada a nível das redes sociais, comércio eletrónico, aplicações móveis e análise de big data.


Tal como referido anteriormente, uma das características específicas deste tipo de base de dados e que lhe confere várias vantagens é a grande diversidade de modelos disponívies existindo, atualmente quatro grandes modelos:

- **Chave-Valor**: Este modelo armazena os dados em pares chave-valor, sendo caracterizados por serem simples e eficientes para consultas rápidas por chave, sendo por isso o modelo ideal para catálogos de produtos e sistemas de votação por exemplo (Redis);

- **Documental**: Estes modelos organizam os dados em documentos JSON, que são caracterizados como flexíveis e perfeitos para o armazenamento de informações semi-estruturadas tal como perfis de usários ou registros de atividade (MongoDB);

- **Grafos**: Neste tipo de modelos os dados são representados como entidades interligadas por relacionamentos sendo ideias para redes sociais ou análises de fraudes (Neo4j);

- **Coluna**: Armazenamento dos dados em colunas sendo um modelo que é otimizado para a análise de grandes volumes de dados com alta performance.


# Librarias e packages necessários

Nesta secção são destacados todos os packages utilizados no trabalho, que facilitam a aquisição e análise de dados ao longo do documento, tornando mais eficiente a obtenção e compreensão das informações relevantes.

In [2]:
import oracledb
import getpass
import cx_Oracle
import pymongo
from pymongo import MongoClient
import mysql.connector
from py2neo import Graph, Node, Relationship
from neo4j import GraphDatabase
from datetime import datetime, timedelta

# Introdução

O modelo relacional, organiza dados em tabelas bidimensionais chamadas "relações", onde cada linha é um registro e cada coluna é um atributo. Cada tabela tem um nome único, e as principais características incluem: chaves primárias, chaves estrangeiras e atributos. Este modelo é amplamento utilizado devido as regras de normalização utilizadas para a criação do modelo relacional na qual se verificar uma redução da redundância e aumento da organização dos dados. Além disso, é um modelo que garante a consistência e integridade dos dados através da utilização de chaves primárias e estrangeiras que são essências para a manutenção da integridade da base de dados. No entanto, este modelo apresenta diminuição da eficiência de consultas complexas para grandes volumes de dados e escabilidade limitada necissitandi de ajustes para suportar grande escalas de dados

O Oracle é um dos principais sistemas utilizados para a gestão de bases de dados relacionais que implementa e estende o modelo relacional com várias funcionalidades avançadas, integrando a linguagem SQL, linguagem utilizada para definição, manipulação e consulta dos dados, juntamente com a linguagem PL/SQL utilizada para a criação de procedimentos, triggers e funções.

A base de dados relacional utilizada como base deste trabalho prático representa um ambiente hospitalar e é constituída por 17 tabela ou entidade:

- Hospital Patient: Contém informações sobre pacientes, incluindo ID, nome, tipo sanguíneo, email, gênero, data de nascimento, entre outros. Relacionado a histórico médico, seguros, episódios, contatos de emergência.

- Hospital Medical History: Registra históricos médicos dos pacientes com detalhes como ID do registro, condição, data, etc. Referencia pacientes por meio de chaves estrangeiras.

- Hospital Insurance: Gerencia informações sobre seguros, incluindo número da apólice, provedor, cobertura, etc. Conectado a pacientes por meio do número da apólice.

- Hospital Emergency Contact: Contém detalhes dos contatos de emergência dos pacientes, incluindo nome, telefone e relação. Relacionado aos pacientes via chave estrangeira.

- Hospital Episode: Registra episódios de tratamento dos pacientes, incluindo ID, data de admissão e alta. Conectado a pacientes e internações.

- Hospital Appointment: Detalha agendamentos de consultas, incluindo data, hora, tipo de consulta, e IDs de médicos e episódios. Relacionado a episódios e médicos.

- Hospital Bill: Gerencia informações de faturas hospitalares, incluindo ID, custos de sala, testes, total, status da conta, etc. Relacionado a episódios e pacientes.

- Hospital Lab Screening: Registra exames de laboratório, incluindo ID do exame, tipo de teste, data e técnico responsável. Conectado a episódios e técnicos.

- Hospital Staff: Contém informações sobre funcionários, incluindo ID, nome, data de entrada e saída, email, endereço, status, etc. Relacionado a departamentos.

- Hospital Department: Gerencia informações dos departamentos hospitalares, incluindo ID, nome, chefe do departamento e número de funcionários. Relacionado a funcionários.

- Hospital Doctor: Registra detalhes dos médicos, incluindo ID e qualificações. Conectado a funcionários.

- Hospital Nurse: Contém informações sobre enfermeiros, incluindo ID e número do funcionário. Relacionado a funcionários.

- Hospital Technician: Gerencia informações dos técnicos, incluindo ID e qualificações. Relacionado a funcionários e exames laboratoriais.

- Hospital Room: Detalha as salas do hospital, incluindo ID da sala, tipo e número da sala. Relacionado a internações.

- Hospital Hospitalization: Registra detalhes das internações, incluindo data de admissão e alta, sala e enfermeiro responsável. Relacionado a episódios, salas e enfermeiros.

- Hospital Medicine: Contém informações sobre medicamentos, incluindo ID, nome, quantidade e custo. Relacionado a prescrições.

- Hospital Prescription: Detalha prescrições médicas, incluindo ID, data, dosagem e ID do medicamento. Relacionado a episódios e medicamentos.


![Modelo lógico da base de dados hospital](hospitalER.png)
<figcaption>Figura 1- Modelo lógico da base de dados hospital</figcaption>

# Objetivo

<p align="justify">
O objetivo principal deste trabalho passou por explorar diferentes paradigmas de base de dados, tendo como referências dois tipos de modelos, um modelo relacional e um modelo não relacional. Em particular, o modelo não relacional será o mais explorado, sendo que, com auxílio de código (maioritariamente em python) procedeu-se, através de uma estratégia definida e explicada posteriormente, à "conversão" do modelo relacional, já dado em modelos não relacionais, explorando as bases de dados MongoDB e Neo4j e seus respetivos paradigmas. 
</p>

 # MongoDB

<p align="justify">
O MongoDB é uma das bases de dados NoSQL orientada a documentos não relacional, para armazenamento de dados em documentos do tipo JSON possibilitando uma estrutura de dados flexível e de facil integração. De entre as várias bases de dados NoSQL o MongoDB destaca-se por ser uma das escolhas mais comuns para o armazenamento de dados não estruturados sendo uma escolha popular para o armazenamento de dados não estruturados devido à facilidade com se consegue realizar escalamento horizontal, ao seu elevado desempenho e linguagem de consulta rica que permite a recuperação e manipulação complexa dos dados, sendo que, além disso, é uma base de dados que se integra perfeitamente com plataformas em nuvem.
</p>

Para navegar neste universo de dados é necessário a compreensão de conceitos básicos que definem a organização e o funcionamento do MongoDB:

- Coleções: Cada banco de dados no MongoDB pode conter diversas coleções (análogos das tabelas nas bases de dados relacional) sendo utilizadas para facilitar a organização e acesso dos dados;

- Documentos: Cada documento no MongoDB é uma estrutura de dados no formato JSON que contem pares chave-valor, onde a chave identifica o atributo enquanto o valor representa o dado associado a esse atributo. No entanto, o valor pode ser também um par chave-valor o que permite a criação de documentos dentro de documentos que são denominados por documentos aninhados.

## Criação das Coleções

<p align="justify">
De modo a realizar a transformação da base de dados do hospital (relacional) para o MongoDB, procedeu-se ao estabelecimento de uma conexão com uma base de dados MongoDB e criou-se coleções específicas utilizando a biblioteca pymongo em Python. A biblioteca pymongo fornece ferramentas para interagir com bases de dados MongoDB, facilitando a manipulação de dados e a gestão de coleções.
</p>
<p align="justify">
A ligação ao servidor MongoDB foi estabelecida no endereço localhost na parta 27017. Após a conexção com o servidor realizou-se a conexção com a base de dados denominada "Hospital" que vai armazenar as várias coleções e documentos criados. Para esta base de dados foram criadas quatro coleções: Patients (pacientes), Services (serviços), Appointments (consultas) e Staff (funcionários).
</p>

In [None]:
# ligação ao servidor mongo
client = MongoClient("localhost", 27017)


# Conexão à base de dados hospital, caso não exista é criada
db = client.Hospital


# Criação das várias coleções vazias
Patients = db.create_collection("Patients")
Services = db.create_collection("Services")
Appointments = db.create_collection("Appointments")
Staff = db.create_collection("Staff")

###  Povoamento da coleções
#### Coleção **Pacientes**

<p align="justify">
A coleção pacientes foi criada com o intuito de facilitar o acesso a toda a informação relativa ao paciente permitindo o acesso aos dados acerca da seguradora, o histórico médico, entre outras informações associadas ao paciente de modo a reduzir a complexidade das consultas e aumentar a eficência do acesso aos dados.
</p>
<p align="justify">
Para criar esta coleção a partir da base de dados relacional é necessário realizar uma query que permita a extração da informação relativa a cada paciente que se encontra dispersa por várias entidades que estão centradas no paciente e que normalmente tendem a ser acessadas juntas.
</p>

Entidades envolvidas: 
* HOSPITAL_PATIENT
* HOSPITAL_INSURANCE
* HOSPITAL_MEDICAL_HISTORY
* HOSPITAL_EMERGENCY_CONTACT

<p align="justify">
Para se realizar a criação da coleção Patients (Pacientes), primeiramente é necessário proceder à extração dos dados das várias entidades. Com esse objetivo, definiu-se a função extract_data_from_oracle_patients, que começa por realizar a conecção à base de dados relacional e posteriormente são realizadas quatro consultas independentes para extrair a informação das entidades envolvidas. A primeira consulta, extrai a informação da entidade HOSPITAL_PATIENT que contém os dados demográficos do paciente, que inclui, o id do paciente, nome, tipo sanguíneo, telefone, entre outros. A segunda consulta retira a informação contida na entidade HOSPITAL_INSURANCE que é utilizada para amazenar os dados referentes à apolice e ao seguro do paciente. A terceira consulta coleta o historial médico associado ao pacinete que se encontra armazenado na tabela HOSPITAL_MEDICAL_HISTORY. A quarta e última consulta é utilizada para recolher os contactos de emergência associados a cada paciente (HOSPITAL_EMERGENCY_CONTACT).
Os resultados de cada consulta realizada são então armazenados e posteriomente tratados e inseridos na coleção Patients através da utilização da função insert_data_to_mongodb_patients.
Esta função recebe os dados extraídos de cada tabela e cria um documento para cada paciente que posteriomente é inserido na coleção.
</p>

In [None]:
def extract_data_from_oracle_patients():
    # Conecção à base de dados relacional e criação de cursor
    password = getpass.getpass(prompt="Enter Oracle password: ")
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para a extração dos dados da entidade HOSPITAL_PATIENT
    sql_patient = """
        SELECT 
            idpatient,     
            patient_fname, 
            patient_lname, 
            blood_type, 
            phone,         
            email,         
            gender,        
            policy_number, 
            BIRTHDAY
        FROM
            patient
    """
    
    # Armazenamento dos dados
    cursor.execute(sql_patient)
    patients = cursor.fetchall()

    # Consulta SQL para extração dos dados de HOSPITAL_INSURANCE
    sql_insurance = """
        SELECT 
            policy_number,  
            provider,       
            insurance_plan, 
            co_pay,         
            coverage,       
            maternity,      
            dental,         
            optical     
        FROM 
            insurance
    """

    # Armazenamento dos dados
    cursor.execute(sql_insurance)
    insurances = cursor.fetchall()
    
    # Consulta SQL para extração dos dados de HOSPITAL_MEDICAL_HISTORY
    sql_medical_history = """
        SELECT 
            record_id,   
            record_date, 
            idpatient   
        FROM 
            medical_history
    """

    # Armazenamento dos dados
    cursor.execute(sql_medical_history)
    medical_histories = cursor.fetchall()

    # Consulta SQL para extração dos dados de HOSPITAL_EMERGENCY_CONTACT
    sql_emergency_contact = """
        SELECT 
            contact_name, 
            phone,        
            relation,    
            idpatient  
        FROM 
            emergency_contact
    """
    
    # Armazenamento dos dados
    cursor.execute(sql_emergency_contact)
    emergency_contacts = cursor.fetchall()

    # Encerramento da conexão
    cursor.close(); connection.close()

    # Inserção dos dados na coleção MongoDB
    insert_data_to_mongodb_patients(patients, insurances, medical_histories, emergency_contacts)


def insert_data_to_mongodb_patients(patients, insurances, medical_histories, emergency_contacts):
    # Conecção à coleção no MongoDB
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    collection = db['Patients']

    # Converter insurances em um dicionário para acesso rápido
    insurance_dict = {insurance[0]: insurance for insurance in insurances}

    # Converter medical_histories e emergency_contacts em dicionários para acesso rápido
    medical_history_dict = {}
    for history in medical_histories:
        if history[2] not in medical_history_dict:
            medical_history_dict[history[2]] = []
        medical_history_dict[history[2]].append(history)
    
    emergency_contact_dict = {}
    for contact in emergency_contacts:
        if contact[3] not in emergency_contact_dict:
            emergency_contact_dict[contact[3]] = []
        emergency_contact_dict[contact[3]].append(contact)

    # Formatar os dados e inserir na coleção MongoDB
    for patient in patients:
        patient_id = patient[0]
        policy_number = patient[7]

        # Informações de seguro
        insurance_data = insurance_dict.get(policy_number, [None]*8)
        
        # Informações de histórico médico
        medical_history_data = medical_history_dict.get(patient_id, [])
        
        # Informações de contato de emergência
        emergency_contact_data = emergency_contact_dict.get(patient_id, [])

        patient_data = {
            "idpatient": patient_id, "patient_fname": patient[1], "patient_lname": patient[2],
            "blood_type": patient[3], "phone": patient[4], "email": patient[5],
            "gender": patient[6], "policy_number": policy_number, "BIRTHDAY": patient[8],
            "insurance": {
                "provider": insurance_data[1], "insurance_plan": insurance_data[2],
                "co_pay": insurance_data[3], "coverage": insurance_data[4], "maternity": insurance_data[5],
                "dental": insurance_data[6], "optical": insurance_data[7]
                },
            "medical_history": [{
                "record_id": history[0], "record_date": history[1]
            } for history in medical_history_data],
            "emergency_contacts": [{
                "contact_name": contact[0], "phone": contact[1], "relation": contact[2]
            } for contact in emergency_contact_data]
        }
        collection.insert_one(patient_data)

    # Encerramento da conexão
    client.close()


In [None]:
# Extração dos dados do Oracle e inserção no MongoDB
extract_data_from_oracle_patients()

#### Coleção **Consulta**

<p align="justify">
A segunda coleção criada corresponde às concultas (Appointments) e foram mantidos numa coleção separada, uma vez que constituem um ponto de interação frequente e independente com o sistema, onde o acesso rápido e a atualização dos dados é crítico.
</p>

Entidades Incluídas: 
* HOSPITAL_APPOINTMENT

<p align="justify">
O código desenvolvido para a criação desta coleção possui duas etapas principais. A primeira etapa corresponde à extração dos dados da tabela "Appointments", para isso criou-se a função extract_data_from_oracle_app que vai realizar a conecção com a base de dados relacional. Em seguida é realizada uma consulta que permite recuperar os dados armazenados na entidade incluída. A informação contida nesta tabela permite saber a data de agendamento da consulta (scheduled_on), a data da consulta (appointment_date) e a que horas será realizada (appointment_time), além disso, também permite saber quem é o médico responsável pela consulta (iddoctor) e o id do episódio clínico associado (idepisode). Posteriormente, o resultado da consulta é transformado em vários documentos do tipo JSON (cada documento corresponde a uma consulta) que são inseridos na coleção.
</p>

In [28]:
def extract_data_from_oracle_app():

    # Conecção à base de dados Oracle e criação do cursor
    password = getpass.getpass(prompt="Enter Oracle password: ")
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de HOSPITAL_APPOINTMENT
    sql_appointment = """
        SELECT 
            scheduled_on,
            appointment_date,
            appointment_time,
            iddoctor,
            idepisode
        FROM 
            APPOINTMENT
    """

    cursor.execute(sql_appointment)
    appointments = cursor.fetchall()

    # Encerramento da conexão
    cursor.close(); connection.close()

    # Inserção dos dados na coleção
    insert_data_to_mongodb_app(appointments)


def insert_data_to_mongodb_app(appointments):
    
    # Conecção à base de dados Hospital e a coleção Appointments no MongoDB
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    collection = db['Appointments']

    # Formatação e inserção do documento na coleção
    for appointment in appointments:
        appointment_data = {
            "scheduled_on": appointment[0],
            "appointment_date": appointment[1],
            "appointment_time": appointment[2],
            "iddoctor": appointment[3],
            "idepisode": appointment[4],
        }
        collection.insert_one(appointment_data)

    # Encerramento da conexão
    client.close()

In [29]:
# Extração e inserção dos dados na coleção
extract_data_from_oracle_app()

#### Coleção **Serviços**

<p align="justify">
Com o intuito de facilitar o rastreamento do atendimento de um determinado paciente e da faturação criou-se a coleção "Services", uma vez que um episódio de atendimento a um paciente normalmente envolve a alocação de um quarto, exames laboratorias e despesas hospitalares que necessitam de ser geridas de forma eficiente e ponderada de modo a garantir o perfeito funcionamento do hospital e o bom atendimento dos pacientes evitando constrangimentos no serviço ou possíveis cenários de negligência.
</p>

Entidades Incluídas: 
* HOSPITAL_EPISODE
* HOSPITAL_ROOM
* HOSPITAL_BILL 
* HOSPITAL_LAB_SCREENING

<p align="justify">
Tal como para as coleções anteriores, foram definidas duas funções de modo a auxiliar a passagem dos dados da base de dados relacional para o MongoDB. A função **extract_data_from_oracle_services** é utilizada para realizar a extração dos dados e posteriomente chama a segunda função que é responsável pelo tratamento e inserção dos dados na coleção realizando assim a migração para o MongoDB. A função de extração realiza 4 consultas SQL separadas para recuperar os dados de tabelas relacionadas. A primeria consulta coleta as informações básicas de um determinado atendimento tal como o id do espisódio e o id do paciente da tabela HOSPITAL_EPISODE. A segunda consulta é realizada com o objetivo de extrair a informação relativa ao quarto utilizado (HOSPITAL_ROOM). De modo a coletar a informação relativa à faturação de um determinado espisódio, realizou-se uma terceira consulta que incide sobre a entidade HOSPITAL_BILL, uma vez que nesta tabela são armazenados todos os dados referentes a uma determinada fatura incluindo o estado, isto é, se a fatura foi líquidada ou se o hospital ainda agurada o pagamento. Por fim, a última consulta realizada, vai recolher as informações relativas aos exames laboratoriais que inclui, o custo, a data do exame e o id do técnico. Os resultados das consultas foram armazenados e posteriomente utilizados na segunda função que realiza a criação dos vários documentos tipo JSON que posteriomente são inseridos na coleção "Services". É importante ressalvar que antes de se realizar a inserção de um novo documento, realiza-se a limpeza da coleção de modo a evitar a existência de duplicados.
</p>

In [None]:
def extract_data_from_oracle_services():
    # Conexão à bases de dados Oracle
    password = getpass.getpass(prompt="Enter Oracle password: ")
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extração dos dados de HOSPITAL_EPISODE
    sql_episode = """
        SELECT 
            idepisode,
            patient_idpatient
        FROM 
            episode
    """

    # Armazenamento da consulta
    cursor.execute(sql_episode)
    episodes = cursor.fetchall()

    # Consulta SQL para extração dos dados de HOSPITAL_ROOM
    sql_room = """
        SELECT 
            r.idroom,
            r.room_type,
            r.room_cost,
            h.idepisode
        FROM 
            room r
        INNER JOIN hospitalization h ON r.idroom = h.room_idroom
    """
    
    # Armazenamento da consulta
    cursor.execute(sql_room)
    rooms = cursor.fetchall()

    # Consulta SQL para extração dos dados de HOSPITAL_BILL
    sql_bill = """
        SELECT 
            b.idbill,
            b.room_cost,
            b.test_cost,
            b.other_charges,
            b.total,
            b.idepisode,
            b.registered_at,
            b.payment_status
        FROM 
            bill b
        INNER JOIN hospitalization h ON b.idepisode = h.idepisode
    """
    
    # Armazenamento da consulta
    cursor.execute(sql_bill)
    bills = cursor.fetchall()

    # Consulta SQL para extração dos dados de HOSPITAL_LAB_SCREENING
    sql_lab_screening = """
        SELECT 
            ls.lab_id,
            ls.test_cost,
            ls.test_date,
            ls.idtechnician,
            h.idepisode
        FROM 
            lab_screening ls
        INNER JOIN hospitalization h ON ls.episode_idepisode = h.idepisode
    """

    # Armazenamento da consulta
    cursor.execute(sql_lab_screening)
    lab_screenings = cursor.fetchall()

    # Encerramento da conexão
    cursor.close(); connection.close()

    # Inserção dos dados na coleção
    insert_data_to_mongodb_services(episodes, rooms, bills, lab_screenings)


def insert_data_to_mongodb_services(episodes, rooms, bills, lab_screenings):
    # Conexão à base de dados e à respetiva coleção
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    collection = db['Services']

    # Remoção de duplicados
    collection.delete_many({})

    # Inserção dos dados na coleção
    for episode in episodes:
        episode_data = {
            "idepisode": episode[0], "patient_idpatient": episode[1],
            "room": [], "bill": [], "lab_screening": []
        }
        for room in rooms:
            if room[3] == episode[0]:
                episode_data["room"].append(
                    {"idroom": room[0], "room_type": room[1],"room_cost": room[2]}
                    )
        for bill in bills:
            if bill[5] == episode[0]:
                episode_data["bill"].append(
                    {"idbill": bill[0], "room_cost": bill[1], "test_cost": bill[2],
                    "other_charges": bill[3], "total": bill[4], "registered_at": bill[6],
                    "payment_status": bill[7]}
                    )
                
        for lab_screening in lab_screenings:
            if lab_screening[4] == episode[0]:
                episode_data["lab_screening"].append(
                    {"lab_id": lab_screening[0], "test_cost": lab_screening[1],
                    "test_date": lab_screening[2], "idtechnician": lab_screening[3]}
                    )
                
        collection.insert_one(episode_data)

    # Encerramento da conexão
    client.close()


In [None]:
# Extração e inserção dos dados na respetiva coleção
extract_data_from_oracle_services()

#### Coleção **Staff**

<p align="justify">
Para promover uma gestão eficiente e integrada dos profissionais de saúde dentro do ambiente hospitalar, foi criada a coleção "Staff" na base de dados da MongoDB. Esta coleção facilita a organização e o acesso a informação detalhadas de cada funcionário, essenciais para operações diárias, planeamento de recursos humanos e resposta rápida a necessidades operacionais e clínicas. A coleção engloba dados de médicos, enfermeiros e técnicos, consolidando informações que são críticas para o bom funcionamento do hospital e para manter um alto padrão de atendimento ao paciente.
</p>

Entidades Incluídas:
* HOSPITAL_DOCTOR
* HOSPITAL_NURSE
* HOSPITAL_TECHNICIAN

<p align="justify">
As funções extract_data_from_oracle e insert_data_to_mongodb foram desenvolvidas para auxiliar a migração dos dados do sistema de base de dados relacional Oracle para o MongoDB. A função extract_data_from_oracle, começa com queries para coletar dados de cada entidade relevante. Para os médicos, enfermeiros e técnicos, são extraídos detalhes como identificação, nome, datas de início e término de vínculo, e-mail, endereço, e outras informações profissionais. Para além disso, também são coletados dados sobre a participação desses profissionais em episódios de tratamento, internações, consultas e exames. Estas informações são fundamentais para entender a carga de trabalho e as responsabilidades específicas de cada membro da equipa. Após a extração, os dados são tratados e formatados adequadamente antes de serem inseridos na coleção "Staff" no MongoDB, onde cada documento representa um funcionário, com campos que refletem as suas qualificações, experiência e papel dentro do hospital.
</p>

In [None]:
def extract_data_from_oracle():
    # Conexão ao Oracle
    password = getpass.getpass(prompt="Enter Oracle password: ")
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extração dos dados de STAFF
    sql_staff = """
        SELECT 
            EMP_ID,
            EMP_FNAME,
            EMP_LNAME,
            DATE_JOINING,
            DATE_SEPERATION,
            EMAIL,
            ADDRESS,
            SSN,
            IDDEPARTMENT,
            IS_ACTIVE_STATUS
        FROM 
            STAFF
    """
    cursor.execute(sql_staff)
    staff = cursor.fetchall()

    # Consulta SQL para extração dos dados de NURSE
    sql_nurse = "SELECT STAFF_EMP_ID FROM NURSE"; cursor.execute(sql_nurse)
    nurses = cursor.fetchall()

    # Consulta SQL para extração dos dados de DOCTOR
    sql_doctor = "SELECT EMP_ID FROM DOCTOR"; cursor.execute(sql_doctor)
    doctors = cursor.fetchall()

    # Consulta SQL para extração dos dados de TECHNICIAN
    sql_technician = "SELECT STAFF_EMP_ID FROM TECHNICIAN"; cursor.execute(sql_technician)
    technicians = cursor.fetchall()

    # Consulta SQL para extração dos dados de HOSPITALIZATION
    sql_hospitalization = "SELECT RESPONSIBLE_NURSE, IDEPISODE FROM HOSPITALIZATION"; cursor.execute(sql_hospitalization)
    hospitalizations = cursor.fetchall()

    # Consulta SQL para extração dos dados de APPOINTMENT
    sql_appointment = "SELECT IDDOCTOR, IDEPISODE FROM APPOINTMENT"; cursor.execute(sql_appointment)
    appointments = cursor.fetchall()

    # Consulta SQL para extração dos dados de LAB_SCREENING
    sql_lab_screening = "SELECT IDTECHNICIAN, EPISODE_IDEPISODE FROM LAB_SCREENING"; cursor.execute(sql_lab_screening)
    lab_screenings = cursor.fetchall()

    # Encerramento da conexão
    cursor.close(); connection.close()

    # Inserção dos dados
    insert_data_to_mongodb(staff, nurses, doctors, technicians, hospitalizations, appointments, lab_screenings)


def insert_data_to_mongodb(staffs, nurses, doctors, technicians, hospitalizations, appointments, lab_screenings):
    # Conexão à bases de dados e respetiva coleção
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    collection = db['Staff']

    # Conversão de listas em conjuntos para pesquisa mais rápida
    nurse_set = {nurse[0] for nurse in nurses}
    doctor_set = {doctor[0] for doctor in doctors}
    technician_set = {technician[0] for technician in technicians}

    # Criação de dicionários para pesquisa de episódios
    nurse_episodes = {}
    for hosp in hospitalizations:
        if hosp[0] in nurse_episodes: nurse_episodes[hosp[0]].append(hosp[1])
        else: nurse_episodes[hosp[0]] = [hosp[1]]
    
    doctor_episodes = {}
    for appt in appointments:
        if appt[0] in doctor_episodes: doctor_episodes[appt[0]].append(appt[1])
        else: doctor_episodes[appt[0]] = [appt[1]]
    
    technician_episodes = {}
    for lab in lab_screenings:
        if lab[0] in technician_episodes: technician_episodes[lab[0]].append(lab[1])
        else: technician_episodes[lab[0]] = [lab[1]]

    # Formatação dos dados e inserção na coleção
    for staff in staffs:
        emp_id = staff[0]
        type_ = "none"
        idepisodes = []

        if emp_id in nurse_set:
            type_ = "nurse"
            idepisodes = nurse_episodes.get(emp_id, [])
        elif emp_id in doctor_set:
            type_ = "doctor"
            idepisodes = doctor_episodes.get(emp_id, [])
        elif emp_id in technician_set:
            type_ = "technician"
            idepisodes = technician_episodes.get(emp_id, [])

        staff_data = {
            "_id": emp_id, "firstName": staff[1], "lastName": staff[2],
            "joiningDate": staff[3], "separationDate": staff[4], "email": staff[5],
            "address": staff[6], "ssn": staff[7], "departmentId": staff[8],
            "isActiveStatus": staff[9], "type": type_, "idepisodes": idepisodes
        }
        collection.insert_one(staff_data)

    # Encerramento da conexão
    client.close()

In [None]:
# Extração e inserção dos dados na coleção staff
extract_data_from_oracle()

## Indexação MongoDB

<p align="justify">
A indexação no MongoDB é uma técnica fundamental para aumentar de forma considerável a eficiência das consultas. Sem a presença de índices, o MongoDB necessita de percorrer todos os documentos de uma determinada coleção de modo a identificar todos aqueles que correspondem aos critérios da consulta, resultando numa operação altamente ineficiente e que demanda o processamento de um grande volume de dados.
</p>
<p align="justify">
Os índices são estruturas de dados especiais que armazenam uma pequena porção dos conjuntos de dados, facilitando o processamento das consultas. Os dados armazenados correspondem a valores de campos específicos ou de conjuntos de campos, ordenados conforme especificado no índice, que permitem a localização rapida dos documentos correspondentes sem proceder à verificação indivual de cada documento, melhorando significativamente a performance das operações de leitura.
</p>
<p align="justify">
O código apresentado em baixo, demonstra como é que se realiza a criação de índices com o intuito de otimizar as consultas nessas coleções específicas, essenciais para a gestão eficiente em contexto hospitalar. 
</p>
<p align="justify">
Para isso selecionou-se as quatro coleções existentes na nossa base de dados: 'Patients', 'Appointments', 'Services' e 'Staff'. Cada coleção armazena dados diferentes e relevantes para a operação do hospital. Por exemplo, 'Patients' contém informações sobre os pacientes, 'Appointments' guarda dados sobre as consultas agendadas, 'Services' registra informações sobre os serviços médicos prestados e 'Staff' detém detalhes sobre os funcionários do hospital.
</p>
<p align="justify">
Em todas as coleções, cada documento é identificado por um "_id" único gerado automaticamente pelo MongoDB. Além disso, na coleção 'Patients', os índices são criados para facilitar buscas por data de nascimento e género e para o número de seguro. Para a coleção 'Appointments', os índices são estabelecidos para a data agendada e uma combinação do médico e da data da consulta, permitindo que o pessoal hospitalar organize e recupere eficientemente as agendas dos médicos e as datas das consultas dos pacientes. A coleção 'Services' utiliza índices para episódios de tratamento e identificação de faturas, o que é vital para o acompanhamento financeiro e clínico dentro do hospital. Finalmente, na coleção 'Staff', são criados índices para o departamento ao qual pertencem e o tipo de função que exercem. Isso permite que o departamento de recursos humanos do hospital gerencie seu pessoal de forma mais eficaz, desde a alocação de tarefas até a conformidade regulatória e administrativa.
</p>

In [None]:
# Conexão ao MongoDB
client = MongoClient('mongodb://localhost:27017/')
db = client['Hospital']


# Seleção das coleções
collection_p = db['Patients']
collection_a = db['Appointments']
collection_s = db['Services']
collection_sa = db['Staff']


# Criação dos índices para cada coleção
# Índices para a coleção Patients
collection_p.create_index([("BIRTHDAY", 1), ("gender", 1)])  # Índice composto para buscas por data de nascimento e gênero
collection_p.create_index([("policy_number", 1)])  # Índice para número de seguro


# Índices para a coleção Appointments
collection_a.create_index([("scheduled_on", 1)])  # Índice para data agendada
collection_a.create_index([("iddoctor", 1), ("appointment_date", 1)])  # Índice composto para consultas por médico e data


# Índices para a coleção Services
collection_s.create_index([("idbill", 1)])  # Índice para identificação da fatura
collection_s.create_index([("lab_id", 1)])  # Índice único para identificação do exame de laboratório


# Índices para a coleção Staff
collection_sa.create_index([("departmentId", 1)])  # Índice para identificação do departamento
collection_sa.create_index([("type", 1)])  # Índice para tipo de funcionário (nurse, doctor, technician)


# Encerramento da conexão
client.close()

## Agregação e Views no MongoDB -> explicar código

<p align="justify">
No MongoDB, o framework de agregação é uma ferramenta poderosa que permite processar dados e realizar operações complexas de transformação, semelhante a uma pipeline, onde os dados passam por várias etapas de processamento antes de produzir o resultado final. Essa capacidade de agregação é fundamental para realizar análises profundas e extração de insights significativos de grandes volumes de dados, especialmente útil em ambientes que demandam análise rápida e eficiente, como big data e análise de dados em tempo real.
</p>
<p align="justify">
Uma pipeline de agregação no MongoDB é composta por vários estágios, onde cada estágio transforma os documentos à medida que eles passam pela pipeline. Os estágios podem incluir operações como filtragem ($match), agrupamento ($group), projeção ($project), ordenação ($sort), limitação ($limit), entre outros. Esses estágios são configurados de forma sequencial, e o output de um estágio é passado como input para o próximo, permitindo a criação de processamentos complexos e customizados. Por exemplo, pode-se começar com um estágio de match para filtrar documentos baseados em critérios específicos, seguido de um estágio de group para agrupar esses documentos por um ou mais campos, e talvez terminar com um estágio de sort para ordenar os resultados por algum critério de interesse.
</p>
<p align="justify">
Além das agregações, o MongoDB também suporta a criação de "views" que são, de certa forma, semelhantes às views em bases de dados relacionais. Uma view no MongoDB é uma representação virtual de um resultado de uma agregação que pode ser tratada quase da mesma forma que se trata uma coleção regular. Uma vez criada, a view pode ser consultada como se fosse uma coleção, mas sem ocupar espaço adicional para armazenamento, pois os dados na view são gerados dinamicamente a partir da coleção original sempre que a view é acessada. Isso é particularmente útil para expor um subconjunto de dados ou uma transformação específica de dados sem duplicar informações na base de dados, facilitando manutenções e atualizações ao isolar a lógica de transformação de dados em um único local.
</p>
<p align="justify">
As views são definidas a partir de uma pipeline de agregação e são armazenadas na base de dados como uma definição, não como dados físicos. Quando um usuário consulta uma view, o MongoDB executa a pipeline de agregação associada para gerar o resultado em tempo real. Isso proporciona uma camada adicional de abstração e segurança, permitindo que os administradores limitem a visibilidade dos dados aos usuários finais, mostrando apenas os dados transformados e relevantes.
</p>
<p align="justify">
Assim, enquanto as agregações fornecem um método dinâmico e poderoso para analisar e transformar dados em MongoDB, as views oferecem uma maneira eficiente e segura de acessar e apresentar esses dados, mantendo a integridade e o controle sobre a informação original armazenada na base de dados. Ambas as funcionalidades, quando utilizadas adequadamente, permitem que os desenvolvedores e analistas de dados maximizem a utilidade dos dados armazenados no MongoDB, criando soluções eficientes e escaláveis para gestão de dados e análise.
</p>
<p align="justify">
O módulo não inclui pacotes para criação direta das views, ou seja, isso apenas é conseguido diretamente na base de dados. No entanto, é possível criar agregações que podem dar informações úteis, como exemplo, explorar se um medico deste hospital também é um paciente do mesmo. Para isso, criou-se uma agregação que compara os primeiro e último nomes dos médicos e dos pacientes da loja online.
</p>

### Médicos que já foram pacientes no hospital

O código apresentado abaixo serve realizar uma agregação que identifica quais médicos também são pacientes no hospital. Para isso, é definida uma pipeline de agregação MongoDB onde uma sequência de estágios de processamento de dados que são aplicados aos documentos na coleção.

a. $match: Filtra os documentos na coleção "Patients" para encontrar aqueles cujo tipo é "doctor", ou seja, médicos.

b. $lookup: Realiza uma operação de junção com a mesma coleção "Patients" para encontrar documentos que tenham um campo "_id" correspondente ao campo "idpatient" nos documentos filtrados no estágio anterior. Isso associa os médicos aos seus registros de paciente.

c. $match: Filtra novamente os documentos resultantes da junção para encontrar aqueles que têm informações de paciente associadas, ou seja, médicos que também são pacientes.

d. $project: Projeta os campos desejados para o resultado final. Aqui, apenas os campos "_id", "firstName", "lastName" são mantidos, e um novo campo "isDoctorPatient" é adicionado usando a expressão condicional "$cond" para indicar se o médico é também um paciente.

In [None]:
# aggregate para descobrir que medicos também já foram pacientes no hospital
def aggregate_doctor_patients():
    try:
        # Conexão com o MongoDB
        client = MongoClient('mongodb://localhost:27017/')
        db = client['Hospital']
        collection = db['Patients']

        # Agregação para encontrar médicos que também são pacientes
        pipeline = [
            {
                "$match": {
                    "type": "doctor"
                }
            },
            {
                "$lookup": {
                    "from": "Patients",
                    "localField": "_id",
                    "foreignField": "idpatient",
                    "as": "patient_info"
                }
            },
            {
                "$match": {
                    "patient_info": {"$ne": []}
                }
            },
            {
                "$project": {
                    "_id": 1,
                    "firstName": 1,
                    "lastName": 1,
                    "isDoctorPatient": {"$cond": {"if": {"$isArray": "$patient_info"}, "then": True, "else": False}}
                }
            }
        ]

        # Executar a agregação
        result = list(collection.aggregate(pipeline))

        # Exibir o resultado
        if not result:
            print("Não há nenhum médico que seja paciente")
        else:
            for doctor_patient in result:
                print(doctor_patient)
    
    except Exception as e:
        print(f"Ocorreu um erro: {e}")

    finally:
        # Fechar conexão
        if client:
            client.close()

# Chamada da função para fazer a agregação
aggregate_doctor_patients()

### Receitas do hospital

O seguinte código serve para realizar uma agregação que calcula as receitas do hospital a partir das faturas dos serviços. Para isso, é definida uma pipeline de agregação MongoDB onde uma sequência de estágios de processamento de dados que são aplicados aos documentos na coleção.

a. $unwind: Este estágio desnormaliza o array de faturas dentro de cada documento, ou seja, para cada documento com múltiplas faturas, cria uma entrada separada para cada fatura. Isso é necessário para que cada fatura possa ser tratada individualmente nos estágios seguintes.

b. $project: Este estágio projeta apenas os campos relevantes das faturas. O campo "_id" é excluído, e os campos "idepisode", "patient_idpatient" e "bill" são mantidos.

In [None]:
# aggregate para calcular as receitas do hospital
def aggregate_services_bills():
    try:
        # Conexão com o MongoDB
        client = MongoClient('mongodb://localhost:27017/')
        db = client['Hospital']
        collection = db['Services']

        # Agregação para extrair as faturas (bills) dentro da coleção services
        pipeline = [
            {
                "$unwind": "$bill"  # Desnormaliza o array de faturas
            },
            {
                "$project": {  # Projeta apenas os campos relevantes das faturas
                    "_id": 0,  # Exclui o _id padrão do MongoDB
                    "idepisode": 1,
                    "patient_idpatient": 1,
                    "bill": 1
                }
            }
        ]

        # Executar a agregação
        result = list(collection.aggregate(pipeline))

        # Exibir o resultado
        for service in result:
            print(service)
    
    except Exception as e:
        print(f"Ocorreu um erro: {e}")

    finally:
        # Fechar conexão
        if client:
            client.close()

# Chamada da função para fazer a agregação
aggregate_services_bills()

### Número de pacientes por faixa etária

As funções definidas em baixo realizam uma agregação que calcula o número de pacientes por faixa etária.Para isso, são definidas dis funcoes e uma pipeline de agregação MongoDB onde uma sequência de estágios de processamento de dados que são aplicados aos documentos na coleção.
 
Função calculate_age: Esta função calcula a idade com base na data de nascimento fornecida. Ela recebe a data de nascimento como entrada e retorna a idade calculada em anos.

Função aggregate_patients_by_age_range: Esta função executa a agregação no MongoDB para calcular o número de pacientes por faixa etária.

a. $project: Este estágio projeta um novo campo "age", que é calculado subtraindo o ano atual do ano de nascimento de cada paciente. Utiliza a função datetime.utcnow() para obter a data atual e a função calculate_age para calcular a idade.

b. $bucket: Este estágio agrupa os documentos por faixa etária. Ele divide os pacientes em faixas etárias pré-definidas (0-18, 19-35, 36-50, 51-65, 66-100, acima de 100) e conta o número de pacientes em cada faixa. Faixas que não se enquadram nos limites especificados são agrupadas na faixa "100+".

In [None]:
# Aggregate do número de pacientes por faixa etária
def calculate_age(birth_date):
    today = datetime.utcnow()
    age = today.year - birth_date.year - ((today.month, today.day) < (birth_date.month, birth_date.day))
    return age

def aggregate_patients_by_age_range():
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    collection = db['Patients']

    pipeline = [
        {
            "$project": {
                "age": {
                    "$subtract": [
                        {"$year": datetime.utcnow()},
                        {"$year": "$BIRTHDAY"}
                    ]
                }
            }
        },
        {
            "$bucket": {
                "groupBy": "$age",
                "boundaries": [0, 18, 35, 50, 65, 100],
                "default": "100+",
                "output": {
                    "count": {"$sum": 1}
                }
            }
        }
    ]

    result = collection.aggregate(pipeline)

    for age_range in result:
        print(age_range)

    client.close()

# Chamada da função para fazer a agregação
aggregate_patients_by_age_range()

### Número de consultas por médico

Este código realizar uma agregação que conta o número de consultas para cada médico no banco de dados, enriquecendo os resultados com informações adicionais sobre os médicos, como seus nomes.Para isso, são definidas dis funcoes e uma pipeline de agregação MongoDB onde uma sequência de estágios de processamento de dados que são aplicados aos documentos na coleção.
 
a. $group: Este estágio agrupa os documentos por "iddoctor", que é o identificador único de cada médico, e calcula o total de consultas para cada médico usando a expressão "$sum".

b. $lookup: Este estágio realiza uma operação de junção com a coleção "Staff" para adicionar informações adicionais sobre os médicos. Ele compara o campo "_id" do estágio anterior com o campo "_id" da coleção "Staff" para encontrar correspondências e adiciona as informações encontradas na matriz "doctor_info".

c. $project: Este estágio projeta os campos desejados para o resultado final. Ele mantém o total de consultas ("total_appointments"), o ID do médico ("doctor_id"), o nome do médico ("doctor_name") e o sobrenome do médico ("doctor_lastname"). Os nomes e sobrenomes são extraídos da matriz "doctor_info" usando a função "$arrayElemAt".

In [None]:
# Aggregate para contar o número de consultas por médico

def aggregate_appointments_by_doctor():
    # Conexão com o MongoDB
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    collection = db['Appointments']

    # Pipeline de agregação para contar o número de consultas por médico
    pipeline = [
        {
            "$group": {
                "_id": "$iddoctor",
                "total_appointments": {"$sum": 1}
            }
        },
        {
            "$lookup": {
                "from": "Staff",
                "localField": "_id",
                "foreignField": "_id",
                "as": "doctor_info"
            }
        },
        {
            "$project": {
                "doctor_id": "$_id",
                "total_appointments": 1,
                "doctor_name": {"$arrayElemAt": ["$doctor_info.firstName", 0]},
                "doctor_lastname": {"$arrayElemAt": ["$doctor_info.lastName", 0]}
            }
        }
    ]

    # Executar a agregação
    result = list(collection.aggregate(pipeline))

    # Exibir o resultado
    for appointment_count in result:
        print(appointment_count)

    # Fechar conexão
    client.close()

# Chamada da função para fazer a agregação
aggregate_appointments_by_doctor()

### Número de consultas por médico, incluindo o número de consultas por mês para cada médico
Por fim, este último aggregate é utilizado para contar o número de consultas para cada médico no base de dados, incluindo informações sobre o mês e o ano de cada consulta.Para isso, são definidas dis funcoes e uma pipeline de agregação MongoDB onde uma sequência de estágios de processamento de dados que são aplicados aos documentos na coleção.
 
a. $addFields: Este estágio adiciona novos campos aos documentos da coleção. Ele cria dois novos campos, "appointment_month" e "appointment_year", que armazenam o mês e o ano da data da consulta, respectivamente.

b. $group: Este estágio agrupa os documentos por "iddoctor" (identificador único do médico), "month" (mês da consulta) e "year" (ano da consulta), calculando o total de consultas para cada combinação de médico, mês e ano usando a expressão "$sum".

c. $lookup: Este estágio realiza uma operação de junção com a coleção "Staff" para adicionar informações adicionais sobre os médicos. Ele compara o campo "_id" do estágio anterior com o campo "_id" da coleção "Staff" para encontrar correspondências e adiciona as informações encontradas na matriz "doctor_info".

d. $project: Este estágio projeta os campos desejados para o resultado final. Ele mantém o ID do médico ("doctor_id"), o mês da consulta ("month"), o ano da consulta ("year"), o total de consultas ("total_appointments"), o nome do médico ("doctor_name") e o sobrenome do médico ("doctor_lastname"). Os nomes e sobrenomes são extraídos da matriz "doctor_info" usando a função "$arrayElemAt".

In [None]:
# Aggregate para contar as consultas por médico, incluindo o número de consultas por mês para cada médico
def aggregate_appointments_by_month_and_doctor():
    # Conexão com o MongoDB
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    collection = db['Appointments']

    # Pipeline de agregação para contar o número de consultas por médico e mês
    pipeline = [
        {
            "$addFields": {
                "appointment_month": {"$month": "$appointment_date"},
                "appointment_year": {"$year": "$appointment_date"}
            }
        },
        {
            "$group": {
                "_id": {
                    "iddoctor": "$iddoctor",
                    "month": "$appointment_month",
                    "year": "$appointment_year"
                },
                "total_appointments": {"$sum": 1}
            }
        },
        {
            "$lookup": {
                "from": "Staff",
                "localField": "_id.iddoctor",
                "foreignField": "_id",
                "as": "doctor_info"
            }
        },
        {
            "$project": {
                "doctor_id": "$_id.iddoctor",
                "month": "$_id.month",
                "year": "$_id.year",
                "total_appointments": 1,
                "doctor_name": {"$arrayElemAt": ["$doctor_info.firstName", 0]},
                "doctor_lastname": {"$arrayElemAt": ["$doctor_info.lastName", 0]}
            }
        }
    ]

    # Executar a agregação
    result = list(collection.aggregate(pipeline))

    # Exibir o resultado
    for appointment_count in result:
        print(appointment_count)

    # Fechar conexão
    client.close()

# Chamada da função para fazer a agregação
aggregate_appointments_by_month_and_doctor()

## Triggers MongoDB

Os triggers no MongoDB são utilizados para responder a eventos específicos que ocorrem na base de dados, permitindo que o código seja executado de forma automática em resposta a mudanças nos dados que podem pasar por, inserções, atualizações ou exclusões. A utilização de trigers é um aspeto essêncial para a manutenção da consistência dos dados podendo ainda ser utilizados para realizar cálculos, envio notificações entre outras aplicações, sem a necessidade de intervenção manual.

Tipos de Triggers no MongoDB Atlas:
- ⁠Database Triggers: Executam funções em resposta a mudanças em documentos em uma coleção.
- ⁠Scheduled Triggers: Executam funções em intervalos de tempo específicos.
- ⁠Authentication Triggers: Executam funções em resposta a eventos de autenticação, como criação de usuários ou login.

Para a nossa base dados, procedeu-se à criação de dois triggers:

O trigger 1, em resumo, corresponde a um manipulador de eventos que é acionado quando um novo documento é inserido em uma coleção. O trigger regista o ID do novo documento e fornece um local para adicionar lógica conforme necessário. Este tipo de função é útil para reagir dinamicamente a mudanças nos dados do banco de dados, permitindo automatizar tarefas e manter outros sistemas ou serviços sincronizados.

![Trigger1](triggers_mongo/trigger1.jpg)
<figcaption>Figura 2- Código do trigger 1</figcaption>

![Trigger1 Resultado](triggers_mongo/trigger1_resultado.jpg)
<figcaption>Figura 3- Resultado da utilização do trigger 1</figcaption>

O trigger 2 corresponde a uma função que foi projetada para ser utilizada para monitorizar inserções ou atualizações na coleção de "Appointments". Quando uma consulta é marcada, a função calcula o número de dias restantes até ao dia da consulta e envia um e-mail de notificação ao paciente correspondente, utilizando a API de e-mail do SendGrid, com o intuito de relembrar o paciente da consulta que se avizinha.

![Trigger2](triggers_mongo/trigger2.jpg)
<figcaption>Figura 4- Código do trigger 2</figcaption>


## Queries MongoDB
Com o intuito de demonstrar a operabilidade da bases de dados NOSQL impletanda no mongo desenhou-se um conjunto de consultas que pretendem simular consultas que podem ser realizada durante a atividade diária do hospital, ou para a análise dos dados de operação do hospital

In [None]:
# número de pacientes registados no hospital
def count_patients():
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    count = db['Patients'].count_documents({})
    print(f"Número total de pacientes: {count}")
    client.close()

count_patients()

Número total de pacientes: 378


In [None]:
# lista de pacientes por grupo sanguíneo
def list_patients_by_blood_type(blood_type):
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']

    # Contar o número de pacientes com o tipo sanguíneo especificado
    count = db['Patients'].count_documents({"blood_type": blood_type})
    print(f"Quantidade de pacientes com tipo sanguíneo {blood_type}: {count}")

    # Buscar e listar os pacientes com o tipo sanguíneo especificado
    patients = db['Patients'].find({"blood_type": blood_type}, {"_id": 0, "patient_fname": 1, "patient_lname": 1, "blood_type": 1})
    for patient in patients:
        print(f"Nome: {patient['patient_fname']} {patient['patient_lname']}, Tipo Sanguíneo: {patient['blood_type']}")
    
    client.close()

list_patients_by_blood_type("O+")

Quantidade de pacientes com tipo sanguíneo O+: 36
Nome: Amelia Tran, Tipo Sanguíneo: O+
Nome: Amelia Tran, Tipo Sanguíneo: O+
Nome: Sophia Garcia, Tipo Sanguíneo: O+
Nome: Mia Gomez, Tipo Sanguíneo: O+
Nome: Emma Flores, Tipo Sanguíneo: O+
Nome: Charlotte Ngo, Tipo Sanguíneo: O+
Nome: Sophia Nguyen, Tipo Sanguíneo: O+
Nome: Natalie Trinh, Tipo Sanguíneo: O+
Nome: Sophia Lam, Tipo Sanguíneo: O+
Nome: Ava Nguyen, Tipo Sanguíneo: O+
Nome: Abigail Vuong, Tipo Sanguíneo: O+
Nome: Avery Hoang, Tipo Sanguíneo: O+
Nome: Ella Le, Tipo Sanguíneo: O+
Nome: Amelia Tran, Tipo Sanguíneo: O+
Nome: Sophia Garcia, Tipo Sanguíneo: O+
Nome: Mia Gomez, Tipo Sanguíneo: O+
Nome: Emma Flores, Tipo Sanguíneo: O+
Nome: Charlotte Ngo, Tipo Sanguíneo: O+
Nome: Sophia Nguyen, Tipo Sanguíneo: O+
Nome: Natalie Trinh, Tipo Sanguíneo: O+
Nome: Sophia Lam, Tipo Sanguíneo: O+
Nome: Ava Nguyen, Tipo Sanguíneo: O+
Nome: Abigail Vuong, Tipo Sanguíneo: O+
Nome: Avery Hoang, Tipo Sanguíneo: O+
Nome: Ella Le, Tipo Sanguíneo:

In [None]:
# pacientes por genero
def list_patients_by_gender(gender):
    # Mapear a entrada do utilizador para o sexo correspondente
    gender_mapping = {"F": "Female", "M": "Male"}
    gender = gender_mapping.get(gender.upper())
    
    if not gender:
        print("Por favor, insira 'F' para female ou 'M' para male.")
        return

    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']

    # Contar o número de pacientes por sexo
    count_male = db['Patients'].count_documents({"gender": "Male"})
    count_female = db['Patients'].count_documents({"gender": "Female"})
    print(f"Quantidade de pacientes do sexo masculino: {count_male}")
    print(f"Quantidade de pacientes do sexo feminino: {count_female}")

    # Buscar e listar os pacientes com o sexo especificado
    patients = db['Patients'].find({"gender": gender}, {"_id": 0, "patient_fname": 1, "patient_lname": 1, "gender": 1})
    for patient in patients:
        print(f"Nome: {patient['patient_fname']} {patient['patient_lname']}, Sexo: {patient['gender']}")
    
    client.close()

gender_input = input("Insira 'F' para female ou 'M' para male: ")
list_patients_by_gender(gender_input)


Quantidade de pacientes do sexo masculino: 138
Quantidade de pacientes do sexo feminino: 132
Nome: Amelia Tran, Sexo: Female
Nome: Amelia Tran, Sexo: Female
Nome: Jane Smith, Sexo: Female
Nome: Emily Brown, Sexo: Female
Nome: Sophia Garcia, Sexo: Female
Nome: Olivia Lee, Sexo: Female
Nome: Emma Perez, Sexo: Female
Nome: Isabella Hernandez, Sexo: Female
Nome: Mia Gomez, Sexo: Female
Nome: Ava Rivera, Sexo: Female
Nome: Sophia Gonzalez, Sexo: Female
Nome: Olivia Perez, Sexo: Female
Nome: Emma Flores, Sexo: Female
Nome: Olivia Gutierrez, Sexo: Female
Nome: Ava Tran, Sexo: Female
Nome: Sophia Le, Sexo: Female
Nome: Amelia Huynh, Sexo: Female
Nome: Isabella Phan, Sexo: Female
Nome: Charlotte Ngo, Sexo: Female
Nome: Amelia Pham, Sexo: Female
Nome: Evelyn Bui, Sexo: Female
Nome: Sophia Nguyen, Sexo: Female
Nome: Madison Dinh, Sexo: Female
Nome: Scarlett Huynh, Sexo: Female
Nome: Victoria Lam, Sexo: Female
Nome: Natalie Trinh, Sexo: Female
Nome: Olivia Nguyen, Sexo: Female
Nome: Emma Dinh, Sex

In [None]:
# consultas por médico
def list_appointments_by_doctor():
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']

    # Contar appointments por nome de doutor e exibir a data e o tempo de cada appointment
    pipeline = [
        {
            "$lookup": {
                "from": "Staff",
                "localField": "iddoctor",
                "foreignField": "_id",
                "as": "doctor_info"
            }
        },
        {
            "$unwind": "$doctor_info"
        },
        {
            "$group": {
                "_id": {
                    "doctor_firstName": "$doctor_info.firstName",
                    "doctor_lastName": "$doctor_info.lastName"
                },
                "appointments": {
                    "$push": {
                        "appointment_date": "$appointment_date",
                        "appointment_time": "$appointment_time"
                    }
                },
                "appointments_count": {"$sum": 1}
            }
        }
    ]
    appointments_by_doctor = list(db['Appointments'].aggregate(pipeline))
    
    # Exibir o resultado
    for result in appointments_by_doctor:
        doctor_name = result['_id']['doctor_firstName'] + " " + result['_id']['doctor_lastName']
        print(f"Doutor: {doctor_name}, Número de Appointments: {result['appointments_count']}")
        print("Appointments:")
        for appointment in result['appointments']:
            print(f"- Data: {appointment['appointment_date']}, Hora: {appointment['appointment_time']}")
        print()
    
    client.close()

list_appointments_by_doctor()



Doutor: Robert Perez, Número de Appointments: 6
Appointments:
- Data: 2017-11-08 00:00:00, Hora: 16:47
- Data: 2019-10-04 00:00:00, Hora: 13:30
- Data: 2023-07-23 00:00:00, Hora: 15:00
- Data: 2023-09-02 00:00:00, Hora: 11:30
- Data: 2023-12-22 00:00:00, Hora: 16:00
- Data: 2023-06-08 00:00:00, Hora: 14:00

Doutor: Ellen Wright, Número de Appointments: 2
Appointments:
- Data: 2020-10-10 00:00:00, Hora: 18:46
- Data: 2023-05-04 00:00:00, Hora: 16:50

Doutor: James Carpenter, Número de Appointments: 4
Appointments:
- Data: 2021-07-14 00:00:00, Hora: 16:32
- Data: 2020-12-28 00:00:00, Hora: 14:17
- Data: 2021-08-11 00:00:00, Hora: 18:40
- Data: 2023-02-11 00:00:00, Hora: 17:10

Doutor: Noah Terry, Número de Appointments: 5
Appointments:
- Data: 2023-11-27 00:00:00, Hora: 10:39
- Data: 2023-06-27 00:00:00, Hora: 11:31
- Data: 2023-10-16 00:00:00, Hora: 19:30
- Data: 2023-09-23 00:00:00, Hora: 10:25
- Data: 2023-05-19 00:00:00, Hora: 16:50

Doutor: Kimberly Blankenship, Número de Appointmen

In [None]:
# número de consultas de cada médico num determinado ano
def list_appointments_by_date(year):
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']

    # Contar as consultas por médico para o ano especificado
    pipeline = [
        {
            "$match": {"$expr": {"$eq": [{"$year": "$appointment_date"}, year]}}
        },
        {
            "$group": {
                "_id": "$iddoctor",
                "appointments_count": {"$sum": 1}
            }
        },
        {
            "$lookup": {
                "from": "Staff",
                "localField": "_id",
                "foreignField": "_id",
                "as": "doctor_info"
            }
        },
        {
            "$unwind": "$doctor_info"
        },
        {
            "$project": {
                "doctor_name": {"$concat": ["$doctor_info.firstName", " ", "$doctor_info.lastName"]},
                "appointments_count": 1
            }
        }
    ]
    appointments_by_doctor = list(db['Appointments'].aggregate(pipeline))

    # Exibir o resultado
    for result in appointments_by_doctor:
        print(f"Médico: {result['doctor_name']}, Número de Consultas: {result['appointments_count']}")
    
    client.close()

year = input("Insira o ano para obter o número de consultas por médico: ")
list_appointments_by_date(int(year))


Médico: Christopher Martinez, Número de Consultas: 4
Médico: Aaron Turner, Número de Consultas: 1
Médico: Brittany Collins, Número de Consultas: 4
Médico: James Carpenter, Número de Consultas: 1
Médico: Michael Peterson, Número de Consultas: 4
Médico: Noah Terry, Número de Consultas: 5
Médico: Daniel Mills, Número de Consultas: 1
Médico: Emily Rowe, Número de Consultas: 1
Médico: William Grant, Número de Consultas: 1
Médico: Robert Perez, Número de Consultas: 4
Médico: Sarah Boyd, Número de Consultas: 5
Médico: Christina Dalton, Número de Consultas: 4
Médico: Kimberly Blankenship, Número de Consultas: 1
Médico: Lisa Hayes, Número de Consultas: 1
Médico: Jessica Jones, Número de Consultas: 1
Médico: Jillian Gordon, Número de Consultas: 1
Médico: James Williams, Número de Consultas: 1
Médico: Kendra Russell, Número de Consultas: 1
Médico: Lee Collins, Número de Consultas: 4
Médico: Ashley Lucas, Número de Consultas: 4
Médico: Dillon Jones, Número de Consultas: 1
Médico: Dawn Roberts, Núm

# Neo4j

<p align="justify">
A Neo4j, é uma plataforma de banco de dados orientada a grafos, projetada para modelar, armazenar e consultar dados que têm uma forte componente relacional. Diferente dss bases de dados relacionais tradicionais, que utilizam tabelas para armazenar dados, o Neo4j usa uma estrutura baseada em grafos composta por nós (que representam entidades) e relações (que conectam essas entidades), permitindo uma representação mais natural e eficiente de redes complexas. Cada nó e relacionamento pode ter propriedades adicionais, como pares de chave-valor, proporcionando uma grande flexibilidade na modelagem de dados. A consulta no Neo4j é realizada através de uma linguagem de consulta específica chamada Cypher, que é intuitiva e poderosa, permitindo explorar padrões de relacionamentos de maneira eficiente. Devido à sua capacidade de lidar com grandes volumes de dados interconectados, o Neo4j é amplamente utilizado em diversas áreas, como análise de redes sociais, recomendações de produtos, detecção de fraudes e gerenciamento de redes de conhecimento. A sua arquitetura permite consultas rápidas e desempenho escalável, tornando-o uma escolha popular para aplicações que requerem uma exploração profunda e em tempo real das interconexões entre dados.
</p>

## Passagem dos dados para o Neo4j

### Adição da informação associada aos pacientes
<p align="justify">
O seguinte código realiza duas operações principais, a extração de dados de um banco de dados Oracle e a inserção desses dados na plantaforma Neo4j. Este código foi desenvolvido para proceder à passagem de toda a informação relativa aos pacientes para uma base de dados orientadas a grafos em que as entradas de cada table vai dão origem a 4 nodos, com os atributos que correspondem às colunas no modelo relacional

Entidades envolvidas: 
* HOSPITAL_PATIENT
* HOSPITAL_INSURANCE
* HOSPITAL_MEDICAL_HISTORY
* HOSPITAL_EMERGENCY_CONTACT

<p align="justify">
Na primeira operação, definiu-se a função extract_data_from_oracle, que começa por realizar a conexão à base de dados relacional e posteriormente são realizadas quatro consultas independentes para extrair a informação das entidades envolvidas. Na segunda operação, definiu-se a função insert_data_to_neo4j que é responsável por inserir os dados extraídos do Oracle no banco de dados Neo4j. Esta função interage com o Neo4j através da biblioteca py2neo, com o endereço e as credenciais fornecidas, cria nós do tipo "Patient", "Insurance", "MedicalHistory"e "EmergencyContact" e insere cada registro extraído do Oracle, no Neo4j. 

In [12]:
def extract_data_from_oracle():
    print("Extração dos dados do Oracle...")

    # Conexão ao Oracle
    password = getpass.getpass(prompt="Enter Oracle password: ")
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de HOSPITAL_PATIENT
    sql_patient = """
        SELECT 
            idpatient,     
            patient_fname, 
            patient_lname, 
            blood_type, 
            phone,         
            email,         
            gender,        
            policy_number, 
            BIRTHDAY
        FROM
            patient
    """
    cursor.execute(sql_patient)
    patients = cursor.fetchall()
    print(f"Pacientes extraídos: {len(patients)}")

    # Consulta SQL para extrair os dados de HOSPITAL_INSURANCE
    sql_insurance = """
        SELECT 
            policy_number,  
            provider,       
            insurance_plan, 
            co_pay,         
            coverage,       
            maternity,      
            dental,         
            optical     
        FROM 
            insurance
    """
    cursor.execute(sql_insurance)
    insurances = cursor.fetchall()
    print(f"Seguros extraídos: {len(insurances)}")
    
    # Consulta SQL para extrair os dados de HOSPITAL_MEDICAL_HISTORY
    sql_MEDICAL_HISTORY = """
        SELECT 
            record_id,   
            record_date, 
            idpatient   
        FROM 
            MEDICAL_HISTORY
    """
    cursor.execute(sql_MEDICAL_HISTORY)
    medical_histories = cursor.fetchall()
    print(f"Históricos médicos extraídos: {len(medical_histories)}")

    # Consulta SQL para extrair os dados de HOSPITAL_EMERGENCY_CONTACT
    sql_emergency_contact = """
        SELECT 
            contact_name, 
            phone,        
            relation,    
            idpatient  
        FROM 
            emergency_contact
    """
    cursor.execute(sql_emergency_contact)
    emergency_contacts = cursor.fetchall()
    print(f"Contatos de emergência extraídos: {len(emergency_contacts)}")

    # Encerramento da conexão
    cursor.close(); connection.close()

    return patients, insurances, medical_histories, emergency_contacts

def insert_data_to_neo4j(patients, insurances, medical_histories, emergency_contacts):
    print("Inserção dos dados no Neo4J...")

    graph = Graph("bolt://localhost:7687", auth=("neo4j", "12345678"))  # Substitua "your_password" pela senha do seu Neo4j

    # Inserir pacientes
    for patient in patients:
        patient_node = Node("Patient", idpatient=patient[0], patient_fname=patient[1], patient_lname=patient[2], 
                            blood_type=patient[3], phone=patient[4], email=patient[5], gender=patient[6], 
                            policy_number=patient[7], birthday=patient[8])
        graph.create(patient_node)
        print(f"Paciente inserido: {patient[1]} {patient[2]}")

    # Inserir seguros
    for insurance in insurances:
        insurance_node = Node("Insurance", policy_number=insurance[0], provider=insurance[1], insurance_plan=insurance[2], 
                              co_pay=insurance[3], coverage=insurance[4], maternity=insurance[5], dental=insurance[6], 
                              optical=insurance[7])
        graph.create(insurance_node)
        graph.run("MATCH (p:Patient {policy_number: $policy_number}), (i:Insurance {policy_number: $policy_number}) "
                  "CREATE (p)-[:HAS_INSURANCE]->(i)", policy_number=insurance[0])
        print(f"Seguro inserido: {insurance[1]}")

    # Inserir históricos médicos
    for medical_history in medical_histories:
        medical_history_node = Node("MedicalHistory", record_id=medical_history[0], record_date=medical_history[1])
        graph.create(medical_history_node)
        graph.run("MATCH (p:Patient {idpatient: $idpatient}), (m:MedicalHistory {record_id: $record_id}) "
                  "CREATE (p)-[:HAS_MEDICAL_HISTORY]->(m)", idpatient=medical_history[2], record_id=medical_history[0])
        print(f"Histórico médico inserido: {medical_history[0]}")

    # Inserir contatos de emergência
    for emergency_contact in emergency_contacts:
        emergency_contact_node = Node("EmergencyContact", contact_name=emergency_contact[0], phone=emergency_contact[1], 
                                      relation=emergency_contact[2])
        graph.create(emergency_contact_node)
        graph.run("MATCH (p:Patient {idpatient: $idpatient}), (e:EmergencyContact {contact_name: $contact_name}) "
                  "CREATE (p)-[:HAS_EMERGENCY_CONTACT]->(e)", idpatient=emergency_contact[3], contact_name=emergency_contact[0])
        print(f"Contato de emergência inserido: {emergency_contact[0]}")

# Extrair dados do Oracle e inseri-los no Neo4J
patients, insurances, medical_histories, emergency_contacts = extract_data_from_oracle()
insert_data_to_neo4j(patients, insurances, medical_histories, emergency_contacts)


Extraindo dados do Oracle...
Pacientes extraídos: 270
Seguros extraídos: 10
Históricos médicos extraídos: 78
Contatos de emergência extraídos: 20
Inserindo dados no Neo4J...
Paciente inserido: Amelia Tran
Paciente inserido: Michael Do
Paciente inserido: Jacob Lam
Paciente inserido: Amelia Tran
Paciente inserido: Michael Do
Paciente inserido: John Doe
Paciente inserido: Jane Smith
Paciente inserido: Michael Johnson
Paciente inserido: Emily Brown
Paciente inserido: William Martinez
Paciente inserido: Sophia Garcia
Paciente inserido: James Lopez
Paciente inserido: Olivia Lee
Paciente inserido: Benjamin Gonzalez
Paciente inserido: Emma Perez
Paciente inserido: Jacob Rodriguez
Paciente inserido: Isabella Hernandez
Paciente inserido: Ethan Lopez
Paciente inserido: Mia Gomez
Paciente inserido: Alexander Diaz
Paciente inserido: Ava Rivera
Paciente inserido: William Smith
Paciente inserido: Sophia Gonzalez
Paciente inserido: Michael Martinez
Paciente inserido: Olivia Perez
Paciente inserido: Li

### Adição do idepisode

<p align="justify">
A seginte função "insert_data_to_neo4j_episodes" insere dados de episódios extraídos do Oracle no banco de dados Neo4j, criando nós para os episódios e relacionando-os aos pacientes, para isto ela utiliza o comando MERGE para garantir que o nó do episódio seja criado se não existir, ou atualizado se já existir, define a propriedade patient_idpatient para o nó do episódio, posteriormente utiliza o comando MATCH para encontrar o paciente e o episódio no banco de dados e cria um relacionamento HAS_EPISODE entre o paciente e o episódio usando o comando MERGE.


In [None]:
def insert_data_to_neo4j_episodes(episodes):
    # Conectar ao Neo4j
    neo4j_driver = GraphDatabase.driver("bolt://localhost:7687", auth=("neo4j", "12345678"))
    with neo4j_driver.session() as session:
        for episode in episodes:
            # Extrair os dados do episódio
            idepisode = episode[0]
            patient_idpatient = episode[1]

            # Criar nó do episódio
            session.run("""
                MERGE (e:Episode {idepisode: $idepisode})
                SET e.patient_idpatient = $patient_idpatient
            """, {
                "idepisode": idepisode,
                "patient_idpatient": patient_idpatient
            })

            # Associar episódio ao paciente
            session.run("""
                MATCH (p:Patient {idpatient: $idpatient})
                MATCH (e:Episode {idepisode: $idepisode})
                MERGE (p)-[:HAS_EPISODE]->(e)
            """, {
                "idpatient": patient_idpatient,
                "idepisode": idepisode
            })

    # Fechar conexão
    neo4j_driver.close()



def extract_data_from_oracle_episodes():
    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de HOSPITAL_EPISODE
    sql_episode = """
        SELECT 
            idepisode,
            patient_idpatient
        FROM 
            episode
    """
    cursor.execute(sql_episode)
    episodes = cursor.fetchall()

    # Fechar conexão
    cursor.close()
    connection.close()

    # Inserir os dados no Neo4j
    insert_data_to_neo4j_episodes(episodes)

# Chamar as funções principais para extrair dados do Oracle e inseri-los no Neo4j
extract_data_from_oracle_episodes()

### Associação dos dados da tabela a cada episódio

<p align="justify">
A seguinte função "insert_data_to_neo4j_appointments", é responsavel por inserir dados de "appointements" extraídos do Oracle no Neo4j, criando nós para os compromissos e relacionando-os aos episódios, para isso, utiliza o comando MERGE para garantir que o nó do compromisso seja criado se não existir, ou atualizado se já existir e define as propriedades scheduled_on, appointment_date, appointment_time, iddoctor e idepisode para o nó do compromisso. Posteriormente, utiliza o comando MATCH para encontrar o episódio e o compromisso no banco de dados e cria um relacionamento HAS_APPOINTMENT entre o episódio e o compromisso usando o comando MERGE.

In [None]:
def extract_data_from_oracle_appointments():
    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de HOSPITAL_APPOINTMENT
    sql_appointment = """
        SELECT 
            scheduled_on,
            appointment_date,
            appointment_time,
            iddoctor,
            idepisode
        FROM 
            appointment
    """
    cursor.execute(sql_appointment)
    appointments = cursor.fetchall()

    # Fechar conexão
    cursor.close()
    connection.close()

    # Inserir os dados no Neo4j
    insert_data_to_neo4j_appointments(appointments)

def insert_data_to_neo4j_appointments(appointments):
    # Conectar ao Neo4j
    neo4j_driver = GraphDatabase.driver("bolt://localhost:7687", auth=("neo4j", "12345678"))
    with neo4j_driver.session() as session:
        for appointment in appointments:
            scheduled_on = appointment[0]
            appointment_date = appointment[1]
            appointment_time = appointment[2]
            iddoctor = appointment[3]
            idepisode = appointment[4]

            # Criar nó de appointment
            session.run("""
                MERGE (a:Appointment {scheduled_on: $scheduled_on, appointment_date: $appointment_date, appointment_time: $appointment_time, iddoctor: $iddoctor, idepisode: $idepisode})
                SET a.scheduled_on = $scheduled_on,
                    a.appointment_date = $appointment_date,
                    a.appointment_time = $appointment_time,
                    a.iddoctor = $iddoctor
            """, {
                "scheduled_on": scheduled_on,
                "appointment_date": appointment_date,
                "appointment_time": appointment_time,
                "iddoctor": iddoctor,
                "idepisode": idepisode
            })

            # Associar appointment ao episódio
            session.run("""
                MATCH (e:Episode {idepisode: $idepisode})
                MATCH (a:Appointment {scheduled_on: $scheduled_on, appointment_date: $appointment_date, appointment_time: $appointment_time, iddoctor: $iddoctor, idepisode: $idepisode})
                MERGE (e)-[:HAS_APPOINTMENT]->(a)
            """, {
                "idepisode": idepisode,
                "scheduled_on": scheduled_on,
                "appointment_date": appointment_date,
                "appointment_time": appointment_time,
                "iddoctor": iddoctor
            })

    # Fechar conexão
    neo4j_driver.close()

# Chamar a função principal para extrair dados do Oracle e inseri-los no Neo4j
extract_data_from_oracle_appointments()

### Extração e inserção dos Dados de Rooms
<p align="justify">
A seguinte função "insert_data_to_neo4j_rooms", é responsável por extrair os dados dos quartos do Oracle e inseri-los no Neo4j, criando nós para os quartos e relacionando-os aos episódios, para isso, utiliza o comando MERGE para garantir que o nó do quarto seja criado se não existir, ou atualizado se já existir e define as propriedades room_type e room_cost para o nó do quarto. Posteriormente, utiliza o comando MATCH para encontrar o episódio e o quarto no banco de dados e cria um relacionamento HAS_ROOM entre o episódio e o quarto usando o comando MERGE.

In [None]:
def extract_data_from_oracle_rooms():
    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de HOSPITAL_ROOM e HOSPITALIZATION
    sql_rooms = """
        SELECT 
            r.idroom,
            r.room_type,
            r.room_cost,
            h.idepisode
        FROM 
            room r
        INNER JOIN hospitalization h ON r.idroom = h.room_idroom
    """
    cursor.execute(sql_rooms)
    rooms = cursor.fetchall()

    # Fechar conexão
    cursor.close()
    connection.close()

    # Inserir os dados no Neo4j
    insert_data_to_neo4j_rooms(rooms)

def insert_data_to_neo4j_rooms(rooms):
    # Conectar ao Neo4j
    neo4j_driver = GraphDatabase.driver("bolt://localhost:7687", auth=("neo4j", "12345678"))
    with neo4j_driver.session() as session:
        for room in rooms:
            idroom = room[0]
            room_type = room[1]
            room_cost = room[2]
            idepisode = room[3]

            # Criar nó de Room
            session.run("""
                MERGE (r:Room {idroom: $idroom})
                SET r.room_type = $room_type,
                    r.room_cost = $room_cost
            """, {
                "idroom": idroom,
                "room_type": room_type,
                "room_cost": room_cost
            })

            # Associar Room ao episódio
            session.run("""
                MATCH (e:Episode {idepisode: $idepisode})
                MATCH (r:Room {idroom: $idroom})
                MERGE (e)-[:HAS_ROOM]->(r)
            """, {
                "idepisode": idepisode,
                "idroom": idroom
            })

    # Fechar conexão
    neo4j_driver.close()

# Chamar a função para extrair dados do Oracle e inseri-los no Neo4j
extract_data_from_oracle_rooms()

### Extração e inserção dos dados das Bills

<p align="justify">
A seguinte função "insert_data_to_neo4j_bills", é responsável por inserir os dados de contas extraídos do Oracle no banco de dados Neo4j, criando nós para as contas e relacionando-as aos episódios, para isso utiliza o comando MERGE para garantir que o nó da conta seja criado se não existir, ou atualizado se já existir e define as propriedades room_cost, test_cost, other_charges, total, registered_at e payment_status para o nó da conta. Posteriormente, utiliza o comando MATCH para encontrar o episódio e a conta no banco de dados e cria um relacionamento HAS_BILL entre o episódio e a conta usando o comando MERGE.

In [None]:
def extract_data_from_oracle_bills():
    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de HOSPITAL_BILL
    sql_bills = """
        SELECT 
            idbill,
            room_cost,
            test_cost,
            other_charges,
            total,
            idepisode,
            registered_at,
            payment_status
        FROM 
            bill
    """
    cursor.execute(sql_bills)
    bills = cursor.fetchall()

    # Fechar conexão
    cursor.close()
    connection.close()

    # Inserir os dados no Neo4j
    insert_data_to_neo4j_bills(bills)

def insert_data_to_neo4j_bills(bills):
    # Conectar ao Neo4j
    neo4j_driver = GraphDatabase.driver("bolt://localhost:7687", auth=("neo4j", "12345678"))
    with neo4j_driver.session() as session:
        for bill in bills:
            idbill = bill[0]
            room_cost = bill[1]
            test_cost = bill[2]
            other_charges = bill[3]
            total = bill[4]
            idepisode = bill[5]
            registered_at = bill[6]
            payment_status = bill[7]

            # Criar nó de Bill
            session.run("""
                MERGE (b:Bill {idbill: $idbill})
                SET b.room_cost = $room_cost,
                    b.test_cost = $test_cost,
                    b.other_charges = $other_charges,
                    b.total = $total,
                    b.registered_at = $registered_at,
                    b.payment_status = $payment_status
            """, {
                "idbill": idbill,
                "room_cost": room_cost,
                "test_cost": test_cost,
                "other_charges": other_charges,
                "total": total,
                "registered_at": registered_at,
                "payment_status": payment_status
            })

            # Associar Bill ao episódio
            session.run("""
                MATCH (e:Episode {idepisode: $idepisode})
                MATCH (b:Bill {idbill: $idbill})
                MERGE (e)-[:HAS_BILL]->(b)
            """, {
                "idepisode": idepisode,
                "idbill": idbill
            })

    # Fechar conexão
    neo4j_driver.close()

# Chamar a função para extrair dados do Oracle e inseri-los no Neo4j
extract_data_from_oracle_bills()

###  Extração e inserção dos dados de Lab Screenings
<p align="justify">
A seguinte função "insert_data_to_neo4j_lab_screenings", é responsável por inserir os dados de exames laboratoriais extraídos do Oracle no banco de dados Neo4j, criando nós para os exames e relacionando-os aos episódios, para isso Utiliza o comando MERGE para garantir que o nó do exame seja criado se não existir, ou atualizado se já existir e define as propriedades test_cost, test_date e idtechnician para o nó do exame. Posteriormente, utiliza o comando MATCH para encontrar o episódio e o exame no banco de dados e cria um relacionamento HAS_LAB entre o episódio e o exame usando o comando MERGE.


In [None]:
def extract_data_from_oracle_lab_screenings():
    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de HOSPITAL_LAB_SCREENING
    sql_lab_screenings = """
        SELECT 
            lab_id,
            test_cost,
            test_date,
            idtechnician,
            episode_idepisode
        FROM 
            lab_screening
    """
    cursor.execute(sql_lab_screenings)
    lab_screenings = cursor.fetchall()

    # Fechar conexão
    cursor.close()
    connection.close()

    # Inserir os dados no Neo4j
    insert_data_to_neo4j_lab_screenings(lab_screenings)

def insert_data_to_neo4j_lab_screenings(lab_screenings):
    # Conectar ao Neo4j
    neo4j_driver = GraphDatabase.driver("bolt://localhost:7687", auth=("neo4j", "12345678"))
    with neo4j_driver.session() as session:
        for lab_screening in lab_screenings:
            lab_id = lab_screening[0]
            test_cost = lab_screening[1]
            test_date = lab_screening[2]
            idtechnician = lab_screening[3]
            idepisode = lab_screening[4]

            # Criar nó de Lab Screening
            session.run("""
                MERGE (l:LabScreening {lab_id: $lab_id})
                SET l.test_cost = $test_cost,
                    l.test_date = $test_date,
                    l.idtechnician = $idtechnician
            """, {
                "lab_id": lab_id,
                "test_cost": test_cost,
                "test_date": test_date,
                "idtechnician": idtechnician
            })

            # Associar Lab Screening ao episódio
            session.run("""
                MATCH (e:Episode {idepisode: $idepisode})
                MATCH (l:LabScreening {lab_id: $lab_id})
                MERGE (e)-[:HAS_LAB]->(l)
            """, {
                "idepisode": idepisode,
                "lab_id": lab_id
            })

    # Fechar conexão
    neo4j_driver.close()

# Chamar a função para extrair dados do Oracle e inseri-los no Neo4j
extract_data_from_oracle_lab_screenings()

### Extração e inserção dos dados de Staff associados a cada episódio
<p align="justify">
A seguinte função "insert_data_to_neo4j_staff", é responsável por inserir os dados de pessoal (médicos, enfermeiros e técnicos) extraídos do Oracle no banco de dados Neo4j, criando nós para o pessoal e relacionando-os aos episódios, para isso, a função percorre as listas de appointments, hospitalizations e lab_screenings, preenchendo um dicionário staff_dict onde a chave é o idepisode e os valores são os IDs do médico, enfermeiro e técnico. Para cada idepisode no dicionário staff_dict, a função realiza duas operações principais, a criação do Nó de Pessoal, onde utiliza o comando MERGE para garantir que o nó de pessoal seja criado se não existir, ou atualizado se já existir e define as propriedades doctor, nurse e technician para o nó de pessoal,o relacionamento do Pessoal com o Episódio, onde utiliza o comando MATCH para encontrar o episódio e o pessoal no banco de dados e cria um relacionamento HAS_STAFF entre o episódio e o pessoal usando o comando MERGE.

In [None]:
def extract_data_from_oracle_staff():
    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de APPOINTMENT
    sql_appointment = """
        SELECT 
            iddoctor,
            idepisode
        FROM 
            appointment
    """
    cursor.execute(sql_appointment)
    appointments = cursor.fetchall()

    # Consulta SQL para extrair os dados de HOSPITALIZATION
    sql_hospitalization = """
        SELECT 
            responsible_nurse,
            idepisode
        FROM 
            hospitalization
    """
    cursor.execute(sql_hospitalization)
    hospitalizations = cursor.fetchall()

    # Consulta SQL para extrair os dados de LAB_SCREENING
    sql_lab_screening = """
        SELECT 
            idtechnician,
            episode_idepisode
        FROM 
            lab_screening
    """
    cursor.execute(sql_lab_screening)
    lab_screenings = cursor.fetchall()

    # Fechar conexão
    cursor.close()
    connection.close()

    # Inserir os dados no Neo4j
    insert_data_to_neo4j_staff(appointments, hospitalizations, lab_screenings)

def insert_data_to_neo4j_staff(appointments, hospitalizations, lab_screenings):
    # Conectar ao Neo4j
    neo4j_driver = GraphDatabase.driver("bolt://localhost:7687", auth=("neo4j", "12345678"))
    with neo4j_driver.session() as session:
        staff_dict = {}

        for appointment in appointments:
            iddoctor = appointment[0]
            idepisode = appointment[1]
            if idepisode not in staff_dict:
                staff_dict[idepisode] = {"doctor": None, "nurse": None, "technician": None}
            staff_dict[idepisode]["doctor"] = iddoctor

        for hospitalization in hospitalizations:
            responsible_nurse = hospitalization[0]
            idepisode = hospitalization[1]
            if idepisode not in staff_dict:
                staff_dict[idepisode] = {"doctor": None, "nurse": None, "technician": None}
            staff_dict[idepisode]["nurse"] = responsible_nurse

        for lab_screening in lab_screenings:
            idtechnician = lab_screening[0]
            idepisode = lab_screening[1]
            if idepisode not in staff_dict:
                staff_dict[idepisode] = {"doctor": None, "nurse": None, "technician": None}
            staff_dict[idepisode]["technician"] = idtechnician

        for idepisode, staff in staff_dict.items():
            # Criar nó de Staff
            session.run("""
                MERGE (s:Staff {id: $idepisode})
                SET s.doctor = $doctor,
                    s.nurse = $nurse,
                    s.technician = $technician
            """, {
                "idepisode": idepisode,
                "doctor": staff["doctor"],
                "nurse": staff["nurse"],
                "technician": staff["technician"]
            })

            # Associar Staff ao episódio
            session.run("""
                MATCH (e:Episode {idepisode: $idepisode})
                MATCH (s:Staff {id: $idepisode})
                MERGE (e)-[:HAS_STAFF]->(s)
            """, {
                "idepisode": idepisode
            })

    # Fechar conexão
    neo4j_driver.close()

# Chamar a função para extrair dados do Oracle e inseri-los no Neo4j
extract_data_from_oracle_staff()


###  Inserção dos dados de Staff
<p align="justify">
A seguinte função "insert_data_to_neo4j_staff", é responsável por inserir os dados de pessoal (médicos, enfermeiros e técnicos) extraídos do Oracle no banco de dados Neo4j, criando nós para o pessoal e relacionando-os aos episódios, para isso, a função percorre as listas de appointments, hospitalizations e lab_screenings, preenchendo um dicionário staff_dict onde a chave é o idepisode e os valores são os IDs do médico, enfermeiro e técnico. Para cada idepisode no dicionário staff_dict, a função realiza duas operações principais, a criação do Nó de Pessoal, onde utiliza o comando MERGE para garantir que o nó de pessoal seja criado se não existir, ou atualizado se já existir e define as propriedades doctor, nurse e technician para o nó de pessoal,o relacionamento do Pessoal com o Episódio, onde utiliza o comando MATCH para encontrar o episódio e o pessoal no banco de dados e cria um relacionamento HAS_STAFF entre o episódio e o pessoal usando o comando MERGE.

In [None]:
def extract_data_from_oracle_staff_info():
    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de STAFF
    sql_staff = """
        SELECT 
            EMP_ID,
            EMP_FNAME,
            EMP_LNAME,
            DATE_JOINING,
            DATE_SEPERATION,
            EMAIL,
            ADDRESS,
            SSN,
            IDDEPARTMENT,
            IS_ACTIVE_STATUS
        FROM 
            staff
    """
    cursor.execute(sql_staff)
    staff_info = cursor.fetchall()

    # Fechar conexão
    cursor.close()
    connection.close()

    # Inserir os dados no Neo4j
    insert_data_to_neo4j_staff_info(staff_info)

def insert_data_to_neo4j_staff_info(staff_info):
    # Conectar ao Neo4j
    neo4j_driver = GraphDatabase.driver("bolt://localhost:7687", auth=("neo4j", "12345678"))
    with neo4j_driver.session() as session:
        for info in staff_info:
            emp_id = info[0]
            
            # Criar nó de Staff Information
            session.run("""
                MERGE (si:StaffInfo {EMP_ID: $EMP_ID})
                SET si.EMP_FNAME = $EMP_FNAME,
                    si.EMP_LNAME = $EMP_LNAME,
                    si.DATE_JOINING = $DATE_JOINING,
                    si.DATE_SEPERATION = $DATE_SEPERATION,
                    si.EMAIL = $EMAIL,
                    si.ADDRESS = $ADDRESS,
                    si.SSN = $SSN,
                    si.IDDEPARTMENT = $IDDEPARTMENT,
                    si.IS_ACTIVE_STATUS = $IS_ACTIVE_STATUS
            """, {
                "EMP_ID": info[0],
                "EMP_FNAME": info[1],
                "EMP_LNAME": info[2],
                "DATE_JOINING": info[3],
                "DATE_SEPERATION": info[4],
                "EMAIL": info[5],
                "ADDRESS": info[6],
                "SSN": info[7],
                "IDDEPARTMENT": info[8],
                "IS_ACTIVE_STATUS": info[9]
            })
            
            # Associar StaffInfo ao Staff (doctor, nurse, technician)
            session.run("""
                MATCH (s:Staff)
                WHERE s.doctor = $EMP_ID OR s.nurse = $EMP_ID OR s.technician = $EMP_ID
                MATCH (si:StaffInfo {EMP_ID: $EMP_ID})
                MERGE (s)-[:HAS_INFO]->(si)
            """, {
                "EMP_ID": emp_id
            })

    # Fechar conexão
    neo4j_driver.close()

# Chamar a função para extrair dados do Oracle e inseri-los no Neo4j
extract_data_from_oracle_staff_info()

## Indexação Neo4j

<p align="justify">
A indexação no Neo4j é um recurso fundamental para otimizar a eficiência das consultas nos bancos de dados orientados a grafos. Este recurso é especialmente valioso em contextos onde grandes volumes de dados estão envolvidos e a rapidez nas respostas é crucial. No Neo4j, a indexação permite um acesso mais rápido a nós e relações, utilizando propriedades específicas como referências.

<p align="justify">
Quando um índice é criado numa propriedade de um nó, como por exemplo o nome de um usuário, o Neo4j utiliza esse índice para acelerar as buscas que filtram, baseadas nessa propriedade específica. Isso elimina a necessidade de percorrer todo o grafo para encontrar os nós desejados, o que seria consideravelmente mais lento. Essa capacidade torna as operações de busca não apenas mais eficientes, mas também mais escaláveis à medida que o volume de dados cresce.

<p align="justify">
A criação de índices é feita através da linguagem de consulta Cypher, que é nativa do Neo4j. Por exemplo, para indexar uma propriedade de nome de usuário em nós do tipo “Usuário”, o comando seria algo como CREATE INDEX FOR (u:User) ON (u.username). Este comando instrui o Neo4j a preparar uma estrutura de dados especial que facilita buscas rápidas baseadas no nome de usuário.

<p align="justify">
Além de melhorar a performance das consultas, a indexação tem impactos significativos no planeamento e manutenção de sistemas que utilizam Neo4j. Embora seja uma poderosa ferramenta de otimização, índices requerem espaço adicional de armazenamento e podem tornar as operações de escrita ligeiramente mais lentas, já que cada atualização nos dados requer também uma atualização nos índices. Portanto, é crucial avaliar cuidadosamente quais propriedades se beneficiarão mais da indexação, a fim de equilibrar os benefícios com os custos associados.

<p align="justify">
Com o objetivo de melhorar o desempenho das consultas, criou-se índices no Neo4j para aquelas consultas que são executadas frequentemente:

- Indexação de Pacientes (Patient):
    - ID do Paciente (idpatient): Essencial para buscas rápidas e relacionamentos.

- Indexação de Episódios Médicos (Episode):
    - ID do Episódio (idepisode): Crucial para associar episódios a pacientes e outras entidades relacionadas, como consultas, contas e exames.

- Indexação de Consultas Médicas (Appointment):
    - ID do Médico (iddoctor) e ID do Episódio (idepisode): Importante para buscar consultas específicas e associá-las aos episódios médicos.

- Indexação de Quartos de Hospital (Room):
    - ID do Quarto (idroom): Útil para buscas de alocação de pacientes em quartos específicos.

- Indexação de Contas Hospitalares (Bill):
    - ID da Conta (idbill): Fundamental para acessar rapidamente detalhes financeiros.

- Indexação de Exames de Laboratório (LabScreening):
    - ID do Laboratório (lab_id): Essencial para acessar rapidamente os exames de laboratório de um paciente específico.

<p align="justify">
Cada um desses índices otimiza o desempenho ao reduzir o tempo necessário para localizar nós específicos em consultas comuns. Por exemplo, ao indexar idpatient em Patient, o Neo4j pode encontrar rapidamente todos os nós de pacientes específicos, assim como as suas relações com episódios, consultas, e outros dados relevantes sem a necessidade de percorrer todo o banco de dados.
<p align="justify">
A utilização de índices é um recurso valioso para garantir a eficiência operacional, especialmente em ambientes de dados grandes e complexos como os encontrados nos sistemas de informação hospitalar.

**Nota:** O código aqui apresentado está escrito em cypher 

- Índices para Pacientes (Patients)
    - // Índice composto para data de nascimento e gênero

        CREATE INDEX FOR (p:Patient) ON (p.BIRTHDAY, p.gender)

    - // Índice para número de seguro

        CREATE INDEX FOR (p:Patient) ON (p.policy_number)

- Índices para Consultas Médicas (Appointments)
    - // Índice para data agendada

        CREATE INDEX FOR (a:Appointment) ON (a.scheduled_on)

    - // Índice composto para médico e data da consulta

        CREATE INDEX FOR (a:Appointment) ON (a.iddoctor, a.appointment_date)

- Índices para Serviços (Services)
    - // Índice para identificação da fatura

        CREATE INDEX FOR (s:Service) ON (s.idbill)

    - // Índice para identificação do exame de laboratório

        CREATE INDEX FOR (s:Service) ON (s.lab_id)

- Índices para Funcionários (Staff)
    - // Índice para identificação do departamento

        CREATE INDEX FOR (sa:Staff) ON (sa.departmentId)

    - // Índice para tipo de funcionário

        CREATE INDEX FOR (sa:Staff) ON (sa.type)


Com o intuito de verificar a perfomance e a utilidade da indexação criada criaram-se as seguintes consultas

- Consultas para Pacientes (Patients) - Buscar Pacientes por Data de Nascimento e Gênero:

    MATCH (p:Patient)
    WHERE p = '1990-01-01' AND p.gender = 'M'
    RETURN p

- Consultas para Pacientes (Patients) - Buscar Paciente por Número de Seguro:

    MATCH (p:Patient)
    WHERE p.policy_number = 'PN123456'
    RETURN p

## Queries Neo4j

Com o objetivo de demonstrar a operabilidade da base de dados criada no Neo4j foram desenvolvidas as seguintes consultas de modo a demonstrar possívies aplicações da base de dados desenvolvida

**Nota:** O código apresentado foi escrito em cypher

- Informação sobre os quartos:

    MATCH (r:Room)<-[h:HAS_ROOM]-(episode:Episode)
    RETURN r.idroom, r.room_type, r.room_cost, episode.idepisode;

- Enfermeira responsável por episódio:

    MATCH (episode:Episode)-[hs:HAS_STAFF]->(staff:Staff)
    RETURN staff.nurse AS responsible_nurse, episode.idepisode;

- Staff por episódio:

    MATCH (episode:Episode)-[hs:HAS_STAFF]->(staff:Staff)
    RETURN episode.idepisode AS episode_id, 
           staff.doctor AS doctor_id,
        staff.technician AS technician_id,
        staff.nurse AS nurse_id;

- Informações sobre os pacientes, episódios, quartos e contas associadas:

    MATCH (p:Patient)-[:HAS_EPISODE]->(e:Episode)-[:HAS_ROOM]->(r:Room), 
        (e)-[:HAS_BILL]->(b:Bill)
    RETURN p, e, r, b;

- Consultar Dados de lab_screening

    MATCH (l:LabScreening)
    RETURN l.lab_id, l.test_cost, l.test_date, l.idtechnician, l.episode_idepisode;

- Consultar Dados de appointment, hospitalization e lab_screening para Staff

    - Consulta para Appointment:

        MATCH (a:Appointment)
        RETURN a.iddoctor, a.idepisode;


    - Consulta para Hospitalization:
        
        MATCH (h:Hospitalization)
        RETURN h.responsible_nurse, h.idepisode;

    - Consulta para Lab Screening:

        MATCH (l:LabScreening)
        RETURN l.idtechnician, l.episode_idepisode;

- Consultar Todos os Episódios com Exames de Laboratório Realizados:

    MATCH (e:Episode)-[:HAS_LAB]->(l:LabScreening)
    RETURN e, l;

- Consultar Dados de bill:
    
    MATCH (b:Bill)
    RETURN b.idbill, b.room_cost, b.test_cost, b.other_charges, b.total, b.idepisode, b.registered_at, b.payment_status;

- Consultar Dados de appointment

    MATCH (a:Appointment)
    RETURN a.scheduled_on, a.appointment_date, a.appointment_time, a.iddoctor, a.idepisode;

# Conclusão

Ao selecionar uma base de dados NoSQL, duas opções destacam-se: MongoDB e Neo4j. Cada uma oferece vantagens e desvantagens distintas.

O MongoDB destaca-se devido à flexibilidade do esquema, permitindo o armazenamento de documentos não estruturados ou em constante mudança sem a necessidade de um esquema predefinido. Esta característica é útil para dados dinâmicos e em constante evolução. Além disso, o MongoDB oferece excelente desempenho para operações como consultas, agregações e triggers, garantindo respostas rápidas e eficientes.

No entanto, a flexibilidade do MongoDB também apresenta desafios na migração de dados de bancos de dados relacionais. O processo pode ser complexo e levar à duplicação de dados ou à perda de informações cruciais. Além disso, a natureza flexível do esquema pode dificultar a manutenção da consistência dos dados, especialmente em ambientes distribuídos.

Em contrapartida, o Neo4j destaca-se pela estrutura de grafos, ideal para armazenar e gerenciar dados inter-relacionados, como redes sociais ou mapas mentais. Este modelo de dados permite consultas complexas e eficientes em relações entre entidades, tornando-o ideal para a exploração de conexões e interdependências.

Um dos pontos fortes do Neo4j é sua capacidade de lidar com dados repetidos sem gerar erros. Ao inserir dados duplicados, o Neo4j simplesmente atualiza as informações existentes, evitando problemas de consistência e simplificando o processo de gerenciamento de dados. Além disso, o uso de índices no Neo4j é menos relevante do que no MongoDB, pois o modelo de grafo já otimiza as consultas por natureza.

No entanto, o Neo4j exige um planejamento cuidadoso do esquema antes de armazenar dados. Essa rigidez pode ser um obstáculo para dados em constante mudança, exigindo constantes adaptações do modelo.

O Neo4j revelou-se como a melhor alternativa ao modelo relacional do hospital, devido à capacidade de lidar com dados inter-relacionados, à ausência de erros em inserções duplicadas, à menor relevância de índices, à flexibilidade do modelo lógico e ao excelente desempenho para consultas complexas. A migração de dados e a curva de aprendizado podem ser desafios, mas com planejamento e recursos adequados, a transição para o Neo4j trará benefícios significativos.
