# PASSOS DO TRABALHO

<p align="justify">
Para realizar o trabalho, os alunos devem utilizar um modelo relacional (fornecido pelo prof) e duas bases de dados não relacionais:  

- uma deve ser orientada para documentos (MongoDB);
- e a outra orientada para grafos (Neo4j). 

Após a familiarização com cada um dos modelos de base de dados, pretende-se que cada grupo realize as seguintes 
tarefas:

1. De acordo com o esquema relacional fornecido, **definir** e **explicar** os **processos necessários para migrar os dados fornecidos para os novos sistemas não relacionais**, de forma a maximizar cada um dos paradigmas.

2. **Definir e implementar um conjunto de consultas** que permitam demonstrar a operacionalidade dos sistemas sistemas implementados.

3. **Efetuar uma análise crítica do trabalho** realizado, **comparando**, sempre que possível, **os modelos** e funcionalidades agora implementados com os disponibilizados no sistema relacional fornecido.

No final dos trabalhos, cada grupo de trabalho deverá:
- elaborar um relatório técnico, sucinto e claro, que apresente de forma clara e detalhada o trabalho efectuado, apresentando de forma completa a SBD que implementou, bem como as diferentes estratégias de desenvolvimento adoptadas ao longo do seu processo de desenvolvimento.
</p>

# NOSQL - Trabalho prátrico

Autores: Amindo Machado (pg52170), Duarte Velho (pg53481), Mariana Oliveira (pg52648), Ricardo Oliveira (pg53501) e Rodrigo Esperança (pg50923)

<p align="justify">
Este trabalho foi desenvolvido no âmbito da UC Bases de Dados NoSQL (2023/24), do Mestrado em Bioinformática da Escola de Engenharia da Universidade do Minho, e tem como objetivo explorar diferentes paradigmas de base de dados, tendo como referências dois tipos de modelos, um modelo relacional e um modelo não relacional. 
</p>

<p align="justify">
As bases de dados SQL são utilizadas para organizar e gerenciar grandes volumes de dados, utilizando a linguagem SQL para interagir com os dados, permitindo consultas, manipulações e análises complexas. Embora estas bases de dados possuam várias vantagens tais como padronização, maturidade, escalabilidade, flexibilidade e segurança também apresentam algumas desvantagens e problemas que podem levar a que não seja o tipo de base de dados ideal para algumas aplicações devido: à sua complexidade, à necessidade de manutenção regular e a elevados custos de implementação juntamente com as limitações em termos de escabilidade horizontal. Tendo em conta os problemas enfrentados aquando da utilização de bases de dados SQL e devido às demandas das aplicações modernas que lidam com dados não estruturados ou semiestruturados, surgiu uma nova categoria denominada de bases de dados **NoSQL** (Not Only SQL). Estas novas bases de dados não se baseiam no modelo relacional tradicional utilizado nas bases de dados SQL, onde a rigidez e a complexidade do modelo relacional podem ser um obstaculo à sua utilização em aplicações modernas.
</p>

De entre as várias características associadas as bases de dados NOSQL destacam-se a seguintes:

- Flexibilidade do esquema: Permite o armazenamento dos dados sem necessidade de um esquema predefinido, adptando-se às necessidades da aplicação;

- Escabilidade Horizontal: Possibilita a distribuição de dados em vários servidores, facilitando o aumento da capacidade conforme o crescimento da demanda. Além disso, a distribuição dos dados em vários servidores garante a disponibilidade do sistema mesmo em caso de falhas;

- Alto desempenho: Estas bases de dados estão otimizadas para grandes volumes de dados e consultas complexas;

- Diversos modelos: Suportam diversos modelos de dados;

- Agilidade de desenvolvimento: Possibilitam um desenvolvimento mais rápido e ágil de aplicações devido à flexibilidade dos modelos de dados;

- Escabilidade superior: Suportam o crescimento exponencial dos dados sem existir comprometimento do desempenho;

- Baixo custo : Geralmente possuem custos de infraestrutura e licenciamento mais baixo do que as bases de dados SQL.


Embora as bases de dados NOSQL tenham surgido para culmatar alguns dos problemas inerentes à utilização de bases SQL existem ainda alguns desafios face à sua utilização que podem difultar a sua implementação em alguns cenários:

- Falta de padronização: A ausência de um padrão universal pode dificultar a interoperabilildade entre diferentes bases de dados NOSQL;

- Consistência dos dados: A consistência dos dados distribuídos em vários servidores é um desafio;

- Maturidade relativa: Como estas bases de dados ainda se encontram em desenvolvimento, existe menor disponibilidade de soluções maduras em comparação com as bases de dados SQL;

- Curva de aprendizagem: Necessidade de conhecimento específico para modelar, gerenciar e consultar dados.


Esta nova categoria de bases de dados é utilizada a nível das redes sociais, comércio eletrónico, aplicações móveis e análise de big data.


Tal como referido anteriormente, uma das características específicas deste tipo de base de dados e que lhe confere várias vantagens é a grande diversidade de modelos disponívies existindo, atualmente quatro grandes modelos:

- Chave-Valor: Este modelo armazena os dados em pares chave-valor, sendo caracterizados por serem simples e eficientes para consultas rápidas por chave, sendo por isso o modelo ideal para catálogos de produtos e sistemas de votação por exemplo (Redis);

- Documental: Estes modelos organizam os dados em documentos JSON, que são caracterizados como flexíveis e perfeitos para o armazenamento de informações semi-estruturadas tal como perfis de usários ou registros de atividade (MongoDB);

- Grafos: Neste tipo de modelos os dados são representados como entidades interligadas por relacionamentos sendo ideias para redes sociais ou análises de fraudes (Neo4j);

- Coluna: Armazenamento dos dados em colunas sendo um modelo que é otimizado para a análise de grandes volumes de dados com alta performance.


# Librarias e packages necessários

Nesta secção são importados os diversos packages necessários para a realização do trabalho prático.

In [2]:
import oracledb
import getpass
import cx_Oracle
import pymongo
from pymongo import MongoClient
import mysql.connector
from py2neo import Graph, Node, Relationship

<p align="justify">
A etapa inicial do trabalho consistiu em estabelecer uma conexão entre o Python e a base de dados Oracle. Isso implicou a especificação do utilizador, palavra-passe, anfitrião, porta e SID do Oracle, previamente definidos. Assim, tornou-se possível executar consultas e recuperar dados da base de dados, possibilitando a visualização de todas as informações lá contidas.
</p>

# Introdução

A base deste trabalho foi um conjunto de 17 tabelas que retratavam um Hospital. 

<p align="justify">
O objetivo principal deste trabalho passou por explorar diferentes paradigmas de base de dados, tendo como referências dois tipos de modelos, um modelo relacional e um modelo não relacional. Em particular, o modelo não relacional será o mais explorado, sendo que, com auxílio de código (maioritariamente em python) procedeu-se, através de uma estratégia definida e explicada posteriormente, à "conversão" do modelo relacional, já dado em modelos não relacionais, explorando as bases de dados MongoDB e Neo4j e seus respetivos paradigmas. 
</p>

<p align="justify">
Numa primeira fase, estabeleceu-se uma conexão com uma base de dados Oracle, utilizando as bibliotecas oracledb e getpass em Python. A biblioteca oracledb é usada para interagir com a base de dados Oracle, enquanto getpass permite solicitar de forma segura a senha do utilizador sem a exibir no terminal.
</p>

* Windows

In [24]:
# Pedir senha
password = getpass.getpass(prompt="Enter Oracle password: ")


# Conectar ao Oracle
connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
cursor = connection.cursor()

* MAC

In [62]:
#MACM1
connection = oracledb.connect(user="EU", password="12345678", dsn="localhost/ORCLCDB")
cursor = connection.cursor()

 # MongoDB

<p align="justify">
O MongoDB é uma das bases de dados NoSQL orientada a documentos não relacional, para armazenamento de dados em documentos do tipo JSON possibilitando uma estrutura de dados flexível e de facil integração. De entre as várias bases de dados NoSQL o MongoDB destaca-se por ser uma das escolhas mais comuns para o armazenamento de dados não estruturados sendo uma escolha popular para o armazenamento de dados não estruturados devido à facilidade com se consegue realizar escalamento horizontal, ao seu elevado desempenho e linguagem de consulta rica que permite a recuperação e manipulação complexa dos dados, sendo que, além disso, é uma base de dados que se integra perfeitamente com plataformas em nuvem.
</p>

Para navegar neste universo de dados é necessário a compreensão de conceitos básicos que definem a organização e o funcionamento do MongoDB:

- Coleções: Cada banco de dados no MongoDB pode conter diversas coleções (análogos das tabelas nas bases de dados relacional) sendo utilizadas para facilitar a organização e acesso dos dados;

- Documentos: Cada documento no MongoDB é uma estrutura de dados no formato JSON que contem pares chave-valor, onde a chave identifica o atributo enquanto o valor representa o dado associado a esse atributo. No entanto, o valor pode ser também um par chave-valor o que permite a criação de documentos dentro de documentos que são denominados por documentos aninhados.

## Criação das Coleções

<p align="justify">
De modo a realizar a transformação da base de dados do hospital (relacional) para o MongoDB, procedeu-se ao estabelecimento de uma conexão com uma base de dados MongoDB e criou-se coleções específicas utilizando a biblioteca pymongo em Python. A biblioteca pymongo fornece ferramentas para interagir com bases de dados MongoDB, facilitando a manipulação de dados e a gestão de coleções.
</p>
<p align="justify">
A ligação ao servidor MongoDB foi estabelecida no endereço localhost na parta 27017. Após a conexção com o servidor realizou-se a conexção com a base de dados denominada "Hospital" que vai armazenar as várias coleções e documentos criados. Para esta base de dados foram criadas quatro coleções: Patients (pacientes), Services (serviços), Appointments (consultas) e Staff (funcionários).
</p>

In [None]:
# ligação ao servidor mongo
client = MongoClient("localhost", 27017)


# Conexção à base de dados hospital, caso não exista é criada
db = client.Hospital


#criação das várias coleções
Patients = db.create_collection("Patients")
Services = db.create_collection("Services")
Appointments = db.create_collection("Appointments")
Staff = db.create_collection("Staff")

### Coleção **Pacientes**

A coleção pacientes foi criada com o intuito de facilitar o acesso a toda a informação relativa ao paciente permitindo o acesso aos dados acerca da seguradora, o histórico médico, entre outras informações associadas ao paciente de modo a reduzir a complexidade das consultas e aumentar a eficência do acesso aos dados.

Para criar esta coleção a partir da base de dados relacional é necessário realizar uma query que permita a extração da informação relativa a cada paciente que se encontra dispersa por várias entidades que estão centradas no paciente e que normalmente tendem a ser acessadas juntas.

Entidades envolvidas: 
* HOSPITAL_PATIENT
* HOSPITAL_INSURANCE
* HOSPITAL_MEDICAL_HISTORY
* HOSPITAL_EMERGENCY_CONTACT

Para se realizar a criação da coleção Patients (Pacientes), primeiramente é necessário proceder à extração dos dados das várias entidades. Com esse objetivo, definui-se a função extract_data_from_oracle_patients, que começa por realizar a conecção à base de dados relacional e posteriormente são realizadas quatro consultas independentes para extrair a informação das entidades envolvidas. A primeira consulta, extrai a informação da entidade HOSPITAL_PATIENT que contém os dados demográficos do paciente, que inclui, o id do paciente, nome, tipo sanguíneo, telefone, entre outros. A segunda consulta retira a informação contida na entidade HOSPITAL_INSURANCE que é utilizada para amazenar os dados referentes à apolice e ao seguro do paciente. A terceira consulta coleta o historial médico associado ao pacinete que se encontra armazenado na tabela HOSPITAL_MEDICAL_HISTORY. A quarta e última consulta é utilizada para recolher os contactos de emergência associados a cada paciente (HOSPITAL_EMERGENCY_CONTACT).
Os resultados de cada consulta realizada são então armazenados e posteriomente tratados e inseridos na coleção Patients através da utilização da função insert_data_to_mongodb_patients.
Esta função recebe os dados extraídos de cada tabela e cria um documento para cada paciente que posteriomente é inserido na coleção

In [None]:
def extract_data_from_oracle_patients():
    # Conecção à base de dados relacional e criação de cursor
    password = getpass.getpass(prompt="Enter Oracle password: ")
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para a extração dos dados da entidade HOSPITAL_PATIENT
    sql_patient = """
        SELECT 
            idpatient,     
            patient_fname, 
            patient_lname, 
            blood_type, 
            phone,         
            email,         
            gender,        
            policy_number, 
            BIRTHDAY
        FROM
            patient
    """
    
    # Armazenamento dos dados
    cursor.execute(sql_patient)
    patients = cursor.fetchall()

    # Consulta SQL para extração dos dados de HOSPITAL_INSURANCE
    sql_insurance = """
        SELECT 
            policy_number,  
            provider,       
            insurance_plan, 
            co_pay,         
            coverage,       
            maternity,      
            dental,         
            optical     
        FROM 
            insurance
    """

    # Armazenamento dos dados
    cursor.execute(sql_insurance)
    insurances = cursor.fetchall()
    
    # Consulta SQL para extração dos dados de HOSPITAL_MEDICAL_HISTORY
    sql_medical_history = """
        SELECT 
            record_id,   
            record_date, 
            idpatient   
        FROM 
            medical_history
    """

    # Armazenamento dos dados
    cursor.execute(sql_medical_history)
    medical_histories = cursor.fetchall()

    # Consulta SQL para extração dos dados de HOSPITAL_EMERGENCY_CONTACT
    sql_emergency_contact = """
        SELECT 
            contact_name, 
            phone,        
            relation,    
            idpatient  
        FROM 
            emergency_contact
    """
    
    # Armazenamento dos dados
    cursor.execute(sql_emergency_contact)
    emergency_contacts = cursor.fetchall()

    # Encerramento da conexão
    cursor.close(); connection.close()

    # Inserção dos dados na coleção MongoDB
    insert_data_to_mongodb_patients(patients, insurances, medical_histories, emergency_contacts)


def insert_data_to_mongodb_patients(patients, insurances, medical_histories, emergency_contacts):
    # Conecção à coleção no MongoDB
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    collection = db['Patients']

    # Converter insurances em um dicionário para acesso rápido
    insurance_dict = {insurance[0]: insurance for insurance in insurances}

    # Converter medical_histories e emergency_contacts em dicionários para acesso rápido
    medical_history_dict = {}
    for history in medical_histories:
        if history[2] not in medical_history_dict:
            medical_history_dict[history[2]] = []
        medical_history_dict[history[2]].append(history)
    
    emergency_contact_dict = {}
    for contact in emergency_contacts:
        if contact[3] not in emergency_contact_dict:
            emergency_contact_dict[contact[3]] = []
        emergency_contact_dict[contact[3]].append(contact)

    # Formatar os dados e inserir na coleção MongoDB
    for patient in patients:
        patient_id = patient[0]
        policy_number = patient[7]

        # Informações de seguro
        insurance_data = insurance_dict.get(policy_number, [None]*8)
        
        # Informações de histórico médico
        medical_history_data = medical_history_dict.get(patient_id, [])
        
        # Informações de contato de emergência
        emergency_contact_data = emergency_contact_dict.get(patient_id, [])

        patient_data = {
            "idpatient": patient_id, "patient_fname": patient[1], "patient_lname": patient[2],
            "blood_type": patient[3], "phone": patient[4], "email": patient[5],
            "gender": patient[6], "policy_number": policy_number, "BIRTHDAY": patient[8],
            "insurance": {
                "provider": insurance_data[1], "insurance_plan": insurance_data[2],
                "co_pay": insurance_data[3], "coverage": insurance_data[4], "maternity": insurance_data[5],
                "dental": insurance_data[6], "optical": insurance_data[7]
                },
            "medical_history": [{
                "record_id": history[0], "record_date": history[1]
            } for history in medical_history_data],
            "emergency_contacts": [{
                "contact_name": contact[0], "phone": contact[1], "relation": contact[2]
            } for contact in emergency_contact_data]
        }
        collection.insert_one(patient_data)

    # Encerramento da conexão
    client.close()


In [None]:
# Extração dos dados do Oracle e inserção no MongoDB
extract_data_from_oracle_patients()

### Coleção **Consulta**

A segunda coleção criada corresponde às concultas (Appointments) e foram mantidos em uma coleção separada, uma vez que constituem um ponto de interação frequente e independente com o sistema, onde o acesso rápido e a atualização dos dados é crítico

Entidades Incluídas: 
* HOSPITAL_APPOINTMENT

O código desenvolvido para a criação desta coleção possui duas etapas principais. A primeira etapa corresponde à extração dos dados da tabela "Appointments", para isso criou-se a função extract_data_from_oracle_app que vai realizar a conecção com a base de dados relacional. Em seguida é realizada uma consulta que permite recuperar os dados armazenados na entidade incluída. A informação contida nesta tabela permite saber a data de agendamento da consulta (scheduled_on), a data da consulta (appointment_date) e a que horas será realizada (appointment_time), além disso, também permite saber quem é o médico responsável pela consulta (iddoctor) e o id do episódio clínico associado (idepisode). Posteriormente, o resultado da consulta é transformado em vários documentos do tipo JSON (cada documento corresponde a uma consulta) que são inseridos na coleção.


In [28]:
def extract_data_from_oracle_app():

    # Conecção à base de dados Oracle e criação do cursor
    password = getpass.getpass(prompt="Enter Oracle password: ")
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de HOSPITAL_APPOINTMENT
    sql_appointment = """
        SELECT 
            scheduled_on,
            appointment_date,
            appointment_time,
            iddoctor,
            idepisode
        FROM 
            APPOINTMENT
    """

    cursor.execute(sql_appointment)
    appointments = cursor.fetchall()

    # Encerramento da conexão
    cursor.close(); connection.close()

    # Inserção dos dados na coleção
    insert_data_to_mongodb_app(appointments)


def insert_data_to_mongodb_app(appointments):
    
    # Conecção à base de dados Hospital e a coleção Appointments no MongoDB
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    collection = db['Appointments']

    # Formatação e inserção do documento na coleção
    for appointment in appointments:
        appointment_data = {
            "scheduled_on": appointment[0],
            "appointment_date": appointment[1],
            "appointment_time": appointment[2],
            "iddoctor": appointment[3],
            "idepisode": appointment[4],
        }
        collection.insert_one(appointment_data)

    # Encerramento da conexão
    client.close()

In [29]:
# Extração e inserção dos dados na coleção
extract_data_from_oracle_app()

### Coleção **Serviços**

Com o intuito de facilitar o rastreamento do atendimento de um determinado paciente e da faturação criou-se a coleção "Services", uma vez que um episódio de atendimento a um paciente normalmente envolve a alocação de um quarto, exames laboratorias e despesas hospitalares que necessitam de ser geridas de forma eficiente e ponderada de modo a garantir o perfeito funcionamento do hospital e o bom atendimento dos pacientes evitando constrangimentos no serviço ou possíveis cenários de negligência.

Entidades Incluídas: 
* HOSPITAL_EPISODE
* HOSPITAL_ROOM
* HOSPITAL_BILL 
* HOSPITAL_LAB_SCREENING

Tal como para as coleções anteriores, foram definidas duas funções de modo a auxiliar a passagem dos dados da base de dados relacional para o MongoDB. A função **extract_data_from_oracle_services** é utilizada para realizar a extração dos dados e posteriomente chama a segunda função que é responsável pelo tratamento e inserção dos dados na coleção realizando assim a migração para o MongoDB. A função de extração realiza 4 consultas SQL separadas para recuperar os dados de tabelas relacionadas. A primeria consulta coleta as informações básicas de um determinado atendimento tal como o id do espisódio e o id do paciente da tabela HOSPITAL_EPISODE. A segunda consulta é realizada com o objetivo de extrair a informação relativa ao quarto utilizado (HOSPITAL_ROOM). De modo a coletar a informação relativa à faturação de um determinado espisódio, realizou-se uma terceira consulta que incide sobre a entidade HOSPITAL_BILL, uma vez que nesta tabela são armazenados todos os dados referentes a uma determinada fatura incluindo o estado, isto é se a fatura foi líquidade ou se o hospital ainda agurada o pagamento. Por fim, a ultima consulta realizada, vai recolher as informações relativas aos exames laboratoriais que inclui, o custo, a data do exame e o id do técnico. Os resultados das consultas foram armazenados e posteriomente utilizados na segunda função que realiza a criação dos vários documentos tipo JSON que posteriomente são inseridos na coleção "Services". É importante ressalvar que antes de se realizar a inserção de um novo documento, realiza-se a limpeza da coleção de modo a evitar a existência de duplicados.


In [None]:
def extract_data_from_oracle_services():

    # Conecção à bases de dados Oracle
    password = getpass.getpass(prompt="Enter Oracle password: ")
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extração dos dados de HOSPITAL_EPISODE
    sql_episode = """
        SELECT 
            idepisode,
            patient_idpatient
        FROM 
            episode
    """

    # Armazenamento da consulta
    cursor.execute(sql_episode)
    episodes = cursor.fetchall()

    # Consulta SQL para extração dos dados de HOSPITAL_ROOM
    sql_room = """
        SELECT 
            r.idroom,
            r.room_type,
            r.room_cost,
            h.idepisode
        FROM 
            room r
        INNER JOIN hospitalization h ON r.idroom = h.room_idroom
    """
    
    # Armazenamento da consulta
    cursor.execute(sql_room)
    rooms = cursor.fetchall()

    # Consulta SQL para extração dos dados de HOSPITAL_BILL
    sql_bill = """
        SELECT 
            b.idbill,
            b.room_cost,
            b.test_cost,
            b.other_charges,
            b.total,
            b.idepisode,
            b.registered_at,
            b.payment_status
        FROM 
            bill b
        INNER JOIN hospitalization h ON b.idepisode = h.idepisode
    """
    
    # Armazenamento da consulta
    cursor.execute(sql_bill)
    bills = cursor.fetchall()

    # Consulta SQL para extração dos dados de HOSPITAL_LAB_SCREENING
    sql_lab_screening = """
        SELECT 
            ls.lab_id,
            ls.test_cost,
            ls.test_date,
            ls.idtechnician,
            h.idepisode
        FROM 
            lab_screening ls
        INNER JOIN hospitalization h ON ls.episode_idepisode = h.idepisode
    """

    # Armazenamento da consulta
    cursor.execute(sql_lab_screening)
    lab_screenings = cursor.fetchall()

    # Fechar conexão
    cursor.close(); connection.close()

    # Inserção dos dados na coleção
    insert_data_to_mongodb_services(episodes, rooms, bills, lab_screenings)


def insert_data_to_mongodb_services(episodes, rooms, bills, lab_screenings):

    # Conecção à base de dados e à respetiva coleção
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    collection = db['Services']

    # Limpar a coleção existente antes de inserir novos dados
    collection.delete_many({})

    # Inserir os dados na coleção MongoDB
    for episode in episodes:
        episode_data = {
            "idepisode": episode[0],
            "patient_idpatient": episode[1],
            "room": [],
            "bill": [],
            "lab_screening": []
        }
        for room in rooms:
            if room[3] == episode[0]:
                episode_data["room"].append({
                    "idroom": room[0],
                    "room_type": room[1],
                    "room_cost": room[2]
                })
        for bill in bills:
            if bill[5] == episode[0]:
                episode_data["bill"].append({
                    "idbill": bill[0],
                    "room_cost": bill[1],
                    "test_cost": bill[2],
                    "other_charges": bill[3],
                    "total": bill[4],
                    "registered_at": bill[6],
                    "payment_status": bill[7]
                })
        for lab_screening in lab_screenings:
            if lab_screening[4] == episode[0]:
                episode_data["lab_screening"].append({
                    "lab_id": lab_screening[0],
                    "test_cost": lab_screening[1],
                    "test_date": lab_screening[2],
                    "idtechnician": lab_screening[3]
                })
        collection.insert_one(episode_data)

    # Fechar conexão
    client.close()


In [None]:
# Extração e inserção dos dados na respetiva coleção
extract_data_from_oracle_services()

### Coleção Staff

Entidades Incluídas: 
* HOSPITAL_DOCTOR;
* HOSPITAL_NURSE;
* HOSPITAL_TECHNICIAN.

Integrar os dados de todos os profissionais de saúde numa única coleção permite uma gestão unificada do pessoal, assim como simplifica a atribuição e consulta de responsabilidades do staff.

In [None]:
def extract_data_from_oracle():
    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de STAFF
    sql_staff = """
        SELECT 
            EMP_ID,
            EMP_FNAME,
            EMP_LNAME,
            DATE_JOINING,
            DATE_SEPERATION,
            EMAIL,
            ADDRESS,
            SSN,
            IDDEPARTMENT,
            IS_ACTIVE_STATUS
        FROM 
            STAFF
    """
    cursor.execute(sql_staff)
    staff = cursor.fetchall()

    # Consulta SQL para extrair os dados de NURSE
    sql_nurse = "SELECT STAFF_EMP_ID FROM NURSE"
    cursor.execute(sql_nurse)
    nurses = cursor.fetchall()

    # Consulta SQL para extrair os dados de DOCTOR
    sql_doctor = "SELECT EMP_ID FROM DOCTOR"
    cursor.execute(sql_doctor)
    doctors = cursor.fetchall()

    # Consulta SQL para extrair os dados de TECHNICIAN
    sql_technician = "SELECT STAFF_EMP_ID FROM TECHNICIAN"
    cursor.execute(sql_technician)
    technicians = cursor.fetchall()

    # Consulta SQL para extrair os dados de HOSPITALIZATION
    sql_hospitalization = "SELECT RESPONSIBLE_NURSE, IDEPISODE FROM HOSPITALIZATION"
    cursor.execute(sql_hospitalization)
    hospitalizations = cursor.fetchall()

    # Consulta SQL para extrair os dados de APPOINTMENT
    sql_appointment = "SELECT IDDOCTOR, IDEPISODE FROM APPOINTMENT"
    cursor.execute(sql_appointment)
    appointments = cursor.fetchall()

    # Consulta SQL para extrair os dados de LAB_SCREENING
    sql_lab_screening = "SELECT IDTECHNICIAN, EPISODE_IDEPISODE FROM LAB_SCREENING"
    cursor.execute(sql_lab_screening)
    lab_screenings = cursor.fetchall()

    # Fechar conexão
    cursor.close()
    connection.close()

    # Inserir os dados na coleção MongoDB
    insert_data_to_mongodb(staff, nurses, doctors, technicians, hospitalizations, appointments, lab_screenings)

def insert_data_to_mongodb(staffs, nurses, doctors, technicians, hospitalizations, appointments, lab_screenings):
    # Conectar ao MongoDB
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    collection = db['Staff']

    # Convert lists to sets for faster lookup
    nurse_set = {nurse[0] for nurse in nurses}
    doctor_set = {doctor[0] for doctor in doctors}
    technician_set = {technician[0] for technician in technicians}

    # Create dictionaries for episode lookups
    nurse_episodes = {}
    for hosp in hospitalizations:
        if hosp[0] in nurse_episodes:
            nurse_episodes[hosp[0]].append(hosp[1])
        else:
            nurse_episodes[hosp[0]] = [hosp[1]]
    
    doctor_episodes = {}
    for appt in appointments:
        if appt[0] in doctor_episodes:
            doctor_episodes[appt[0]].append(appt[1])
        else:
            doctor_episodes[appt[0]] = [appt[1]]
    
    technician_episodes = {}
    for lab in lab_screenings:
        if lab[0] in technician_episodes:
            technician_episodes[lab[0]].append(lab[1])
        else:
            technician_episodes[lab[0]] = [lab[1]]

    # Formatar os dados e inserir na coleção MongoDB
    for staff in staffs:
        emp_id = staff[0]
        type_ = "none"
        idepisodes = []

        if emp_id in nurse_set:
            type_ = "nurse"
            idepisodes = nurse_episodes.get(emp_id, [])
        elif emp_id in doctor_set:
            type_ = "doctor"
            idepisodes = doctor_episodes.get(emp_id, [])
        elif emp_id in technician_set:
            type_ = "technician"
            idepisodes = technician_episodes.get(emp_id, [])

        staff_data = {
            "_id": emp_id,
            "firstName": staff[1],
            "lastName": staff[2],
            "joiningDate": staff[3],
            "separationDate": staff[4],
            "email": staff[5],
            "address": staff[6],
            "ssn": staff[7],
            "departmentId": staff[8],
            "isActiveStatus": staff[9],
            "type": type_,
            "idepisodes": idepisodes
        }
        collection.insert_one(staff_data)

    # Fechar conexão
    client.close()

# Chamar a função principal para extrair dados do Oracle e inseri-los no MongoDB
extract_data_from_oracle()

## Indexação no MongoDB

<p align="justify">
A indexação no MongoDB é uma técnica fundamental para aumentar a eficiência das consultas. Sem a presença de índices, o MongoDB precisa de percorrer todos os documentos de uma coleção para encontrar aqueles que correspondem aos critérios da consulta, resultando numa operação altamente ineficiente e que demanda o processamento de um grande volume de dados.
</p>
<p align="justify">
Os índices são estruturas de dados especiais que armazenam uma pequena porção dos conjuntos de dados, facilitando o processamento das consultas. Eles armazenam os valores de campos específicos ou de conjuntos de campos, ordenados conforme especificado no índice. Isso permite ao MongoDB localizar rapidamente os documentos correspondentes sem precisar verificar cada documento na coleção, melhorando significativamente a performance das operações de leitura.
</p>

In [24]:
# Conectar ao MongoDB
client = MongoClient('mongodb://localhost:27017/')
db = client['Hospital']
    
# Selecionar coleções
collection_p = db['Patients']
collection_a = db['Appointments']
collection_s = db['Services']
collection_sa = db['Staff']

# Criar índices nas coleções
collection_p.create_index([("idepisode", 1)])
collection_p.create_index([("BIRTHDAY", 1), ("gender", 1)])
collection_a.create_index([("scheduled_on", 1)])
collection_a.create_index([("status", 1)])
collection_s.create_index([("idbill", 1)])
collection_s.create_index([("type", 1)])
collection_sa.create_index([("_id", 1)])
collection_sa.create_index([("specialty", 1)])

# Fechar conexão
client.close()

#### Consultas

In [25]:
# Consulta para encontrar pacientes nascidos em uma data específica e do sexo masculino
patients = collection_p.find({"BIRTHDAY": "1988-08-29T00:00:00.000+00:00", "gender": "Female"})

# Consulta para listar todos os compromissos com status 'agendado'
appointments = collection_a.find({"status": "PENDING"})

# Consulta para encontrar todos os serviços do tipo 'Radiografia'
services = collection_s.find({"type": "Radiography"})

# Consulta para encontrar todo o staff com especialidade em 'Cardiologia'
staff_members = collection_sa.find({"specialty": "Cardiology"})

##  Procedures no MongoDB

<p align="justify">
No mongo, a criação de procedimentos não é idêntica ao Oracle, todavia é possível alcançar resultados semelhantes utilizando certas operações específicas.
Com isto, optou-se por criar alguns "procedimentos" no script em Oracle.
</p>
<p align="justify">
A seguinte função criada, acede à coleção appointments no MongoDB criada anteriormente, recupera o documento com a informação dos agendamentos com base na data fornecida e realiza a verificação do calendário de acordo com o que está definido na função, ou seja permite uma atualização do agendamento da consultas tendo obviamente como referência a data do mesmo.
</p>

In [None]:
def update_appointment_schedule( scheduled_on, appointment_date, appointment_time, iddoctor, idepisode):
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    

    # Recupere o documento de agendamento
    appointment_document = collection_a.find_one({scheduled_on: scheduled_on})

    if appointment_document:
        # Atualizar o agendamento existente
        collection_a.update_one(
            {"scheduled_on": scheduled_on},
            {"$set": {
            
                "appointment_date": appointment_date,
                "appointment_time": appointment_time,
                "iddoctor": iddoctor,
                "idepisode": idepisode
            }}
        )
        print(f"Agendamento com scheduled_on {scheduled_on} atualizado com sucesso.")
    else:
        # Inserir um novo agendamento
        new_appointment = {
            "scheduled_on": scheduled_on,
            "appointment_date": appointment_date,
            "appointment_time": appointment_time,
            "iddoctor": iddoctor,
            "idepisode": idepisode
        }
        collection_a.insert_one(new_appointment)
        print(f"Novo agendamento com scheduled_on {scheduled_on} inserido com sucesso.")

    # Fechar conexão
    client.close()

# Exemplo de chamada da função
update_appointment_schedule(
    scheduled_on="2024-05-30T14:00:00Z",
    appointment_date="2024-06-05",
    appointment_time="10:00",
    iddoctor=101,
    idepisode=202
)

In [None]:
#A próxima query ajuda a verificar o Procedure a funcionar
documents = collection_a.find({"scheduled_on":"2024-05-30T14:00:00Z"})
for i in documents:
    print(i)
    break

<p align="justify">
O procedimento seguinte acedeu novamente à coleção appointments e procurou todos os documentos que correspondem à data específica fornecida como argumento da função. Isto é util pelo que permite obter rapidamente uma lista de todos os compromissos de um dia específico de maneira a garantir um fácil acesso aos dados.
</p>

In [None]:
def get_appointments_by_date(appointment_date):
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    
    # Recuperar os documentos de agendamento com a data especificada
    appointments = collection_a.find({"appointment_date": appointment_date})

    # Imprimir cada agendamento encontrado
    for appointment in appointments:
        print(appointment)
    
    # Fechar a conexão
    client.close()

# Exemplo de chamada da função
get_appointments_by_date("2024-06-10")

<p align="justify">
A função permite recuperar e exibir todos os agendamentos associados a um médico específico na coleção appointments. Conseguimos rapidamente visualizar todos os agendamentos atribuídos a esse médico para permitir controlar e evitar conflitos na sobreposição de agendamentos.
</p>

In [None]:
def get_appointments_by_doctor(iddoctor):
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    
    # Recuperar os documentos de agendamento com o ID do médico
    appointments = collection_a.find({"iddoctor": iddoctor})

    # Imprimir cada agendamento encontrado
    for appointment in appointments:
        print(appointment)
    
    client.close()

# Exemplo de chamada da função
get_appointments_by_doctor(101)

<p align="justify">
Esta função permite atualizar o médico associado a um agendamento específico, identificando o agendamento pela data e hora. Esta funcionalidade é útil para gerir alterações nos compromissos médicos, garantindo que as informações do médico sejam sempre atualizadas.
</p>

In [None]:
def update_doctor_of_appointment(scheduled_on, new_iddoctor):
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    
    # Atualizar o documento de agendamento com a nova identificação do médico
    result = collection_a.update_one(
        {"scheduled_on": scheduled_on},
        {"$set": {"iddoctor": new_iddoctor}}
    )

    # Verificar se o documento foi atualizado
    if result.matched_count > 0:
        print(f"Agendamento com scheduled_on {scheduled_on} atualizado com um novo ID de médico {new_iddoctor}.")
    else:
        print(f"Nenhum agendamento encontrado com scheduled_on {scheduled_on}.")
    
    # Fechar a conexão
    client.close()

# Exemplo de chamada da função
update_doctor_of_appointment("2024-05-30T14:00:00Z", 105)

## Agregação e Views no MongoDB

<p align="justify">
No MongoDB, o framework de agregação é uma ferramenta poderosa que permite processar dados e realizar operações complexas de transformação, semelhante a uma pipeline, onde os dados passam por várias etapas de processamento antes de produzir o resultado final. Essa capacidade de agregação é fundamental para realizar análises profundas e extração de insights significativos de grandes volumes de dados, especialmente útil em ambientes que demandam análise rápida e eficiente, como big data e análise de dados em tempo real.
</p>
<p align="justify">
Uma pipeline de agregação no MongoDB é composta por vários estágios, onde cada estágio transforma os documentos à medida que eles passam pela pipeline. Os estágios podem incluir operações como filtragem ($match), agrupamento ($group), projeção ($project), ordenação ($sort), limitação ($limit), entre outros. Esses estágios são configurados de forma sequencial, e o output de um estágio é passado como input para o próximo, permitindo a criação de processamentos complexos e customizados. Por exemplo, pode-se começar com um estágio de match para filtrar documentos baseados em critérios específicos, seguido de um estágio de group para agrupar esses documentos por um ou mais campos, e talvez terminar com um estágio de sort para ordenar os resultados por algum critério de interesse.
</p>
<p align="justify">
Além das agregações, o MongoDB também suporta a criação de "views" que são, de certa forma, semelhantes às views em bancos de dados relacionais. Uma view no MongoDB é uma representação virtual de um resultado de uma agregação que pode ser tratada quase da mesma forma que se trata uma coleção regular. Uma vez criada, a view pode ser consultada como se fosse uma coleção, mas sem ocupar espaço adicional para armazenamento, pois os dados na view são gerados dinamicamente a partir da coleção original sempre que a view é acessada. Isso é particularmente útil para expor um subconjunto de dados ou uma transformação específica de dados sem duplicar informações no banco de dados, facilitando manutenções e atualizações ao isolar a lógica de transformação de dados em um único local.
</p>
<p align="justify">
As views são definidas a partir de uma pipeline de agregação e são armazenadas no banco de dados como uma definição, não como dados físicos. Quando um usuário consulta uma view, o MongoDB executa a pipeline de agregação associada para gerar o resultado em tempo real. Isso proporciona uma camada adicional de abstração e segurança, permitindo que os administradores limitem a visibilidade dos dados aos usuários finais, mostrando apenas os dados transformados e relevantes.
</p>
<p align="justify">
Assim, enquanto as agregações fornecem um método dinâmico e poderoso para analisar e transformar dados em MongoDB, as views oferecem uma maneira eficiente e segura de acessar e apresentar esses dados, mantendo a integridade e o controle sobre a informação original armazenada no banco de dados. Ambas as funcionalidades, quando utilizadas adequadamente, permitem que os desenvolvedores e analistas de dados maximizem a utilidade dos dados armazenados no MongoDB, criando soluções eficientes e escaláveis para gestão de dados e análise.
</p>
<p align="justify">
O módulo não inclui pacotes para criação direta das views, ou seja, isso apenas é conseguido correndo diretamente na base de dados. No entanto, é possível criar agregações que podem dar informações úteis, como exemplo, explorar se um medico deste hospital também é um paciente do mesmo. Para isso, criou-se uma agregação que compara os primeiro e último nomes dos médicos e dos pacientes da loja online.
</p>

In [None]:
#RESOLVER PROBLEMAS NO SEGUINTE CODIGO COM IDS

def find_matching_documents():
    
    pipeline = [
        {
            "$lookup": {
                "from": "Patients",
                "let": {"firstname": "$FIRST_NAME", "lastname": "$LAST_NAME"},
                "pipeline": [
                    {
                        "$match": {
                            "$expr": {
                                "$and": [
                                    {"$eq": ["$$firstname", "$patient_fname"]},
                                    {"$eq": ["$$lastname", "$patient_lname"]}
                                ]
                            }
                        }
                    }
                ],
                "as": "matching_patients"
            }
        },
        {
            "$match": {
                "matching_patients": {"$ne": []}
            }
        },
        {
            "$project": {
                "_id": 0,
                "staff_firstName": "$FIRST_NAME",
                "staff_lastName": "$LAST_NAME",
                "matching_patients": 1
            }
        }
    ]

    aggregation_result = collection_sa.aggregate(pipeline)

    for result in aggregation_result:
        print(result)

   

# Exemplo de uso da função

# Exemplo de uso da função
find_matching_documents()

#Fazer Querys para Mongo

## Triggers

Os triggers no MongoDB são usados para responder a eventos específicos que ocorrem na base de dados, permitindo que o código seja executado de forma automática em resposta a mudanças nos dados que podem pasar por, inserções, atualizações ou exclusões. A utilização de trigers é um aspeto essêncial para a manutenção da consistência dos dados podendo ainda ser utilizados para realizar cálculos, envio notificações entre outras aplicações, sem a necessidade de intervenção manual.

Tipos de Triggers no MongoDB Atlas
1.⁠ ⁠Database Triggers: Executam funções em resposta a mudanças em documentos em uma coleção.
2.⁠ ⁠Scheduled Triggers: Executam funções em intervalos de tempo específicos, semelhantes a um cron job.
3.⁠ ⁠Authentication Triggers: Executam funções em resposta a eventos de autenticação, como criação de usuários ou login.


Através do MongoDB Atlas criamos então um Database Trigger configurado para ser acionado sempre que um novo documento é inserido na coleção Appointments. Ele tem como objetivo notificar o paciente sobre quantos dias faltam até a consulta assim que uma nova consulta é marcada.

Funcionamento
1.⁠ ⁠Quando é acionado: O trigger é ativado quando um novo documento (uma nova consulta) é inserido na coleção appointments.
2. 
3.⁠ ⁠Ação executada:
    * Calcula o número de dias restantes até a data da consulta.
    * Busca o e-mail do paciente correspondente na coleção patients com base no idepisode.
    * Envia um e-mail ao paciente informando a data da consulta e quantos dias faltam.

# Neo4j

<p align="justify">
A Neo4j, é uma plataforma de banco de dados orientada a grafos, projetada para modelar, armazenar e consultar dados que têm uma forte componente relacional. Diferente dos bancos de dados relacionais tradicionais, que utilizam tabelas para armazenar dados, o Neo4j usa uma estrutura baseada em grafos composta por nós (que representam entidades) e relações (que conectam essas entidades), permitindo uma representação mais natural e eficiente de redes complexas. Cada nó e relacionamento pode ter propriedades adicionais, como pares de chave-valor, proporcionando uma grande flexibilidade na modelagem de dados. A consulta no Neo4j é realizada através de uma linguagem de consulta específica chamada Cypher, que é intuitiva e poderosa, permitindo explorar padrões de relacionamentos de maneira eficiente. Devido à sua capacidade de lidar com grandes volumes de dados interconectados, o Neo4j é amplamente utilizado em diversas áreas, como análise de redes sociais, recomendações de produtos, detecção de fraudes e gerenciamento de redes de conhecimento. A sua arquitetura permite consultas rápidas e desempenho escalável, tornando-o uma escolha popular para aplicações que requerem uma exploração profunda e em tempo real das interconexões entre dados.
</p>

* Tendo em conta a coleção pacientes

In [12]:
def extract_data_from_oracle():
    print("Extraindo dados do Oracle...")

    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de HOSPITAL_PATIENT
    sql_patient = """
        SELECT 
            idpatient,     
            patient_fname, 
            patient_lname, 
            blood_type, 
            phone,         
            email,         
            gender,        
            policy_number, 
            BIRTHDAY
        FROM
            patient
    """
    cursor.execute(sql_patient)
    patients = cursor.fetchall()
    print(f"Pacientes extraídos: {len(patients)}")

    # Consulta SQL para extrair os dados de HOSPITAL_INSURANCE
    sql_insurance = """
        SELECT 
            policy_number,  
            provider,       
            insurance_plan, 
            co_pay,         
            coverage,       
            maternity,      
            dental,         
            optical     
        FROM 
            insurance
    """
    cursor.execute(sql_insurance)
    insurances = cursor.fetchall()
    print(f"Seguros extraídos: {len(insurances)}")
    
    # Consulta SQL para extrair os dados de HOSPITAL_MEDICAL_HISTORY
    sql_MEDICAL_HISTORY = """
        SELECT 
            record_id,   
            record_date, 
            idpatient   
        FROM 
            MEDICAL_HISTORY
    """
    cursor.execute(sql_MEDICAL_HISTORY)
    medical_histories = cursor.fetchall()
    print(f"Históricos médicos extraídos: {len(medical_histories)}")

    # Consulta SQL para extrair os dados de HOSPITAL_EMERGENCY_CONTACT
    sql_emergency_contact = """
        SELECT 
            contact_name, 
            phone,        
            relation,    
            idpatient  
        FROM 
            emergency_contact
    """
    cursor.execute(sql_emergency_contact)
    emergency_contacts = cursor.fetchall()
    print(f"Contatos de emergência extraídos: {len(emergency_contacts)}")

    # Fechar conexão
    cursor.close()
    connection.close()

    return patients, insurances, medical_histories, emergency_contacts

def insert_data_to_neo4j(patients, insurances, medical_histories, emergency_contacts):
    print("Inserindo dados no Neo4J...")

    graph = Graph("bolt://localhost:7687", auth=("neo4j", "12345678"))  # Substitua "your_password" pela senha do seu Neo4j

    # Inserir pacientes
    for patient in patients:
        patient_node = Node("Patient", idpatient=patient[0], patient_fname=patient[1], patient_lname=patient[2], 
                            blood_type=patient[3], phone=patient[4], email=patient[5], gender=patient[6], 
                            policy_number=patient[7], birthday=patient[8])
        graph.create(patient_node)
        print(f"Paciente inserido: {patient[1]} {patient[2]}")

    # Inserir seguros
    for insurance in insurances:
        insurance_node = Node("Insurance", policy_number=insurance[0], provider=insurance[1], insurance_plan=insurance[2], 
                              co_pay=insurance[3], coverage=insurance[4], maternity=insurance[5], dental=insurance[6], 
                              optical=insurance[7])
        graph.create(insurance_node)
        graph.run("MATCH (p:Patient {policy_number: $policy_number}), (i:Insurance {policy_number: $policy_number}) "
                  "CREATE (p)-[:HAS_INSURANCE]->(i)", policy_number=insurance[0])
        print(f"Seguro inserido: {insurance[1]}")

    # Inserir históricos médicos
    for medical_history in medical_histories:
        medical_history_node = Node("MedicalHistory", record_id=medical_history[0], record_date=medical_history[1])
        graph.create(medical_history_node)
        graph.run("MATCH (p:Patient {idpatient: $idpatient}), (m:MedicalHistory {record_id: $record_id}) "
                  "CREATE (p)-[:HAS_MEDICAL_HISTORY]->(m)", idpatient=medical_history[2], record_id=medical_history[0])
        print(f"Histórico médico inserido: {medical_history[0]}")

    # Inserir contatos de emergência
    for emergency_contact in emergency_contacts:
        emergency_contact_node = Node("EmergencyContact", contact_name=emergency_contact[0], phone=emergency_contact[1], 
                                      relation=emergency_contact[2])
        graph.create(emergency_contact_node)
        graph.run("MATCH (p:Patient {idpatient: $idpatient}), (e:EmergencyContact {contact_name: $contact_name}) "
                  "CREATE (p)-[:HAS_EMERGENCY_CONTACT]->(e)", idpatient=emergency_contact[3], contact_name=emergency_contact[0])
        print(f"Contato de emergência inserido: {emergency_contact[0]}")

# Extrair dados do Oracle e inseri-los no Neo4J
patients, insurances, medical_histories, emergency_contacts = extract_data_from_oracle()
insert_data_to_neo4j(patients, insurances, medical_histories, emergency_contacts)


Extraindo dados do Oracle...
Pacientes extraídos: 270
Seguros extraídos: 10
Históricos médicos extraídos: 78
Contatos de emergência extraídos: 20
Inserindo dados no Neo4J...
Paciente inserido: Amelia Tran
Paciente inserido: Michael Do
Paciente inserido: Jacob Lam
Paciente inserido: Amelia Tran
Paciente inserido: Michael Do
Paciente inserido: John Doe
Paciente inserido: Jane Smith
Paciente inserido: Michael Johnson
Paciente inserido: Emily Brown
Paciente inserido: William Martinez
Paciente inserido: Sophia Garcia
Paciente inserido: James Lopez
Paciente inserido: Olivia Lee
Paciente inserido: Benjamin Gonzalez
Paciente inserido: Emma Perez
Paciente inserido: Jacob Rodriguez
Paciente inserido: Isabella Hernandez
Paciente inserido: Ethan Lopez
Paciente inserido: Mia Gomez
Paciente inserido: Alexander Diaz
Paciente inserido: Ava Rivera
Paciente inserido: William Smith
Paciente inserido: Sophia Gonzalez
Paciente inserido: Michael Martinez
Paciente inserido: Olivia Perez
Paciente inserido: Li

* Tendo em conta a coleção atendimento

In [17]:
def extract_data_from_oracle_appointments():
    print("Extraindo dados do Oracle...")

    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de HOSPITAL_APPOINTMENT
    sql_appointment = """
        SELECT 
            scheduled_on,
            appointment_date,
            appointment_time,
            iddoctor,
            idepisode
        FROM 
            APPOINTMENT
    """
    cursor.execute(sql_appointment)
    appointments = cursor.fetchall()
    print(f"Nomeações extraídas: {len(appointments)}")

    # Fechar conexão
    cursor.close()
    connection.close()

    return appointments

def insert_data_to_neo4j_appointments(appointments):
    print("Inserindo dados no Neo4J...")

    graph = Graph("bolt://localhost:7687", auth=("neo4j", "12345678"))  # Substitua "your_password" pela senha do seu Neo4j

    # Inserir nomeações
    for appointment in appointments:
        appointment_node = Node("Appointment", scheduled_on=appointment[0], appointment_date=appointment[1], 
                                appointment_time=appointment[2], iddoctor=appointment[3], idepisode=appointment[4])
        graph.create(appointment_node)
        print(f"Nomeação inserida: {appointment[1]} {appointment[2]} para o Doutor {appointment[3]}")

        # Criação de relações (se necessário)
        # Por exemplo, se quiser ligar nomeações a pacientes e doutores, você precisa extrair e criar esses nós e relações
        graph.run("MATCH (p:Patient {idpatient: $idepisode}), (a:Appointment {idepisode: $idepisode}) " "CREATE (p)-[:HAS_APPOINTMENT]->(a)", idepisode=appointment[4])
        graph.run("MATCH (d:Doctor {iddoctor: $iddoctor}), (a:Appointment {iddoctor: $iddoctor}) "
                   "CREATE (d)-[:HAS_APPOINTMENT]->(a)", iddoctor=appointment[3])

# Extrair dados do Oracle e inseri-los no Neo4J
appointments = extract_data_from_oracle_appointments()
insert_data_to_neo4j_appointments(appointments)


Extraindo dados do Oracle...
Nomeações extraídas: 99
Inserindo dados no Neo4J...
Nomeação inserida: 2013-12-21 00:00:00 13:13 para o Doutor 99
Nomeação inserida: 2017-11-08 00:00:00 16:47 para o Doutor 96
Nomeação inserida: 2018-11-27 00:00:00 18:11 para o Doutor 92
Nomeação inserida: 2022-12-12 00:00:00 16:50 para o Doutor 89
Nomeação inserida: 2017-12-17 00:00:00 17:14 para o Doutor 85
Nomeação inserida: 2020-12-15 00:00:00 19:60 para o Doutor 83
Nomeação inserida: 2022-12-20 00:00:00 17:34 para o Doutor 82
Nomeação inserida: 2016-12-12 00:00:00 14:15 para o Doutor 71
Nomeação inserida: 2015-12-05 00:00:00 10:48 para o Doutor 66
Nomeação inserida: 2016-12-26 00:00:00 15:34 para o Doutor 63
Nomeação inserida: 2015-10-02 00:00:00 17:52 para o Doutor 62
Nomeação inserida: 2020-10-10 00:00:00 18:46 para o Doutor 57
Nomeação inserida: 2021-10-22 00:00:00 17:10 para o Doutor 56
Nomeação inserida: 2018-12-10 00:00:00 19:29 para o Doutor 34
Nomeação inserida: 2023-11-27 00:00:00 10:39 para o

* Tendo em conta a coleção agendamento

In [19]:
def extract_data_from_oracle_services():
    print("Extraindo dados do Oracle...")

    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de HOSPITAL_EPISODE
    sql_episode = """
        SELECT 
            idepisode,
            patient_idpatient
        FROM 
            episode
    """
    cursor.execute(sql_episode)
    episodes = cursor.fetchall()
    print(f"Episódios extraídos: {len(episodes)}")

    # Consulta SQL para extrair os dados de HOSPITAL_ROOM
    sql_room = """
        SELECT 
            idroom,
            room_type,
            room_cost
        FROM 
            room
    """
    cursor.execute(sql_room)
    rooms = cursor.fetchall()
    print(f"Salas extraídas: {len(rooms)}")

    # Consulta SQL para extrair os dados de HOSPITAL_BILL
    sql_bill = """
        SELECT 
            idbill,
            room_cost,
            test_cost,
            other_charges,
            total,
            idepisode,
            registered_at,
            payment_status
        FROM 
            bill
    """
    cursor.execute(sql_bill)
    bills = cursor.fetchall()
    print(f"Faturas extraídas: {len(bills)}")

    # Consulta SQL para extrair os dados de HOSPITAL_LAB_SCREENING
    sql_lab_screening = """
        SELECT 
            lab_id,
            test_cost,
            test_date,
            idtechnician,
            episode_idepisode
        FROM 
            lab_screening
    """
    cursor.execute(sql_lab_screening)
    lab_screenings = cursor.fetchall()
    print(f"Rastreios de laboratório extraídos: {len(lab_screenings)}")

    # Fechar conexão
    cursor.close()
    connection.close()

    return episodes, rooms, bills, lab_screenings

def insert_data_to_neo4j_services(episodes, rooms, bills, lab_screenings):
    print("Inserindo dados no Neo4J...")

    graph = Graph("bolt://localhost:7687", auth=("neo4j", "12345678"))  # Substitua "your_password" pela senha do seu Neo4j

    # Inserir episódios
    for episode in episodes:
        episode_node = Node("Episode", idepisode=episode[0], patient_idpatient=episode[1])
        graph.create(episode_node)
        print(f"Episódio inserido: {episode[0]}")

        # Criação de relações (se necessário)
        # Por exemplo, se quiser ligar episódios a pacientes, você precisa extrair e criar esses nós e relações
        # graph.run("MATCH (p:Patient {idpatient: $patient_idpatient}), (e:Episode {idepisode: $idepisode}) "
        #           "CREATE (p)-[:HAS_EPISODE]->(e)", patient_idpatient=episode[1], idepisode=episode[0])

    # Inserir salas
    for room in rooms:
        room_node = Node("Room", idroom=room[0], room_type=room[1], room_cost=room[2])
        graph.create(room_node)
        print(f"Sala inserida: {room[0]}")

    # Inserir faturas
    for bill in bills:
        bill_node = Node("Bill", idbill=bill[0], room_cost=bill[1], test_cost=bill[2], other_charges=bill[3], 
                         total=bill[4], idepisode=bill[5], registered_at=bill[6], payment_status=bill[7])
        graph.create(bill_node)
        print(f"Fatura inserida: {bill[0]}")

        # Criação de relações (se necessário)
        # Por exemplo, se quiser ligar faturas a episódios, você precisa extrair e criar esses nós e relações
        # graph.run("MATCH (e:Episode {idepisode: $idepisode}), (b:Bill {idepisode: $idepisode}) "
        #           "CREATE (e)-[:HAS_BILL]->(b)", idepisode=bill[5])

    # Inserir rastreios de laboratório
    for lab_screening in lab_screenings:
        lab_screening_node = Node("LabScreening", lab_id=lab_screening[0], test_cost=lab_screening[1], 
                                  test_date=lab_screening[2], idtechnician=lab_screening[3], 
                                  episode_idepisode=lab_screening[4])
        graph.create(lab_screening_node)
        print(f"Rastreio de laboratório inserido: {lab_screening[0]}")

        # Criação de relações (se necessário)
        # Por exemplo, se quiser ligar rastreios de laboratório a episódios, você precisa extrair e criar esses nós e relações
        # graph.run("MATCH (e:Episode {idepisode: $episode_idepisode}), (l:LabScreening {episode_idepisode: $episode_idepisode}) "
        #           "CREATE (e)-[:HAS_LAB_SCREENING]->(l)", episode_idepisode=lab_screening[4])

# Extrair dados do Oracle e inseri-los no Neo4J
episodes, rooms, bills, lab_screenings = extract_data_from_oracle_services()
insert_data_to_neo4j_services(episodes, rooms,bills, lab_screenings)


Extraindo dados do Oracle...
Episódios extraídos: 600
Salas extraídas: 180
Faturas extraídas: 79
Rastreios de laboratório extraídos: 100
Inserindo dados no Neo4J...
Episódio inserido: 201
Episódio inserido: 202
Episódio inserido: 203
Episódio inserido: 204
Episódio inserido: 205
Episódio inserido: 206
Episódio inserido: 207
Episódio inserido: 208
Episódio inserido: 209
Episódio inserido: 210
Episódio inserido: 211
Episódio inserido: 212
Episódio inserido: 213
Episódio inserido: 214
Episódio inserido: 215
Episódio inserido: 216
Episódio inserido: 217
Episódio inserido: 218
Episódio inserido: 219
Episódio inserido: 220
Episódio inserido: 221
Episódio inserido: 222
Episódio inserido: 223
Episódio inserido: 224
Episódio inserido: 225
Episódio inserido: 226
Episódio inserido: 227
Episódio inserido: 228
Episódio inserido: 229
Episódio inserido: 230
Episódio inserido: 231
Episódio inserido: 232
Episódio inserido: 233
Episódio inserido: 234
Episódio inserido: 235
Episódio inserido: 236
Episódi

* Tendo em conta a coleção Staff

In [None]:
def extract_data_from_oracle_staff():
    print("Extraindo dados do Oracle...")

    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de STAFF
    sql_staff = """
        SELECT 
            EMP_ID,
            EMP_FNAME,
            EMP_LNAME,
            DATE_JOINING,
            DATE_SEPERATION,
            EMAIL,
            ADDRESS,
            SSN,
            IDDEPARTMENT,
            IS_ACTIVE_STATUS
        FROM 
            STAFF
    """
    cursor.execute(sql_staff)
    staff = cursor.fetchall()
    print(f"Funcionários extraídos: {len(staff)}")

    # Fechar conexão
    cursor.close()
    connection.close()

    return staff

def insert_data_to_neo4j_staff(staff):
    print("Inserindo dados no Neo4J...")

    graph = Graph("bolt://localhost:7687", auth=("neo4j", "12345678"))  # Substitua "your_password" pela senha do seu Neo4j

    # Inserir funcionários
    for s in staff:
        staff_node = Node("Staff", emp_id=s[0], first_name=s[1], last_name=s[2], joining_date=s[3], 
                          separation_date=s[4], email=s[5], address=s[6], ssn=s[7], 
                          department_id=s[8], is_active_status=s[9])
        graph.create(staff_node)
        print(f"Funcionário inserido: {s[0]} - {s[1]} {s[2]}")

        # Criação de relações (se necessário)
        # Por exemplo, se quiser ligar funcionários a departamentos, você pode criar nós de departamentos e relações aqui.
        # graph.run("MATCH (d:Department {iddepartment: $department_id}), (s:Staff {emp_id: $emp_id}) "
        #           "CREATE (s)-[:BELONGS_TO]->(d)", department_id=s[8], emp_id=s[0])

# Extrair dados do Oracle e inseri-los no Neo4J
staff = extract_data_from_oracle_staff()
insert_data_to_neo4j_staff(staff)