# NOSQL - Trabalho prátrico

Autores: Amindo Machado (pg52170), Duarte Velho (pg53481), Mariana Oliveira (pg52648), Ricardo Oliveira (pg53501) e Rodrigo Esperança (pg50923)

<p align="justify">
Este trabalho foi desenvolvido no âmbito da UC Bases de Dados NoSQL (2023/24), do Mestrado em Bioinformática da Escola de Engenharia da Universidade do Minho, e tem como objetivo explorar diferentes paradigmas de base de dados, tendo como referências dois tipos de modelos, um modelo relacional e um modelo não relacional. 
</p>

<p align="justify">
As bases de dados SQL são utilizadas para organizar e gerenciar grandes volumes de dados, utilizando a linguagem SQL para interagir com os dados, permitindo consultas, manipulações e análises complexas. Embora estas bases de dados possuam várias vantagens tais como padronização, maturidade, escalabilidade, flexibilidade e segurança também apresentam algumas desvantagens e problemas que podem levar a que não seja o tipo de base de dados ideal para algumas aplicações devido: à sua complexidade, à necessidade de manutenção regular e a elevados custos de implementação juntamente com as limitações em termos de escabilidade horizontal. Tendo em conta os problemas enfrentados aquando da utilização de bases de dados SQL e devido às demandas das aplicações modernas que lidam com dados não estruturados ou semiestruturados, surgiu uma nova categoria denominada de bases de dados **NoSQL** (Not Only SQL). Estas novas bases de dados não se baseiam no modelo relacional tradicional utilizado nas bases de dados SQL, onde a rigidez e a complexidade do modelo relacional podem ser um obstaculo à sua utilização em aplicações modernas.
</p>

De entre as várias características associadas as bases de dados NOSQL destacam-se a seguintes:

- Flexibilidade do esquema: Permite o armazenamento dos dados sem necessidade de um esquema predefinido, adptando-se às necessidades da aplicação;

- Escabilidade Horizontal: Possibilita a distribuição de dados em vários servidores, facilitando o aumento da capacidade conforme o crescimento da demanda. Além disso, a distribuição dos dados em vários servidores garante a disponibilidade do sistema mesmo em caso de falhas;

- Alto desempenho: Estas bases de dados estão otimizadas para grandes volumes de dados e consultas complexas;

- Diversos modelos: Suportam diversos modelos de dados;

- Agilidade de desenvolvimento: Possibilitam um desenvolvimento mais rápido e ágil de aplicações devido à flexibilidade dos modelos de dados;

- Escabilidade superior: Suportam o crescimento exponencial dos dados sem existir comprometimento do desempenho;

- Baixo custo : Geralmente possuem custos de infraestrutura e licenciamento mais baixo do que as bases de dados SQL.


Embora as bases de dados NOSQL tenham surgido para culmatar alguns dos problemas inerentes à utilização de bases SQL existem ainda alguns desafios face à sua utilização que podem difultar a sua implementação em alguns cenários:

- Falta de padronização: A ausência de um padrão universal pode dificultar a interoperabilildade entre diferentes bases de dados NOSQL;

- Consistência dos dados: A consistência dos dados distribuídos em vários servidores é um desafio;

- Maturidade relativa: Como estas bases de dados ainda se encontram em desenvolvimento, existe menor disponibilidade de soluções maduras em comparação com as bases de dados SQL;

- Curva de aprendizagem: Necessidade de conhecimento específico para modelar, gerenciar e consultar dados.


Esta nova categoria de bases de dados é utilizada a nível das redes sociais, comércio eletrónico, aplicações móveis e análise de big data.


Tal como referido anteriormente, uma das características específicas deste tipo de base de dados e que lhe confere várias vantagens é a grande diversidade de modelos disponívies existindo, atualmente quatro grandes modelos:

- Chave-Valor: Este modelo armazena os dados em pares chave-valor, sendo caracterizados por serem simples e eficientes para consultas rápidas por chave, sendo por isso o modelo ideal para catálogos de produtos e sistemas de votação por exemplo (Redis);

- Documental: Estes modelos organizam os dados em documentos JSON, que são caracterizados como flexíveis e perfeitos para o armazenamento de informações semi-estruturadas tal como perfis de usários ou registros de atividade (MongoDB);

- Grafos: Neste tipo de modelos os dados são representados como entidades interligadas por relacionamentos sendo ideias para redes sociais ou análises de fraudes (Neo4j);

- Coluna: Armazenamento dos dados em colunas sendo um modelo que é otimizado para a análise de grandes volumes de dados com alta performance.


# Librarias e packages necessários

In [17]:
#pip install pymongo
#pip install cx_Oracle
#pip install oracledb
#pip install mysql-connector-python

In [None]:
import oracledb
import getpass
import cx_Oracle
import pymongo
from pymongo import MongoClient
import mysql.connector
from py2neo import Graph, Node, Relationship

## Informação relativa à base de dados

- database: trabalho_pratico
- username: nosql
- password: nosql2024


<p align="justify">
A etapa inicial do trabalho consistiu em estabelecer uma conexão entre o Python e a base de dados Oracle. Isso implicou a especificação do utilizador, palavra-passe, anfitrião, porta e SID do Oracle, previamente definidos. Assim, tornou-se possível executar consultas e recuperar dados da base de dados, possibilitando a visualização de todas as informações lá contidas.
</p>

# Introdução

A base deste trabalho foi um conjunto de 17 tabelas que retratavam um Hospital. 

<p align="justify">
O objetivo principal deste trabalho passou por explorar diferentes paradigmas de base de dados, tendo como referências dois tipos de modelos, um modelo relacional e um modelo não relacional. Em particular, o modelo não relacional será o mais explorado, sendo que, com auxílio de código (maioritariamente em python) procedeu-se, através de uma estratégia definida e explicada posteriormente, à "conversão" do modelo relacional, já dado em modelos não relacionais, explorando as bases de dados MongoDB e Neo4j e seus respetivos paradigmas. 
</p>

<p align="justify">
Numa primeira fase, estabeleceu-se uma conexão com uma base de dados Oracle, utilizando as bibliotecas oracledb e getpass em Python. A biblioteca oracledb é usada para interagir com a base de dados Oracle, enquanto getpass permite solicitar de forma segura a senha do utilizador sem a exibir no terminal.
</p>

* Windows

In [24]:
# Pedir senha
password = getpass.getpass(prompt="Enter Oracle password: ")

# Conectar ao Oracle
connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
cursor = connection.cursor()

* MAC

In [62]:
#MACM1 Rodrigo

connection = oracledb.connect(user="EU", password="12345678", dsn="localhost/ORCLCDB")
cursor = connection.cursor()

 # MONGO

<p align="justify">
O MongoDB é uma das bases de dados NoSQL orientada a documentos não relacional, para armazenamento de dados em documentos do tipo JSON possibilitando uma estrutura de dados flexível e de facil integração. De entre as várias bases de dados NoSQL o MongoDB destaca-se por ser uma das escolhas mais comuns para o armazenamento de dados não estruturados sendo uma escolha popular para o armazenamento de dados não estruturados devido à facilidade com se consegue realizar escalamento horizontal, ao seu elevado desempenho e linguagem de consulta rica que permite a recuperação e manipulação complexa dos dados, sendo que, além disso, é uma base de dados que se integra perfeitamente com plataformas em nuvem.
</p>

Para navegar neste universo de dados é necessário a compreensão de conceitos básicos que definem a organização e o funcionamento do MongoDB:

- Coleções: Cada banco de dados no MongoDB pode conter diversas coleções (análogos das tabelas nas bases de dados relacional) sendo utilizadas para facilitar a organização e acesso dos dados;

- Documentos: Cada documento no MongoDB é uma estrutura de dados no formato JSON que contem pares chave-valor, onde a chave identifica o atributo enquanto o valor representa o dado associado a esse atributo. No entanto, o valor pode ser também um par chave-valor o que permite a criação de documentos dentro de documentos que são denominados por documentos aninhados.

## Criação das Coleções

<p align="justify">
De modo a realizar a transformação da base de dados do hospital (relacional) para o MongoDB, procedeu-se ao estabelecimento de uma conexão com uma base de dados MongoDB e criou-se coleções específicas utilizando a biblioteca pymongo em Python. A biblioteca pymongo fornece ferramentas para interagir com bases de dados MongoDB, facilitando a manipulação de dados e a gestão de coleções.
</p>
<p align="justify">
A ligação ao servidor MongoDB foi estabelecida no endereço localhost na parta 27017. Após a conexção com o servidor realizou-se a conexção com a base de dados denominada "Hospital" que vai armazenar as várias coleções e documentos criados. Para esta base de dados foram criadas quatro coleções: Patients (pacientes), Services (serviços), Appointments (consultas) e Staff (funcionários).
</p>

In [None]:
# ligação ao servidor mongo
client = MongoClient("localhost", 27017)


# Conexção à base de dados hospital, caso não exista é criada
db = client.Hospital


#criação das várias coleções
Patients = db.create_collection("Patients")
Services = db.create_collection("Services")
Appointments = db.create_collection("Appointments")
Staff = db.create_collection("Staff")

### Coleção **Pacientes**

Entidades Incluídas: 

- HOSPITAL_PATIENT;
- HOSPITAL_INSURANCE;
- HOSPITAL_MEDICAL_HISTORY;
- HOSPITAL_EMERGENCY_CONTACT.
<p align="justify">
As entidades acima citadas, estão todas centradas no paciente e tendem a ser acessadas juntas. Aninhou-se informações de seguro, histórico médico e contato de emergência diretamente no documento do paciente, de modo a se poder reduzir a complexidade e aumentar a eficiência do acesso a dados.
</p>

In [None]:
#PATIENTS

collection_P = db.Patients

query= "SELECT * FROM PATIENT P, INSURANCE I, MEDICAL_HISTORY MH, EMERGENCY_CONTACT EC WHERE P.POLICY_NUMBER = I.POLICY_NUMBER AND P.IDPATIENT = MH.IDPATIENT AND P.IDPATIENT = EC.IDPATIENT "

cursor.execute(query)
res = cursor.fetchall()
for row in res:
    print(cursor.description)
    document = dict(zip([column[0] for column in res.description], row))
    collection_P.insert_one(document)

cursor.close()
connection.close()
client.close()

<p align="justify">
Criou-se a função **extract_data_from_oracle** que solicita ao utilizador a senha para aceder à base de dados Oracle, utilizando a função getpass.getpass(). De seguida, estabelece uma conexão com a base de dados Oracle, utilizando a função oracledb.connect() com o nome de utilizador, a senha e o Data Source Name (DSN). Uma vez estabelecida a conexão, várias consultas SQL são executadas para extrair dados de diferentes tabelas: patient, insurance, MEDICAL_HISTORY e emergency_contact. Os resultados dessas consultas são armazenados em variáveis correspondentes.
</p>
<p align="justify">
Após a extração dos dados, a conexão com a base de dados Oracle é fechada. Finalmente, os dados extraídos são inseridos numa coleção MongoDB através da função insert_data_to_mongodb.
</p>

In [26]:
def extract_data_from_oracle_patients():

    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

# Consulta SQL para extrair os dados de HOSPITAL_PATIENT
    sql_patient = """
        SELECT 
            idpatient,     
            patient_fname, 
            patient_lname, 
            blood_type, 
            phone,         
            email,         
            gender,        
            policy_number, 
            BIRTHDAY
        FROM
            patient
    """
    cursor.execute(sql_patient)
    patients = cursor.fetchall()

# Consulta SQL para extrair os dados de HOSPITAL_INSURANCE
    sql_insurance = """
        SELECT 
            policy_number,  
            provider,       
            insurance_plan, 
            co_pay,         
            coverage,       
            maternity,      
            dental,         
            optical     
        FROM 
            insurance
    """
    cursor.execute(sql_insurance)
    insurances = cursor.fetchall()
    
 # Consulta SQL para extrair os dados de HOSPITAL_MEDICAL_HISTORY
    sql_MEDICAL_HISTORY = """
        SELECT 
            record_id,   
            record_date, 
            idpatient   
        FROM 
            MEDICAL_HISTORY
    """
    cursor.execute(sql_MEDICAL_HISTORY)
    MEDICAL_HISTORYs = cursor.fetchall()

    # Consulta SQL para extrair os dados de HOSPITAL_EMERGENCY_CONTACT
    sql_emergency_contact = """
        SELECT 
            contact_name, 
            phone,        
            relation,    
            idpatient  
        FROM 
            emergency_contact
    """
    cursor.execute(sql_emergency_contact)
    lab_emergency_contact = cursor.fetchall()

    # Fechar conexão
    cursor.close()
    connection.close()

    # Inserir os dados na coleção MongoDB
    insert_data_to_mongodb_patients(patients, insurances, MEDICAL_HISTORYs, lab_emergency_contact)

In [27]:
# Função para inserir os dados no MongoDB
def insert_data_to_mongodb_patients(patients, insurances, MEDICAL_HISTORYs, lab_emergency_contact):
    
    # Conectar ao MongoDB
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']  # Substitua 'nome_do_banco_de_dados' pelo nome do seu banco de dados no MongoDB
    collection = db['Patients']

    # Formatar os dados e inserir na coleção MongoDB
    for patient in patients:
        patient_data = {
            "idepisode": patient[0],
            "patient_fname": patient[1],
            "patient_lname" : patient[2] ,   
            "blood_type": patient[3],
            "phone"   : patient[4],    
            "email"  : patient[5],     
            "gender"   : patient[6],   
            "policy_number": patient[7],
            "BIRTHDAY": patient[8],
        }
        collection.insert_one(patient_data)

    for insurance in insurances:
        insurance_data = {
            "policy_number" : insurance[0],
            "provider"  : insurance[1],     
            "insurance_plan" : insurance[2],
            "co_pay"      : insurance[3],   
            "coverage"   : insurance[4],    
            "maternity"  : insurance[5],    
            "dental"   : insurance[6],      
            "optical" : insurance[7],
        }
        collection.insert_one(insurance_data)

    for MEDICAL_HISTORY in MEDICAL_HISTORYs:
        MEDICAL_HISTORY_data = {
            "record_id"  : MEDICAL_HISTORY[0], 
            "record_date" : MEDICAL_HISTORY[1],
            "idpatient" : MEDICAL_HISTORY[2],
        }
        collection.insert_one(MEDICAL_HISTORY_data)

    for emergency_contact in lab_emergency_contact:
        emergency_contact_data = {
            "contact_name ": emergency_contact[0],
            "phone": emergency_contact[1],        
            "relation": emergency_contact[2],    
            "idpatient": emergency_contact[3],
        }
        collection.insert_one(emergency_contact_data)

    # Fechar conexão
    client.close()

# Chamar a função principal para extrair dados do Oracle e inseri-los no MongoDB
extract_data_from_oracle_patients()

### Coleção **Agendamento**

Entidades Incluídas: 
* HOSPITAL_APPOINTMENT

Os agendamentos podem ser mantidos numa coleção separada, pois constituem um ponto de interação frequente e independente com o sistema, onde o acesso rápido e a atualização de dados são críticos.

In [28]:
def extract_data_from_oracle_app():
    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de HOSPITAL_APPOINTMENT
    sql_appointment = """
        SELECT 
            scheduled_on,
            appointment_date,
            appointment_time,
            iddoctor,
            idepisode
        FROM 
            APPOINTMENT
    """
    cursor.execute(sql_appointment)
    appointments = cursor.fetchall()

    # Fechar conexão
    cursor.close()
    connection.close()

    # Inserir os dados na coleção MongoDB
    insert_data_to_mongodb_app(appointments)

In [29]:
# Função para inserir os dados na coleção 'HOSPITAL_APPOINTMENT'
def insert_data_to_mongodb_app(appointments):
    
    # Conectar ao MongoDB
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']  # Substitua 'nome_do_banco_de_dados' pelo nome do seu banco de dados no MongoDB
    collection = db['Appointments']

    # Formatar os dados e inserir na coleção MongoDB
    for appointment in appointments:
        appointment_data = {
            "scheduled_on": appointment[0],
            "appointment_date": appointment[1],
            "appointment_time": appointment[2],
            "iddoctor": appointment[3],
            "idepisode": appointment[4],
        }
        collection.insert_one(appointment_data)

    # Fechar conexão
    client.close()

# Chamar a função principal para extrair dados do Oracle e inseri-los no MongoDB
extract_data_from_oracle_app()


### Coleção **Atendimento**

Entidades Incluídas: 
* HOSPITAL_EPISODE
* HOSPITAL_ROOM
* HOSPITAL_BILL 
* HOSPITAL_LAB_SCREENING

Um episódio de atendimento ao paciente normalmente envolve a alocação de um quarto, geração de contas e exames laboratoriais. Ter essas informações numa única coleção facilita o rastreamento do atendimento ao paciente e a faturação.

In [30]:
def extract_data_from_oracle_services():

    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

# Consulta SQL para extrair os dados de HOSPITAL_EPISODE
    sql_episode = """
        SELECT 
            idepisode,
            patient_idpatient
        FROM 
            episode
    """
    cursor.execute(sql_episode)
    episodes = cursor.fetchall()

# Consulta SQL para extrair os dados de HOSPITAL_ROOM
    sql_room = """
        SELECT 
            idroom,
            room_type,
            room_cost
        FROM 
            room
    """
    cursor.execute(sql_room)
    rooms = cursor.fetchall()
 # Consulta SQL para extrair os dados de HOSPITAL_BILL
    sql_bill = """
        SELECT 
            idbill,
            room_cost,
            test_cost,
            other_charges,
            total,
            idepisode,
            registered_at,
            payment_status
        FROM 
            bill
    """
    cursor.execute(sql_bill)
    bills = cursor.fetchall()

    # Consulta SQL para extrair os dados de HOSPITAL_LAB_SCREENING
    sql_lab_screening = """
        SELECT 
            lab_id,
            test_cost,
            test_date,
            idtechnician,
            episode_idepisode
        FROM 
            lab_screening
    """
    cursor.execute(sql_lab_screening)
    lab_screenings = cursor.fetchall()

    # Fechar conexão
    cursor.close()
    connection.close()

    # Inserir os dados na coleção MongoDB
    insert_data_to_mongodb_services(episodes, rooms, bills, lab_screenings)

In [31]:
# Função para inserir os dados no MongoDB
def insert_data_to_mongodb_services(episodes, rooms, bills, lab_screenings):
    
    # Conectar ao MongoDB
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']  # Substitua 'nome_do_banco_de_dados' pelo nome do seu banco de dados no MongoDB
    collection = db['Services']

    # Formatar os dados e inserir na coleção MongoDB
    for episode in episodes:
        episode_data = {
            "idepisode": episode[0],
            "patient_idpatient": episode[1],
            # Adicione outros campos conforme necessário
        }
        collection.insert_one(episode_data)

    for room in rooms:
        room_data = {
            "idroom": room[0],
            "room_type": room[1],
            "room_cost": room[2],
            # Adicione outros campos conforme necessário
        }
        collection.insert_one(room_data)

    for bill in bills:
        bill_data = {
            "idbill": bill[0],
            "room_cost": bill[1],
            "test_cost": bill[2],
            "other_charges": bill[3],
            "total": bill[4],
            "idepisode": bill[5],
            "registered_at": bill[6],
            "payment_status": bill[7],
            # Adicione outros campos conforme necessário
        }
        collection.insert_one(bill_data)

    for lab_screening in lab_screenings:
        lab_screening_data = {
            "lab_id": lab_screening[0],
            "test_cost": lab_screening[1],
            "test_date": lab_screening[2],
            "idtechnician": lab_screening[3],
            "episode_idepisode": lab_screening[4],
            # Adicione outros campos conforme necessário
        }
        collection.insert_one(lab_screening_data)

    # Fechar conexão
    client.close()

# Chamar a função principal para extrair dados do Oracle e inseri-los no MongoDB
extract_data_from_oracle_services()

### Coleção Staff

Entidades Incluídas: 
* HOSPITAL_DOCTOR;
* HOSPITAL_NURSE;
* HOSPITAL_TECHNICIAN.

Integrar os dados de todos os profissionais de saúde numa única coleção permite uma gestão unificada do pessoal, assim como simplifica a atribuição e consulta de responsabilidades do staff.

In [None]:
def extract_data_from_oracle():
    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="EU", password=password, dsn="localhost/ORCLCDB")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de STAFF
    sql_staff = """
        SELECT 
            EMP_ID,
            EMP_FNAME,
            EMP_LNAME,
            DATE_JOINING,
            DATE_SEPERATION,
            EMAIL,
            ADDRESS,
            SSN,
            IDDEPARTMENT,
            IS_ACTIVE_STATUS
        FROM 
            STAFF
    """
    cursor.execute(sql_staff)
    staff = cursor.fetchall()

    # Fechar conexão
    cursor.close()
    connection.close()

    # Inserir os dados na coleção MongoDB
    insert_data_to_mongodb(staff)   # Função para inserir os dados na coleção 'Staff'

def insert_data_to_mongodb(staffs):
    # Conectar ao MongoDB
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']  # Substitua 'Hospital' pelo nome do seu banco de dados no MongoDB
    collection = db['Staff']

    # Formatar os dados e inserir na coleção MongoDB
    for staff in staffs:
        staff_data = {
            "_id": staff[0],  # Use o ID do funcionário como o ID do documento
            "firstName": staff[1],
            "lastName": staff[2],
            "joiningDate": staff[3],
            "separationDate": staff[4],
            "email": staff[5],
            "address": staff[6],
            "ssn": staff[7],
            "departmentId": staff[8],
            "isActiveStatus": staff[9]
        }
        collection.insert_one(staff_data)

    # Fechar conexão
    client.close()

# Chamar a função principal para extrair dados do Oracle e inseri-los no MongoDB
extract_data_from_oracle()





# INDEX

In [None]:
def create_indexes():
    # Conectar ao MongoDB
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    
    # Selecionar coleções
    collection_p = db['Patients']
    collection_a = db['Appointments']
    collection_s = db['Services']
    collection_sa = db['Staff']

    # Criar índices nas coleções
    collection_p.create_index([("idepisode", 1)])
    collection_a.create_index([("scheduled_on", 1)])
    collection_s.create_index([("idbill", 1)])
    collection_sa.create_index([("_id", 1)])

    # Fechar conexão
    client.close()

# Chamar a função para criar os índices nas coleções
create_indexes()

In [None]:
#se por ventura for necessário apagar um idex

#Hospital.drop_index("")


In [None]:
def list_indexes():
    # Conectar ao MongoDB
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']

    collections = ['Patients', 'Appointments', 'Services', 'Staff']
    
    for collection_name in collections:
        collection = db[collection_name]
        indexes = collection.list_indexes()
        
        print(f"\nÍndices na coleção '{collection_name}':")
        for index in indexes:
            print(index)

    # Fechar conexão
    client.close()

# Chamar a função para listar os índices
list_indexes()

# Procedure

No mongo a criação de procedimentos não é identica ao Oracle, todavia podemos alcançar resultados semelhantes utilizando certas operações específicas.
Com isto optamos por, assim como no script em Oracle, criar um "procedimento" que permita uma atualização do agendamento da consultas tendo obviamente como referência a data do mesmo.

Em suma, a função criada acede à coleção appointments no MongoDB criada anteriormente, recupera o documento com a informação dos agendamentos com base na data fornecida e realiza a verificação do calendario de acordo com o que está definido na função.


In [None]:
def update_appointment_schedule( scheduled_on, appointment_date, appointment_time, iddoctor, idepisode):
    client = MongoClient('mongodb://localhost:27017/')
    db = client['Hospital']
    

    # Recupere o documento de agendamento
    appointment_document = collection_a.find_one({scheduled_on: scheduled_on})

    if appointment_document:
        # Atualizar o agendamento existente
        collection_a.update_one(
            {"scheduled_on": scheduled_on},
            {"$set": {
            
                "appointment_date": appointment_date,
                "appointment_time": appointment_time,
                "iddoctor": iddoctor,
                "idepisode": idepisode
            }}
        )
        print(f"Agendamento com scheduled_on {scheduled_on} atualizado com sucesso.")
    else:
        # Inserir um novo agendamento
        new_appointment = {
            "scheduled_on": scheduled_on,
            "appointment_date": appointment_date,
            "appointment_time": appointment_time,
            "iddoctor": iddoctor,
            "idepisode": idepisode
        }
        collection_a.insert_one(new_appointment)
        print(f"Novo agendamento com scheduled_on {scheduled_on} inserido com sucesso.")

    # Fechar conexão
    client.close()

# Exemplo de chamada da função
update_appointment_schedule(
    scheduled_on="2024-05-30T14:00:00Z",
    appointment_date="2024-06-05",
    appointment_time="10:00",
    iddoctor=101,
    idepisode=202
)

In [None]:
#A próxima query ajuda a verificar o Procedure a funcionar
documents = collection_a.find({"scheduled_on":"2024-05-30T14:00:00Z"})
for i in documents:
    print(i)
    break


# Views / agregação

O módulo não inclui pacotes para criação direta das views, ou seja, isso apenas é conseguido correndo diretamente na base de dados. No entanto, é possível criar agregações que nos pode dar informação útil. Como exemplo, pretendemos explorar se um medico deste hospital também é um paciente do mesma. E para isso, criou-se uma agregação que compara os primeiro e último nomes dos medicos e dos pacientes da loja online.

In [None]:
#RESOLVER PROBLEMAS NO SEGUINTE CODIGO COM IDS

def find_matching_documents():
    
    pipeline = [
        {
            "$lookup": {
                "from": "Patients",
                "let": {"firstname": "$FIRST_NAME", "lastname": "$LAST_NAME"},
                "pipeline": [
                    {
                        "$match": {
                            "$expr": {
                                "$and": [
                                    {"$eq": ["$$firstname", "$patient_fname"]},
                                    {"$eq": ["$$lastname", "$patient_lname"]}
                                ]
                            }
                        }
                    }
                ],
                "as": "matching_patients"
            }
        },
        {
            "$match": {
                "matching_patients": {"$ne": []}
            }
        },
        {
            "$project": {
                "_id": 0,
                "staff_firstName": "$FIRST_NAME",
                "staff_lastName": "$LAST_NAME",
                "matching_patients": 1
            }
        }
    ]

    aggregation_result = collection_sa.aggregate(pipeline)

    for result in aggregation_result:
        print(result)

   

# Exemplo de uso da função

# Exemplo de uso da função
find_matching_documents()

#Fazer Querys para Mongo

# Neo4j

* Tendo em conta a coleção pacientes

In [12]:
def extract_data_from_oracle():
    print("Extraindo dados do Oracle...")

    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de HOSPITAL_PATIENT
    sql_patient = """
        SELECT 
            idpatient,     
            patient_fname, 
            patient_lname, 
            blood_type, 
            phone,         
            email,         
            gender,        
            policy_number, 
            BIRTHDAY
        FROM
            patient
    """
    cursor.execute(sql_patient)
    patients = cursor.fetchall()
    print(f"Pacientes extraídos: {len(patients)}")

    # Consulta SQL para extrair os dados de HOSPITAL_INSURANCE
    sql_insurance = """
        SELECT 
            policy_number,  
            provider,       
            insurance_plan, 
            co_pay,         
            coverage,       
            maternity,      
            dental,         
            optical     
        FROM 
            insurance
    """
    cursor.execute(sql_insurance)
    insurances = cursor.fetchall()
    print(f"Seguros extraídos: {len(insurances)}")
    
    # Consulta SQL para extrair os dados de HOSPITAL_MEDICAL_HISTORY
    sql_MEDICAL_HISTORY = """
        SELECT 
            record_id,   
            record_date, 
            idpatient   
        FROM 
            MEDICAL_HISTORY
    """
    cursor.execute(sql_MEDICAL_HISTORY)
    medical_histories = cursor.fetchall()
    print(f"Históricos médicos extraídos: {len(medical_histories)}")

    # Consulta SQL para extrair os dados de HOSPITAL_EMERGENCY_CONTACT
    sql_emergency_contact = """
        SELECT 
            contact_name, 
            phone,        
            relation,    
            idpatient  
        FROM 
            emergency_contact
    """
    cursor.execute(sql_emergency_contact)
    emergency_contacts = cursor.fetchall()
    print(f"Contatos de emergência extraídos: {len(emergency_contacts)}")

    # Fechar conexão
    cursor.close()
    connection.close()

    return patients, insurances, medical_histories, emergency_contacts

def insert_data_to_neo4j(patients, insurances, medical_histories, emergency_contacts):
    print("Inserindo dados no Neo4J...")

    graph = Graph("bolt://localhost:7687", auth=("neo4j", "12345678"))  # Substitua "your_password" pela senha do seu Neo4j

    # Inserir pacientes
    for patient in patients:
        patient_node = Node("Patient", idpatient=patient[0], patient_fname=patient[1], patient_lname=patient[2], 
                            blood_type=patient[3], phone=patient[4], email=patient[5], gender=patient[6], 
                            policy_number=patient[7], birthday=patient[8])
        graph.create(patient_node)
        print(f"Paciente inserido: {patient[1]} {patient[2]}")

    # Inserir seguros
    for insurance in insurances:
        insurance_node = Node("Insurance", policy_number=insurance[0], provider=insurance[1], insurance_plan=insurance[2], 
                              co_pay=insurance[3], coverage=insurance[4], maternity=insurance[5], dental=insurance[6], 
                              optical=insurance[7])
        graph.create(insurance_node)
        graph.run("MATCH (p:Patient {policy_number: $policy_number}), (i:Insurance {policy_number: $policy_number}) "
                  "CREATE (p)-[:HAS_INSURANCE]->(i)", policy_number=insurance[0])
        print(f"Seguro inserido: {insurance[1]}")

    # Inserir históricos médicos
    for medical_history in medical_histories:
        medical_history_node = Node("MedicalHistory", record_id=medical_history[0], record_date=medical_history[1])
        graph.create(medical_history_node)
        graph.run("MATCH (p:Patient {idpatient: $idpatient}), (m:MedicalHistory {record_id: $record_id}) "
                  "CREATE (p)-[:HAS_MEDICAL_HISTORY]->(m)", idpatient=medical_history[2], record_id=medical_history[0])
        print(f"Histórico médico inserido: {medical_history[0]}")

    # Inserir contatos de emergência
    for emergency_contact in emergency_contacts:
        emergency_contact_node = Node("EmergencyContact", contact_name=emergency_contact[0], phone=emergency_contact[1], 
                                      relation=emergency_contact[2])
        graph.create(emergency_contact_node)
        graph.run("MATCH (p:Patient {idpatient: $idpatient}), (e:EmergencyContact {contact_name: $contact_name}) "
                  "CREATE (p)-[:HAS_EMERGENCY_CONTACT]->(e)", idpatient=emergency_contact[3], contact_name=emergency_contact[0])
        print(f"Contato de emergência inserido: {emergency_contact[0]}")

# Extrair dados do Oracle e inseri-los no Neo4J
patients, insurances, medical_histories, emergency_contacts = extract_data_from_oracle()
insert_data_to_neo4j(patients, insurances, medical_histories, emergency_contacts)


Extraindo dados do Oracle...
Pacientes extraídos: 270
Seguros extraídos: 10
Históricos médicos extraídos: 78
Contatos de emergência extraídos: 20
Inserindo dados no Neo4J...
Paciente inserido: Amelia Tran
Paciente inserido: Michael Do
Paciente inserido: Jacob Lam
Paciente inserido: Amelia Tran
Paciente inserido: Michael Do
Paciente inserido: John Doe
Paciente inserido: Jane Smith
Paciente inserido: Michael Johnson
Paciente inserido: Emily Brown
Paciente inserido: William Martinez
Paciente inserido: Sophia Garcia
Paciente inserido: James Lopez
Paciente inserido: Olivia Lee
Paciente inserido: Benjamin Gonzalez
Paciente inserido: Emma Perez
Paciente inserido: Jacob Rodriguez
Paciente inserido: Isabella Hernandez
Paciente inserido: Ethan Lopez
Paciente inserido: Mia Gomez
Paciente inserido: Alexander Diaz
Paciente inserido: Ava Rivera
Paciente inserido: William Smith
Paciente inserido: Sophia Gonzalez
Paciente inserido: Michael Martinez
Paciente inserido: Olivia Perez
Paciente inserido: Li

* Tendo em conta a coleção atendimento

In [17]:
def extract_data_from_oracle_appointments():
    print("Extraindo dados do Oracle...")

    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de HOSPITAL_APPOINTMENT
    sql_appointment = """
        SELECT 
            scheduled_on,
            appointment_date,
            appointment_time,
            iddoctor,
            idepisode
        FROM 
            APPOINTMENT
    """
    cursor.execute(sql_appointment)
    appointments = cursor.fetchall()
    print(f"Nomeações extraídas: {len(appointments)}")

    # Fechar conexão
    cursor.close()
    connection.close()

    return appointments

def insert_data_to_neo4j_appointments(appointments):
    print("Inserindo dados no Neo4J...")

    graph = Graph("bolt://localhost:7687", auth=("neo4j", "12345678"))  # Substitua "your_password" pela senha do seu Neo4j

    # Inserir nomeações
    for appointment in appointments:
        appointment_node = Node("Appointment", scheduled_on=appointment[0], appointment_date=appointment[1], 
                                appointment_time=appointment[2], iddoctor=appointment[3], idepisode=appointment[4])
        graph.create(appointment_node)
        print(f"Nomeação inserida: {appointment[1]} {appointment[2]} para o Doutor {appointment[3]}")

        # Criação de relações (se necessário)
        # Por exemplo, se quiser ligar nomeações a pacientes e doutores, você precisa extrair e criar esses nós e relações
        graph.run("MATCH (p:Patient {idpatient: $idepisode}), (a:Appointment {idepisode: $idepisode}) " "CREATE (p)-[:HAS_APPOINTMENT]->(a)", idepisode=appointment[4])
        graph.run("MATCH (d:Doctor {iddoctor: $iddoctor}), (a:Appointment {iddoctor: $iddoctor}) "
                   "CREATE (d)-[:HAS_APPOINTMENT]->(a)", iddoctor=appointment[3])

# Extrair dados do Oracle e inseri-los no Neo4J
appointments = extract_data_from_oracle_appointments()
insert_data_to_neo4j_appointments(appointments)


Extraindo dados do Oracle...
Nomeações extraídas: 99
Inserindo dados no Neo4J...
Nomeação inserida: 2013-12-21 00:00:00 13:13 para o Doutor 99
Nomeação inserida: 2017-11-08 00:00:00 16:47 para o Doutor 96
Nomeação inserida: 2018-11-27 00:00:00 18:11 para o Doutor 92
Nomeação inserida: 2022-12-12 00:00:00 16:50 para o Doutor 89
Nomeação inserida: 2017-12-17 00:00:00 17:14 para o Doutor 85
Nomeação inserida: 2020-12-15 00:00:00 19:60 para o Doutor 83
Nomeação inserida: 2022-12-20 00:00:00 17:34 para o Doutor 82
Nomeação inserida: 2016-12-12 00:00:00 14:15 para o Doutor 71
Nomeação inserida: 2015-12-05 00:00:00 10:48 para o Doutor 66
Nomeação inserida: 2016-12-26 00:00:00 15:34 para o Doutor 63
Nomeação inserida: 2015-10-02 00:00:00 17:52 para o Doutor 62
Nomeação inserida: 2020-10-10 00:00:00 18:46 para o Doutor 57
Nomeação inserida: 2021-10-22 00:00:00 17:10 para o Doutor 56
Nomeação inserida: 2018-12-10 00:00:00 19:29 para o Doutor 34
Nomeação inserida: 2023-11-27 00:00:00 10:39 para o

* Tendo em conta a coleção agendamento

In [19]:
def extract_data_from_oracle_services():
    print("Extraindo dados do Oracle...")

    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de HOSPITAL_EPISODE
    sql_episode = """
        SELECT 
            idepisode,
            patient_idpatient
        FROM 
            episode
    """
    cursor.execute(sql_episode)
    episodes = cursor.fetchall()
    print(f"Episódios extraídos: {len(episodes)}")

    # Consulta SQL para extrair os dados de HOSPITAL_ROOM
    sql_room = """
        SELECT 
            idroom,
            room_type,
            room_cost
        FROM 
            room
    """
    cursor.execute(sql_room)
    rooms = cursor.fetchall()
    print(f"Salas extraídas: {len(rooms)}")

    # Consulta SQL para extrair os dados de HOSPITAL_BILL
    sql_bill = """
        SELECT 
            idbill,
            room_cost,
            test_cost,
            other_charges,
            total,
            idepisode,
            registered_at,
            payment_status
        FROM 
            bill
    """
    cursor.execute(sql_bill)
    bills = cursor.fetchall()
    print(f"Faturas extraídas: {len(bills)}")

    # Consulta SQL para extrair os dados de HOSPITAL_LAB_SCREENING
    sql_lab_screening = """
        SELECT 
            lab_id,
            test_cost,
            test_date,
            idtechnician,
            episode_idepisode
        FROM 
            lab_screening
    """
    cursor.execute(sql_lab_screening)
    lab_screenings = cursor.fetchall()
    print(f"Rastreios de laboratório extraídos: {len(lab_screenings)}")

    # Fechar conexão
    cursor.close()
    connection.close()

    return episodes, rooms, bills, lab_screenings

def insert_data_to_neo4j_services(episodes, rooms, bills, lab_screenings):
    print("Inserindo dados no Neo4J...")

    graph = Graph("bolt://localhost:7687", auth=("neo4j", "12345678"))  # Substitua "your_password" pela senha do seu Neo4j

    # Inserir episódios
    for episode in episodes:
        episode_node = Node("Episode", idepisode=episode[0], patient_idpatient=episode[1])
        graph.create(episode_node)
        print(f"Episódio inserido: {episode[0]}")

        # Criação de relações (se necessário)
        # Por exemplo, se quiser ligar episódios a pacientes, você precisa extrair e criar esses nós e relações
        # graph.run("MATCH (p:Patient {idpatient: $patient_idpatient}), (e:Episode {idepisode: $idepisode}) "
        #           "CREATE (p)-[:HAS_EPISODE]->(e)", patient_idpatient=episode[1], idepisode=episode[0])

    # Inserir salas
    for room in rooms:
        room_node = Node("Room", idroom=room[0], room_type=room[1], room_cost=room[2])
        graph.create(room_node)
        print(f"Sala inserida: {room[0]}")

    # Inserir faturas
    for bill in bills:
        bill_node = Node("Bill", idbill=bill[0], room_cost=bill[1], test_cost=bill[2], other_charges=bill[3], 
                         total=bill[4], idepisode=bill[5], registered_at=bill[6], payment_status=bill[7])
        graph.create(bill_node)
        print(f"Fatura inserida: {bill[0]}")

        # Criação de relações (se necessário)
        # Por exemplo, se quiser ligar faturas a episódios, você precisa extrair e criar esses nós e relações
        # graph.run("MATCH (e:Episode {idepisode: $idepisode}), (b:Bill {idepisode: $idepisode}) "
        #           "CREATE (e)-[:HAS_BILL]->(b)", idepisode=bill[5])

    # Inserir rastreios de laboratório
    for lab_screening in lab_screenings:
        lab_screening_node = Node("LabScreening", lab_id=lab_screening[0], test_cost=lab_screening[1], 
                                  test_date=lab_screening[2], idtechnician=lab_screening[3], 
                                  episode_idepisode=lab_screening[4])
        graph.create(lab_screening_node)
        print(f"Rastreio de laboratório inserido: {lab_screening[0]}")

        # Criação de relações (se necessário)
        # Por exemplo, se quiser ligar rastreios de laboratório a episódios, você precisa extrair e criar esses nós e relações
        # graph.run("MATCH (e:Episode {idepisode: $episode_idepisode}), (l:LabScreening {episode_idepisode: $episode_idepisode}) "
        #           "CREATE (e)-[:HAS_LAB_SCREENING]->(l)", episode_idepisode=lab_screening[4])

# Extrair dados do Oracle e inseri-los no Neo4J
episodes, rooms, bills, lab_screenings = extract_data_from_oracle_services()
insert_data_to_neo4j_services(episodes, rooms,bills, lab_screenings)


Extraindo dados do Oracle...
Episódios extraídos: 600
Salas extraídas: 180
Faturas extraídas: 79
Rastreios de laboratório extraídos: 100
Inserindo dados no Neo4J...
Episódio inserido: 201
Episódio inserido: 202
Episódio inserido: 203
Episódio inserido: 204
Episódio inserido: 205
Episódio inserido: 206
Episódio inserido: 207
Episódio inserido: 208
Episódio inserido: 209
Episódio inserido: 210
Episódio inserido: 211
Episódio inserido: 212
Episódio inserido: 213
Episódio inserido: 214
Episódio inserido: 215
Episódio inserido: 216
Episódio inserido: 217
Episódio inserido: 218
Episódio inserido: 219
Episódio inserido: 220
Episódio inserido: 221
Episódio inserido: 222
Episódio inserido: 223
Episódio inserido: 224
Episódio inserido: 225
Episódio inserido: 226
Episódio inserido: 227
Episódio inserido: 228
Episódio inserido: 229
Episódio inserido: 230
Episódio inserido: 231
Episódio inserido: 232
Episódio inserido: 233
Episódio inserido: 234
Episódio inserido: 235
Episódio inserido: 236
Episódi

* Tendo em conta a coleção Staff

In [None]:
def extract_data_from_oracle_staff():
    print("Extraindo dados do Oracle...")

    # Pedir senha
    password = getpass.getpass(prompt="Enter Oracle password: ")

    # Conectar ao Oracle
    connection = oracledb.connect(user="nosql", password=password, dsn="localhost/xe")
    cursor = connection.cursor()

    # Consulta SQL para extrair os dados de STAFF
    sql_staff = """
        SELECT 
            EMP_ID,
            EMP_FNAME,
            EMP_LNAME,
            DATE_JOINING,
            DATE_SEPERATION,
            EMAIL,
            ADDRESS,
            SSN,
            IDDEPARTMENT,
            IS_ACTIVE_STATUS
        FROM 
            STAFF
    """
    cursor.execute(sql_staff)
    staff = cursor.fetchall()
    print(f"Funcionários extraídos: {len(staff)}")

    # Fechar conexão
    cursor.close()
    connection.close()

    return staff

def insert_data_to_neo4j_staff(staff):
    print("Inserindo dados no Neo4J...")

    graph = Graph("bolt://localhost:7687", auth=("neo4j", "12345678"))  # Substitua "your_password" pela senha do seu Neo4j

    # Inserir funcionários
    for s in staff:
        staff_node = Node("Staff", emp_id=s[0], first_name=s[1], last_name=s[2], joining_date=s[3], 
                          separation_date=s[4], email=s[5], address=s[6], ssn=s[7], 
                          department_id=s[8], is_active_status=s[9])
        graph.create(staff_node)
        print(f"Funcionário inserido: {s[0]} - {s[1]} {s[2]}")

        # Criação de relações (se necessário)
        # Por exemplo, se quiser ligar funcionários a departamentos, você pode criar nós de departamentos e relações aqui.
        # graph.run("MATCH (d:Department {iddepartment: $department_id}), (s:Staff {emp_id: $emp_id}) "
        #           "CREATE (s)-[:BELONGS_TO]->(d)", department_id=s[8], emp_id=s[0])

# Extrair dados do Oracle e inseri-los no Neo4J
staff = extract_data_from_oracle_staff()
insert_data_to_neo4j_staff(staff)