## Experimentos da abordagem de evolução incremental de esquemas JSON

* Requisições para evolução de esquemas 
    * 'http://localhost:4200/api/batch/rawschema/steps/all'

    * 'http://localhost:4200/api/batch/rawschema/steps/allupdate'

* Execultar os experimentos 10 vezes

* Salvar o resultado do tempo de processamento em csv

* Particionamento dos conjuntos de dados


### Coleção usada no esquema inicial
- `twitter_450`
- `vk_450`
- `livros_10000`

### Conjuntos de coleções usadas para atualização

#### Conjunto de dados Twitter
`twitter_900`, `twitter_1800`, `twitter_3600`, `twitter_7200`, `twitter_14400`,  
`twitter_28800`, `twitter_57600`, `twitter_115200`, `twitter_230400`,  
`twitter_460800`, `twitter_921600`

#### Conjunto de dados VK
`vk_900`, `vk_1800`, `vk_3600`, `vk_7200`, `vk_14400`,  
`vk_28800`, `vk_57600`, `vk_115200`, `vk_230400`,  
`vk_460800`, `vk_921600`

#### Conjunto de dados de metadados de livros
`books_10000`, `books_20000`, `books_40000`, `books_80000`,  
`books_160000`, `books_320000`, `books_640000`, `books_1280000`,  
`books_2560000`, `books_5120000`, `books_10240000`, `books_20480000`

### Imports

In [1]:
import requests
import time
import csv
from json.decoder import JSONDecodeError
import json

### Dados de entrada

In [2]:
# Caminho para o arquivo de configuração
config_file_path = 'config_JSD_Evolution.json'

# Carregar os dados do arquivo JSON
with open(config_file_path, 'r') as file:
    config = json.load(file)


# Número de repetições
num_repetitions = config['num_repetitions']


# Coleções usadas para evoluir o esquema JSON
collections_to_update = config['collections_to_update']


### Criar uma conta para testar

In [3]:
# Dados do usuário
user_data = {
    'username': config['username'],
    'email': config['email'],
    'password': config['password']
}

# requisição
url = 'http://localhost:4200/api/register'

# Fazendo a requisição POST
response = requests.post(url, json=user_data)

# Verificando a resposta
if response.status_code == 200:
    print('Requisição bem-sucedida!')
    print('Resposta:', response.json())  
elif response.status_code == 400:
    try:
        error_details = response.json()
        # Verifica se o erro é de duplicação de email
        if error_details.get('error', {}).get('code') == 11000 and 'email' in error_details.get('error', {}).get('keyPattern', {}):
            print('O email já está registrado.')
        else:
            print('Erro na requisição:', response.status_code)
            print('Detalhes do erro:', response.text)
    except ValueError:
        # Caso a resposta não seja um JSON válido
        print('Erro na requisição:', response.status_code)
        print('Detalhes do erro:', response.text)
else:
    print('Erro na requisição:', response.status_code)
    print('Detalhes do erro:', response.text)


Requisição bem-sucedida!
Resposta: {'username': 'example', 'email': 'example_1@example.com', '_id': '68992f6be3ac8d6b20c819b0', 'createdAt': '2025-08-10T23:46:51.455Z', 'updatedAt': '2025-08-10T23:46:51.455Z', '__v': 0}


### Acessar a conta criada e recuperar o token de autentificação

In [4]:
# Dados de login
login_data = {
    'email': config['email'],
    'password': config['password']
}

# requisição
login_url = 'http://localhost:4200/api/login' 

# Fazendo a requisição de login
response = requests.post(login_url, json=login_data)

# Verificando a resposta
if response.status_code == 200:
    print('Login bem-sucedido!')
    token = response.json().get('token')
    if token:
        print('Token de acesso:', token)
    else:
        print('Token de acesso não encontrado na resposta.')
else:
    print('Erro no login:', response.json().get('message'))
    print('Código de erro:', response.json().get('code'))



Login bem-sucedido!
Token de acesso: eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJ1c2VyIjp7Il9pZCI6IjY4OTkyZjZiZTNhYzhkNmIyMGM4MTliMCIsInVzZXJuYW1lIjoiZXhhbXBsZSIsImVtYWlsIjoiZXhhbXBsZV8xQGV4YW1wbGUuY29tIiwiY3JlYXRlZEF0IjoiMjAyNS0wOC0xMFQyMzo0Njo1MS40NTVaIiwidXBkYXRlZEF0IjoiMjAyNS0wOC0xMFQyMzo0Njo1MS40NTVaIiwiX192IjowfSwiaWF0IjoxNzU0ODY5NjEyfQ.esDBjKbc-4UpJCPBSowwMjX69UPP8AMTSPcZAnnxkeM


### Teste JSD Evolution

In [5]:
# token autorização
headers_batch = {
    'Authorization': 'Bearer '+ token,
    'Content-Type': 'application/json'
}

# requisições
url_batch = 'http://localhost:4200/api/batch/rawschema/steps/all'
url_update = 'http://localhost:4200/api/batch/rawschema/steps/allupdate'

In [6]:
def make_request(url, data, headers):
    start_time = time.time()
    response = requests.post(url, json=data, headers=headers)
    elapsed_time = time.time() - start_time
    
    # Imprime as informações
    print(f"URL: {url}")
    print(f"Status code: {response.status_code}")
    
    try:
        response_json = response.json()
        print(f"Response: {response_json}")
    except JSONDecodeError:
        print("Response: Unable to decode JSON")
    
    print(f"Tempo de processamento: {elapsed_time} segundos")
    print("------------------------")  
    
    return response, elapsed_time

# Dados do lote (batch) para twitter_400
data_batch = {
    "authentication": {
        "authMechanism": "SCRAM-SHA-1",
        "userName": config['database_userName'],
        "password": config['database_password']
    },
    "port": "27017",
    "address": "localhost",
    "databaseName": config['database'],
    "collectionName": config['initial_collection'],
    "userId": "65b07893d3104d1b36282d4f",
}


# Arrays para armazenar os tempos de execução
elapsed_times_batch = []
elapsed_times_update = []

# Abre um arquivo CSV para escrever os resultados
with open('resultados_vk_update.csv', mode='w', newline='') as file:
   
    fieldnames = ['Iteração', 'Coleção', 'Tempo de Execução (Batch)', 'Tempo de Execução (Update)']
    writer = csv.DictWriter(file, fieldnames=fieldnames)

    # Escreve os cabeçalhos no arquivo
    writer.writeheader()

    # Executa as requisições múltiplas vezes
    for iteration in range(num_repetitions):
        # Solicitação de lote (batch) usando twitter_400
        response_batch, elapsed_time_batch = make_request(url_batch, data_batch, headers_batch)

        # Itera sobre as coleções para atualização
        for collection in collections_to_update:
            # Atualiza os dados da solicitação de atualização com o novo batchId
            data_update = {
                "authentication": {
                    "authMechanism": "SCRAM-SHA-1",
                    "userName": config['database_userName'],
                    "password": config['database_password']
                },
                "port": "27017",
                "address": "localhost",
                "databaseName": config['database'],
                "collectionName": collection,
                "userId": "65b07893d3104d1b36282d4f",
                "batchId": response_batch.json().get('batchId')
            }
            iteration_ = iteration + 1
            print("Iteração: ", iteration_)
            
            # Solicitação de atualização usando o batchId extraído
            response_update, elapsed_time_update = make_request(url_update, data_update, headers_batch)
            
            # Escreve os resultados no arquivo CSV
            writer.writerow({
                'Iteração': iteration + 1,
                'Coleção': collection,
                'Tempo de Execução (Batch)': elapsed_time_batch,
                'Tempo de Execução (Update)': elapsed_time_update
            })


print(f"Número de repetições: {num_repetitions}")



URL: http://localhost:4200/api/batch/rawschema/steps/all
Status code: 200
Response: {'batchId': '68992f6f50d17cc3be08e324', 'userId': '68992f6be3ac8d6b20c819b0', 'status': 'DONE', 'type': 'DONE', 'dbUri': 'localhost:27017/experiment_collections', 'collectionName': 'esquema_inicial', 'date': '2025-08-10T23:46:55.267Z', 'my_version': 0, '_id': '68992f6f50d17cc3be08e33e', 'createdAt': '2025-08-10T23:46:55.267Z', 'updatedAt': '2025-08-10T23:46:55.267Z', '__v': 0}
Tempo de processamento: 0.06491637229919434 segundos
------------------------
Iteração:  1
URL: http://localhost:4200/api/batch/rawschema/steps/allupdate
Status code: 200
Response: {'batchId': '68992f6f50d17cc3be08e324', 'userId': '68992f6be3ac8d6b20c819b0', 'status': 'DONE', 'type': 'DONE', 'dbUri': 'localhost:27017/experiment_collections', 'collectionName': '8_experimentReferences', 'date': '2025-08-10T23:46:55.356Z', 'my_version': 1, '_id': '68992f6fe9f5c22df7a1a2de', 'createdAt': '2025-08-10T23:46:55.357Z', 'updatedAt': '2025-