## Experimentos da abordagem de evolução incremental de esquemas JSON

* Requisições para evolução de esquemas 
    * 'http://localhost:4200/api/batch/rawschema/steps/all'

    * 'http://localhost:4200/api/batch/rawschema/steps/allupdate'

* Execultar os experimentos 10 vezes

* Salvar o resultado do tempo de processamento em csv

* **Coleção usada no esquema inicial**
    * "twitter_450"
    * "vk_450"
    * "livros_10000"
* **Conjuntos de coleções usadas para update**

    * **Conjunto de dados Twitter**

        * "twitter_900",
        * "twitter_1800",
        * "twitter_3600",
        * "twitter_7200",
        * "twitter_14400",
        * "twitter_28800",
        * "twitter_57600",
        * "twitter_115200",
        * "twitter_230400",
        * "twitter_460800",
        * "twitter_921600",
        
        

    * **Conjunto de dados VK**

        * "vk_900",
        * "vk_1800",
        * "vk_3600",
        * "vk_7200",
        * "vk_14400",
        * "vk_28800",
        * "vk_57600",
        * "vk_115200",
        * "vk_230400",
        * "vk_460800",
        * "vk_921600",

    * **Conjunto de dados de metadados de livros**

        * "books_10000"
        * "books_20000"
        * "books_40000"
        * "books_80000"
        * "books_160000"
        * "books_320000"
        * "books_640000"
        * "books_1280000"
        * "books_2560000"
        * "books_5120000"
        * "books_10240000"
        * "books_20480000"


#### Imports

In [10]:
import requests
import time
import csv
from json.decoder import JSONDecodeError
import json

#### Dados de entrada

In [13]:
# Caminho para o arquivo de configuração
config_file_path = 'config_JSD_Evolution.json'

# Carregar os dados do arquivo JSON
with open(config_file_path, 'r') as file:
    config = json.load(file)


# Número de repetições
num_repetitions = config['num_repetitions']


# Coleções usadas para evoluir o esquema JSON
collections_to_update = config['collections_to_update']


### Criar uma conta para testar

In [14]:
# Dados do usuário
user_data = {
    'username': config['username'],
    'email': config['email'],
    'password': config['password']
}

# requisição
url = 'http://localhost:4200/api/register'

# Fazendo a requisição POST
response = requests.post(url, json=user_data)

# Verificando a resposta
if response.status_code == 200:
    print('Requisição bem-sucedida!')
    print('Resposta:', response.json())  
elif response.status_code == 400:
    try:
        error_details = response.json()
        # Verifica se o erro é de duplicação de email
        if error_details.get('error', {}).get('code') == 11000 and 'email' in error_details.get('error', {}).get('keyPattern', {}):
            print('O email já está registrado.')
        else:
            print('Erro na requisição:', response.status_code)
            print('Detalhes do erro:', response.text)
    except ValueError:
        # Caso a resposta não seja um JSON válido
        print('Erro na requisição:', response.status_code)
        print('Detalhes do erro:', response.text)
else:
    print('Erro na requisição:', response.status_code)
    print('Detalhes do erro:', response.text)


O email já está registrado.


### Acessar a conta criada e recuperar o token de autentificação

In [15]:
# Dados de login
login_data = {
    'email': config['email'],
    'password': config['password']
}

# requisição
login_url = 'http://localhost:4200/api/login' 

# Fazendo a requisição de login
response = requests.post(login_url, json=login_data)

# Verificando a resposta
if response.status_code == 200:
    print('Login bem-sucedido!')
    token = response.json().get('token')
    if token:
        print('Token de acesso:', token)
    else:
        print('Token de acesso não encontrado na resposta.')
else:
    print('Erro no login:', response.json().get('message'))
    print('Código de erro:', response.json().get('code'))



Login bem-sucedido!
Token de acesso: eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJ1c2VyIjp7Il9pZCI6IjY2NWQ2YjY2Mzk0MDc4YWFlNjNhMDliMCIsInVzZXJuYW1lIjoiZXhhbXBsZV8xIiwiZW1haWwiOiJleGFtcGxlXzFAZXhhbXBsZS5jb20iLCJjcmVhdGVkQXQiOiIyMDI0LTA2LTAzVDA3OjA2OjE0LjgwN1oiLCJ1cGRhdGVkQXQiOiIyMDI0LTA2LTAzVDA3OjA2OjE0LjgwN1oiLCJfX3YiOjB9LCJpYXQiOjE3MTc4OTE1Nzh9.I7FhgMlP7gleU_MXD1VSTeOnaOVppsdYY008JWWip18


### Teste JSD Evolution

In [16]:
# token autorização
headers_batch = {
    'Authorization': 'Bearer '+ token,
    'Content-Type': 'application/json'
}

# requisições
url_batch = 'http://localhost:4200/api/batch/rawschema/steps/all'
url_update = 'http://localhost:4200/api/batch/rawschema/steps/allupdate'

In [17]:
def make_request(url, data, headers):
    start_time = time.time()
    response = requests.post(url, json=data, headers=headers)
    elapsed_time = time.time() - start_time
    
    # Imprime as informações
    print(f"URL: {url}")
    print(f"Status code: {response.status_code}")
    
    try:
        response_json = response.json()
        print(f"Response: {response_json}")
    except JSONDecodeError:
        print("Response: Unable to decode JSON")
    
    print(f"Tempo de processamento: {elapsed_time} segundos")
    print("------------------------")  
    
    return response, elapsed_time

# Dados do lote (batch) para twitter_400
data_batch = {
    "authentication": {
        "authMechanism": "SCRAM-SHA-1",
        "userName": config['database_userName'],
        "password": config['database_password']
    },
    "port": "27017",
    "address": "localhost",
    "databaseName": config['database'],
    "collectionName": config['initial_collection'],
    "userId": "65b07893d3104d1b36282d4f",
}


# Arrays para armazenar os tempos de execução
elapsed_times_batch = []
elapsed_times_update = []

# Abre um arquivo CSV para escrever os resultados
with open('resultados_vk_update.csv', mode='w', newline='') as file:
   
    fieldnames = ['Iteração', 'Coleção', 'Tempo de Execução (Batch)', 'Tempo de Execução (Update)']
    writer = csv.DictWriter(file, fieldnames=fieldnames)

    # Escreve os cabeçalhos no arquivo
    writer.writeheader()

    # Executa as requisições múltiplas vezes
    for iteration in range(num_repetitions):
        # Solicitação de lote (batch) usando twitter_400
        response_batch, elapsed_time_batch = make_request(url_batch, data_batch, headers_batch)

        # Itera sobre as coleções para atualização
        for collection in collections_to_update:
            # Atualiza os dados da solicitação de atualização com o novo batchId
            data_update = {
                "authentication": {
                    "authMechanism": "SCRAM-SHA-1",
                    "userName": config['database_userName'],
                    "password": config['database_password']
                },
                "port": "27017",
                "address": "localhost",
                "databaseName": config['database'],
                "collectionName": collection,
                "userId": "65b07893d3104d1b36282d4f",
                "batchId": response_batch.json().get('batchId')
            }
            iteration_ = iteration + 1
            print("Iteração: ", iteration_)
            
            # Solicitação de atualização usando o batchId extraído
            response_update, elapsed_time_update = make_request(url_update, data_update, headers_batch)
            
            # Escreve os resultados no arquivo CSV
            writer.writerow({
                'Iteração': iteration + 1,
                'Coleção': collection,
                'Tempo de Execução (Batch)': elapsed_time_batch,
                'Tempo de Execução (Update)': elapsed_time_update
            })


print(f"Número de repetições: {num_repetitions}")



URL: http://localhost:4200/api/batch/rawschema/steps/all
Status code: 200
Response: {'batchId': '6664f1fe779d2269ae719a5d', 'userId': '665d6b66394078aae63a09b0', 'status': 'DONE', 'type': 'DONE', 'dbUri': 'localhost:27017/Teste_simples', 'collectionName': 'teste_1', 'date': '2024-06-09T00:06:22.894Z', 'my_version': 0, '_id': '6664f1fe779d2269ae719a76', 'createdAt': '2024-06-09T00:06:22.895Z', 'updatedAt': '2024-06-09T00:06:22.895Z', '__v': 0}
Tempo de processamento: 0.09057211875915527 segundos
------------------------
Iteração:  1
URL: http://localhost:4200/api/batch/rawschema/steps/allupdate
Status code: 200
Response: {'batchId': '6664f1fe779d2269ae719a5d', 'userId': '665d6b66394078aae63a09b0', 'status': 'DONE', 'type': 'DONE', 'dbUri': 'localhost:27017/Teste_simples', 'collectionName': 'teste_2', 'date': '2024-06-09T00:06:22.977Z', 'my_version': 1, '_id': '6664f1fe4cbc76110767198d', 'createdAt': '2024-06-09T00:06:22.978Z', 'updatedAt': '2024-06-09T00:06:22.978Z', '__v': 0}
Tempo de 

URL: http://localhost:4200/api/batch/rawschema/steps/allupdate
Status code: 200
Response: {'batchId': '6664f1ff52ca5b49fdd21829', 'userId': '665d6b66394078aae63a09b0', 'status': 'DONE', 'type': 'DONE', 'dbUri': 'localhost:27017/Teste_simples', 'collectionName': 'teste_2', 'date': '2024-06-09T00:06:23.834Z', 'my_version': 1, '_id': '6664f1ff779d2269ae719ae7', 'createdAt': '2024-06-09T00:06:23.835Z', 'updatedAt': '2024-06-09T00:06:23.835Z', '__v': 0}
Tempo de processamento: 0.05110764503479004 segundos
------------------------
Iteração:  6
URL: http://localhost:4200/api/batch/rawschema/steps/allupdate
Status code: 200
Response: {'batchId': '6664f1ff52ca5b49fdd21829', 'userId': '665d6b66394078aae63a09b0', 'status': 'DONE', 'type': 'DONE', 'dbUri': 'localhost:27017/Teste_simples', 'collectionName': 'teste_3', 'date': '2024-06-09T00:06:23.885Z', 'my_version': 2, '_id': '6664f1ff4cbc761107671a00', 'createdAt': '2024-06-09T00:06:23.885Z', 'updatedAt': '2024-06-09T00:06:23.885Z', '__v': 0}
Tem