## Experimentos da abordagem de evolução incremental de esquemas JSON

* Requisições para evolução de esquemas 
    * 'http://localhost:4200/api/batch/rawschema/steps/all'

    * 'http://localhost:4200/api/batch/rawschema/steps/allupdate'

* Execultar os experimentos 10 vezes

* Salvar o resultado do tempo de processamento em csv

* **Coleção usada no esquema inicial**
    * "twitter_450"
    * "vk_450"
    * "livros_10000"
* **Conjuntos de coleções usadas para update**

    * **Conjunto de dados Twitter**

        * "twitter_900",
        * "twitter_1800",
        * "twitter_3600",
        * "twitter_7200",
        * "twitter_14400",
        * "twitter_28800",
        * "twitter_57600",
        * "twitter_115200",
        * "twitter_230400",
        * "twitter_460800",
        * "twitter_921600",
        
        

    * **Conjunto de dados VK**

        * "vk_900",
        * "vk_1800",
        * "vk_3600",
        * "vk_7200",
        * "vk_14400",
        * "vk_28800",
        * "vk_57600",
        * "vk_115200",
        * "vk_230400",
        * "vk_460800",
        * "vk_921600",

    * **Conjunto de dados de metadados de livros**

        * "books_10000"
        * "books_20000"
        * "books_40000"
        * "books_80000"
        * "books_160000"
        * "books_320000"
        * "books_640000"
        * "books_1280000"
        * "books_2560000"
        * "books_5120000"
        * "books_10240000"
        * "books_20480000"


#### Imports

In [None]:
import requests
import time
import csv
from json.decoder import JSONDecodeError

#### Dados de entrada

In [None]:
# Dados Criar conta

username = 'example_1'
email = 'example_1@example.com'
password = 'password123'


# Número de repetições
num_repetitions = 10

# Database 
database = "experiment_VK_update"

# Coleção usada para gerar o primeiro esquema
initial_collection = 'vk_450'

# Coleções usadas para evoluir o esquema JSON
collections_to_update = ['vk_900',
                         'vk_1800',
                         'vk_3600',
                         'vk_7200',
                         'vk_14400',
                         'vk_28800',
                         'vk_57600',
                         'vk_115200',
                         'vk_230400',
                         'vk_460800',
                         'vk_921600']

database_userName = ""
database_password = ""

### Criar uma conta para testar

In [1]:
# Dados do usuário
user_data = {
    'username': username,
    'email': email,
    'password': password
}

# requisição
url = 'http://localhost:4200/api/register'

# Fazendo a requisição POST
response = requests.post(url, json=user_data)

# Verificando a resposta
if response.status_code == 200:
    print('Requisição bem-sucedida!')
    print('Resposta:', response.json())  
elif response.status_code == 400:
    try:
        error_details = response.json()
        # Verifica se o erro é de duplicação de email
        if error_details.get('error', {}).get('code') == 11000 and 'email' in error_details.get('error', {}).get('keyPattern', {}):
            print('O email já está registrado.')
        else:
            print('Erro na requisição:', response.status_code)
            print('Detalhes do erro:', response.text)
    except ValueError:
        # Caso a resposta não seja um JSON válido
        print('Erro na requisição:', response.status_code)
        print('Detalhes do erro:', response.text)
else:
    print('Erro na requisição:', response.status_code)
    print('Detalhes do erro:', response.text)


Erro: O email já está registrado.


### Acessar a conta criada e recuperar o token de autentificação

In [2]:
# Dados de login
login_data = {
    'email': email,
    'password': password
}

# requisição
login_url = 'http://localhost:4200/api/login' 

# Fazendo a requisição de login
response = requests.post(login_url, json=login_data)

# Verificando a resposta
if response.status_code == 200:
    print('Login bem-sucedido!')
    token = response.json().get('token')
    if token:
        print('Token de acesso:', token)
    else:
        print('Token de acesso não encontrado na resposta.')
else:
    print('Erro no login:', response.json().get('message'))
    print('Código de erro:', response.json().get('code'))



Login bem-sucedido!
Token de acesso: eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJ1c2VyIjp7Il9pZCI6IjY2NGY3NWY0MjI2OTRjYzc0NWZiODAxZiIsInVzZXJuYW1lIjoiZXhhbXBsZV8xIiwiZW1haWwiOiJleGFtcGxlXzFAZXhhbXBsZS5jb20iLCJjcmVhdGVkQXQiOiIyMDI0LTA1LTIzVDE2OjU5OjMyLjg0OVoiLCJ1cGRhdGVkQXQiOiIyMDI0LTA1LTIzVDE2OjU5OjMyLjg0OVoiLCJfX3YiOjB9LCJpYXQiOjE3MTY1NTUwNjl9.KjVdADB3Enyj2oOkht-YNnTA8p6mW0wvwyFVIY5Rl58


### Teste JSD Evolution

In [19]:
# token autorização
headers_batch = {
    'Authorization': 'Bearer '+ token,
    'Content-Type': 'application/json'
}

# requisições
url_batch = 'http://localhost:4200/api/batch/rawschema/steps/all'
url_update = 'http://localhost:4200/api/batch/rawschema/steps/allupdate'

In [20]:
def make_request(url, data, headers):
    start_time = time.time()
    response = requests.post(url, json=data, headers=headers)
    elapsed_time = time.time() - start_time
    
    # Imprime as informações
    print(f"URL: {url}")
    print(f"Status code: {response.status_code}")
    
    try:
        response_json = response.json()
        print(f"Response: {response_json}")
    except JSONDecodeError:
        print("Response: Unable to decode JSON")
    
    print(f"Tempo de processamento: {elapsed_time} segundos")
    print("------------------------")  
    
    return response, elapsed_time

# Dados do lote (batch) para twitter_400
data_batch = {
    "authentication": {
        "authMechanism": "SCRAM-SHA-1",
        "userName": "",
        "password": ""
    },
    "port": "27017",
    "address": "localhost",
    "databaseName": database,
    "collectionName": initial_collection,
    "userId": "65b07893d3104d1b36282d4f",
}


# Arrays para armazenar os tempos de execução
elapsed_times_batch = []
elapsed_times_update = []

# Abre um arquivo CSV para escrever os resultados
with open('resultados_vk_update.csv', mode='w', newline='') as file:
   
    fieldnames = ['Iteração', 'Coleção', 'Tempo de Execução (Batch)', 'Tempo de Execução (Update)']
    writer = csv.DictWriter(file, fieldnames=fieldnames)

    # Escreve os cabeçalhos no arquivo
    writer.writeheader()

    # Executa as requisições múltiplas vezes
    for iteration in range(num_repetitions):
        # Solicitação de lote (batch) usando twitter_400
        response_batch, elapsed_time_batch = make_request(url_batch, data_batch, headers_batch)

        # Itera sobre as coleções para atualização
        for collection in collections_to_update:
            # Atualiza os dados da solicitação de atualização com o novo batchId
            data_update = {
                "authentication": {
                    "authMechanism": "SCRAM-SHA-1",
                    "userName": "",
                    "password": ""
                },
                "port": "27017",
                "address": "localhost",
                "databaseName": database,
                "collectionName": collection,
                "userId": "65b07893d3104d1b36282d4f",
                "batchId": response_batch.json().get('batchId')
            }
            iteration_ = iteration + 1
            print("Iteração: ", iteration_)
            
            # Solicitação de atualização usando o batchId extraído
            response_update, elapsed_time_update = make_request(url_update, data_update, headers_batch)
            
            # Escreve os resultados no arquivo CSV
            writer.writerow({
                'Iteração': iteration + 1,
                'Coleção': collection,
                'Tempo de Execução (Batch)': elapsed_time_batch,
                'Tempo de Execução (Update)': elapsed_time_update
            })


print(f"Número de repetições: {num_repetitions}")



URL: http://localhost:4200/api/batch/rawschema/steps/all
Status code: 200
Response: {'batchId': '664bb1facd5363b7f9de8148', 'userId': '664baca15017eded320ad34c', 'status': 'DONE', 'type': 'DONE', 'dbUri': 'localhost:27017/experiment_collections', 'collectionName': 'esquema_inicial', 'date': '2024-05-20T20:26:34.745Z', 'my_version': 0, '_id': '664bb1facd5363b7f9de8162', 'createdAt': '2024-05-20T20:26:34.746Z', 'updatedAt': '2024-05-20T20:26:34.746Z', '__v': 0}
Tempo de processamento: 0.08166313171386719 segundos
------------------------
Iteração:  1
URL: http://localhost:4200/api/batch/rawschema/steps/allupdate
Status code: 200
Response: {'batchId': '664bb1facd5363b7f9de8148', 'userId': '664baca15017eded320ad34c', 'status': 'DONE', 'type': 'DONE', 'dbUri': 'localhost:27017/experiment_collections', 'collectionName': '8_experimentReferences', 'date': '2024-05-20T20:26:34.841Z', 'my_version': 1, '_id': '664bb1faa3410e2514855a3a', 'createdAt': '2024-05-20T20:26:34.842Z', 'updatedAt': '2024-