# Controlador e Configuração de entrada

O Controlador e a configuração de entrada são usados para gerar a carga de trabalho necessária para a nossa abordagem. O Controlador monitora a inserção de novos documentos na coleção e verifica se o número de novos documentos adicionados atingiu ou excedeu o limite pré-definido pelo usuário, estabelecido em termos da quantidade de novos documentos na coleção, determinando assim se uma atualização do esquema é necessária.



![Descrição da imagem](caminho/para/sua/imagem.png)

Monitoramentos Banco de dados MongoDB usando replicaset

https://www.mongodb.com/developer/languages/python/python-change-streams/

In [2]:
import pymongo
import time
import logging
from bson.json_util import dumps

# Configuração do logging
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)


# Função para se conectar ao MongoDB
def conectar_mongo():
    return pymongo.MongoClient('mongodb://localhost:27016,localhost:27018,localhost:27019/?replicaSet=rs0')

# Função para iniciar o changestream em uma coleção do MongoDB
def iniciar_changestream(client, collection_name, resume_token=None):
    return client.changestream[collection_name].watch(
        [{'$match': {'operationType': {'$in': ['insert']}}}],
        resume_after=resume_token
    )

# Função para salvar um documento em outro banco de dados MongoDB
def salvar_documento_em_outro_banco(documento, colecao_destino):
    try:
        client_destino = pymongo.MongoClient('mongodb://localhost:27017')
        database_destino = client_destino['seu_outro_banco']
        colecao_destino = database_destino[colecao_destino]
        colecao_destino.insert_one(documento)
    except Exception as e:
        logger.error(f'Erro ao salvar documento em outro banco: {e}')

def acionar_evolucao (num_documentos, limite_documentos):
    # Verificar se a contagem de documentos atingiu o limite definido pelo usuário
    if num_documentos >= limite_documentos:
        logger.info(f'Atingiu o limite de {limite_documentos} documentos.')
        logger.info(f'Iniciando a atualização com {limite_documentos}')
        
        # Executar a atualização do esquema
        # Usar com id
        # executar_atualizacao_do_esquema (Id)
        update = executar_atualizacao_do_esquema() 
        
        if update:
            logger.info('O esquema foi atualizado ...')
            # Atualizando indice do documentos 
            indice_pa += 1
            num_documentos = 0
            atualizacao_do_esquema_concluida = False
            time.sleep(2)
        else:
            logger.info('Esperando a atualização do esquema terminar...')
            time.sleep(30)
    else:
        atualizacao_do_esquema_concluida = False
        
        


In [None]:
def main():
    # Conecta-se ao MongoDB
    client = conectar_mongo()
    resume_token = None
    primeiro_termo_pa = 100
    razao_pa = 100
    num_documentos = 0
    indice_pa = 0
    atualizacao_do_esquema_concluida = True

    try:
        while True:
            # Inicia o changestream na coleção especificada 
            # monitorando a coleção twitter_100000
            with iniciar_changestream(client, 'twitter_100000', resume_token) as change_stream:
                for change in change_stream:
                    # Extrai o documento inserido e determina a coleção de destino
                    documento_inserido = change['fullDocument']
                    limite_documentos = primeiro_termo_pa + (indice_pa * razao_pa)
                    
                    # Em vez de usar colecao_ deve usar o nome da coleção que esta sendo monitorada. 
                    colecao_destino = f'colecao_{limite_documentos}'
                    
                    # Salva o documento em outro banco de dados
                    salvar_documento_em_outro_banco(documento_inserido, colecao_destino)
                    
                    # Atualiza o token de continuação e a contagem de documentos
                    #Salvar o token em um arquivo para recuperar caso seja necessario
                    resume_token = change['_id']
                    num_documentos += 1

                    logger.info(f'num_documentos: {num_documentos}')
                    logger.info(dumps(change))
                    logger.info('')

                    # Verifica se a contagem de documentos atingiu o limite
                    if num_documentos >= limite_documentos:
                        logger.info(f'Atingiu o limite de {limite_documentos} documentos.')
                        logger.info(f'Iniciando a atualização com {limite_documentos} documentos...')
                        
                        # Executa a atualização do esquema
                        update = executar_atualizacao_do_esquema()

                        if update:
                            logger.info('A atualização do esquema terminou... ')
                            # Atualiza o índice e reinicia a contagem de documentos
                            indice_pa += 1
                            num_documentos = 0
                            atualizacao_do_esquema_concluida = False
                            time.sleep(2)
                        else:
                            logger.info('Esperando a atualização do esquema terminar...')
                            time.sleep(30)
                    else:
                        atualizacao_do_esquema_concluida = False

                # Verifica se a atualização do esquema foi concluída
                if not atualizacao_do_esquema_concluida:
                    logger.info('Atividades de atualização concluídas.')
                    break

    except KeyboardInterrupt:
        logger.info('Encerrando programa devido a KeyboardInterrupt.')
    except pymongo.errors.PyMongoError as e:
        logger.error(f"Erro no ChangeStream: {e}")
    except Exception as e:
        logger.error(f"Erro inesperado: {e}")

    time.sleep(1)

# Ponto de entrada do script
if __name__ == "__main__":
    main()



### Requisição para evoluir esquema JSON

In [None]:
import requests
import time
import csv
from json.decoder import JSONDecodeError



# Função para realizar a requisição e medir o tempo de execução
def make_request(url, data, headers):
    start_time = time.time()
    response = requests.post(url, json=data, headers=headers)
    elapsed_time = time.time() - start_time
    
    # Imprime as informações
    print(f"URL: {url}")
    print(f"Status code: {response.status_code}")
    
    try:
        # Tenta decodificar a resposta JSON
        response_json = response.json()
        print(f"Response: {response_json}")
    except JSONDecodeError:
        # Se houver um erro ao decodificar, imprime uma mensagem indicando que não foi possível decodificar a resposta
        print("Response: Unable to decode JSON")
    
    print(f"Tempo de processamento: {elapsed_time} segundos")
    print("------------------------")  # Adiciona uma linha para separar as saídas
    
    return response, elapsed_time


# def make_request(url, data, headers):
#     start_time = time.time()
#     response = requests.post(url, json=data, headers=headers)
#     elapsed_time = time.time() - start_time
#     return response, elapsed_time

def run_iteration(url_batch, url_update, data_batch, headers_batch, collection_name, num_repetitions):
    elapsed_times_batch = []
    elapsed_times_update = []

    with open('resultados.csv', mode='a', newline='') as file:
        fieldnames = ['Iteração', 'Coleção', 'Tempo de Execução (Batch)', 'Tempo de Execução (Update)']
        writer = csv.DictWriter(file, fieldnames=fieldnames)

        for iteration in range(num_repetitions):
            response_batch, elapsed_time_batch = make_request(url_batch, data_batch, headers_batch)
            elapsed_times_batch.append(elapsed_time_batch)

            data_update = {
                "authentication": {
                    "authMechanism": "SCRAM-SHA-1",
                    "userName": "",
                    "password": ""
                },
                "port": "27017",
                "address": "localhost",
                "databaseName": "experimentTwitterUpdate",
                "collectionName": collection_name,
                "userId": "655a51b42a775fdad3eab456",
                "batchId": response_batch.json().get('batchId')
            }

            response_update, elapsed_time_update = make_request(url_update, data_update, headers_batch)
            elapsed_times_update.append(elapsed_time_update)

            writer.writerow({
                'Iteração': iteration + 1,
                'Coleção': collection_name,
                'Tempo de Execução (Batch)': elapsed_time_batch,
                'Tempo de Execução (Update)': elapsed_time_update
            })

    return elapsed_times_batch, elapsed_times_update

def calculate_average_times(elapsed_times_batch, elapsed_times_update, num_repetitions):
    average_time_batch = sum(elapsed_times_batch) / num_repetitions
    average_time_update = sum(elapsed_times_update) / num_repetitions

    print(f"Número de repetições: {num_repetitions}")
    print(f"Tempo médio de processamento (batch): {average_time_batch:.6f} segundos")
    print(f"Tempo médio de processamento (update): {average_time_update:.6f} segundos")

def executar_atualizacao_do_esquema():
    # Configurações compartilhadas entre as requisições
    url_batch = 'http://localhost:4200/api/batch/rawschema/steps/all'
    url_update = 'http://localhost:4200/api/batch/rawschema/steps/allupdate'

    # Dados do lote (batch) para twitter_400
    data_batch = {
        "authentication": {
            "authMechanism": "SCRAM-SHA-1",
            "userName": "",
            "password": ""
        },
        "port": "27017",
        "address": "localhost",
        "databaseName": "experimentTwitterBatchBB",
        "collectionName": "experiment_twitter_batch_1",
        "userId": "6557b923d761a2380847cb84",
        "batchId": "65526db0989842e5e5d89e1d"
    }

    # Cabeçalhos para a solicitação do lote (batch)
    headers_batch = {
        'Authorization': 'Bearer eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJ1c2VyIjp7Il9pZCI6IjY1ODEwYzYyY2YyMTY0Njk0NDUxNTM0NCIsInVzZXJuYW1lIjoiZWxlb25pbGlhIiwiZW1haWwiOiJhZG1pbkBnbWFpbC5jb20iLCJjcmVhdGVkQXQiOiIyMDIzLTEyLTE5VDAzOjIyOjEwLjQ4NFoiLCJ1cGRhdGVkQXQiOiIyMDIzLTEyLTE5VDAzOjIyOjEwLjQ4NFoiLCJfX3YiOjB9LCJpYXQiOjE3MDI5NTYxMzB9._ie_brzLETlLk0cUh7JK_nh-BDuOG7QDEsOZxkFs1-g',
        'Content-Type': 'application/json'
    }

    # Nome da coleção para atualização
    collection_name = "twitter_900"

    # Número de repetições
    num_repetitions = 2

    elapsed_times_batch, elapsed_times_update = run_iteration(url_batch, url_update, data_batch, headers_batch, collection_name, num_repetitions)
    calculate_average_times(elapsed_times_batch, elapsed_times_update, num_repetitions)
if __name__ == "__main__":
    main()
