In [1]:
import etcd3
from tqdm import tqdm
from simulation import RETRIEVE, CREATE, DELETE, create_simulation
from client import ClientWithFailover
from collections import Counter

Para realizar el experimento debemos crear un escenario de prueba, para ello
definimos el método `create_simulation(iterations, seed)` que devuelve una lista de operaciones a realizar,
por simplicidad solo se consideraron las operaciones de INSERTAR, CONSULTAR y ELIMINAR. El formato en que
se definen las operaciones es:

- INSERTAR: `("CREATE", device, ip)`
- CONSULTAR: `("RETRIEVE", device)`
- ELIMINAR: `("DELETE", device)`

In [2]:
simulation = create_simulation(iterations=100000, seed=123)

Teniendo el escenario de prueba debemos definir los objetivos del experimento

1. Simular el escenario de prueba utilizando una base de datos llave-valor (etcd) y una base de datos relacional (MySQL)
2. Comprobar si las bases de datos fueron capaces de realizar las operaciones: no se producen excepciones durante la ejecución y el total de llaves en la base de datos es correcta (debería ser `CANT_OPERACIONES_INSERTAR - CANT_OPERACIONES_ELIMINAR`); y comparar el tiempo de ejecución de la simulación
3. Comprobar que el clúster de etcd es capaz de realizar las operaciones en caso de fallo del nodo principal, y en caso de restablecimiento de la conexión sincronizar los datos de todos los nodos.

In [3]:
counter = Counter([x[0] for x in simulation])
print("La simulación generada contiene las siguientes operaciones:")
print()
print(f"\tINSERTAR: {counter[CREATE]}")
print(f"\tCONSULTAR: {counter[RETRIEVE]}")
print(f"\tELIMINAR: {counter[DELETE]}")
print()
print(f"La cantidad de llaves esperada al final del experimento es: {counter[CREATE] - counter[DELETE]}")


La simulación generada contiene las siguientes operaciones:

	INSERTAR: 40234
	CONSULTAR: 41989
	ELIMINAR: 17777

La cantidad de llaves esperada al final del experimento es: 22457


## 1. Simulación del escenario

Para comunicarnos con un sistema gestor de base de datos llave-valor, al igual que para los relacionales, debemos utilizar una aplicación cliente. Para este caso decoramos la implementación del cliente de etcd provisto en el paquete de python `etcd3` para incorporar un protocolo ante fallos de conexión, este protocolo ya viene implementado de forma nativa en el cliente para shell.

Al cliente conectarse a un nodo del clúster de etcd tiene acceso a las direcciones de todos los nodos del cluster, esto permite establecer protocolos de recuperación en casos de fallas de nodos.

Para la base de datos llave-valor no es necesario la definición de esquema ya que no existe :), podemos directamente empezar a insertar, sin embargo, en caso de querer "agrupar" las llaves se aconseja añadir un prefijo a la llave para poder recuperar grupos
de llaves en base al prefijo.

In [4]:
etcd_client = ClientWithFailover('etcd1', 2380)

Succesfully created etcd client in cluster with nodes [('etcd1', 2380), ('etcd3', 2380), ('etcd2', 2380)] and current write node ('etcd1', 2380)


In [5]:
%%time
for op in tqdm(simulation):
    if op[0] == CREATE:
        etcd_client.put_with_retry("EXP1-" + op[1], op[2])
    elif op[0] == DELETE:
        etcd_client.delete_with_retry("EXP1-" + op[1])
    else:
        etcd_client.get_with_retry("EXP1-" + op[1])
        

  0%|          | 0/100000 [00:00<?, ?it/s]

Error: Failover procedure started
Selected etcd2:2380 as the new write node


100%|██████████| 100000/100000 [01:11<00:00, 1396.94it/s]

CPU times: user 21.4 s, sys: 5.11 s, total: 26.5 s
Wall time: 1min 11s





Para realizar la simulación en MySQL debemos crear un esquema `ips(device CHAR(200), ip CHAR(20))`

In [6]:
%load_ext sql
%sql mysql://root:root@sample-dns-mysql

In [7]:
%%sql
CREATE DATABASE IF NOT EXISTS test_database;
USE test_database;
CREATE TABLE IF NOT EXISTS ips(
    device CHAR(200),
    ip CHAR(20),
    PRIMARY KEY (device)
);
SHOW DATABASES;

 * mysql://root:***@sample-dns-mysql
1 rows affected.
0 rows affected.
0 rows affected.
5 rows affected.


Database
information_schema
mysql
performance_schema
sys
test_database


In [8]:
%%time
%%capture
for op in simulation:
    if op[0] == CREATE:
        q = f"INSERT INTO ips (device, ip) VALUES (\'{op[1]}\', \'{op[2]}\')"
        %sql $q;
    elif op[0] == DELETE:
        q = f"DELETE FROM ips WHERE device = \'{op[1]}\'"
        %sql $q;
    else:
        q = f"SELECT * FROM ips WHERE device = \'{op[1]}\'"
        %sql $q;

CPU times: user 56.8 s, sys: 6.76 s, total: 1min 3s
Wall time: 2min 42s


## 2. Resultados y comparación

In [9]:
etcd = etcd3.client(host='etcd1', port=2380)  
 # Use the get_all() method to retrieve all keys and count them
key_count = sum(1 for _ in etcd.get_prefix("EXP1-"))
assert key_count == counter[CREATE] - counter[DELETE]

In [10]:
mysql_count = %sql SELECT COUNT(1) FROM ips 
assert mysql_count[0][0] == counter[CREATE] - counter[DELETE]

 * mysql://root:***@sample-dns-mysql
1 rows affected.


## 3. Comprobación de disponibilidad 

Para comprobar que el clúster es capaz de realizar las operaciones incluso en caso de falla de uno de los nodos, volveremos
a ejecutar la simulación pero en este caso detendremos el nodo al cual nos conectamos inicialmente, este evento debería detener la ejecución debido a un error de conexión hasta que el protocolo de fallo del cliente conecte con uno de los nodos que se mantienen activos. Al finalizar le ejecución reiniciaremos el nodo inicial y comprobaremos que todos los nodos tienen los mismos datos.

In [11]:
%%time
for op in tqdm(simulation):
    if op[0] == CREATE:
        etcd_client.put_with_retry("EXP2-" + op[1], op[2])
    elif op[0] == DELETE:
        etcd_client.delete_with_retry("EXP2-" + op[1])
    else:
        etcd_client.get_with_retry("EXP2-" + op[1])

 12%|█▏        | 11973/100000 [00:09<01:29, 980.28it/s] 

Error: Failover procedure started
Selected etcd3:2380 as the new write node


100%|██████████| 100000/100000 [01:13<00:00, 1353.82it/s]

CPU times: user 23 s, sys: 5.82 s, total: 28.8 s
Wall time: 1min 13s





In [12]:
etcd = etcd3.client(host='etcd1', port=2380)  
 # Use the get_all() method to retrieve all keys and count them
key_count1 = sum(1 for _ in etcd.get_prefix("EXP2-"))

In [13]:
etcd = etcd3.client(host='etcd2', port=2380)  
 # Use the get_all() method to retrieve all keys and count them
key_count2 = sum(1 for _ in etcd.get_prefix("EXP2-"))

In [14]:
etcd = etcd3.client(host='etcd3', port=2380)  
 # Use the get_all() method to retrieve all keys and count them
key_count3 = sum(1 for _ in etcd.get_prefix("EXP2-"))

In [15]:
assert key_count1 == key_count2 == key_count3 == counter[CREATE] - counter[DELETE]