### Introducción

El reto supone la construcción de un autocodificador **determinístico convolucional**, es decir:
- Existe un espacio latente único. Por lo que, para cada entrada existe solo un punto en el espacio latente (relación bionivoca)
- No se introduce ruido ni distribuciones de probabilidad en el espacio latente.
- El autocodificador solo considera capas densas o convolucionales, entrenandas con pérdida como MSE o BCE.

### Competencias:
1. Diseñar e implementar un autocodificador utilizando una arquitectura basada en clases. 
2. Aplicar principios de redes convolucionales (CNN) y feedforward para diseñar el codificador y el decodificador.
3. Dividir el conjunto de datos en dos subconjuntos: conjunto de entrenamiento (80%) y conjunto de prueba (20%).
4. Aplicar y analizar el desempeño de diferentes métodos de optimización (descenso de gradiente, Adam, RMSprop, u otros) y de diferentes funciones de pérdida (MSE, BCE, etc.) 
5. Desarrollar una métrica (distancia hamming) para evaluar la calidad del decodificador.

### Instrucciones:
- Identifique las secciones con la palabra **competencia** y reemplace la línea  ```______________``` con el código que corresponda.
- Investigue que operadores se aplican para la construcción de una red de aprendizaje determinista (capa densa, funciones de activación).
- Evalué diferentes métodos de optimización y funciones de pérdida.  
- Investigue y desarrolle la métrica distancia hamming.

### Reto 1. Descifrando del mensaje secreto.

Un oponente genera mensajes de 32 bits con información confidencial y los cifra utilizando un codificador determinista que reduce cada mensaje a una secuencia de 16 números de punto flotante. De los 10,000 mensajes generados, se ha logrado interceptar solo el 30% de los originales (3000 mensajes) junto con sus correspondientes versiones cifradas (100 de ellos). Su misión es entrenar un decodificador capaz de reconstruir exactamente los mensajes originales a partir de sus versiones cifradas, utilizando únicamente los 3000 mensajes interceptados para el entrenamiento.<br>

Los siguientes son ejemplos de mensajes no-cifrados confidenciales<br>
```
11000110100110011001100110010101
10111010010100010110111001000110
11001100110100000000100001010011
10110001001010101101110100101000
``` 

El siguiente es un ejemplo un mensaje cifrado<br>
```
-0.21161067  0.9819643   0.50920117 -0.10046072  0.0970166   0.47773603
-0.02057732 -0.19037446  0.99944896  0.6825894  -0.1577787   0.3304235
0.73278713 -0.09858703  0.11817224  0.9356269
```

El reto consiste en construir un decodificador capaz de recuperar los mensajes cifrados interceptados sin conocer los detalles de la red neuronal que los generó, incluyendo:
- El número de capas.
- La cantidad de nodos por capa.
- Las funciones de activación utilizadas.
- El número de épocas y el tamaño del batch en su entrenamiento

In [4]:
# Librerías para aprendizaje
import tensorflow as tf
from tensorflow.keras.layers import Dense
from tensorflow.keras.models import Model

# Librerias para representación de datos y E/S
import numpy as np
from numpy import savetxt, loadtxt

- **Competencia 1**: Diseñar e implementar un autocodificador utilizando una arquitectura basada en clases. 
- **Competencia 2**: Aplicar principios de redes convolucionales (CNN) y feedforward para diseñar el codificador y el decodificador.

In [2]:
class Autocodificador(tf.keras.Model):
    def __init__(self, long_msg):
        super(Autocodificador, self).__init__()
        
        # Longitud del mensaje secreto
        self.long_msg = long_msg
        
        # Capas del codificador (codif)
        _______________________________
       
        # Capas del decodificador (decod)
        _______________________________
        
    
    def codificador(self, entradas):
        """ Interfaz para acceder solo al codificador """
        # Aplicación de las capas de codificador
        _______________________________
    
        return codificado

    
    def decodificador(self, codificado):
        """ Interfaz para acceder solo al decodificador """
        # Aplicación de las capas de decodificado
         _______________________________
            
        return decodificado    
    
    
    # Con training=True (modo entrenamiento) capas como:
    # - Dropout aplican aleatoriamente el apagado de neuronas.
    # - BatchNormalization usa la media y varianza del mini-lote en curso.
    #  Esta implementación no las aplica por ende training=False por omision.
    def call(self, entradas, training=False):
        codificado = self.codificador(entradas)  # Salida del codificador
        decodificado = self.decodificador(codificado)  # Salida del decodificador
        return decodificado

In [None]:
modelo = Autocodificador(long_msg)
modelo(tf.keras.Input(shape=(long_msg,)))  
modelo.summary()

In [3]:
long_msg = 64 

# Cargado de las 3000 cadenas interceptadas.
datos = loadtxt("mensajes_interceptados.csv", delimiter=",")

**Competencia 3**: Dividir el conjunto de datos en dos subconjuntos: conjunto de entrenamiento (80%) y conjunto de prueba (20%).

In [5]:
# Dividido en conjuntos de entrenamiento y prueba (80 % de entrenamiento, 20 % de prueba)

# Estime un humbrar para la selección del 80% de datos 
# para el proceso de entrenamiento
entrenamiento_tamano = _______________________________   
# Seleccione el 80% de datos en terminos del humbral previmente estimado
prueba_datos = _______________________________

# Convertir a conjuntos de datos TensorFlow
cargador_entrenamiento = tf.data.Dataset.from_tensor_slices(entrenamiento_datos)
cargador_prueba        = tf.data.Dataset.from_tensor_slices(prueba_datos)

# Defina el tamaño del batch
tamano_batch = _______________________________ 

# Aplicar mezcla, procesamiento por lotes y precarga al conjunto de entrenamiento
cargador_entrenamiento = cargador_entrenamiento.shuffle(buffer_size=10000).batch(tamano_batch).prefetch(tf.data.experimental.AUTOTUNE)

# Aplicar procesamiento por lotes y precarga al conjunto de pruebas
cargador_prueba = cargador_prueba.batch(tamano_batch).prefetch(tf.data.experimental.AUTOTUNE)

**Competencia 4**: Aplicar y analizar el desempeño de diferentes métodos de optimización (descenso de gradiente, Adam, RMSprop, u otros) y de diferentes funciones de pérdida (MSE, BCE, etc.)

In [None]:
# Número de épocas para entrenar el modelo

num_epocas = _______________________________       # Defina el número de epocas

# Definir el optimizador y la función de pérdida
optimizador = _______________________________      # Defina el optimizador
funcion_perdida =  _______________________________ # Defina la función de pérdida.

# Iterar sobre las épocas
for epoch in range(1, num_epocas + 1):
    
    # Registro de la pérdida de entrenamiento
    perdida_accum = 0.0

    ###################
    # Entrenar el modelo #
    ###################
    for batch_datos in cargador_entrenamiento:
        # El autocodificador espera una entrada de tamaño `long_msg`
        # Asegúrate de que los datos tengan la forma adecuada
        batch_datos = tf.reshape(batch_datos, (-1, long_msg))

        with tf.GradientTape() as tape:
            # Pase hacia adelante: calcula las salidas predichas pasando las entradas al modelo
            salidas = modelo(batch_datos)
            # Calcula la pérdida
            perdida = funcion_perdida(batch_datos, salidas)

        # Pase hacia atrás: calcula el gradiente de la pérdida con respecto a los parámetros del modelo
        gradients = tape.gradient(perdida, modelo.trainable_variables)
        # Realizar un paso de optimización (actualización de parámetros)
        optimizador.apply_gradients(zip(gradients, modelo.trainable_variables))

        # Actualizar la pérdida de entrenamiento acumulada
        perdida_accum += perdida.numpy() * batch_datos.shape[0]

    # Imprimir estadísticas de entrenamiento promedio
    perdida_accum = perdida_accum / len(cargador_entrenamiento)
    print(f'Epoca: {epoch} \tPerdida de entrenamiento: {perdida_accum:.6f}')

**Competencia 5**: Desarrollar una métrica (distancia hamming) para evaluar la calidad del decodificador.

In [49]:
# Calcular la distancia Hamming entre los mensajes reales y los descifrados
# distancia hamming. En este caso, si los mensajes son perfectamente 
# descifrados la distancia hamming será cero.

def hamming( x, y ):
    _______________________________
    
    return distancia

In [5]:
# Los 100 mensajes interceptados para los cuales existe codificación
mensajes_cifrados = loadtxt("mensajes_cifrados.csv", delimiter=",")
mensajes_originales = loadtxt("mensajes_originales.csv", delimiter=",")

In [47]:
# Los Codifica los mensajes interceptados
mensajes_cifrados = np.empty((0, 16), dtype=np.float32)
for mensaje in mensajes_interceptados:
    msgCifrado = codificador(mensaje.reshape(1,-1))
    mensajes_cifrados = np.vstack([mensajes_cifrados, msgCifrado])

In [48]:
# Almacenar y cargar los mensages cifrados
savetxt("mensajes_cifrados.csv", mensajes_cifrados, delimiter=",")
savetxt("mensajes_originales.csv", mensajes_interceptados, delimiter=",")

In [43]:
mensajes_cifrados = loadtxt("mensajes_cifrados.csv", delimiter=",")

In [53]:
mensajes_decodificados = np.empty((0, long_msg), dtype=np.float32)
for cifrado in mensajes_cifrados:
    decodificado = decodificador(cifrado.reshape(1,-1))
    decodificado = tf.cast(decodificado > 0.5, tf.float32)
    mensajes_decodificados = np.vstack([mensajes_decodificados, decodificado])

In [None]:
distancia = 0
for mensaje, decodificado in zip(mensajes_originales, mensajes_decodificados):
    mensaje = ''.join(str(int(bit)) for bit in mensaje)
    decodificado = ''.join(str(int(bit)) for bit in decodificado)
    entero_mensaje = int(mensaje,2)
    entero_decodificado = int(decodificado, 2)
    dist = hamming( entero_mensaje, entero_decodificado )
    distancia += dist
    # print("Mensaje original     : ", mensaje)
    # print("Mensaje decodificado : ", decodificado)
    # print("Distancia Hamming    : ", dist)
distancia = distancia/len(mensajes_interceptados)
print("La distancia promedio es: ", distancia)