# Parte 2
Elaboración de autoencoders

Acá se importan las librerías necesarias. También se importa el dataset MNIST.

In [1]:
from keras.layers import Input, Dense
from keras.models import Model
from keras.datasets import mnist
from keras.datasets import fashion_mnist
import numpy as np
(x_train_mnist, _), (x_test_mnist, _) = mnist.load_data()
(x_train_fashion_mnist, _), (x_test_fashion_mnist, _) = fashion_mnist.load_data()

Using TensorFlow backend.


En este paso se normalizan los datos y se añade ruido a las imágenes. Se normalizan los datos dividiendo entre 255.0. Se define el parametro de ruido gaussiano que se agregará a las imágenes con un factor de 0.05.

In [2]:
x_train = x_train.astype('float32') / 255.0
x_test = x_test.astype('float32') / 255.0
noise_rate = 0.05

Se añade ruido a las imágenes de entrenamiento y de prueba. Se añade ruido gaussiano a las imágenes con el factor definido anteriormente. Se limita el rango de los valores de los pixeles entre 0 y 1.

In [3]:
x_train_noisy = x_train + noise_rate * np.random.normal(loc=0.0, scale=1.0, size=x_train.shape)
x_test_noisy = x_test + noise_rate * np.random.normal(loc=0.0, scale=1.0, size=x_test.shape)
x_train_noisy = np.clip(x_train_noisy, 0.0, 1.0)
x_test_noisy = np.clip(x_test_noisy, 0.0, 1.0)

Se redimensionan los datos de entrenamiento y de prueba. Se redimensionan los datos de entrenamiento y de prueba para que tengan la forma (número de imágenes, número de pixeles). También se verifica que los datos de entrenamiento y de prueba tengan la misma cantidad de pixeles.

In [4]:
x_train = x_train.reshape((len(x_train), np.prod(x_train.shape[1:])))
x_test = x_test.reshape((len(x_test), np.prod(x_test.shape[1:])))
x_train_noisy = x_train_noisy.reshape((len(x_train_noisy), np.prod(x_train_noisy.shape[1:])))
x_test_noisy = x_test_noisy.reshape((len(x_test_noisy), np.prod(x_test_noisy.shape[1:])))
assert x_train_noisy.shape[1] == x_test_noisy.shape[1]

Se define la arquitectura del autoencoder con tres capas de codificación y tres capas de decodificación. Las capas de codificación tienen 128, 64 y 32 neuronas respectivamente. Las capas de decodificación tienen 64, 128 y 784 neuronas respectivamente. 

In [5]:
inputs = Input(shape=(x_train_noisy.shape[1],))
encode1 = Dense(128, activation='relu')(inputs)
encode2 = Dense(64, activation='tanh')(encode1)
encode3 = Dense(32, activation='relu')(encode2)
decode3 = Dense(64, activation='relu')(encode3)
decode2 = Dense(128, activation='sigmoid')(decode3)
decode1 = Dense(x_train_noisy.shape[1], activation='relu')(decode2)

2024-08-18 19:30:16.608111: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcuda.so.1
2024-08-18 19:30:16.621956: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:981] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero
2024-08-18 19:30:16.623961: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1561] Found device 0 with properties: 
pciBusID: 0000:01:00.0 name: NVIDIA GeForce RTX 4090 computeCapability: 8.9
coreClock: 2.52GHz coreCount: 128 deviceMemorySize: 23.42GiB deviceMemoryBandwidth: 938.86GiB/s
2024-08-18 19:30:16.624052: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcudart.so.10.1
2024-08-18 19:30:16.624785: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcublas.so.10
2024-08-18 19:30:16.635515: I tensorflow/stream_executor/pl

Se compila el autoencoder con el optimizador 'sgd' y la función de pérdida 'mean_squared_error'. Se entrena el autoencoder con los datos de entrenamiento y se evalúa con los datos de prueba. Se imprimen los resultados de la evaluación.

In [6]:
autoencoder = Model(inputs, decode1)
autoencoder.compile(optimizer='sgd', loss='mean_squared_error',metrics=['accuracy'])
autoencoder.fit(x_train,x_train,epochs=5,batch_size=256,shuffle=True)

Epoch 1/5


2024-08-18 19:33:04.994616: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library libcublas.so.10


Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x75250b88ba90>

Se evalúa el autoencoder con los datos de prueba y se imprimen los resultados de la evaluación. Se obtienen los pesos del autoencoder y se guardan en un archivo.

In [7]:
metrics = autoencoder.evaluate(x_test_noisy, x_test, verbose=1)
print()
print("%s:%.2f%%" % (autoencoder.metrics_names[1], metrics[1]*100))
print()
results = autoencoder.predict(x_test)
all_AE_weights_shapes = [x.shape for x in autoencoder.get_weights()]
print(all_AE_weights_shapes)
ww=len(all_AE_weights_shapes)
deeply_encoded_MNIST_weight_matrix = autoencoder.get_weights()[int((ww/2))]
print(deeply_encoded_MNIST_weight_matrix.shape)
autoencoder.save_weights("all_AE_weights.h5")


accuracy:0.35%

[(784, 128), (128,), (128, 64), (64,), (64, 32), (32,), (32, 64), (64,), (64, 128), (128,), (128, 784), (784,)]
(32, 64)


Se obtiene una precisión del 35% con los datos de prueba.