#**PyTorch VI**
Autor: Jheremy Reyes,

estudiante de matemáticas,

Universidad El Bosque

##**Implementación de un Perceptrón Multicapa (MLP) en PyTorch**

Un Perceptrón Multicapa (MLP) es una red neuronal totalmente conectada (Feedforward Neural Network). Consiste en:

Una capa de entrada.

Una o más capas ocultas con activación no lineal (ReLU, Sigmoid, etc.).

Una capa de salida para clasificación o regresión.

A continuación, te muestro cómo implementar un MLP en PyTorch para clasificación binaria.

In [None]:
import torch
import torch.nn as nn

# Definir las capas de la red neuronal
layer1 = nn.Linear(3, 2)  # Entrada de tamaño 3, salida de tamaño 2
layer2 = nn.Linear(2, 3)  # Entrada de tamaño 2, salida de tamaño 3
layer3 = nn.Linear(3, 4)  # Entrada de tamaño 3, salida de tamaño 4

# Funciones de activación
relu = nn.ReLU()
sigmoid = nn.Sigmoid()

# Crear un tensor de prueba (equivalente a tf.ones((3,3)))
x = torch.ones((3, 3))

# Aplicar las capas secuencialmente
y = layer3(sigmoid(layer2(relu(layer1(x)))))
print(y)


In [None]:
# Definir el modelo equivalente en PyTorch
class MyFirstModel(nn.Module):
    def __init__(self):
        super(MyFirstModel, self).__init__()
        self.layer1 = nn.Linear(3, 2)  # Equivalente a Dense(2, activation="relu")
        self.layer2 = nn.Linear(2, 3)  # Equivalente a Dense(3, activation="sigmoid")
        self.layer3 = nn.Linear(3, 4)  # Equivalente a Dense(4)

        # Funciones de activación
        self.relu = nn.ReLU()
        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        x = self.relu(self.layer1(x))   # Aplicar ReLU después de la primera capa
        x = self.sigmoid(self.layer2(x))  # Aplicar Sigmoid después de la segunda capa
        x = self.layer3(x)  # Tercera capa sin activación
        return x

# Crear una instancia del modelo
model = MyFirstModel()

# Crear un tensor de entrada (equivalente a tf.ones((3,3)))
x = torch.ones((3, 3))

# Pasar los datos a través del modelo
y = model(x)
print(y)


In [None]:
# Lista de capas en el modelo PyTorch
print(list(model.children()))  # Obtiene las capas definidas en el modelo


In [None]:
# Acceder a los pesos de la tercera capa (layer3 en este caso)
weights = model.layer3.weight  # Pesos de la capa
bias = model.layer3.bias  # Bias de la capa

# Imprimir pesos y bias
print("Pesos de la capa 3:\n", weights)
print("Bias de la capa 3:\n", bias)


In [None]:
from torchinfo import summary

# Mostrar el resumen del modelo
summary(model, input_size=(3, 3))  # Tamaño de entrada similar a Keras


Definimos la red en InitialModel, equivalente al modelo Sequential en Keras.

nn.Linear(in_features, out_features) se usa en lugar de Dense(units, activation=...).

forward() maneja la propagación, aplicando las activaciones manualmente.

El resumen se genera con torchinfo.summary(), similar a model.summary().

In [None]:
# Definir el modelo en PyTorch
class InitialModel(nn.Module):
    def __init__(self):
        super(InitialModel, self).__init__()
        self.layer1 = nn.Linear(3, 2)  # Equivalente a Dense(2, activation="relu")
        self.layer2 = nn.Linear(2, 3)  # Equivalente a Dense(3, activation="sigmoid")
        self.layer3 = nn.Linear(3, 4)  # Equivalente a Dense(4)

        # Funciones de activación
        self.relu = nn.ReLU()
        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        x = self.relu(self.layer1(x))   # Aplicar ReLU después de la primera capa
        x = self.sigmoid(self.layer2(x))  # Aplicar Sigmoid después de la segunda capa
        x = self.layer3(x)  # Tercera capa sin activación
        return x

# Crear el modelo
initial_model = InitialModel()

# Resumen del modelo
summary(initial_model, input_size=(1, 3))  # Input de tamaño (batch_size, features)

In [None]:
# Definir un tensor de entrada de prueba
x = torch.randn(1, 3)  # Simula una entrada de tamaño (1,3)

# Pasar la entrada al modelo
output = initial_model(x)

# Mostrar la forma de la entrada
print("Forma de la entrada:", x.shape)


In [None]:
# Definir un tensor de entrada de prueba
x = torch.randn(1, 3)  # Simula una entrada de tamaño (batch=1, features=3)

# Obtener la salida del modelo
output = initial_model(x)

# Mostrar la salida y su forma
print("Salida del modelo:\n", output)
print("Forma de la salida:", output.shape)


En TensorFlow/Keras, model.trainable_variables devuelve una lista con los pesos y sesgos entrenables del modelo.

En PyTorch, el equivalente es model.parameters(), que devuelve los tensores de los parámetros entrenables.

In [None]:
# Definir el modelo en PyTorch
class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        self.layer1 = nn.Linear(3, 2)  # Equivalente a Dense(2, activation="relu")
        self.layer2 = nn.Linear(2, 3)  # Equivalente a Dense(3, activation="sigmoid")
        self.layer3 = nn.Linear(3, 4)  # Equivalente a Dense(4, activation="relu")

        # Activaciones
        self.relu = nn.ReLU()
        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        x = self.relu(self.layer1(x))   # ReLU después de la primera capa
        x = self.sigmoid(self.layer2(x))  # Sigmoid después de la segunda capa
        x = self.relu(self.layer3(x))  # ReLU después de la tercera capa
        return x

# Crear el modelo
model = MyModel()

# Resumen del modelo
summary(model, input_size=(1, 3))  # Input con batch_size=1 y 3 features

In [None]:
# Obtener los parámetros entrenables del modelo
for name, param in model.named_parameters():
    if param.requires_grad:  # Solo muestra los parámetros entrenables
        print(f"Nombre: {name}, Forma: {param.shape}")

En TensorFlow/Keras, model.layers permite iterar sobre las capas de un modelo Sequential, y layer.trainable indica si los parámetros de la capa se pueden entrenar.

En PyTorch, el equivalente es iterar sobre model.children() y verificar requires_grad en los parámetros de cada capa.

In [None]:
# Iterar sobre las capas del modelo y verificar si son entrenables
for name, layer in model.named_children():
    trainable = any(param.requires_grad for param in layer.parameters())
    print(f"Capa: {name}, Entrenable: {trainable}")

En TensorFlow/Keras, la propiedad model.trainable = False congela todas las capas del modelo, haciendo que model.trainable_variables devuelva una lista vacía.

En PyTorch, el equivalente es desactivar requires_grad en todos los parámetros del modelo.

In [None]:
# Congelar todos los parámetros del modelo
for param in model.parameters():
    param.requires_grad = False

# Verificar los parámetros entrenables después de la congelación
trainable_params = [param for param in model.parameters() if param.requires_grad]
print("Parámetros entrenables:", len(trainable_params))  # Debe ser 0 si todo está congelado

En TensorFlow/Keras, puedes iterar sobre model.layers y verificar si cada capa es entrenable con layer.trainable.

En PyTorch, no existe model.layers, pero puedes usar model.children() o model.named_children() para acceder a las capas y verificar si sus parámetros son entrenables.

In [None]:
# Iterar sobre las capas del modelo y verificar si son entrenables
for name, layer in model.named_children():
    trainable = any(param.requires_grad for param in layer.parameters())
    print(f"Capa: {name}, Entrenable: {trainable}")

In [None]:
# Definir el modelo en PyTorch
class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        self.layer1 = nn.Linear(3, 2)  # Equivalente a Dense(2, activation="relu")
        self.layer2 = nn.Linear(2, 3)  # Equivalente a Dense(3, activation="sigmoid")
        self.layer3 = nn.Linear(3, 4)  # Equivalente a Dense(4, activation="relu")
        self.layer4 = nn.Linear(4, 5)  # Equivalente a Dense(5, activation="relu")
        self.layer5 = nn.Linear(5, 6)  # Equivalente a Dense(6, activation="sigmoid")
        self.layer6 = nn.Linear(6, 7)  # Equivalente a Dense(7, activation="relu")

        # Activaciones
        self.relu = nn.ReLU()
        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        x = self.relu(self.layer1(x))   # ReLU después de la primera capa
        x = self.sigmoid(self.layer2(x))  # Sigmoid después de la segunda capa
        x = self.relu(self.layer3(x))  # ReLU después de la tercera capa
        x = self.relu(self.layer4(x))  # ReLU después de la cuarta capa
        x = self.sigmoid(self.layer5(x))  # Sigmoid después de la quinta capa
        x = self.relu(self.layer6(x))  # ReLU después de la sexta capa
        return x

# Crear el modelo
model = MyModel()

# Resumen del modelo
summary(model, input_size=(1, 3))  # Input con batch_size=1 y 3 features

En TensorFlow/Keras, la API funcional permite extraer características de un modelo definiendo una nueva arquitectura con entradas y salidas específicas.

En PyTorch, puedes hacer algo similar accediendo directamente a las capas del modelo en forward().

In [None]:
# Definir el modelo base en PyTorch
class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        self.layer1 = nn.Linear(3, 2)
        self.layer2 = nn.Linear(2, 3)
        self.layer3 = nn.Linear(3, 4)
        self.layer4 = nn.Linear(4, 5)  # Salida deseada del extractor
        self.layer5 = nn.Linear(5, 6)
        self.layer6 = nn.Linear(6, 7)

        self.relu = nn.ReLU()
        self.sigmoid = nn.Sigmoid()

    def forward(self, x, return_features=False):
        x = self.relu(self.layer1(x))
        x = self.sigmoid(self.layer2(x))
        x = self.relu(self.layer3(x))
        features = self.relu(self.layer4(x))  # Extracción en "layer4"

        if return_features:
            return features  # Devuelve solo hasta "layer4"

        x = self.sigmoid(self.layer5(features))
        x = self.relu(self.layer6(x))
        return x

# Crear el modelo base
model = MyModel()

# Crear el "feature extractor"
def feature_extractor(x):
    return model(x, return_features=True)

# Prueba con una entrada
x_test = torch.randn(1, 3)  # Entrada de prueba (batch_size=1, features=3)
features = feature_extractor(x_test)

print("Salida del extractor de características:\n", features)

En Keras, feature_extractor.summary() muestra el resumen del modelo intermedio.

En PyTorch, puedes usar torchinfo.summary() para obtener información similar.

In [None]:
from torchinfo import summary

# Resumen del extractor de características
summary(model, input_size=(1, 3), depth=4)


En TensorFlow/Keras, tf.keras.utils.plot_model() genera un diagrama visual del modelo.

En PyTorch, no hay un equivalente directo pero se puede usar torchviz o hiddenlayer para visualizar la arquitectura.

In [None]:
pip install torchviz

In [None]:
import torch
from torchviz import make_dot

# Entrada de ejemplo
x_sample = torch.randn(1, 3)

# Obtener la salida del modelo
y_sample = model(x_sample)

# Generar el diagrama
dot = make_dot(y_sample, params=dict(model.named_parameters()))

# Guardar la imagen
dot.format = "png"
dot.render("model")

# Mostrar en Jupyter Notebook (si lo estás usando)
dot


nn.Linear(in_features, out_features) es el equivalente de Dense(units).

Activaciones (ReLU y Softmax) se aplican en forward(), ya que PyTorch no las incluye dentro de Linear().

Resumen del modelo se obtiene con torchinfo.summary().

In [None]:
# Definir el modelo en PyTorch
class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        self.fc1 = nn.Linear(784, 64)  # Capa densa de 64 neuronas
        self.fc2 = nn.Linear(64, 64)   # Otra capa de 64 neuronas
        self.fc3 = nn.Linear(64, 10)   # Capa de salida con 10 clases

        self.relu = nn.ReLU()
        self.softmax = nn.Softmax(dim=1)  # Softmax en la dimensión de las clases

    def forward(self, x):
        x = self.relu(self.fc1(x))
        x = self.relu(self.fc2(x))
        x = self.softmax(self.fc3(x))
        return x

# Crear el modelo
model = MyModel()

# Mostrar resumen del modelo
summary(model, input_size=(1, 784))


Se aplanan las imágenes de (32, 32, 3) a 3072 (x.view(x.size(0), -1)).

Se replican las conexiones residuales (torch.add()) en block_2_output y block_3_output.

Las activaciones (ReLU, Softmax) se aplican manualmente en forward().

Se mantiene Dropout(0.5) antes de la salida.

Resumen del modelo se obtiene con torchinfo.summary().

In [None]:
# Definir el modelo en PyTorch
class VeryDenseNet(nn.Module):
    def __init__(self):
        super(VeryDenseNet, self).__init__()

        # Bloque 1
        self.fc1 = nn.Linear(32 * 32 * 3, 64)
        self.fc2 = nn.Linear(64, 64)
        self.fc3 = nn.Linear(64, 64)  # block_1_output

        # Bloque 2
        self.fc4 = nn.Linear(64, 32)
        self.fc5 = nn.Linear(32, 64)

        # Bloque 3
        self.fc6 = nn.Linear(64, 32)
        self.fc7 = nn.Linear(32, 64)

        # Capa de salida
        self.fc8 = nn.Linear(64, 16)
        self.fc9 = nn.Linear(16, 32)
        self.fc10 = nn.Linear(32, 256)
        self.fc_out = nn.Linear(256, 10)

        self.dropout = nn.Dropout(0.5)

    def forward(self, x):
        x = x.view(x.size(0), -1)  # Aplanar la imagen (32x32x3 → 3072)

        # Bloque 1
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        block_1_output = F.relu(self.fc3(x))

        # Bloque 2 con skip connection
        x = F.relu(self.fc4(block_1_output))
        x = F.relu(self.fc5(x))
        block_2_output = torch.add(x, block_1_output)  # Residual sum

        # Bloque 3 con skip connection
        x = F.relu(self.fc6(block_2_output))
        x = F.relu(self.fc7(x))
        block_3_output = torch.add(x, block_2_output)  # Residual sum

        # Capas finales
        x = F.relu(self.fc8(block_3_output))
        x = F.relu(self.fc9(x))
        x = F.relu(self.fc10(x))
        x = self.dropout(x)  # Dropout antes de la salida
        x = F.softmax(self.fc_out(x), dim=1)  # Softmax para clasificación

        return x

# Crear el modelo
model = VeryDenseNet()

# Resumen del modelo
summary(model, input_size=(1, 3, 32, 32))


torch.randn(1, 3, 32, 32) crea un tensor de entrada con el mismo tamaño que en Keras.

make_dot(y_sample, params=dict(model.named_parameters())) genera la estructura del modelo.

dot.render("model_visualization") guarda el modelo en un archivo .png.

dot lo muestra en un Jupyter Notebook.

In [None]:
# Crear una entrada de prueba (batch de 1 imagen de 32x32x3)
x_sample = torch.randn(1, 3, 32, 32)

# Obtener la salida del modelo
y_sample = model(x_sample)

# Generar el diagrama de flujo del modelo
dot = make_dot(y_sample, params=dict(model.named_parameters()))

# Guardar la imagen
dot.format = "png"
dot.render("model_visualization")

# Mostrar en Jupyter Notebook
dot

##**Personalizar Layers y Models**

Se usa nn.Module para definir la capa personalizada.

Se inicializan los pesos (self.w) y el sesgo (self.b) en la primera pasada dentro de forward(), equivalente a build() en Keras.

Se aplica la operación torch.matmul(inputs, self.w) + self.b, equivalente a tf.matmul(inputs, self.w) + self.b.

Se crean parámetros entrenables (nn.Parameter) para que PyTorch los optimice automáticamente

In [None]:
# Definir la clase de la capa personalizada
class MyLayer(nn.Module):
    def __init__(self, units=1):
        super(MyLayer, self).__init__()
        self.units = units
        self.w = None  # Se inicializa en forward()
        self.b = None

    def forward(self, inputs):
        if self.w is None:  # Inicializar pesos en la primera pasada (similar a 'build' en Keras)
            input_dim = inputs.shape[-1]
            self.w = nn.Parameter(torch.randn(input_dim, self.units))  # Pesos inicializados normal
            self.b = nn.Parameter(torch.zeros(self.units))  # Sesgo inicializado en ceros
        return torch.matmul(inputs, self.w) + self.b

# Crear una instancia de la capa con 8 unidades
linear_layer = MyLayer(8)

# Crear una entrada de prueba (tensor de 1x2)
x = torch.ones((1, 2))

# Pasar la entrada por la capa
y = linear_layer(x)
y

Se usa nn.Linear() en lugar de tf.keras.layers.Dense().

Se aplican activaciones manualmente (F.relu() y F.elu()).

Se maneja training=False congelando los parámetros de dense3 con param.requires_grad = False.

Se usa torchinfo.summary() para imprimir un resumen del modelo (similar a model.summary() en Keras).

In [None]:
# Definir la clase del modelo personalizado
class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        self.dense1 = nn.Linear(2, 2)  # Entrada de tamaño 2, salida de tamaño 2
        self.dense2 = nn.Linear(2, 4)
        self.dense3 = nn.Linear(4, 8)

    def forward(self, inputs, training=False):
        x = F.relu(self.dense1(inputs))
        x = F.relu(self.dense2(x))
        x = F.elu(self.dense3(x))

        if not training:
            for param in self.dense3.parameters():
                param.requires_grad = False  # Congelar capa densa3 si no está en entrenamiento

        return x

# Crear el modelo
model = MyModel()

# Crear una entrada de prueba
x = torch.ones((1, 2)) * 2

# Pasar la entrada por el modelo
y = model(x, training=False)

print('Resultado:', y)

# Mostrar resumen del modelo
from torchinfo import summary
summary(model, input_size=(1, 2))