# Tema 2: PyTorch - Autograd, MLP con iris


In [1]:
import torch

##1.1. Introducción a Autograd en PyTorch

### Ejercicio 1: Calcular el gradiente de la siguiente función para una sola variable.

a)

$$ x = 2$$

$$ y = x^{3}$$

In [2]:
x = torch.tensor(2.0, requires_grad=True)
y = x ** 3
y.backward()
print(x.grad)

tensor(12.)


b)

$$ x = 5$$

$$ y = 2x$$

In [3]:
x = torch.tensor(5.0, requires_grad=True)
y = 2 * x
y.backward()
print(x.grad)

tensor(2.)


### Ejercicio 2: Función con Múltiples Variables

1. Crear dos tensores, como en ejercicio anterior.
2. Definir una operación de multiples variables.
3. Calcular el gradiente en función de los dos tensores
4. Mostrar los gradientes respecto a los tensores.

a)

$$ x = 2 $$
$$ z = 3 $$


$$ f = 3x^{2}+z^{3} $$


In [4]:
x = torch.tensor(2.0, requires_grad=True)
z = torch.tensor(3.0, requires_grad=True)

f = 3 * x ** 2 + z ** 3
f.backward()


print(f"df/dx = {x.grad}")
print(f"df/dz = {z.grad}")

df/dx = 12.0
df/dz = 27.0


### Ejercicio 3: Simulación de una Función de Pérdida y Reinicio de Gradientes, utilizando *grad.zero_()*

1. Crear un tensor, con los valores mostrados abajo.
2. crear la función de pérdida.
3. Calcular el gradiente e imprimirlo.
4. Reiniciar el gradiente.
5. Crear la nueva función de pérdida.
6. Calcular e imprimir los nuevos gradientes.


$$ x = [1.0,2.0,3.0]$$

$$\text{Función de pérdida (antes de reiniciar los gradientes)} = (\sum{x} - 5)^{2}$$

$$\text{Función de pérdida (después de reiniciar los gradientes)} = (\sum{x} - 6)^{2}$$





In [5]:
# Crear un tensor de datos
x = torch.tensor([1.0, 2.0, 3.0], requires_grad=True)

# Definir una función de pérdida como suma cuadrática
loss = (x.sum() - 5) ** 2

# Calcular gradiente
loss.backward()
print("Gradientes iniciales:", x.grad)

# Reiniciar gradientes y volver a calcular
x.grad.zero_()
loss = (x.sum() - 6) ** 2
loss.backward()
print("Gradientes después de reiniciar:", x.grad)

Gradientes iniciales: tensor([2., 2., 2.])
Gradientes después de reiniciar: tensor([0., 0., 0.])


### Ejercicio 4: Simulación de una Función de Pérdida y Reinicio de Gradientes, utilizando *zero_grad()*

1. Crear un tensor, con los valores mostrados abajo.
2. Crear el optimizador, utilizando SGD y un learning rate de 0.1.
2. Crear la función de pérdida.
3. Calcular el gradiente e imprimirlo.
4. Reiniciar el gradiente.
5. Crear la nueva función de pérdida.
6. Calcular e imprimir los nuevos gradientes.


$$ x = [1.0,2.0,3.0]$$

$$\text{Función de pérdida (antes de reiniciar los gradientes)} = (\sum{x} - 5)^{2}$$

$$\text{Función de pérdida (después de reiniciar los gradientes)} = (\sum{x} - 6)^{2}$$


In [6]:
# Crear un tensor de datos
x = torch.tensor([1.0, 2.0, 3.0], requires_grad=True)

# Crear un optimizador
optimizer = torch.optim.SGD([x], lr=0.1)

# Primera pérdida y gradientes
loss = (x.sum() - 5) ** 2
loss.backward()
print("Gradientes iniciales:", x.grad)

# Reiniciar gradientes usando optimizer.zero_grad()
optimizer.zero_grad()

# Segunda pérdida y gradientes
loss = (x.sum() - 6) ** 2
loss.backward()
print("Gradientes después de reiniciar:", x.grad)

Gradientes iniciales: tensor([2., 2., 2.])
Gradientes después de reiniciar: tensor([0., 0., 0.])


### Ejercicio 5: Optimización simple usando descenso de gradiente.

Crear un buble de 5 épocas que actualice los valores de un tensor para minimizar la función de pérdida.

1. Definir el learning rate y x =5.
2. Crear un bucle de 5 épocas.
3. Calcular la función de pérdida.

$$ loss = x^{2}$$

4. Imprimir el valor del loss y x.
5. Calcular el gradiente.
6. Con el cálculo de gradiente desactivado recalcular x con la siguiente función.

$$ x = x - \text{learning_rate} * \text{x.grad} $$

In [7]:
import torch
learning_rate = 0.1
x = torch.tensor(5.0, requires_grad=True)


for epoch in range(5):
    loss = x ** 2
    print(f"Epoch {epoch+1}, Pérdida: {loss.item():.2f}, x: {x.item():.2f}")

    loss.backward()

    with torch.no_grad():  # Actualización manual sin rastreo

        x -= learning_rate * x.grad

    x.grad.zero_()  # Reiniciar gradientes

Epoch 1, Pérdida: 25.00, x: 5.00
Epoch 2, Pérdida: 16.00, x: 4.00
Epoch 3, Pérdida: 10.24, x: 3.20
Epoch 4, Pérdida: 6.55, x: 2.56
Epoch 5, Pérdida: 4.19, x: 2.05


### Ejercicio 6: Repite el ejercicio anterior utilizando *zero_grad()* y el mismo optimizador del ejercicio 4.

In [8]:
x = torch.tensor(5.0, requires_grad=True)

# Definir el optimizador
learning_rate = 0.1
optimizer = torch.optim.SGD([x], lr=learning_rate)

# Bucle de optimización
for epoch in range(5):
    # Calcular la pérdida (ejemplo: minimizar x^2)
    loss = x ** 2

    # Mostrar el progreso
    print(f"Epoch {epoch+1}, Pérdida: {loss.item():.2f}, x: {x.item():.2f}")

    # Calcular gradientes
    loss.backward()

    # Actualizar parámetros con el optimizador
    optimizer.step()

    # Reiniciar gradientes con optimizer.zero_grad()
    optimizer.zero_grad()


Epoch 1, Pérdida: 25.00, x: 5.00
Epoch 2, Pérdida: 16.00, x: 4.00
Epoch 3, Pérdida: 10.24, x: 3.20
Epoch 4, Pérdida: 6.55, x: 2.56
Epoch 5, Pérdida: 4.19, x: 2.05


## 1.2. Crear un MLP con pytorch

En este apartado vamos a crear una clase que se llame MLP_pytorch para clasificar el dataset Iris.

Esta **MLP** tiene:
- 3 capas densas 64, 16, 3, respectivamente.
- La función de activación RELU

El **dataset Iris** consta de 150 muestras pertenecientes a 3 clases diferentes. Este dataset dispone de 4 feautres diferentes.





In [9]:
import torch
import torch.nn as nn
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
from sklearn.metrics import accuracy_score

### 1. Cargar el dataset Iris utilizando la librería sklearn

In [10]:
iris = load_iris()

### 2. Separar las muestras y las etiquetas.

In [11]:
X, y = iris.data, iris.target

### 3. Separar las muestras y etiquetas entre: Entrenamiento, Validación y Test

Los porcentajes tiene que ser: 30% test, del 80% restante 80% será entrenamiento y 20% será validación.

In [12]:
X_train_tmp, X_test, y_train_tmp, y_test = train_test_split(X, y, train_size=0.8)


In [13]:
X_train, X_val, y_train, y_val = train_test_split(X_train_tmp, y_train_tmp, train_size=0.8)


### 4. Transformar los datos en tensores.

Las muestras tiene que ser de tipo float y las etiquetas de tipo long

In [14]:
X_tr_tensor = torch.tensor(X_train, dtype=torch.float32)
y_tr_tensor = torch.tensor(y_train, dtype=torch.long)

X_val_tensor = torch.tensor(X_val, dtype=torch.float32)
y_val_tensor = torch.tensor(y_val, dtype=torch.long)

X_te_tensor = torch.tensor(X_test, dtype=torch.float32)
y_te_tensor = torch.tensor(y_test, dtype=torch.long)


### 5. Crear el modelo

In [15]:
class MLP_pytorch(nn.Module):
    def __init__(self):
        super().__init__()
        self.l1 = nn.Linear(4, 64)
        self.l2 = nn.Linear(64, 16)
        self.l3 = nn.Linear(16, 3)
        self.act = nn.ReLU()

    def forward(self, x):
        # Forward pass
        x = self.l1(x)
        x = self.act(x)
        x = self.l2(x)

        x = self.act(x)
        x = self.l3(x)
        return x

In [40]:
model = MLP_pytorch()

### 6. Definir los parámetros para el entrenamiento.

- Número de épocas
- Learning rate
- Función de pérdida
- Optimizador: Utilizaremos Adams y los parámetros del modelo.

In [48]:
epochs = 100
learning_rate = 0.001
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

### 7. Entrenar el modelo.

En cada época se debe imprimir el Loss y Acc del conjunto de entrenamiento y el conjunto de validación.

In [49]:
for epoch in range(epochs):

  model.train()
  optimizer.zero_grad()
  output = model(X_tr_tensor)


  loss = criterion(output, y_tr_tensor)
  loss.backward()
  optimizer.step()

  _, predicted_tr = torch.max(output, 1)

  accuracy = accuracy_score(y_train, predicted_tr)

  print(f"Epoch [{epoch+1}/{epochs}], Loss training: {loss.item():.2f}, Accuracy training: {accuracy:.2f}")

  model.eval()
  with torch.no_grad():
    val_output = model(X_val_tensor)
    val_loss = criterion(val_output, y_val_tensor)
    _, predicted_val = torch.max(val_output, 1)
    val_accuracy = accuracy_score(y_val_tensor, predicted_val)

    print(f"Epoch [{epoch+1}/{epochs}], Loss validation: {val_loss.item():.2f}, Accuracy validation: {val_accuracy:.2f}")




Epoch [1/100], Loss training: 0.73, Accuracy training: 0.73
Epoch [1/100], Loss validation: 0.67, Accuracy validation: 0.92
Epoch [2/100], Loss training: 0.72, Accuracy training: 0.76
Epoch [2/100], Loss validation: 0.66, Accuracy validation: 0.92
Epoch [3/100], Loss training: 0.71, Accuracy training: 0.78
Epoch [3/100], Loss validation: 0.66, Accuracy validation: 0.92
Epoch [4/100], Loss training: 0.70, Accuracy training: 0.78
Epoch [4/100], Loss validation: 0.65, Accuracy validation: 0.92
Epoch [5/100], Loss training: 0.70, Accuracy training: 0.78
Epoch [5/100], Loss validation: 0.64, Accuracy validation: 0.92
Epoch [6/100], Loss training: 0.69, Accuracy training: 0.79
Epoch [6/100], Loss validation: 0.63, Accuracy validation: 0.92
Epoch [7/100], Loss training: 0.68, Accuracy training: 0.84
Epoch [7/100], Loss validation: 0.63, Accuracy validation: 0.92
Epoch [8/100], Loss training: 0.67, Accuracy training: 0.85
Epoch [8/100], Loss validation: 0.62, Accuracy validation: 0.92
Epoch [9

In [50]:
model.eval()
with torch.no_grad():
    test_output = model(X_te_tensor)
    _, predicted_test = torch.max(test_output, 1)
    test_accuracy = accuracy_score(y_te_tensor, predicted_test)
    print(f"\nFinal Test Set Accuracy: {test_accuracy:.2f}")


Final Test Set Accuracy: 0.93
