In [2]:
import numpy as np
import matplotlib.pyplot as plt

# Laboratorio 05
Objetivo: Programar una regresión multivariada


1. Para simular un conjunto de características $x_1$ , $x_2$,..., $x_n$ trabajaremos en la primera parte con dos características de datos aleatorios que presentan un plano y mostraremos que los párametros optimizados se corresponden con el valor esperado.

- Definir la ecuación  $y = 2.1*x_1 - 3.1*x_2$, y generar números aleatorios que pertenecen al plano.

- Realizar un diagrama 3D de los puntos generados aleatoriamente.


Nuestro objetivo será encontrar los valores $\theta_0 = 0, \theta_1=2.1, \theta_1=-3.1$ que mejor ajustar el plano, empleando cálculos vectorizados.



In [68]:
num_points = 100 
x1 = np.random.uniform(-10, 10, num_points)
x2 = np.random.uniform(-10, 10, num_points)

In [69]:
y = 2.1 * x1 - 3.1 * x2

In [70]:
import plotly.graph_objects as go
import numpy as np
import plotly.graph_objects as go

X1, X2 = np.meshgrid(np.linspace(-10, 10, 50), np.linspace(-10, 10, 50))
Y_plane = 2.1 * X1 - 3.1 * X2


fig = go.Figure()
fig.add_trace(go.Surface(x=X1, y=X2, z=Y_plane, colorscale='Viridis', opacity=0.5))
fig.add_trace(go.Scatter3d(x=x1, y=x2, z=y, mode='markers', marker=dict(size=4, color='blue')))
fig.update_layout(title='Y = 2.1 * X_1 - 3.1 * X_2',
                  scene=dict(
                      xaxis_title='X_1',
                      yaxis_title='X_2',
                      zaxis_title='Y'
                  ))
fig.show()


2. Inicializar conjunto de parámetros $\Theta$ de manera aleatoria.

In [71]:
np.random.seed(23) 
theta = np.random.randn(3, 1) 

3. Construir la matrix X con dimensiones $(n+1, m)$, m es el numero de datos de entrenamiento y (n) el número de caracteristicas.

In [72]:
X = np.vstack((np.ones(num_points), x1, x2))

4. Calcular la función de coste(revise cuidosamente las dimensiones de cada matriz):

  - $h = \Theta^{T} X $
  - $\Lambda= (h -Y) $
  - $\Lambda*= (h -Y)^2 $
  - $\Lambda= [\Lambda_1,\Lambda_2, ...,\Lambda_m]$
  - $J = \frac{1}{2m} \sum_{i}^m \Lambda_i $


Para calcular la función de coste, primero calculamos $h = \Theta^T X $, que son las predicciones del modelo. Luego, se resta los valores reales para obtener el error $ \Lambda $ y calculamos el error cuadrado para cada dato. Finalmente, promediamos estos errores para obtener el coste $ J(\Theta) $, el cual es la métrica que queremos minimizar para obtener un buen ajuste del modelo.

In [73]:
# calcular h = Theta^T * X
h = np.dot(theta.T, X)  

# calcular Lambda = (h - Y)
Lambda = h - y  

# calcular Lambda* = (h - Y)^2
Lambda_squared = Lambda ** 2  

# finalmente calcular J
J = (1 / (2 * num_points)) * np.sum(Lambda_squared) 

print("Función de coste J:", J)


Función de coste J: 159.36192776573563


5. Aplicar el gradiente descendente:
  - Encontrar el gradiente.
    $\nabla J = \Lambda X.T $
  
  - Actualizar los nuevos parametros:
    $\Theta_{n+1}=\Theta_{n}-\alpha\nabla J$

Implementamos el gradiente descendente (que nos indica la dirección de mayor cambio en el coste) y usamos este gradiente para actualizar los parámetros en dirección opuesta (reduciendo el coste).

In [74]:
alpha = 0.01 # tasa de aprendizaje


# calcular h = Theta^T * X y el error Lambda = (h - Y)
h = np.dot(theta.T, X)  
Lambda = h - y  # vector de errores

# calcular el gradiente: grad_J = Lambda * X.T
grad_J = np.dot(Lambda, X.T).T / num_points  

# actualizar los parámetros Theta
theta = theta - alpha * grad_J

print("Valores de theta después de una actualización de gradiente descendente:")
print(theta)


Valores de theta después de una actualización de gradiente descendente:
[[ 0.65331524]
 [ 0.70732004]
 [-1.53742   ]]


6. Iterar para encontrar los valores $\Theta$ que se ajustan el plano.

In [75]:
alpha = 0.01 # tasa de aprendizaje

num_iterations = 1000

for iteration in range(num_iterations):
    h = np.dot(theta.T, X)
    Lambda = h - y 

    grad_J = np.dot(Lambda, X.T).T / num_points 

    theta = theta - alpha * grad_J

    if iteration % 100 == 0:
        cost = (1 / (2 * num_points)) * np.sum(Lambda ** 2)
        print(f"Iteración {iteration}: Coste = {cost}")

print("Valores finales de theta después de la optimización:")
print(theta)


Iteración 0: Coste = 72.22001153466672
Iteración 100: Coste = 0.027517332996957803
Iteración 200: Coste = 0.0037444503819013164
Iteración 300: Coste = 0.0005095300719757643
Iteración 400: Coste = 6.933484697847714e-05
Iteración 500: Coste = 9.434813114930982e-06
Iteración 600: Coste = 1.2838522387061488e-06
Iteración 700: Coste = 1.747015601425932e-07
Iteración 800: Coste = 2.3772700779774843e-08
Iteración 900: Coste = 3.2348955665100174e-09
Valores finales de theta después de la optimización:
[[ 2.97825625e-05]
 [ 2.10000044e+00]
 [-3.09999989e+00]]


Hemos llegado a los valores deseados para los parámetros $\theta_0 = 0$, $\theta_1 = 2.1$, y $\theta_2 = -3.1$. Observamos que, a medida que aumentamos el número de iteraciones en el gradiente descendente, los valores de los parámetros se acercan cada vez más a los valores óptimos, minimizando el coste y mejorando la precisión del modelo.