#### Universidad Autónoma de Aguascalientes
#### Departamento: Ciencias de la Computación
#### Carrera: Ingenieria en Computación Inteligente
#### Curso: Machine Learning y Deep Learning 
#### Maestro: Dr. Francisco Javier Luna Rosas

#### Alumno: Jorge Hernández
#### Semestre: Enero - Junio del 2025

PRACTICA No. 6. Descenso del Gradiente 3D

La idea principal es representar el error como una función continua de los pesos e intentar ilevar la red hacia una configuración de valores de activación que nos permita encontrar el mínimo de esta
función.

Para determinar la magnitud y dirección del cambio que debemos introducir en el vector de pesos para reducir el error que está cometiendo, utilizaremos el concepto de «pendiente», que indica que la pendiente de un punto dado es el gradiente de la tangente a la curva de la función en el punto dado.

El gradiente es la derivada de una operación tensorial. Es la generalización del concepto de derivadas a funciones que toman fensores como entradas

Paso 1: Importar las librerías necesarias

In [100]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

Paso 2: Definimos la funcion $$f(x) = x^2 + 3y$$

In [101]:
def funcion(x,y):
    return (pow(x,2)+3*y)

PASO 3: IMPLEMENTAMOS EL ALGORITMO DEL DESCENSO DEL GRADIENTE

PASO 3_1: Tomar un punto al azar de X0

In [102]:
x = -10#np.random.randint(-10,10)
y = 10 #np.random.randint(-10,10)

In [103]:
pointsXY = np.array([x,y])
pointsZ = np.array(funcion(pointsXY[0],pointsXY[1]))

print(pointsXY)
print(pointsZ)

[-10  10]
130


PASO 3_2: Calcular el valor de la pendiente (Primera Derivada)  $$f'(x) = 2x + 3$$

In [104]:
def gradiente_func(x,y):
    return np.array([2*x, 3])

PASO 3_3: Camine en direccion opuesta a la pendiente 
$$x_1 = x_0 - eta * f'(x_0)$$

NOTA: ETA representa la Taza de Aprendizaje

PASO 3_4: Ejecutamos una primera vez

In [105]:
eta = 0.1

x0 = np.array([x,y])
x1 = x0 - eta * gradiente_func(x0[0],x0[1])

print(f"X: {x1[0]} Y: {x1[1]} \t Z: {funcion(x1[0],x1[1])}")

X: -8.0 Y: 9.7 	 Z: 93.1


PASO 3_5: Ejecutamos una segunda vez

In [106]:
x2 = x1 - eta * gradiente_func(x1[0],x1[1])

print(f"X: {x2[0]} Y: {x2[1]} \t Z: {funcion(x2[0],x2[1])}")

X: -6.4 Y: 9.399999999999999 	 Z: 69.16


PASO 3_6: Ejecutamos una tercera vez

In [107]:
x3 = x2 - eta * gradiente_func(x2[0],x2[1])

print(f"X: {x3[0]} Y: {x3[1]} \t Z: {funcion(x3[0],x3[1])}")

X: -5.12 Y: 9.099999999999998 	 Z: 53.514399999999995


PASO 3_7: Ejecutamos con más puntos

In [108]:
tol = 1e-6

xi = np.array([x, y])

for i in range(40):
    grad = gradiente_func(xi[0], xi[1])  
    xi_new = xi - eta * grad  

    if np.linalg.norm(xi_new - xi) < tol:
        print(f"Se detuvo en la iteración {i} por convergencia.")
        break

    xi = xi_new
    print(f"Iteración {i}: X={xi[0]}, Y={xi[1]}, Z={funcion(xi[0],xi[1])}")

Iteración 0: X=-8.0, Y=9.7, Z=93.1
Iteración 1: X=-6.4, Y=9.399999999999999, Z=69.16
Iteración 2: X=-5.12, Y=9.099999999999998, Z=53.514399999999995
Iteración 3: X=-4.096, Y=8.799999999999997, Z=43.17721599999999
Iteración 4: X=-3.2768, Y=8.499999999999996, Z=36.23741823999999
Iteración 5: X=-2.62144, Y=8.199999999999996, Z=31.47194767359999
Iteración 6: X=-2.0971520000000003, Y=7.899999999999996, Z=28.09804651110399
Iteración 7: X=-1.6777216000000004, Y=7.599999999999996, Z=25.614749767106552
Iteración 8: X=-1.3421772800000003, Y=7.299999999999996, Z=23.701439850948187
Iteración 9: X=-1.0737418240000003, Y=6.9999999999999964, Z=22.152921504606837
Iteración 10: X=-0.8589934592000003, Y=6.699999999999997, Z=20.837869762948372
Iteración 11: X=-0.6871947673600002, Y=6.399999999999997, Z=19.672236648286955
Iteración 12: X=-0.5497558138880001, Y=6.099999999999997, Z=18.60223145490365
Iteración 13: X=-0.43980465111040007, Y=5.799999999999997, Z=17.59342813113833
Iteración 14: X=-0.3518437208

GRAFICO EN 3D

In [132]:
import plotly.graph_objs as go
import plotly.express as px

xi = np.array([x,y])
xyz = []

for i in range(60):
    xi = xi - eta * gradiente_func(xi[0], xi[1])
    xyz.append([xi[0], xi[1], funcion(xi[0],xi[1])])

xyz = np.array(xyz)
data = pd.DataFrame({"X": xyz[:, 0], "Y": xyz[:, 1], "Z": xyz[:, 2]})

In [139]:
data.head(10)

fig = px.scatter_3d(data, x='X', y='Y', z='Z', color_discrete_sequence=["red"])
xdata = np.arange(-10,10,0.1)
ydata = np.arange(-10,10,0.1)

X,Y = np.meshgrid(xdata, ydata)

Z = X**2 + 3*Y

fig.add_trace(go.Surface(
    x = X,
    y = Y,
    z = Z,
    opacity = .7, showscale= False,
    colorscale='Viridis'
))

fig.show()

### CONCLUSION
El gradiente descendente en 3D es la derivada de una operacion tensorial. Es la generalizacion del concepto de derivadas a funciones que toman tensores como entradas

#### BIBLIOGRAFIA
URL: KERAS (2025) https://keras.io/

Oldemar Rodriguez (2025). Reporte Técnico de PROMIDAT: http://promidat.com/ (Ultimo acceso febrero 2025).