Para aplicar el descenso del gradiente en Python, puedes utilizar bibliotecas como NumPy para un enfoque más manual o frameworks de aprendizaje automático como TensorFlow o PyTorch que ofrecen implementaciones integradas del descenso del gradiente. A continuación, te mostraré un ejemplo simple usando NumPy para ilustrar cómo se puede implementar el descenso del gradiente para una función cuadrática simple. Luego, brevemente, describiré cómo se aplica en frameworks más avanzados.

Ejemplo Básico con NumPy
Vamos a optimizar una función cuadrática simple:
�
(
�
)
=
�
2
f(x)=x
2
 . Sabemos que el mínimo de esta función está en
�
=
0
x=0.

Inicializar parámetros: Comenzamos con un valor inicial para
�
x.

Calcular el gradiente: El gradiente de
�
(
�
)
=
�
2
f(x)=x
2
  es
�
′
(
�
)
=
2
�
f
′
 (x)=2x.

Actualizar el parámetro: Ajustamos
�
x utilizando la regla de actualización:
�
=
�
−
�
×
�
′
(
�
)
x=x−α×f
′
 (x), donde
�
α es la tasa de aprendizaje.

Aquí está el código para hacer esto en Python:

In [1]:
import numpy as np

# Paso 1: Inicializar los parámetros
x = np.random.uniform(-10, 10)  # Valor inicial aleatorio para x
alpha = 0.01  # Tasa de aprendizaje
iterations = 1000  # Número de iteraciones

# Paso 2 y 3: Calcular el gradiente y actualizar el parámetro en un bucle
for i in range(iterations):
    gradient = 2 * x  # Derivada de f(x) = x^2
    x = x - alpha * gradient  # Actualizar x

print(f"Valor de x después de {iterations} iteraciones: {x}")

Valor de x después de 1000 iteraciones: 2.284841377167715e-09


Este código debe converger hacia el valor mínimo de
�
=
0
x=0.

Usando Frameworks de Aprendizaje Automático
En frameworks como TensorFlow o PyTorch, el descenso del gradiente se maneja de manera más automatizada, especialmente cuando trabajas con redes neuronales. Estos frameworks calculan gradientes automáticamente (usando diferenciación automática) y aplican el descenso del gradiente (o sus variantes) para actualizar los parámetros de los modelos.

TensorFlow:

In [2]:
import tensorflow as tf

# Definir una variable y una función de pérdida simple
x = tf.Variable(initial_value=tf.random.uniform(shape=()), dtype=tf.float32)
loss = lambda: x ** 2  # Función de pérdida: x^2

# Optimizador
optimizer = tf.optimizers.SGD(learning_rate=0.01)

# Entrenamiento (optimización)
for i in range(1000):
    optimizer.minimize(loss, var_list=[x])

print(f"Valor de x después de la optimización: {x.numpy()}")

Valor de x después de la optimización: 8.4488088747392e-10


PyTorch:

In [3]:
import torch

# Definir una variable y una función de pérdida simple
x = torch.randn((), requires_grad=True)
loss = lambda: x ** 2  # Función de pérdida: x^2

# Optimizador
optimizer = torch.optim.SGD([x], lr=0.01)

# Entrenamiento (optimización)
for i in range(1000):
    optimizer.zero_grad()
    output = loss()
    output.backward()
    optimizer.step()

print(f"Valor de x después de la optimización: {x.item()}")

Valor de x después de la optimización: 7.260740342296401e-10
