# **Reporte Detallado: Ejemplos de Cálculo de Descenso de Gradiente en Jupyter Notebook**

A continuación, se presenta un *notebook* en formato de reporte que ilustra el **paso a paso** de cómo se aplica el algoritmo de **Descenso de Gradiente** para **cuatro funciones** diferenciables y convexas. Cada ejemplo:

1. Elige un **punto inicial aleatorio** diferente cada vez que se ejecuta.
2. Muestra cómo se realiza el **cálculo iterativo** hasta llegar (o acercarse) al **mínimo**.
3. Genera **gráficas interactivas** (una para cada función) que te permitirán **hacer zoom, rotar y manipular** la figura con el mouse (utilizando `%matplotlib notebook`).

> **Nota**: Para ejecutar este notebook con la visualización 3D interactiva, puede que necesites instalar la extensión `ipywidgets` o usar `%matplotlib widget`/`%matplotlib ipympl` según tu entorno.

¡Por favor, copia y pega todo este contenido en un archivo `.ipynb` y ejecútalo para ver el reporte completo!


In [1]:
# --------------------------------------------------------------------------------
# CELDA 1: Configuraciones iniciales y librerías
# --------------------------------------------------------------------------------

# Activamos el modo de plots interactivos para permitir zoom, rotación y manipulación en 3D.
# NOTA: En algunos entornos, '%matplotlib notebook' puede requerir la extensión ipywidgets.
# Si no funciona, podrías probar con '%matplotlib ipympl' o '%matplotlib widget'.
%matplotlib notebook

import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D  # Necesario para gráficos 3D interactivos
import random

# Fijar semilla comentado por defecto para que cada corrida sea distinta.
# Si quieres ver siempre el mismo resultado, descomenta la siguiente línea:
# np.random.seed(42)

def grad_desc(
    x: np.array,                # Punto inicial
    f,                          # Función objetivo
    gf,                         # Gradiente de la función objetivo
    lr=0.05,                    # Tasa de aprendizaje
    maxiter=20,                 # Número máximo de iteraciones
    tol=1e-4                    # Tolerancia para la norma del gradiente
):
    """
    Esta función implementa el algoritmo de descenso por gradiente
    y, además, va mostrando cada iteración.

    Retorna:
    - x: punto final tras las iteraciones
    - historial: lista de puntos (np.array) visitados en cada iteración
    """
    historial = [x.copy()]
    
    for i in range(maxiter):
        grad = gf(x)
        norm_grad = np.linalg.norm(grad)

        # Imprimir información de la iteración
        print(f"Iteración {i+1}:")
        print(f"  - Punto actual: {x}")
        print(f"  - Valor de f(x): {f(x):.6f}")
        print(f"  - Gradiente: {grad}")
        print(f"  - Norma del gradiente: {norm_grad:.6f}")
        print("------------------------------------------------")

        # Verificamos si la norma del gradiente es menor a la tolerancia
        if norm_grad < tol:
            print("La norma del gradiente es menor que la tolerancia. Fin del descenso.\n")
            break

        # Actualizamos x usando la regla del descenso de gradiente
        x = x - lr * grad
        historial.append(x.copy())
    
    return x, historial

def plot_3d_and_path(
    f,              # Función objetivo de 2 variables
    x_vals,         # Lista de puntos en el descenso de gradiente
    title="Función", 
    elev=20,        # Ángulo de elevación del gráfico 3D
    azim=-60        # Ángulo azimutal (rotación en el plano XY)
):
    """
    Grafica la superficie 3D de la función 'f' (de R^2 en R)
    y la ruta de puntos dada en x_vals.
    """
    # Creación de la malla (X, Y) para graficar la superficie
    grid_points = 100
    rango = np.linspace(-5, 5, grid_points)
    X, Y = np.meshgrid(rango, rango)
    
    # Calcular Z para toda la malla
    Z = np.zeros_like(X)
    for i in range(grid_points):
        for j in range(grid_points):
            Z[i, j] = f([X[i,j], Y[i,j]])
    
    # Figura en 3D
    fig = plt.figure(figsize=(6, 5))
    ax = fig.add_subplot(111, projection='3d')
    ax.set_title(title)
    
    # Graficar la superficie
    ax.plot_surface(X, Y, Z, cmap='viridis', alpha=0.7)

    # Graficar la trayectoria del descenso de gradiente
    x_path = [p[0] for p in x_vals]
    y_path = [p[1] for p in x_vals]
    z_path = [f(p) for p in x_vals]

    ax.scatter(x_path, y_path, z_path, color='r', s=50, marker='o')
    ax.plot(x_path, y_path, z_path, color='r', linewidth=2)

    # Ajustar ángulos de cámara 3D
    ax.view_init(elev=elev, azim=azim)

    # Etiquetas de ejes
    ax.set_xlabel('X')
    ax.set_ylabel('Y')
    ax.set_zlabel('f(X,Y)')
    
    plt.show()


## **Ejemplo 1: Función 1**

La primera función es una de las más simples y conocidas:

\[
f(x, y) = x^2 + y^2
\]

- Es convexa.
- Tiene un único mínimo global en \((0, 0)\).
- Su gradiente es:

\[
\nabla f(x, y) = \begin{pmatrix}
2x \\
2y
\end{pmatrix}.
\]

A continuación, elegimos un **punto inicial aleatorio** y aplicamos el descenso de gradiente, mostrando en cada iteración:
1. El punto actual.
2. El valor de la función en ese punto.
3. El gradiente y su norma.
4. Verificamos si se cumple la tolerancia para detener el proceso.


In [2]:
# --------------------------------------------------------------------------------
# CELDA 2: Ejemplo 1
# --------------------------------------------------------------------------------

def f1(xy):
    x, y = xy
    return x**2 + y**2

def grad_f1(xy):
    x, y = xy
    return np.array([2*x, 2*y])

# Generamos un punto inicial aleatorio en el rango [-3,3]
x0_1 = np.random.uniform(-3, 3, size=2)

print("===== EJEMPLO 1: f(x,y) = x^2 + y^2 =====")
print(f"Punto inicial aleatorio: {x0_1}\n")

# Llamamos a la función de descenso de gradiente
sol_1, historial_1 = grad_desc(x0_1, f1, grad_f1, lr=0.1, maxiter=15, tol=1e-4)

print("\nPunto encontrado como mínimo aproximado:")
print(f"x* = {sol_1}")
print(f"f(x*) = {f1(sol_1):.6f}")

# Graficamos en 3D la función y el recorrido
plot_3d_and_path(f1, historial_1, title="Ejemplo 1: f(x,y) = x^2 + y^2")


===== EJEMPLO 1: f(x,y) = x^2 + y^2 =====
Punto inicial aleatorio: [1.14486814 2.0389348 ]

Iteración 1:
  - Punto actual: [1.14486814 2.0389348 ]
  - Valor de f(x): 5.467978
  - Gradiente: [2.28973627 4.0778696 ]
  - Norma del gradiente: 4.676742
------------------------------------------------
Iteración 2:
  - Punto actual: [0.91589451 1.63114784]
  - Valor de f(x): 3.499506
  - Gradiente: [1.83178902 3.26229568]
  - Norma del gradiente: 3.741393
------------------------------------------------
Iteración 3:
  - Punto actual: [0.73271561 1.30491827]
  - Valor de f(x): 2.239684
  - Gradiente: [1.46543121 2.60983654]
  - Norma del gradiente: 2.993115
------------------------------------------------
Iteración 4:
  - Punto actual: [0.58617249 1.04393462]
  - Valor de f(x): 1.433398
  - Gradiente: [1.17234497 2.08786923]
  - Norma del gradiente: 2.394492
------------------------------------------------
Iteración 5:
  - Punto actual: [0.46893799 0.83514769]
  - Valor de f(x): 0.917375
  - G

<IPython.core.display.Javascript object>

## **Ejemplo 2: Función 2**

\[
f(x, y) = (x - 2)^2 + (y + 1)^2
\]

- También es convexa.
- Su mínimo está en \((2, -1)\).
- El gradiente es:

\[
\nabla f(x, y) = \begin{pmatrix}
2(x - 2) \\
2(y + 1)
\end{pmatrix}.
\]

Seguiremos el mismo procedimiento (punto inicial aleatorio, iteraciones e impresión de resultados).

In [3]:
# --------------------------------------------------------------------------------
# CELDA 3: Ejemplo 2
# --------------------------------------------------------------------------------

def f2(xy):
    x, y = xy
    return (x - 2)**2 + (y + 1)**2

def grad_f2(xy):
    x, y = xy
    return np.array([2*(x - 2), 2*(y + 1)])

# Punto inicial aleatorio en el rango [-3,3]
x0_2 = np.random.uniform(-3, 3, size=2)

print("\n===== EJEMPLO 2: f(x,y) = (x - 2)^2 + (y + 1)^2 =====")
print(f"Punto inicial aleatorio: {x0_2}\n")

sol_2, historial_2 = grad_desc(x0_2, f2, grad_f2, lr=0.1, maxiter=15, tol=1e-4)

print("\nPunto encontrado como mínimo aproximado:")
print(f"x* = {sol_2}")
print(f"f(x*) = {f2(sol_2):.6f}")

# Graficar
plot_3d_and_path(f2, historial_2, title="Ejemplo 2: (x - 2)^2 + (y + 1)^2")



===== EJEMPLO 2: f(x,y) = (x - 2)^2 + (y + 1)^2 =====
Punto inicial aleatorio: [ 1.76936736 -1.24479638]

Iteración 1:
  - Punto actual: [ 1.76936736 -1.24479638]
  - Valor de f(x): 0.113117
  - Gradiente: [-0.46126527 -0.48959276]
  - Norma del gradiente: 0.672656
------------------------------------------------
Iteración 2:
  - Punto actual: [ 1.81549389 -1.1958371 ]
  - Valor de f(x): 0.072395
  - Gradiente: [-0.36901222 -0.39167421]
  - Norma del gradiente: 0.538125
------------------------------------------------
Iteración 3:
  - Punto actual: [ 1.85239511 -1.15666968]
  - Valor de f(x): 0.046333
  - Gradiente: [-0.29520977 -0.31333937]
  - Norma del gradiente: 0.430500
------------------------------------------------
Iteración 4:
  - Punto actual: [ 1.88191609 -1.12533575]
  - Valor de f(x): 0.029653
  - Gradiente: [-0.23616782 -0.25067149]
  - Norma del gradiente: 0.344400
------------------------------------------------
Iteración 5:
  - Punto actual: [ 1.90553287 -1.1002686 ]


<IPython.core.display.Javascript object>

## **Ejemplo 3: Función 3**

\[
f(x, y) = x^2 + 2y^2
\]

- Convexa.
- Tiene su mínimo en \((0, 0)\).
- Gradiente:

\[
\nabla f(x, y) = \begin{pmatrix}
2x \\
4y
\end{pmatrix}.
\]

Nuevamente se parte de un punto aleatorio y se observa la convergencia.

In [4]:
# --------------------------------------------------------------------------------
# CELDA 4: Ejemplo 3
# --------------------------------------------------------------------------------

def f3(xy):
    x, y = xy
    return x**2 + 2*(y**2)

def grad_f3(xy):
    x, y = xy
    return np.array([2*x, 4*y])

# Punto inicial aleatorio
x0_3 = np.random.uniform(-3, 3, size=2)

print("\n===== EJEMPLO 3: f(x,y) = x^2 + 2y^2 =====")
print(f"Punto inicial aleatorio: {x0_3}\n")

sol_3, historial_3 = grad_desc(x0_3, f3, grad_f3, lr=0.1, maxiter=15, tol=1e-4)

print("\nPunto encontrado como mínimo aproximado:")
print(f"x* = {sol_3}")
print(f"f(x*) = {f3(sol_3):.6f}")

# Graficar
plot_3d_and_path(f3, historial_3, title="Ejemplo 3: x^2 + 2y^2")



===== EJEMPLO 3: f(x,y) = x^2 + 2y^2 =====
Punto inicial aleatorio: [-2.02451429 -0.04609563]

Iteración 1:
  - Punto actual: [-2.02451429 -0.04609563]
  - Valor de f(x): 4.102908
  - Gradiente: [-4.04902859 -0.18438253]
  - Norma del gradiente: 4.053225
------------------------------------------------
Iteración 2:
  - Punto actual: [-1.61961144 -0.02765738]
  - Valor de f(x): 2.624671
  - Gradiente: [-3.23922287 -0.11062952]
  - Norma del gradiente: 3.241111
------------------------------------------------
Iteración 3:
  - Punto actual: [-1.29568915 -0.01659443]
  - Valor de f(x): 1.679361
  - Gradiente: [-2.5913783  -0.06637771]
  - Norma del gradiente: 2.592228
------------------------------------------------
Iteración 4:
  - Punto actual: [-1.03655132 -0.00995666]
  - Valor de f(x): 1.074637
  - Gradiente: [-2.07310264 -0.03982663]
  - Norma del gradiente: 2.073485
------------------------------------------------
Iteración 5:
  - Punto actual: [-0.82924106 -0.00597399]
  - Valor d

<IPython.core.display.Javascript object>

## **Ejemplo 4: Función 4**

\[
f(x, y) = 3 (x - 1)^2 + 5 (y + 2)^2
\]

- Convexa.
- Su mínimo se encuentra en \((1, -2)\).
- El gradiente:

\[
\nabla f(x, y) = \begin{pmatrix}
6(x - 1) \\
10(y + 2)
\end{pmatrix}.
\]


In [5]:
# --------------------------------------------------------------------------------
# CELDA 5: Ejemplo 4
# --------------------------------------------------------------------------------

def f4(xy):
    x, y = xy
    return 3*(x - 1)**2 + 5*(y + 2)**2

def grad_f4(xy):
    x, y = xy
    return np.array([6*(x - 1), 10*(y + 2)])

# Punto inicial aleatorio
x0_4 = np.random.uniform(-3, 3, size=2)

print("\n===== EJEMPLO 4: f(x,y) = 3 (x - 1)^2 + 5 (y + 2)^2 =====")
print(f"Punto inicial aleatorio: {x0_4}\n")

sol_4, historial_4 = grad_desc(x0_4, f4, grad_f4, lr=0.1, maxiter=15, tol=1e-4)

print("\nPunto encontrado como mínimo aproximado:")
print(f"x* = {sol_4}")
print(f"f(x*) = {f4(sol_4):.6f}")

# Graficar
plot_3d_and_path(f4, historial_4, title="Ejemplo 4: 3(x-1)^2 + 5(y+2)^2")



===== EJEMPLO 4: f(x,y) = 3 (x - 1)^2 + 5 (y + 2)^2 =====
Punto inicial aleatorio: [-1.85858794 -2.36279582]

Iteración 1:
  - Punto actual: [-1.85858794 -2.36279582]
  - Valor de f(x): 25.172679
  - Gradiente: [-17.15152761  -3.62795821]
  - Norma del gradiente: 17.531029
------------------------------------------------
Iteración 2:
  - Punto actual: [-0.14343517 -2.        ]
  - Valor de f(x): 3.922332
  - Gradiente: [-6.86061104  0.        ]
  - Norma del gradiente: 6.860611
------------------------------------------------
Iteración 3:
  - Punto actual: [ 0.54262593 -2.        ]
  - Valor de f(x): 0.627573
  - Gradiente: [-2.74424442  0.        ]
  - Norma del gradiente: 2.744244
------------------------------------------------
Iteración 4:
  - Punto actual: [ 0.81705037 -2.        ]
  - Valor de f(x): 0.100412
  - Gradiente: [-1.09769777  0.        ]
  - Norma del gradiente: 1.097698
------------------------------------------------
Iteración 5:
  - Punto actual: [ 0.92682015 -2.  

<IPython.core.display.Javascript object>

## **Conclusiones de cada paso**

1. **Selección de punto aleatorio**: 
   - En cada ejemplo utilizamos `np.random.uniform(-3, 3, size=2)` para generar un vector \((x, y)\) aleatorio. Esto garantiza que cada ejecución comience en un punto inicial distinto dentro del cuadrado de coordenadas \([-3, 3] \times [-3, 3]\).

2. **Cálculo del gradiente**:
   - Para cada función, se definió la **fórmula analítica** del gradiente. Este se evalúa en el punto actual en cada iteración.

3. **Actualización de la posición**:
   \[
   x_{\text{nuevo}} = x_{\text{viejo}} - \alpha \nabla f(x_{\text{viejo}}),
   \]
   - donde \(\alpha\) (`lr`) es la **tasa de aprendizaje**.

4. **Condición de parada**:
   - El algoritmo se detiene cuando se supera un número máximo de iteraciones (`maxiter`) o cuando la norma del gradiente (`np.linalg.norm(grad)`) es menor que la **tolerancia** (`tol`).

5. **Visualización 3D**:
   - Cada figura se muestra de forma **interactiva**, lo que permite manipular la vista (rotar, hacer zoom) y observar de manera clara cómo el camino de descenso se dirige hacia el mínimo de la función.

6. **Resultados**:
   - Como se evidencia en los reportes impresos en cada iteración y en los gráficos 3D, las trayectorias convergen hacia los mínimos correspondientes.

---
### **Fin del Notebook**

Cada vez que ejecutes este notebook de principio a fin, se generarán **cuatro puntos iniciales aleatorios** diferentes, por lo que **los caminos de descenso pueden variar** ligeramente. 

Si deseas **repetir** una ejecución exactamente, puedes **fijar la semilla** al principio (descomentando la línea `np.random.seed(42)` por ejemplo).

Las funciones mostradas son todas **convexas**, razón por la cual el **descenso de gradiente** converge al **mínimo global** en cada caso.

¡Disfruta explorando el **Descenso de Gradiente** con estos ejemplos!