# Obligatorio 1



In [3]:
import numpy as np
import numpy.linalg as la
import numpy.random as rnd

# seteamos la semilla de generación de números aleatorios para reproducir los resultados
rnd.seed(2025)

m= 20
n= 10
A = rnd.rand(m,n)
b = rnd.rand(m)
lambd = 0.8

Sea $\lambda$ un real positivo. Considere la función $f:\mathbb{R}^n \to \mathbb{R}$ definida como $f(x) = ||Ax-b||^2 + \lambda||x||^2$, donde $A \in \mathbb{R}^{m\times n}$ es una matriz, y $b \in \mathbb{R}^m$ un vector dado.



1.   Calcule el gradiente de la función ($\nabla{f}$). Escriba la expresión en esta celda de texto, y en la función de la celda de código siguiente.

$\nabla f(x) =
$$
\ 2A^T A x - 2A^T b + 2\lambda x
$

Explicacion: Usando lo visto en el teórico planteamos
$$
f(a + h) = \|A(X + h) - b\|^2 + \lambda \|X + h\|^2
$$

Usando que la norma al cuadrado es igual al producto interno de la matriz consigo misma obtuvimos que lo anterior es igual a:

$$
= \langle Ax + Ah - b,\ Ax + Ah - b \rangle + \lambda \langle x + h,\ x + h \rangle
$$

Desarrollando con las propiedades de producto interno llegamos a la expresion:

$$
= \langle Ax - b, Ax - b \rangle + 2 \langle Ax - b, Ah \rangle + 2\langle Ah, Ah \rangle + \lambda \left( 2\langle x, x \rangle + 2 \langle h,h \rangle +2 \langle x, h \rangle \right)
$$

Los términos:
$$ \langle Ax - b, Ax - b \rangle $$ y $$\ 2\lambda \langle x, x \rangle $$ son iguales a f(x) ya que f(x) es igual a la norma cuadrada de
$$
f(a) = \|A(X) - b\|^2 + \lambda \|X\|^2
$$.

A su vez los términos:
$$ 2\langle h,h \rangle $$
y
$$ 2\langle Ah, Ah \rangle $$
son
$$ O(h^2 ) $$
y corresponden al resto del desarrollo de Taylor.

Los términos restantes de la expresión son lineales:
$$
= 2 \langle Ax - b, Ah \rangle +2 \lambda  \langle x, h \rangle
$$
Por definición deferenciabilidad, una función f(x) es diferenciable si puede escribirse como f(x) más un término lineal en h más un término cuadrático en h, donde el término lineal en h es el producto interno del gradiente con h.

Despejando ahora la h del lado derecho del producto interno obtenemos:
$$
= 2 \langle A^T(Ax - b), h \rangle +2 \lambda  \langle x, h \rangle
$$
donde
$$ A^T(Ax - b)+ 2 \lambda  x $$
es el gradiente.

De esta forma obtuvimos la solución de arriba:

$\nabla f(x) =
$$
\ 2A^T A x - 2A^T b + 2\lambda x
$



In [1]:
def f(x):
  return la.norm(A@x-b)**2 + lambd*la.norm(x)**2

def gradf(x):
  ## completar
  return 2*A.T@A@x-2*A.T@b+2*lambd*x



2.   Compruebe numéricamente que el cálculo del gradiente es correcto, escribiendo una función que calcule una aproximación numérica del gradiente, a partir de cocientes incrementales.



In [4]:
def grad_numerico(x):
  eps = 1e-7
  grad = np.zeros(n)
  for i in range(len(x)):
    xcopia=x.copy()
    xcopia[i]+=eps
    grad[i]=(f(xcopia)-f(x))/eps
  return grad

xr = rnd.rand(n)

#calculemos la norma de la diferencia entre el gradiente calculado y la aproximación numérica, en un punto aleatorio xr.
#Si todo está bien, debería ser un número chico
print(la.norm(gradf(xr) - grad_numerico(xr)))

1.8455308629281004e-06


3.  A partir de la expresión de $\nabla f$ hallada en el punto 1, escriba la condición de optimalidad, y halle un $x^*$ que la cumpla.

La condición de optimalidad es:
Si f es diferenciable en x* y x* es un mínimo relativo, entonces ∇f(x*)=0.

Comenzamos igualando el gradiente obtenido arriba a 0:
$$\nabla f(x^*) =
\ 2A^T A x^* - 2A^T b + 2\lambda x* =0
$$
Luego simplificamos los coeficientes 2 y despejamos los términos en x:

$$
\ A^T A x* + \lambda x^* = A^T b
$$

El siguiente paso fue factorizar x* obteniendo:
$$
\ (A^T A + I\lambda) x^* = A^T b
$$
Despejamos x^* multiplicando a ambos lados por el inverso de la matriz y obtuvimos el resultado final:
$$
 x^* = (A^T A + I\lambda)^{-1}A^T b
$$



In [5]:
# sustituya 0 por el vector hallado que cumpla la condición de optimalidad
xstar = la.inv((A.T@A)+(np.eye(n)*lambd))@(A.T@b)

4. Compruebe que el gradiente se anula en $x^*$

In [6]:
# En esta celda, comprobar la condición necesaria de optimalidad en xstar
print(la.norm(gradf(xstar)))

3.675286015406637e-14
