# Métodos de primer orden

Los **métodos de primer orden** son métodos iterativos basados en derivadas de primer orden del objetivo. Dado un punto de inicio $\boldsymbol{\theta}_0$, la iteración $t$ consiste en hacer:
$$\boldsymbol{\theta}_{t+1}=\boldsymbol{\theta}_t+\eta_t\boldsymbol{d}_t$$
donde $\eta_t$ es el **factor de aprendizaje (learning rate)** y $\boldsymbol{d}_t$ la **dirección de descenso**

## Descenso por gradiente

Consiste en escoger el negativo del gradiente del objetivo como dirección de descenso:
$$\boldsymbol{\theta}_{t+1}=\boldsymbol{\theta}_t-\eta_t\boldsymbol{g}_t
\quad\text{con}\quad
\boldsymbol{g}_t=\mathbf{\nabla}\mathcal{L}(\boldsymbol{\theta})\rvert_{\boldsymbol{\theta}_t}$$


**Ejemplo:** $\mathcal{L}=\theta^2$, $\theta_0=10$, $\eta_t=0.2$, tolerancia $0.01$

In [1]:
import numpy as np

grad, theta, eta, tol = lambda t: 2*t, 10.0, 0.2, 0.01
while True:
	delta = -eta * grad(theta)
	if np.all(np.abs(delta) <= tol):
		break
	theta += delta
	print(round(theta, 3))

6.0
3.6
2.16
1.296
0.778
0.467
0.28
0.168
0.101
0.06
0.036
0.022
