# Funciones diferenciables. Aplicaciones

---

### Formas cuadráticas

Para la resolución de problemas de optimización es necesario conocer previamente el concepto de forma cuadrática y manejar ciertos resultados asociados al mismo. Esta sección se presenta como un pequeño apéndice necesario para la comprensión de varios resultados fundamentales de optimización en varias variables. Comenzamos con la definición de forma cuadrática.

#### Definición 15.1

Una forma cuadrática es una aplicación $Q:\mathbb{R}^k\to\mathbb{R}$ definida por

$$
Q(x_1,x_2,\dots,x_k)=\sum_{i,j=1,\ i\leq j}^{k}\alpha_{ij}x_ix_j
$$

Veamos algunos ejemplos de formas cuadráticas.

---

#### Ejemplo 15.1

Para el caso de $k=1$ variable, la función $Q:\mathbb{R}\to\mathbb{R}$ definida por
$$
Q(x)=2x^2
$$
es un ejemplo de forma cuadrática, donde $\alpha_{11}=2$.

Para el caso de $k=2$ variables, la función $Q:\mathbb{R}^2\to\mathbb{R}$ definida por
$$
Q(x_1,x_2)=2x_1^2+3x_1x_2-x_2^2
$$
es un ejemplo de forma cuadrática definida en $\mathbb{R}^2$, donde $\alpha_{11}=2$, $\alpha_{12}=3$, $\alpha_{22}=-1$.

Para el caso de $k=3$ variables, la función $Q:\mathbb{R}^3\to\mathbb{R}$ definida por
$$
Q(x_1,x_2,x_3)=x_1^2+2x_1x_3+3x_2^2-4x_2x_3
$$
es una forma cuadrática definida en $\mathbb{R}^3$, siendo en este caso $\alpha_{11}=1$, $\alpha_{12}=0$, $\alpha_{13}=2$, $\alpha_{22}=3$, $\alpha_{23}=-4$, $\alpha_{33}=0$.

---

Una forma cuadrática $Q:\mathbb{R}^k\to\mathbb{R}$,

$$
Q(x_1,x_2,\dots,x_k)=\sum_{i,j=1,\ i\leq j}^{k}\alpha_{ij}x_ix_j
$$

se puede expresar matricialmente de la forma

$$
Q(x_1,x_2,\dots,x_k)=
\begin{pmatrix}
x_1 & x_2 & \dots & x_k
\end{pmatrix}
A
\begin{pmatrix}
x_1 \\ x_2 \\ \vdots \\ x_k
\end{pmatrix}
$$

donde $A=(a_{ij})\in\mathcal{M}_k$ es una matriz cuadrada simétrica de orden $k$ definida por

$$
\begin{aligned}
a_{ii} & = \alpha_{ii}, \quad i\in\{1,2,\dots,k\} \\
a_{ij} & = a_{ji} = \frac{\alpha_{ij}}{2}, \quad i,j\in\{1,2,\dots,k\},\ i<j
\end{aligned}
$$

---

### Ejemplo 15.2

Consideremos las formas cuadráticas del ejemplo anterior. En el caso de la forma cuadrática
$$
Q(x_1,x_2)=2x_1^2+3x_1x_2-x_2^2
$$
la matriz simétrica asociada es
$$
A=\begin{pmatrix}
2 & \frac{3}{2}\\
\frac{3}{2} & -1
\end{pmatrix}
$$
En efecto,
$$
\begin{pmatrix}
x_1 & x_2
\end{pmatrix}
\begin{pmatrix}
2 & \frac{3}{2}\\
\frac{3}{2} & -1
\end{pmatrix}
\begin{pmatrix}
x_1\\
x_2
\end{pmatrix}
=
\begin{pmatrix}
x_1 & x_2
\end{pmatrix}
\begin{pmatrix}
2x_1+\frac{3}{2}x_2\\
\frac{3}{2}x_1-x_2
\end{pmatrix}
=
2x_1^2+3x_1x_2-x_2^2
$$

De igual manera, para la forma cuadrática
$$
Q(x_1,x_2,x_3)=x_1^2+2x_1x_3+3x_2^2-4x_2x_3
$$
su matriz simétrica asociada es
$$
A=\begin{pmatrix}
1 & 0 & 1\\
0 & 3 & -2\\
1 & -2 & 0
\end{pmatrix}
$$
y se cumple que
$$
\begin{aligned}
Q(x_1,x_2,x_3)
&=
\begin{pmatrix}
x_1 & x_2 & x_3
\end{pmatrix}
\begin{pmatrix}
1 & 0 & 1\\
0 & 3 & -2\\
1 & -2 & 0
\end{pmatrix}
\begin{pmatrix}
x_1\\
x_2\\
x_3
\end{pmatrix} \\
&=
\begin{pmatrix}
x_1 & x_2 & x_3
\end{pmatrix}
\begin{pmatrix}
x_1+x_3\\
3x_2-2x_3\\
x_1-2x_2
\end{pmatrix}
=
x_1(x_1+x_3)+x_2(3x_2-2x_3)+x_3(x_1-2x_2) \\
&=
x_1^2+2x_1x_3+3x_2^2-4x_2x_3
\end{aligned}
$$

---

Como veremos, es importante el signo que toma una forma cuadrática, en particular en optimización de funciones de varias variables. Atendiendo a su signo, las formas cuadráticas se clasifican del siguiente modo.

### Definición 15.2

Sea $Q:\mathbb{R}^k\to\mathbb{R}$ una forma cuadrática. Se dice que $Q$ es

- **Definida positiva** si $Q(x)>0$ para todo $x\in\mathbb{R}^k$, $x\neq 0$.
- **Definida negativa** si $Q(x)<0$ para todo $x\in\mathbb{R}^k$, $x\neq 0$.
- **Semidefinida positiva** si $Q(x)\geq 0$ para todo $x\in\mathbb{R}^k$.
- **Semidefinida negativa** si $Q(x)\leq 0$ para todo $x\in\mathbb{R}^k$.
- **Indefinida** si $Q$ toma valores positivos y negativos.

Habitualmente, diremos que la matriz $A$ que representa la forma cuadrática $Q$ es definida positiva (respectivamente, definida negativa, semidefinida positiva, semidefinida negativa o indefinida) si la forma cuadrática $Q$ lo es.

---

A continuación, damos dos criterios de clasificación de las formas cuadráticas. En el primero de ellos se establecen condiciones para clasificar la forma cuadrática en base a los signos de los autovalores de la matriz simétrica, y en el segundo se proporcionan condiciones en base al signo de los determinantes de ciertas submatrices de $A$.

En primer lugar, es importante resaltar que toda matriz simétrica es diagonalizable, por lo que, en particular, existen autovalores y éstos son números reales.

### Teorema 15.1

Sea $Q:\mathbb{R}^k\to\mathbb{R}$ una forma cuadrática y $A$ su matriz simétrica asociada. Denotemos por $\lambda_i$, $i=1,2,\dots,k$, los autovalores de $A$ (algunos de ellos pueden coincidir). Se cumplen los siguientes criterios:

1. Los autovalores son todos estrictamente positivos, $\lambda_i>0$ para $i=1,2,\dots,k$, si y solamente si $Q$ es definida positiva.
2. Los autovalores son todos estrictamente negativos, $\lambda_i<0$ para $i=1,2,\dots,k$, si y solamente si $Q$ es definida negativa.
3. Los autovalores son todos no negativos, $\lambda_i\geq 0$ para $i=1,2,\dots,k$, si y solamente si $Q$ es semidefinida positiva.
4. Los autovalores son todos no positivos, $\lambda_i\leq 0$ para $i=1,2,\dots,k$, si y solamente si $Q$ es semidefinida negativa.
5. Si algunos autovalores son negativos y otros son positivos, entonces $Q$ es indefinida.

---

### Ejemplo 15.3

Clasifique la forma cuadrática
$$
Q(x_1,x_2)=2x_1^2+3x_1x_2-x_2^2
$$
Como vimos en el ejemplo anterior, la matriz simétrica asociada a $Q$ viene dada por
$$
A=\begin{pmatrix}
2 & \frac{3}{2}\\
\frac{3}{2} & -1
\end{pmatrix}
$$
Los autovalores de $A$ son las raíces del polinomio característico
$$
p(\lambda)=\det(A-\lambda I)
=
\begin{vmatrix}
2-\lambda & \frac{3}{2}\\
\frac{3}{2} & -1-\lambda
\end{vmatrix}
=(2-\lambda)(-1-\lambda)-\frac{9}{4}
=\lambda^2-\lambda-\frac{17}{4}
$$
Sus raíces son
$$
\lambda_1=\frac{1+3\sqrt{2}}{2}>0,
\qquad
\lambda_2=\frac{1-3\sqrt{2}}{2}<0
$$
Como existe un autovalor positivo y otro negativo, por el criterio de clasificación anterior, $Q$ es indefinida.

En efecto, se puede comprobar que $Q$ es indefinida buscando dos puntos en los que $Q$ cambie de signo. Observemos que
$$
Q(1,0)=2>0
$$
y
$$
Q(0,1)=-1<0
$$

---

### Ejemplo 15.4

Clasifique la forma cuadrática
$$
Q(x_1,x_2,x_3)=3x_1^2+2x_1x_3+x_2^2+5x_3^2
$$

Su matriz simétrica asociada es
$$
A=
\begin{pmatrix}
3 & 0 & 1 \\
0 & 1 & 0 \\
1 & 0 & 5
\end{pmatrix}
$$

El polinomio característico viene dado por
$$
p(\lambda)=\det(A-\lambda I)=
\begin{vmatrix}
3-\lambda & 0 & 1 \\
0 & 1-\lambda & 0 \\
1 & 0 & 5-\lambda
\end{vmatrix}
=(1-\lambda)\bigl((3-\lambda)(5-\lambda)-1\bigr)
=(1-\lambda)(\lambda^2-8\lambda+14)
$$

Sus raíces se obtienen de
$$
(1-\lambda)(\lambda^2-8\lambda+14)=0
$$
y, por tanto, los autovalores son
$$
\lambda_1=1,\qquad \lambda_2=4+\sqrt{2},\qquad \lambda_3=4-\sqrt{2}
$$
Como $\lambda_1>0$, $\lambda_2>0$ y $\lambda_3>0$, se deduce que $Q$ es definida positiva.

---

Para el siguiente criterio de clasificación, consideramos los determinantes de las submatrices principales, que no son más que las submatrices de $A$ obtenidas tomando las $i$ primeras filas y las $i$ primeras columnas de $A$. Denotamos dichos determinantes por
$$
\Delta_i=
\begin{vmatrix}
a_{11} & \cdots & a_{1i} \\
\vdots & \ddots & \vdots \\
a_{i1} & \cdots & a_{ii}
\end{vmatrix}
$$
para $i=1,\dots,k$.

Por ejemplo, si
$$
A=
\begin{pmatrix}
1 & 2 & 5 \\
2 & 2 & 0 \\
5 & 0 & 3
\end{pmatrix}
$$
entonces
$$
\Delta_1=1,\qquad
\Delta_2=
\begin{vmatrix}
1 & 2 \\
2 & 2
\end{vmatrix},\qquad
\Delta_3=\det(A)=-56
$$

### Teorema 15.2

Sea $Q:\mathbb{R}^k\to\mathbb{R}$ una forma cuadrática y sea $A$ su matriz simétrica asociada. Supongamos que $\Delta_i\neq 0$ para todo $i=1,2,\dots,k$. Entonces se verifican los siguientes criterios:

1. $\Delta_i>0$ para todo $i=1,2,\dots,k$ si y sólo si $Q$ es definida positiva.

2. $(-1)^i\Delta_i>0$ para todo $i=1,2,\dots,k$ (es decir, $\Delta_1<0$, $\Delta_2>0$, $\Delta_3<0$, $\dots$) si y sólo si $Q$ es definida negativa.

---

### Ejemplo 15.5

Consideremos la forma cuadrática del Ejemplo 15.3. Se tiene que
$$
\Delta_1=2>0
$$
y
$$
\Delta_2=-\frac{17}{4}<0
$$
Por tanto, $Q$ no es ni definida positiva ni definida negativa (obsérvese que, para que sea definida negativa, los signos de los determinantes deben alternar de la forma $<0$, $>0$, $<0$, ...).

---

### Ejemplo 15.6

Consideremos ahora la forma cuadrática del Ejemplo 15.4. Se tiene que
$$
\Delta_1=3>0
$$
y
$$
\Delta_2=
\begin{vmatrix}
3 & 0 \\
0 & 1
\end{vmatrix}
=3>0
$$
y
$$
\Delta_3=\det(A)=14>0
$$
Por tanto, por el segundo criterio de clasificación se deduce que $Q$ es definida positiva, como ya sabíamos.

---

### Observación 15.2

Como hemos visto, toda forma cuadrática determina una matriz simétrica. Del mismo modo, toda matriz simétrica determina una forma cuadrática. Nuestra aplicación principal de las formas cuadráticas surge en Optimización; en particular, la forma cuadrática $Q$ asociada a la matriz hessiana y definida por
$$
Q(\mathbf{x})=\mathbf{x}^T\nabla^2 f(\mathbf{a})\mathbf{x}
$$
Recordemos que la hessiana $\nabla^2 f(\mathbf{a})$ es una matriz simétrica bajo condiciones de regularidad suficiente. Como veremos en el siguiente apartado, la clasificación de los puntos críticos en máximos y mínimos locales depende del signo de la forma cuadrática $Q$.

---

## Teorema de Taylor para varias variables

En esta sección extendemos el Teorema de Taylor a funciones de varias variables. La idea consiste en reducir el problema al caso de una variable proyectando la función sobre rectas y aplicando el resultado conocido en una dimensión.

Recordemos que, para una función de una variable $f:\mathbb{R}\to\mathbb{R}$ y un punto $a\in\mathbb{R}$, el Teorema de Taylor asegura la existencia de un escalar $\theta$ perteneciente al intervalo de extremos $a$ y $x$ tal que
$$
f(x)=f(a)+f'(a)(x-a)+\frac{f''(a)}{2!}(x-a)^2+\dots+\frac{f^{(n)}(a)}{n!}(x-a)^n+\frac{f^{(n+1)}(\theta)}{(n+1)!}(x-a)^{n+1}
$$
Si denotamos $h=x-a$, podemos reescribir la expresión anterior de forma equivalente como
$$
f(a+h)=f(a)+f'(a)h+\frac{f''(a)}{2!}h^2+\dots+\frac{f^{(n)}(a)}{n!}h^n+\frac{f^{(n+1)}(\theta)}{(n+1)!}h^{n+1}
$$
Recordemos también que el polinomio de Taylor de orden $n$ de $f$ en $a$ viene dado por
$$
p_n(x)=f(a)+f'(a)(x-a)+\frac{f''(a)}{2!}(x-a)^2+\dots+\frac{f^{(n)}(a)}{n!}(x-a)^n
$$

### Extensión a varias variables

Sea $f:\mathbb{R}^k\to\mathbb{R}$ una función suficientemente regular, sea $\mathbf{a}=(a_1,\dots,a_k)$ un punto fijo y sea $\mathbf{h}=(h_1,\dots,h_k)\in\mathbb{R}^k$ una dirección. Consideramos la recta $r$ definida por
$$
r=\mathbf{a}+t\mathbf{h}
=\left\lbrace (a_1+th_1,\dots,a_k+th_k):t\in\mathbb{R}\right\rbrace
$$
Definimos la función $f_{\mathbf{h}}:\mathbb{R}\to\mathbb{R}$ como la restricción de $f$ a dicha recta, es decir,
$$
f_{\mathbf{h}}(t)=f(\mathbf{a}+t\mathbf{h})
$$
Esta función se obtiene como composición de las aplicaciones
$$
\begin{array}{cccccc}
f_{\mathbf{h}}: & \mathbb{R} & \longrightarrow & \mathbb{R}^k              & \longrightarrow & \mathbb{R} \\
                & t          & \longmapsto     & \mathbf{a}+t\mathbf{h}    & \longmapsto     & f(\mathbf{a}+t\mathbf{h})
\end{array}
$$
Aplicando el Teorema de Taylor de una variable al caso $a=0$ y $t=1$, obtenemos
$$
f_{\mathbf{h}}(1)=f_{\mathbf{h}}(0)+f'_{\mathbf{h}}(0)+\frac{f''_{\mathbf{h}}(0)}{2!}
+\dots+\frac{f^{(n)}_{\mathbf{h}}(0)}{n!}
+\frac{f^{(n+1)}_{\mathbf{h}}(\theta)}{(n+1)!}
$$
donde $\theta\in(0,1)$. Esta expresión determina el Teorema de Taylor para varias variables una vez que se calculan las derivadas $f^{(i)}_{\mathbf{h}}(0)$ mediante la regla de la cadena. En lo que sigue nos centraremos en los polinomios de Taylor de orden $1$ y $2$.

### Polinomios de Taylor

Construimos ahora explícitamente los polinomios de Taylor de la función $f$. En primer lugar, consideramos la aproximación dada por los dos primeros sumandos de la expresión anterior,
$$
f_{\mathbf{h}}(1)\approx f_{\mathbf{h}}(0)+f'_{\mathbf{h}}(0)
$$
Calculemos cada término. Por definición,
$$
f_{\mathbf{h}}(1)=f(\mathbf{a}+\mathbf{h})
$$
y
$$
f_{\mathbf{h}}(0)=f(\mathbf{a})
$$
Aplicando la regla de la cadena obtenemos
$$
f'_{\mathbf{h}}(0)=
\begin{pmatrix}
D_1f(\mathbf{a}) & \dots & D_kf(\mathbf{a})
\end{pmatrix}
\begin{pmatrix}
h_1\\
\vdots\\
h_k
\end{pmatrix}
=\nabla f(\mathbf{a})^T\mathbf{h}
$$
donde utilizamos la convención de vectores columna, de modo que $\nabla f(\mathbf{a})$ es un vector columna. Por tanto,
$$
f(\mathbf{a}+\mathbf{h})\approx f(\mathbf{a})+\nabla f(\mathbf{a})^T\mathbf{h}
$$
Si denotamos $\mathbf{x}=\mathbf{a}+\mathbf{h}$, esta expresión es equivalente a
$$
f(\mathbf{x})\approx f(\mathbf{a})+\nabla f(\mathbf{a})^T(\mathbf{x}-\mathbf{a})
$$
que determina el polinomio de Taylor de orden $1$ de $f$ en el punto $\mathbf{a}$.

---

### Definición 15.3

Sea $f:\mathbb{R}^k\to\mathbb{R}$. El polinomio
$$
P_1(\mathbf{x})=f(\mathbf{a})+\nabla f(\mathbf{a})^T(\mathbf{x}-\mathbf{a})
$$
recibe el nombre de polinomio de Taylor de orden $1$ de $f$ en el punto $\mathbf{a}$.

---

De igual forma, los tres primeros sumandos,
$$
f_{\mathbf{h}}(0)+f'_{\mathbf{h}}(0)+\frac{f''_{\mathbf{h}}(0)}{2!},
$$
proporcionan el polinomio de Taylor de orden $2$. Como ya hemos visto,
$$
\begin{aligned}
f_{\mathbf{h}}(0)  & = f(\mathbf{a}), \\
f'_{\mathbf{h}}(0) & = \nabla f(\mathbf{a})^T\mathbf{h},
\end{aligned}
$$
nos resta calcular la derivada segunda $f''_{\mathbf{h}}(0)$.

Esta se obtiene aplicando nuevamente la regla de la cadena. En efecto,
$$
f''_{\mathbf{h}}(0)
= \frac{d}{dt}\left(
D_1f(\mathbf{a}+t\mathbf{h})h_1+\dots+D_kf(\mathbf{a}+t\mathbf{h})h_k
\right)\Bigg|_{t=0}
= \sum_{j=1}^k \frac{d}{dt}\left(D_jf(\mathbf{a}+t\mathbf{h})h_j\right)\Bigg|_{t=0}
$$
Aplicando la regla de la cadena a cada término,
$$
\frac{d}{dt}\left(D_jf(\mathbf{a}+t\mathbf{h})h_j\right)
= \sum_{i=1}^k D_{ij}f(\mathbf{a}+t\mathbf{h})h_ih_j
$$
Teniendo en cuenta la simetría del Hessiano, $D_{ij}f=D_{ji}f$, se obtiene
$$
\begin{aligned}
f''_{\mathbf{h}}(t)= {} & D_{11}f(\mathbf{a}+t\mathbf{h})h_1^2
+ D_{21}f(\mathbf{a}+t\mathbf{h})h_2h_1
+ \cdots
+ D_{k1}f(\mathbf{a}+t\mathbf{h})h_kh_1 \\
& + D_{12}f(\mathbf{a}+t\mathbf{h})h_1h_2
+ D_{22}f(\mathbf{a}+t\mathbf{h})h_2^2
+ \cdots
+ D_{k2}f(\mathbf{a}+t\mathbf{h})h_kh_2 \\
& \vdots \\
& + D_{1k}f(\mathbf{a}+t\mathbf{h})h_1h_k
+ D_{2k}f(\mathbf{a}+t\mathbf{h})h_2h_k
+ \cdots
+ D_{kk}f(\mathbf{a}+t\mathbf{h})h_k^2 \\
= {} & \sum_{i=1}^k D_{ii}f(\mathbf{a}+t\mathbf{h})h_i^2
+ \sum_{i<j} 2\,D_{ij}f(\mathbf{a}+t\mathbf{h})h_ih_j \\
= {} & \mathbf{h}^T\nabla^2 f(\mathbf{a}+t\mathbf{h})\mathbf{h}
\end{aligned}
$$
En particular, evaluando en $t=0$, se concluye que $f''_{\mathbf{h}}(0)$ coincide con la forma cuadrática asociada a la matriz hessiana $\nabla^2 f(\mathbf{a})$.

---

### Definición 15.4

Sea $f:\mathbb{R}^k\to\mathbb{R}$. El polinomio
$$
P_2(\mathbf{x})
= f(\mathbf{a})
+ \nabla f(\mathbf{a})^T(\mathbf{x}-\mathbf{a})
+ \frac{1}{2}(\mathbf{x}-\mathbf{a})^T\nabla^2 f(\mathbf{a})(\mathbf{x}-\mathbf{a})
$$
recibe el nombre de polinomio de Taylor de orden $2$ de $f$ en el punto $\mathbf{a}$.

---

### Observación 15.3

Como ya se indicó en la Observación 15.2 al final del apartado referente a formas cuadráticas, obsérvese que el término
$$
\frac{1}{2}(\mathbf{x}-\mathbf{a})^T\nabla^2 f(\mathbf{a})(\mathbf{x}-\mathbf{a})
$$
corresponde a una forma cuadrática cuya matriz asociada viene determinada por la hessiana de la función $f$ en el punto $\mathbf{x}=\mathbf{a}$.

Este término constituye la extensión a varias variables del término de segundo orden del polinomio de Taylor para una función $f:\mathbb{R}\to\mathbb{R}$ de una variable. En efecto, puede expresarse de manera análoga como
$$
\frac{f''(a)}{2!}(x-a)^2=\frac{1}{2}(x-a)f''(a)(x-a)
$$

---