# Búsqueda de ceros de funciones reales

**by Roberto E. Navarro**

## Abstract

Este documento discute algunos métodos para tratar el problema de búsqueda de ceros de una función real $f(x)$, o bien, encontrar los puntos $x = x^*$ donde $f(x^*) = 0$. En muchas ocasiones, $f(x)$ puede ser una función no algebraica o trascendental, por lo que sus ceros o raíces no son analíticos o no tienen una forma cerrada. La mayoría de los métodos para encontrar raíces son iterativos, es decir, a partir de una estimación inicial $x = x_0$, esperamos que una secuencia apropiada $x_k$ se acerque iterativamente de modo que $x_k \to x^*$ para algún $k > K$. Un gran número de métodos se han desarrollado, principalmente porque ninguno de ellos funciona en todos los casos, por lo que el método es altamente dependiente del tipo de función $f(x)$.

# 1 Método de bisección

Una primera aproximación podría ser intentar acotar las raíces de $f(x)$. Si $f(x)$ es continuo en cierto intervalo $a < x < b$ y si $f(a)f(b) < 0$, es decir $f(x)$ cambia de signo, entonces podemos asegurar que existe cierto valor $a < x^* < b$ en el intervalo de modo que $f(x^*) = 0$.

Así, se propone el siguiente algoritmo:

1. Si $f(a) = 0$, entonces $x = a$ es una raíz, por lo que el algoritmo termina. Lo mismo con $f(b)$.
2. Defina $c = (a + b)/2$.
3. Si $f(a)f(c) < 0$, entonces $a < x^* < c$ es un nuevo intervalo más acotado. Luego, $b = c$.
4. En caso contrario, entonces $c < x^* < b$ es el nuevo intervalo. Luego, $a = c$.
5. Repetir el ciclo desde el punto (1), hasta encontrar una raíz o $|b - a| < \epsilon$ con $\epsilon$ cierta tolerancia.

Note que, si $c_n = (a_n + b_n)/2$ en la iteración $n$, con $a_n = \{a_{n-1}|c_{n-1}\}$ y $b_n = \{c_{n-1}|b_{n-1}\}$, entonces:

$$
c_n - x^* \leq \frac{1}{2}(b_n - a_n) = \frac{1}{2^{n+1}}(b_0 - a_0)
$$

Por lo tanto, $c_n \to x^*$ cuando $n \to \infty$. Esto también implica que, si $\epsilon_n = c_n - x^*$, entonces:

$$
\epsilon_{n+1} \simeq \frac{1}{2}\epsilon_n
$$

Cuando el error $\epsilon_n$ del método cumple una regla de la forma $\epsilon_{n+1} \propto \epsilon_n^p$, se dice que el método es de orden $p$. En el caso del método de la bisección, este es de orden $p = 1$.

# 2 Método de Newton-Raphson

Supongamos que $x = x_n$ está lo suficientemente cerca de la raíz $x = x^*$. Luego, expandimos en torno a $x = x_n$ tal que

$$
f(x^*) \simeq f(x_n) + f'(x_n)(x^* - x_n)
$$

$$
x^* \simeq x_n - \frac{f(x_n)}{f'(x_n)}
$$

Si $x^*$ resulta no ser una raíz, entonces definimos el método de Newton-Raphson:

$$
x_{n+1} = x_n - \frac{f(x_n)}{f'(x_{n+1})}
$$

y repetimos el proceso hasta que $x_n \to x^*$ converja a la raíz.

Para estimar el orden de convergencia, usamos una expansión similar pero en torno a la raíz:

$$
f(x_n) = f'(x^*)\epsilon_n + \frac{1}{2}f''(x^*)\epsilon_n^2 + O(\epsilon_n^3)
$$

$$
f'(x_n) = f'(x^*) + f''(x^*)\epsilon_n + O(\epsilon_n^2)
$$

donde $\epsilon_n = x_n - x^*$. Reemplazando en el método de Newton-Raphson:

$$
\epsilon_{n+1} = \epsilon_n - \frac{f'(x^*)\epsilon_n + \frac{1}{2}f''(x^*)\epsilon_n^2 + O(\epsilon_n^3)}{f'(x^*) + f''(x^*)\epsilon_n + \frac{1}{2}f'''(x^*)\epsilon_n^2 + O(\epsilon_n^3)}
$$

$$
= \epsilon_n - \frac{f'(x^*)\epsilon_n + \frac{1}{2}f''(x^*)\epsilon_n^2 + O(\epsilon_n^3)}{f'(x^*)}
\left[\frac{1}{1 + \frac{f''(x^*)}{f'(x^*)}\epsilon_n + O(\epsilon_n^2)}\right]
$$

$$
\simeq \epsilon_n - \frac{f'(x^*)\epsilon_n + \frac{1}{2}f''(x^*)\epsilon_n^2 + O(\epsilon_n^3)}{f'(x^*)}
\left[1 - \frac{f''(x^*)}{f'(x^*)}\epsilon_n + O(\epsilon_n^2)\right]
$$

$$
\simeq -\frac{1}{2}\frac{f''(x^*)}{f'(x^*)}\epsilon_n^2 + \frac{f''(x^*)}{f'(x^*)}\epsilon_n^2 + O(\epsilon_n^3)
$$

$$
\simeq \frac{1}{2}\frac{f''(x^*)}{f'(x^*)}\epsilon_n^2 + O(\epsilon_n^3)
$$



Luego, como $\epsilon_{n+1} \propto \epsilon_n^2$, entonces el orden del método es 2.

En la segunda línea del procedimiento anterior, factorizamos el denominador por $f'(x^*)$. En la tercera línea usamos la aproximación de la serie geométrica $1/(1 + \alpha\epsilon) \simeq 1 - \alpha\epsilon$.

Notar que términos de la forma $O(\epsilon^n)$ corresponden a la notación big-O, que es simplemente una indicación de que hay términos $\epsilon^n$ de potencia n o superior, con $\epsilon^n$ el término dominante. Así:

1. Si $O(\epsilon^m)$ son términos de orden $m$, entonces $\beta\epsilon^n O(\epsilon^m) = O(\epsilon^{m+n})$ es simplemente un término de orden $m + n$, con $\beta$ una constante o función independiente de $\epsilon$.

2. La resta $O(\epsilon^n) - O(\epsilon^n)$ no necesariamente es nula. Recordar que $O(\epsilon^n)$ solo indica el orden de una expresión, pero no dice nada de qué forma tiene. Así, $O(\epsilon^n) - O(\epsilon^n)$ podría representar la resta de dos polinomios simples $\alpha\epsilon^n - \beta\epsilon^n = (\alpha - \beta)\epsilon^n$ que resulta en otro polinomio de orden $n$ y solo se anula en el caso especial en que $\alpha = \beta$. Como tenemos poca información de los coeficientes, entonces en general $O(\epsilon^n) - O(\epsilon^n) = O(\epsilon^n)$ es otro objeto de orden n.

3. La suma $O(\epsilon^m) + O(\epsilon^n)$ debe evaluar cuál término tiene el término dominante. Si $n < m$, entonces $O(\epsilon^n)$ (el de orden menor) es dominante por sobre $O(\epsilon^m)$ (el de orden mayor), por lo que $O(\epsilon^n) + O(\epsilon^m) = O(\epsilon^n)$. En general, $O(\epsilon^m) + O(\epsilon^n) = O(\epsilon^{\min(m,n)})$.

**NOTAR:** Si $f(x^*) = 0$ y además $f'(x^*) = 0$, o sea $x = x^*$ es tanto un cero como un extremo de $f$ (se dice que el cero es de multiplicidad 2), entonces

$$
\epsilon_{n+1} = \epsilon_n - \frac{\frac{1}{2}f''(x^*)\epsilon_n^2 + \frac{1}{6}f'''(x^*)\epsilon_n^3 + O(\epsilon_n^4)}{f''(x^*)\epsilon_n + \frac{1}{2}f'''(x^*)\epsilon_n^2 + O(\epsilon_n^3)}
$$

$$
\simeq \epsilon_n - \frac{\frac{1}{2}f''(x^*)\epsilon_n^2 + \frac{1}{6}f'''(x^*)\epsilon_n^3 + O(\epsilon_n^4)}{f''(x^*)\left[1 + \frac{1}{2}\frac{f'''(x^*)}{f''(x^*)}\epsilon_n + O(\epsilon_n^2)\right]}
$$

$$
\simeq \frac{1}{2}\epsilon_n + \frac{\frac{1}{12}f'''(x^*)}{f''(x^*)}\epsilon_n^2 + O(\epsilon_n^3)
$$

por lo que en este caso la convergencia es a lo más lineal y quizás es necesario considerar la segunda derivada para el método de Newton.

# 3 Método de la secante

$$
x_{n+2} = x_n - \frac{f(x_n)}{f(x_{n+1}) - f(x_n)}(x_{n+1} - x_n)
$$

$$
x_{n+1} = x_n - \frac{f(x_n)}{f'(x_{n+1})}
$$

Si $x_n$ está suficientemente cerca del cero $x = r$ tal que $f(r) = 0$, entonces

$$
f(x_n) = f(r) + f'(r)(x_n - r) + \frac{1}{2}f''(r)(x_n - r)^2 + \cdots
$$

$$
f(x_{n+1}) = f(r) + f'(r)(x_{n+1} - r) + \frac{1}{2}f''(r)(x_{n+1} - r)^2 + \cdots
$$

Reemplazando en el método:

$$
x_{n+2} = x_n - \frac{f'(r)(x_n - r) + \frac{1}{2}f''(r)(x_n - r)^2 + \cdots}{f'(r)(x_{n+1} - r) + \frac{1}{2}f''(r)((x_{n+1} - r)^2) - (x_n - r)^2] + \cdots} (x_{n+1} - x_n)
$$

$$
= x_n - \frac{f(r) + f'(r)(x_n - r) + \frac{1}{2}f''(r)(x_n - r)^2 + \cdots}{f'(r) + \frac{1}{2}f''(r)[x_{n+1} + x_n - 2r] + \cdots}
$$

Definiendo $\epsilon_n = x_n - r$:

$$
\epsilon_{n+2} \approx \epsilon_n - \frac{f'(r) + \frac{1}{2}f''(r)\epsilon_n}{f'(r) + \frac{1}{2}f''(r)(\epsilon_{n+1} + \epsilon_n)}\epsilon_n
$$

$$
\approx \epsilon_n - \epsilon_n\left[1 + \frac{1}{2}\frac{f''(r)}{f'(r)}\epsilon_n\right]^{-1}\left[1 - \frac{1}{2}\frac{f''(r)}{f'(r)}(\epsilon_{n+1} + \epsilon_n)\right]
$$

$$
\approx \epsilon_n - \left[\epsilon_n + \frac{1}{2}\frac{f''(r)}{f'(r)}\epsilon_n^2\right] + \epsilon_n\left[\frac{1}{2}\frac{f''(r)}{f'(r)}\epsilon_n\right]
$$

$$
\approx \frac{1}{2}\frac{f''(r)}{f'(r)}\epsilon_{n+1}\epsilon_n
$$

Supongamos que $\epsilon_{n+1} = k\epsilon_n^p$ y $\epsilon_{n+2} = k\epsilon_{n+1}^p = k^{p+1}\epsilon_n^{p^2}$, luego

$$
k^{p+1}\epsilon_n^{p^2} \approx \frac{1}{2}\frac{f''(r)}{f'(r)}k^{p+1}\epsilon_n^{p+1}
$$

con soluciones

$$
k^p = \frac{1}{2}\frac{f''(r)}{f'(r)}
$$

$$
p^2 = p + 1
$$

o bien $p = \frac{(1 + \sqrt{5})}{2} \approx 1.618$ que es el número aureo: $\epsilon_{n+1} = k\epsilon_n^{1.618}$ el método es de orden $1.618$.
