<style>
@import url(https://www.numfys.net/static/css/nbstyle.css);
</style>
<a href="https://www.numfys.net"><img class="logo" /></a>

# Алгоритм Ньютона-Рафсона

### Modules - Root Finding
<section class="post-meta">
By Magnus A. Gjennestad, Vegard Hagen, Aksel Kvaal, Morten Vassvik, Trygve B. Wiig and Peter Berg
</section>
Last edited: March 11th 2018 
___

__ Вопрос:__

Существует ли более эффективный (более быстрый) метод поиска корня $x_0$ функции $f(x)$, отличный от алгоритма деления пополам?

__Пример 1:__

Опять же, мы хотели бы знать, где функция $g(x) = x$ пересекает функцию $h(x) = e^{−x}$ (см. Модуль по алгоритму деления пополам). И опять же, нам нужно решить
$$x = e^{-x}.$$
Это эквивалентно поиску корня $x_0$ функции $f(x) = e^{−x} − x = 0$:
$$f(x_0)=e^{−x_0} −x_0 =0.$$

In [None]:
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt

# Set common figure parameters
newparams = {'figure.figsize': (16, 6), 'axes.grid': True,
             'lines.linewidth': 1.5, 'lines.linewidth': 2,
             'font.size': 14}
plt.rcParams.update(newparams)

Когда мы строим график $f$, мы видим, что он должен иметь один уникальный корень около $x = 0,6$, как показано на графике.

In [None]:
x = np.linspace(-1, 2, 100)
def f(x): return np.exp(-x)-x

plt.plot(x, f(x))
plt.xlabel(r'$x$')
plt.ylabel(r'$f(x)$')
#plt.grid();

Как мы можем найти этот корень (кроме как с помощью метода деления пополам)?

Идея состоит в том , чтобы начать с предположения $x_1$ и соответствующей точки на графике $(x_1, f(x_1))$. Давайте выберем $x_1 = -0,5$. Затем мы "следуем" за линией, касательной к графику в этой точке, пока не достигнем оси x.

In [None]:
x = np.linspace(-1, 1, 100)
def f(x): return np.exp(-x)-x

x1 = -0.5
dfdx_x1 = -np.exp(-x1)-1  # Производная от f(x) в точке x1
x2 = x1-f(x1)/dfdx_x1     # Ноль касательной

# Plot function
plt.plot(x, f(x))

# Plot lines:
plt.plot([x1,x1], [f(x1),0], 'r')
plt.plot([x1,x2], [0, 0], 'r')
plt.plot([x1,x2], [f(x1),0], 'r')
plt.plot([x2,x2], [f(x2),0], 'g')

plt.xlabel(r'$x$')
plt.ylabel(r'$f(x)$')
plt.text(-0.2, -0.5, r'$\Delta x$')
plt.text(-0.7, 1, r'$f(x_1)$')
plt.text(x1, 2.5, r'$1$')
plt.text(x2, 0.5, r'$2$')
plt.grid();

Пересечение касательной линии и оси $x$дает нам новую оценку корня, $x_2$. Как мы видим, теперь мы действительно ближе к настоящему корню.

Мы можем повторить эту процедуру, т.е. следовать по касательной к $x_2$ линии, пока снова не достигнем оси $x$. Это дает наше следующее предположение $x_3$ и так далее.

Из предыдущего графика мы видим, что разница $\Delta x$ (где $\Delta x = x_\mathrm{next} − x_\mathrm{cur})$ между текущей догадкой, $x_\mathrm{cur}$, и следующей догадкой, $x_\mathrm{next}$, связана с наклоном касательной линии, $f'(x_\mathrm{cur})$, через (обратите внимание на знак минус)
$$f′(x_\mathrm{cur}) = −\frac{f(x_\mathrm{cur})}{\Delta x}.$$

Это дает
$$x_\mathrm{next} =x_\mathrm{cur} +\Delta x = x_\mathrm{cur} − \frac{f(x_\mathrm{cur})}{f'(x_\mathrm{cur})}.$$
Эта процедура называется __Алгоритм Ньютона-Рафсона__ (также называемый [метод Ньютона](https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%9D%D1%8C%D1%8E%D1%82%D0%BE%D0%BD%D0%B0)) и может быть сформулирована следующим образом:
1. Предположение значения $x_\mathrm{cur}$ корня функции $f(x)$. Иногда построение графика помогает угадать значение (см. Выше).
2. Если существует более одного корня, попробовать выбрать значение, близкое к интересующему корню.
3. Установить $x_\mathrm{next} = x_\mathrm{cur} − \frac{f(x_\mathrm{cur})}{f'(x_\mathrm{cur})}$ в качестве следующей оценки корня.
4. Задать $x_\mathrm{cur} = x_\mathrm{next}$.
5. Повторять шаги 3 и 4 до тех пор, пока не будет достигнута требуемая точность.

Точность может зависить от двух явлений:
1. Когда алгоритм сходится, $\Delta x$ в конечном счете уменьшается с каждой итерацией. Вопрос в следующем: при каком значении $\Delta x$ мы должны остановить нашу итерационную процедуру?
2. Насколько близко $f(x_\mathrm{cur})$ к нулю?

Примечание: В каждом случае мы не можем быть уверены, насколько мы действительно близки к фактическому корню $x_0$. Это во многом связано с поведением функции $f$ вблизи $x_0$.
- В случае 1 $\Delta x$ в принципе может снова увеличиться во время следующей итерации.
- В случае 2 величина $f(x_\mathrm{cur})$ в принципе может снова увеличиться на следующей итерации.

Если корень лежит в области, где $f(x)$ почти линейна, алгоритм будет сходиться быстро, намного быстрее, чем алгоритм деления пополам.

Однако, как правило, нет никакой гарантии, что алгоритм сходится. При применении алгоритма Ньютона-Рафсона часто возникают два явления. Давайте обсудим их.

__Проблема № 1:__
Производная $f'(x_\mathrm{cur})$ иногда может становиться очень маленькой, делая $\Delta x = − \frac{f(x_\mathrm{cur})}{f'(x_\mathrm{cur})}$ очень большим. Это имеет место вблизи локальных минимумов и максимумов или в точке (горизонтального)
перегиба.

Следующая догадка $x_\mathrm{next}$ находится далеко от фактического корня. Компьютерный код может остановиться из-за слишком больших по своей природе чисел. Либо $x_\mathrm{next}$ может попасть в область другого корня, что явно помешает нахождению интересующего значения.
В этом случае первоначальное предположение должно быть изменено. Или мы можем ограничить размер шага $\Delta x$.

__Проблема № 2:__
Алгоритм не сходится и не расходится. Скорее, он остается в непосредственной близости от корня, колеблясь в бесконечном цикле вокруг фактического корня, не приближаясь к нему.

Опять же, первоначальное предположение должно быть изменено. Или нам нужно еще уменьшить размер шага (релаксацию): мы можем заменить $\Delta x$ на $\gamma \Delta x$, где $0 < \gamma < 1$.
___

Иногда может быть полезно сначала использовать более медленный, но надежный метод деления пополам, чтобы приблизиться достаточно близко к фактическому корню, чтобы обеспечить хорошее начальное предположение для более быстрого метода Ньютона-Рафсона. Последний же обеспечивает лучшую конвергенцию.

Еще один полезный трюк - аппроксимировать производную $f′(x_\mathrm{cur})$ как 
$$f′(x_\mathrm{cur}) \approx \frac{f(x_\mathrm{cur} + \delta x)−f(x_\mathrm{cur})}{\delta x}$$
для некоторого небольшого значения $\delta x$. Это удобно, когда производная не может быть легко вычислена в аналитической форме и требуется численная оценка.

__Пример 2:__

Мы хотим решить уравнение
$$ 2 - x^4 = \tanh(x)$$
для $x > 0$. Следовательно, нам нужно решить
$$f(x) = 2 - x^4 - \tanh(x).$$
Наш алгоритм 
$$
\begin{align}
x_\mathrm{next} = x_\mathrm{cur} - \frac{f(x_\mathrm{cur})}{f'(x_\mathrm{cur})} = \frac{2-x_\mathrm{cur}^4-\tanh(x_\mathrm{cur})}{-4 x_\mathrm{cur}^3-\frac{1}{\cosh(x_\mathrm{cur})^2}}.
\end{align}
$$
Построение графика $f(x)$ помогает нам сделать первоначальное предположение.

In [None]:
x = np.linspace(0, 1.5, 100)
def f(x): return 2 - x**4 - np.tanh(x)

plt.plot(x, f(x))
plt.xlabel(r'$x$')
plt.ylabel(r'$f(x)$')
#plt.grid();

Мы выбираем $x_\mathrm{cur} = x_1 = 1.0$.

Теперь мы находим следующие последовательные оценки для корня на протяжении первых 5 итераций (до 12 значащих цифр):

In [None]:
N = 5

x_cur = 1.0
print(x_cur)

for i in range(N):
    x_cur = x_cur-(2-x_cur**4-np.tanh(x_cur))/(-4*x_cur**3-1/(np.cosh(x_cur))**2)
    print(x_cur)
    
print(r'Значение на последней итерации, f(x_cur) = %s' % f(x_cur))

Мы видим, что в этом случае достаточно 5 итераций!
Алгоритму деления пополам потребуется гораздо больше итераций для той же точности.

Значение $f(x)$ для нашей окончательной оценки корня равно
$$f(1.05053505396) =  -2.22044604925 \times 10^{-16}.$$
Очень хорошая оценка!

__Note:__
Метод Ньютона может быть распространен на более высокие измерения, т.е. иметь $k$ переменных и $k$ функций, корни которых нам нужно найти одновременно. Это особенно актуально для численных решений дифференциальных уравнений. Однако эти тонкости метода Ньютона не будут рассмотриваться в этом модуле.