<div style="font-size:18pt; padding-top:20px; text-align:center; line-height: 1.5;">СЕМИНАР. <b>Безусловная оптимизация.</b> Градиентный спуск</div><hr>
<div style="text-align:right;">Папулин С.Ю. <span style="font-style: italic;font-weight: bold;">(papulin.study@yandex.ru)</span></div>

<a name="0"></a>
<div><span style="font-size:14pt; font-weight:bold">Содержание</span>
    <ol>
        <li><a href="#1">Производная</a></li>
        <li><a href="#2">Градиентный спуск</a></li>
    </ol>
</div>

In [None]:
import numpy as np
import pandas as pnd
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from matplotlib import cm
%matplotlib inline

<a name="1"></a>
<div style="display:table; width:100%; padding-top:10px; padding-bottom:10px; border-bottom:1px solid lightgrey">
    <div style="display:table-row">
        <div style="display:table-cell; width:80%; font-size:16pt; font-weight:bold">1. Производная</div>
    	<div style="display:table-cell; width:20%; text-align:center; background-color:whitesmoke; border:1px solid lightgrey"><a href="#0">К содержанию</a></div>
    </div>
</div>

In [None]:
from scipy.misc import derivative

Производная в точке

In [None]:
x0 = -4
f = lambda x: x**2


# Производная в точке x0
df_x0 = derivative(f, x0, n=1)
print("f'(x0) =", df_x0)

# Вторая производная в точке x0
ddf_x0 = derivative(f, x0, n=2)
print("f''(x0) =", ddf_x0)

Производные на итервале значений

In [None]:
x_start = -4
x_end = 5
step = 1

# Набор значений от x_start до x_end с шагом step
x = np.arange(x_start, x_end, step)
print("Значения:", x)

# Производные
df = derivative(f, x, n=1)
print("Производные:", df)

# Вторые производные
ddf = derivative(f, x, n=2)
print("Вторые производные:", ddf)

Отрицательная функция

In [None]:
f_neg = lambda x: - x**2

In [None]:
# Производные
df_neg = derivative(f_neg, x, n=1)
print("Производные:", df_neg)

# Вторые производные
ddf_neg = derivative(f_neg, x, n=2)
print("Вторые производные:", ddf_neg)

Графики

In [None]:
plt.figure("4", figsize=[15,6])

ax1 = plt.subplot(1,2,1)

plt.plot(x, f(x), "-o", label="$f(x)=x^2$")
plt.plot(x, df, "-o", label="$f'(x)$")
plt.plot(x, ddf, "-o", label="$f''(x)$")

plt.title("$f(x)=x^2$")

plt.xlabel("x")
plt.ylabel("y")

plt.grid(True)

plt.legend()

ax2 = plt.subplot(1,2,2)

plt.plot(x, f_neg(x), "-o",  label="$f_{neg}(x)=-x^2$")
plt.plot(x, df_neg, "-o", label="$f'_{neg}(x)$")
plt.plot(x, ddf_neg, "-o", label="$f''_{neg}(x)$")

plt.title("$f(x)=-x^2$")

plt.xlabel("x")
plt.ylabel("y")

plt.grid(True)

plt.legend()

plt.show()

Функция:

$$f(x) = x^2 + 10 \cdot \sin(x)$$

In [None]:
# Исходные данные
x = np.arange(-10, 10, 0.1)
f = lambda x: x**2 + 10 * np.sin(x)

# Производные
df = derivative(f, x, n=1)
ddf = derivative(f, x, n=2)

In [None]:
# Поиск экстремумов (brute force)
indx = np.where(np.logical_and(df >= -0.35, df <= 0.25))
indx

Графики

In [None]:
plt.figure("4", figsize=[8,6])

ax1 = plt.subplot(1,1,1)

plt.plot(x, f(x), "-", label="$f(x)$")
plt.plot(x, df, "-", label="$f'(x)$")
plt.plot(x, ddf, "-", label="$f''(x)$")

plt.plot(x[indx], f(x[indx]), "o", color="darkblue")

for xx in x[indx]:
    plt.axvline(x=xx, color="grey", linestyle="dashed", linewidth=1)

plt.title("$f(x)=x^2 + 10 \cdot \sin(x)$")

plt.xlabel("x")
plt.ylabel("y")

plt.grid(True)

plt.legend()

plt.show()

<a name="2"></a>
<div style="display:table; width:100%; padding-top:10px; padding-bottom:10px; border-bottom:1px solid lightgrey">
    <div style="display:table-row">
        <div style="display:table-cell; width:80%; font-size:16pt; font-weight:bold">2. Градиентный спуск</div>
    	<div style="display:table-cell; width:20%; text-align:center; background-color:whitesmoke; border:1px solid lightgrey"><a href="#0">К содержанию</a></div>
    </div>
</div>

$$ \mathbf{x}^{(i+1)} = \mathbf{x}^{(i)}-\alpha \cdot \bigtriangledown f \left( \mathbf{x}\right)$$

### Функция с одной переменной

$$f(x) = x^2 + 10 \sin(x)$$
$$f^{'}(x) = 2x + 10 \cos(x)$$

In [None]:
# Функция
def f(x):
    return x**2 + 10 * np.sin(x)

# Производная
def df(x):
    return 2*x + 10 * np.cos(x)

# Значения аргумента
x = np.arange(-10, 10, 0.1)

In [None]:
plt.figure("1")

plt.grid(True)
plt.plot(x, f(x))
plt.plot(x, df(x))
plt.title("$f(x) = x^2+10\sin(x)$")
plt.xlabel("x")
plt.ylabel("f(x)")
plt.legend(("$f(x)$", "$f^{\prime}(x)$"), loc="lower right")
plt.grid(True)

plt.show()

<p>Исследование влияния значения коэффициента альфа</p>

<p><b><i>Начальная точка 1</i></b></p>

$$x_0 = -8$$
$$\alpha \in \{ 0.02, 0.05, 0.1, 0.2, 0.4, 0.6\}$$
$$err_{min} = 10^{-3}$$
$$iteration_{max} = 20$$

<img src="img/gd-one-var-alpha-left.png">

<p><b><i>Начальная точка 2</i></b></p>

$$x_0 = 8$$
$$\alpha \in \{ 0.02, 0.05, 0.1, 0.2, 0.4, 0.6\}$$
$$err_{min} = 10^{-3}$$
$$iteration_{max} = 20$$

<img src="img/gd-one-var-alpha-right.png">

### Функция с двумя переменными

Исходная функция:

$$f(x_1, x_2) = 2x_1^2 + x_2^2 + x_1x_2$$

Частная производная по $x_1$:

$$\frac {\partial f(x_1, x_2)}{\partial x_1}  = 4x_1 + x_2$$

Частная производная по $x_2$:
$$\frac {\partial f(x_1, x_2)}{\partial x_2}  = 2x_2 + x_1$$

In [None]:
f = lambda x1, x2: 2*x1**2 + x2**2 +x1*x2  # функция
dfx1 = lambda x1, x2: 4*x1 + x2  # частная производная по x1
dfx2 = lambda x1, x2: 2*x2 + x1  # частная производная по x2

coord_x1 = np.arange(-4, 5, 0.1)  # значения x c шагом 1
coord_x2 = np.arange(-4, 5, 0.1)  # значения x c шагом 1

x1, x2 = np.meshgrid(coord_x1, coord_x2)

In [None]:
fig = plt.figure(1, figsize=(10, 10))

ax0 = fig.add_subplot(2, 2, 1, projection="3d")
ax0.set_title("$f(x_1,x_2)=2x^2_{1}+x^2_{2}+x_{1}x_{2}$")
ax0.plot_surface(x1, x2, f(x1,x2), rstride=1, cstride=1, cmap=cm.coolwarm,
                       linewidth=0, antialiased=True)
ax0.set_xlabel("$x_1$")
ax0.set_ylabel("$x_2$")
ax0.set_zlabel("$f(x_1,x_2)$")

ax1 = plt.subplot(2,2,2)
ax1.set_title("$f(x_1,x_2)=2x^2_{1}+x^2_{2}+x_{1}x_{2}$")
cf = ax1.contourf(x1, x2, f(x1,x2), 20, alpha=0.5, cmap=cm.coolwarm)
plt.colorbar(cf)
ax1.set_xlabel("$x_1$")
ax1.set_ylabel("$x_2$")

ax2 = plt.subplot(2,2,3)
ax2.set_title("Gradient")
ax2.set_xlabel("$x_1$")
ax2.set_ylabel("$x_2$")
ax2.quiver(x1[0::5, 0::5], x2[0::5, 0::5], 
           dfx1(x1[0::5, 0::5],x2[0::5, 0::5]), dfx2(x1[0::5, 0::5],x2[0::5, 0::5]), scale=100)

ax3 = plt.subplot(2,2,4)
ax3.set_title("Gradient")
ax3.set_xlabel("$x_1$")
ax3.set_ylabel("$x_2$")
cf = ax3.contourf(x1, x2, f(x1,x2), 20, cmap=cm.coolwarm)
plt.colorbar(cf)
ax3.quiver(x1[0::5, 0::5], x2[0::5, 0::5], 
           dfx1(x1[0::5, 0::5],x2[0::5, 0::5]), dfx2(x1[0::5, 0::5],x2[0::5, 0::5]), scale=100)

plt.tight_layout()

plt.show()

<p>Исследование влияния значения коэффициента альфа</p>

<p><b><i>Начальная точка 1</i></b></p>

$$x_{1,0} = 3$$
$$x_{2,0} = 0$$
$$\alpha \in \{ 0.02, 0.05, 0.1, 0.2, 0.3, 0.45\}$$
$$err_{min} = 10^{-3}$$
$$iteration_{max} = 20$$

<img src="img/gd-two-var-alpha-right.png">

<p><b><i>Начальная точка 2</i></b></p>

$$x_{1,0} = -3$$
$$x_{2,0} = -2$$
$$\alpha \in \{ 0.02, 0.05, 0.1, 0.2, 0.3, 0.45\}$$
$$err_{min} = 10^{-3}$$
$$iteration_{max} = 20$$

<img src="img/gd-two-var-alpha-left.png">