# 最急降下法を多変数関数に適用する．

このページは以下のリンクより， google colaboratoryから動作させることができる．
- [Open with Colab](https://colab.research.google.com/github/OedaLabClass/Intelligent_system/blob/master/gdm/IS_5_gdm_0609.ipynb)

## 最急降下法を多変数関数に適用する
目的関数が微分できれば，多変数関数でも極小値を求めることができる

目的関数

$$
 f\left(x,y\right)=\sin{(x)}+2x\cos{(y)}+0.2x^2+0.2y^2
$$

の最小値を求めたい．

表示すると，次のような複雑な局面を持つ2変数関数です．

![title](./img/sincos.png)

多変数関数でも，偏微分できれば最急降下法が使えます．


目的関数

$$
 f\left(x,y\right)=\sin{(x)}+2x\cos{(y)}+0.2x^2+0.2y^2
$$

偏微分
$$
\begin{align}
\frac{\partial f(x,y)}{\partial x} &=\cos{(x)}+2\cos{(y)}+0.4x\\
\frac{\partial f(x,y)}{\partial y} &=-2x\sin{(y)}+0.4y
\end{align}
$$

In [None]:
# 複雑な3次元データの最小値を求める．

import numpy as np

#
# 目的関数を設定（この関数の最小値を求めたい．）
#
def mathfunc(a, b):
    y = np.sin(a)+2*a*np.cos(b)+0.2*a**2+0.2*b**2
    return y

# 最急降下法で目的関数の最小値をとるパラメータを求める．

# 初期値
a = 5.8
b = 6.2
c = mathfunc(a, b)

# 学習係数
eta = 0.01

# 目的関数の偏微分:x
def ｄerivative_x(a, b):
    y = np.cos(a)+2.0*np.cos(b)+0.4*a
    return y

# 目的関数の偏微分:y
def ｄerivative_y(a,b):
    y = -2*np.sin(b)+0.4*b
    return y

para_a = []
para_b =[]
para_c =[]

# 終了条件
epsilon = 0.0001
old_para_a = a
old_para_b = b

ct = 0
for i in range(1000):
    para_a.append(a)
    para_b.append(b)
    para_c.append(c)

    # 更新式
    a = a - eta*derivative_x(a, b)
    b = b - eta*derivative_y(a, b)
    c = mathfunc(a, b)
    
    if abs(old_para_a-a)<epsilon and abs(old_para_b-b)<epsilon:
        break
    old_para_a = a
    old_para_b = b
    
    ct+=1

# 更新回数
print('更新回数=', ct)

# 求めたパラメータ
print('a=', a)
print('b=', b)

#
# 最急降下法の様子をグラフを表示する
# （ここでは3次元グラフ）
#

from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt
import numpy as np

x = np.arange(-10.0, 10.0, 1)
y = np.arange(-10.0, 10.0, 1)
X, Y = np.meshgrid(x, y)
Z = mathfunc(X, Y)
fig = plt.figure()
ax = Axes3D(fig)
ax.plot_wireframe(X, Y, Z)
ax.plot(para_a, para_b, para_c,marker="o",linestyle='None', color='red')
plt.show()

更新の様子を別の角度から見たものを下図に示す．
<img src="img/gdm7.png" width="400">
<div style="text-align: center;">
図7.  多変数関数の最急降下法の様子
</div>

## 最急降下法の欠点
- 最急降下法は最小値ではなく，極小値を求めることしかできない．  
- 結果が初期値に依存する
- 学習係数のパラメータの設定を行う必要がある．