# 第5回レポート課題


提出物：

- report05.ipynb（このノートブック）
  - ノートブックに直接コードを書いて実行できる
  - コードを実行した結果の状態で保存して提出すること
- レポート
  - 形式：A4縦，PDFファイル1つ（複数ファイルやwordファイルは受け付けない）
  - 1ページ目冒頭に，氏名・学生番号・所属学科/分野/コース・授業名・課題名・出題授業日を明記すること
  - 各課題（「課題5-01」「課題5-02」など）を区別できるようにすること
  - 含める内容
    - コードの抜粋とその説明
    - 実行結果（テキスト出力，プロット等）とその説明
    - 各課題で指定された内容とその説明
  - レポート作成上の注意事項:
    - **レポートにはできるだけ丁寧な説明を含めること**



## 課題5-01：定数ステップ幅の勾配法

以下の関数を最小化する勾配法のプログラムを作成せよ．

$$
\begin{align}
 f(x_1,x_2) = x_1^2 + x_2^2 + x_1 \sin(x_2) + x_2 \sin(x_1)
\end{align}
$$

ただし，ステップ幅$\alpha$は定数で固定とする（バックトラックはしない単純な勾配法）．

作成の手順を以下に示す．

1. 目的関数$f(\boldsymbol{x})$の計算を行う関数 `calc_f(x)`の中身を作成する．
2. 勾配$\boldsymbol{g}(\boldsymbol{x})$と勾配のノルム$\| \boldsymbol{g}(\boldsymbol{x}) \|$の計算を行う関数`calc_grad(x, grad)`の中身を作成する．
3. 解$\boldsymbol{x}$を更新を行う関数`min_func(x)`の中身を作成する．

また，$\boldsymbol{x}$の更新軌跡を表示して，振る舞いを確認する．

- レポートに含める内容:
  - 実行例
    - 初期値が$\boldsymbol{x}=(3, 5)$の場合
    - 初期値が上記以外の場合
  - それぞれの実行例について，$\boldsymbol{x}$の更新軌跡，反復ごとの関数値$f(x)$と勾配のノルム$\| \boldsymbol{g}(\boldsymbol{x}) \|$のプロット
    - 関数値と勾配ノルムは，それぞれについて，縦軸が線形軸のものと対数軸のもの

In [None]:
import numpy as np


def calc_f(x):
    """目的関数の計算

    Args:
        x (ndarray): 現在の変数xの値

    Returns:
        fx (float): 関数値f(x)
    """

    #
    # 1. ここにf(x)の計算を作成し返す
    # (テンプレートは暫定的に0を返してるので書き換える)
    #

    x_1, x_2 = x
    fx = 0  # これはダミーです

    return fx


def calc_grad(x):
    """勾配とそのノルムの計算

    Args:
        x (ndarray): 現在の変数xの値

    Returns:
        norm_grad (float): 勾配ベクトルのノルム
        grad (ndarray): 勾配ベクトル
    """

    #
    # 2. ここで, ２次元ベクトル"grad"に勾配を設定
    #
    x_1, x_2 = x
    grad = np.zeros_like(x)  # これはダミーです

    #
    # 2. 勾配のノルムの値を返り値で返す
    #
    # ヒント: 平方根を求める関数は np.sqrt(x) が利用可能
    # 参考: numpyにはノルムを求める関数も存在するのでわかる人はそちらを使っても良い

    norm_grad = 1.0  # これはダミーです

    return norm_grad, grad


def min_func(x):
    """最小化を行う関数

    Args:
        x (ndarray): xの初期値

    Returns:
        (ndarray): xの最適解
        (bool): 収束したかどうかのフラグ
        (ndarray): xの軌跡
        (ndarray): f(x)の軌跡
        (ndarray): ||g(x)||の軌跡
    """

    maxIter = 50  # 最大繰り返し
    tol = 0.01 # 停止条件
    alpha = 0.1  # 更新幅

    is_converged = False
    trajectory = []  # 最適化の過程を保存する変数
    trajectory_fx = []
    trajectory_norm_g = []

    for iter in range(maxIter):
        
        # 現在の解を保存（プロット用）
        trajectory.append(x)

        #
        # 1. 現在の目的関数の値を計算する
        #

        fx = calc_f(x)
        trajectory_fx.append(fx)

        #
        # 2. 現在の勾配を計算する
        #

        norm_g, g = calc_grad(x)
        trajectory_norm_g.append(norm_g)

        print("Iteration {}: f(x)={}, x={}, g={}, ||g||={}".format(
            iter, fx, x, g, norm_g
        ))

        #
        # 勾配のノルムが十分小さくなれば終了
        # 
        if norm_g < tol:
            is_converged = True
            break

        #
        # 3. xを更新する
        #
       
        x = np.zeros_like(x)  # これはダミーです
        

    return x, is_converged, np.array(trajectory), \
        np.array(trajectory_fx), np.array(trajectory_norm_g)
  


# 初期解
x = np.array([3.0, 5.0])
print("initial solution:", x)

x, is_converged, trajectory, traj_fx, traj_norm_g = min_func(x)

# 最適解
print("optimal solution:", x)


In [None]:
#
# 作図用．編集の必要なし．注意：calc_f()を作成しないとエラーが出ます
#

import matplotlib.pyplot as plt
%matplotlib inline
from matplotlib import rcParams
rcParams["savefig.bbox"] = 'tight'

def visualize_f(trajectory):
    
    def f(x):
        return calc_f(x)

    fig, ax = plt.subplots(figsize=(6, 5))
    plt.scatter(trajectory[:, 0], trajectory[:, 1], lw=1, s=5)
    plt.plot(trajectory[:, 0], trajectory[:, 1], lw=1)

    # set plot range
    x_min = -10
    x_max = +10
    y_min = -10
    y_max = +10
    plt.xlim(x_min, x_max)
    plt.ylim(y_min, y_max)
       
    # make a grid
    XX, YY = np.mgrid[x_min:x_max:200j, y_min:y_max:200j] 
    # evaluate f() at each point in the grid
    Z = np.array([f(x) for x in np.c_[XX.ravel(), YY.ravel()]])
    Z = Z.reshape(XX.shape) # reshape form 1D to 2D
    
    cs = plt.contour(XX, YY, Z, 
                    cmap='coolwarm',
                    levels=list(np.arange(0, 250, 10)),
                    )
    ax.clabel(cs, colors='k', fmt='%d',
              levels=list(np.arange(0, 250, 20)))
    plt.colorbar()

    plt.xlabel('$x_1$')
    plt.ylabel('$x_2$')


# 作図と保存

visualize_f(trajectory)

plt.savefig('fig_report05-01.png')
plt.savefig('fig_report05-01.jpg')
plt.savefig('fig_report05-01.pdf')
plt.savefig('fig_report05-01.svg')

In [None]:
#
# 作図用．編集の必要なし．
#

fig, ax = plt.subplots(figsize=(6, 5))

plt.plot(traj_fx, '.-')
plt.xlabel('iterations')
plt.ylabel('$f(x)$')
# plt.yscale('log')  # 縦軸を対数スケールにする

plt.savefig('fig_report05-01-traj_fx.png')
plt.savefig('fig_report05-01-traj_fx.jpg')
plt.savefig('fig_report05-01-traj_fx.pdf')
plt.savefig('fig_report05-01-traj_fx.svg')

In [None]:
#
# 作図用．編集の必要なし．
#

fig, ax = plt.subplots(figsize=(6, 5))

plt.plot(traj_norm_g, '.-')
plt.xlabel('iterations')
plt.ylabel('$||g(x)||$')
# plt.yscale('log')  # 縦軸を対数スケールにする

plt.savefig('fig_report05-01-traj_norm_g.png')
plt.savefig('fig_report05-01-traj_norm_g.jpg')
plt.savefig('fig_report05-01-traj_norm_g.pdf')
plt.savefig('fig_report05-01-traj_norm_g.svg')

## 課題5-02：バックトラック付き勾配法

課題5-01で行った式(1)の勾配法での最適化に，バックトラックサーチを追加したものを以下に作成せよ．
アルミホの条件で減少量の判定を行うこと．

作成の手順を以下に示す．
ただし，最初に`calc_f`と`calc_grad`を作成しておく．これらは課題5-01と同じでよい．
幅$\alpha$の初期値$\alpha_0$や，減衰率$\tau$，アルミホの条件の$\xi$などはすでに定義されている値をそのまま使えばよい．



1. 「バックトラックの繰り返し」とコメントされている部分がバックトラックで$\alpha$を下げながら$f$の値の減少を判定するループに対応している．
for文の前で，$\boldsymbol{x}^{(t)}$を上書きして失わないように`x`を`x_prev`にコピーしている．
`x_prev`から現在の$\alpha$で値を更新した`x`を作成する．

2. アルミホの条件の右辺を計算する

3. 現在の一時的な$\boldsymbol{x}$での$f(\boldsymbol{x})$を計算し，アルミホの不等式が成立するか調べる

4. ステップ幅$\alpha$を倍率$\tau$で減衰させる



$\boldsymbol{x}$の更新軌跡を表示して，振る舞いを確認する．


- レポートに含める内容:
  - 実行例
    - 初期値が$\boldsymbol{x}=(3, 5)$の場合
    - 初期値が上記以外の場合
  - それぞれの実行例について，$\boldsymbol{x}$の更新軌跡，反復ごとの関数値$f(x)$と勾配のノルム$\| \boldsymbol{g}(\boldsymbol{x}) \|$のプロット
    - 関数値と勾配ノルムは，それぞれについて，縦軸が線形軸のものと対数軸のもの


In [None]:
import numpy as np


def calc_f(x):
    """目的関数の計算

    Args:
        x (ndarray): 現在の変数xの値

    Returns:
        fx (float): 関数値f(x)
    """

    #
    # 1. ここにf(x)の計算を作成し返す
    # (テンプレートは暫定的に0を返してるので書き換える)
    #

    fx = 0  # これはダミーです

    return fx


def calc_grad(x):
    """勾配とそのノルムの計算

    Args:
        x (ndarray): 現在の変数xの値

    Returns:
        norm_grad (float): 勾配ベクトルのノルム
        grad (ndarray): 勾配ベクトル
    """

    #
    # 2. ここで, ２次元ベクトル"grad"に勾配を設定
    #
    grad = np.zeros_like(x)  # これはダミーです

    #
    # 2. 勾配のノルムの値を返り値で返す
    #
    # ヒント: 平方根を求める関数は np.sqrt(x) が利用可能
    # 参考: numpyにはノルムを求める関数も存在するのでわかる人はそちらを使っても良い

    norm_grad = 0  # これはダミーです

    return norm_grad, grad


def min_func(x):
    """最小化を行う関数

    Args:
        x (ndarray): xの初期値

    Returns:
        (ndarray): xの最適解
        (bool): 収束したかどうかのフラグ
        (ndarray): xの軌跡
        (ndarray): f(x)の軌跡
        (ndarray): ||g(x)||の軌跡
    """

    maxIter = 25  # 最大繰り返し
    tol = 0.01 # 停止条件
    alpha = 0.1  # 更新幅

    is_converged = False
    trajectory = []  # 最適化の過程を保存する変数
    trajectory_fx = []
    trajectory_norm_g = []

    for iter in range(maxIter):
        
        # 現在の解を保存（プロット用）
        trajectory.append(x)

        #
        # 1. 現在の目的関数の値を計算する
        #

        fx = calc_f(x)
        trajectory_fx.append(fx)

        #
        # 2. 現在の勾配を計算する
        #

        norm_g, g = calc_grad(x)
        trajectory_norm_g.append(norm_g)

        print("Iteration {}: f(x)={}, x={}, g={}, ||g||={}".format(
            iter, fx, x, g, norm_g
        ))

        #
        # 勾配のノルムが十分小さくなれば終了
        # 
        if norm_g < tol:
            is_converged = True
            break

        #
        # 3. xを更新する（バックトラック付き）
        #
       

        maxIterBT = 10  # バックトラック最大回数
        xi = 0.1  # アルミホ条件右辺の定数
        tau = 0.9  # バックトラック減衰率
        alpha0 = 1  # バックトラック初期更新幅


        x_prev = x  # 古い解を保存
        alpha = alpha0  # 更新幅初期化
        is_accepted = False  # バックトラック中にアルミホを満たしたか


        #
        # バックトラックの繰り返し
        #
        for btIter in range(maxIterBT):

            # 1. 現在のalphaでx_prevから更新したxを作る
            x = 0  # これはダミーです

            # 2. アルミホの条件の右辺を計算する
            armijoRHS = 0  # これはダミーです


            # 3. f_tempに現在の一時的なxでのf(x)をf_tempに計算し，
            #    if文でアルミホ条件を判定 
            #    (以下のif文の条件部を作成し，コメントを外す)

            if アルミホの不等式が成立するなら:
                is_accepted = True  # 不等式が成立したことを記録
                break

            # 4. ステップ幅alphaを減衰させる
            alpha = 0  # これはダミーです


        if not is_accepted:  # 最小更新幅でもアルミホが満たされなかったら古い解に戻して終了
            x = x_prev
            break


    return x, is_converged, np.array(trajectory), \
        np.array(trajectory_fx), np.array(trajectory_norm_g)            


# 初期解
x = np.array([3.0, 5.0])
print("initial solution:", x)

x, is_converged, trajectory, traj_fx, traj_norm_g = min_func(x)

# 最適解
print("optimal solution:", x)

In [None]:
#
# 作図用．編集の必要なし
#

import matplotlib.pyplot as plt
%matplotlib inline
from matplotlib import rcParams
rcParams["savefig.bbox"] = 'tight'

def visualize_f(trajectory):
    
    def f(x):
        return calc_f(x)

    fig, ax = plt.subplots(figsize=(6, 5))
    plt.scatter(trajectory[:, 0], trajectory[:, 1], lw=1, s=5)
    plt.plot(trajectory[:, 0], trajectory[:, 1], lw=1)

    # set plot range
    x_min = -10
    x_max = +10
    y_min = -10
    y_max = +10
    plt.xlim(x_min, x_max)
    plt.ylim(y_min, y_max)
    
    # make a grid
    XX, YY = np.mgrid[x_min:x_max:200j, y_min:y_max:200j] 
    # evaluate f() at each point in the grid
    Z = np.array([f(x) for x in np.c_[XX.ravel(), YY.ravel()]])
    Z = Z.reshape(XX.shape) # reshape form 1D to 2D
    
    cs = plt.contour(XX, YY, Z, 
                    cmap='coolwarm',
                    levels=list(np.arange(0, 250, 10)),
                    )
    ax.clabel(cs, colors='k', fmt='%d',
              levels=list(np.arange(0, 250, 20)))
    plt.colorbar()

    plt.xlabel('$x_1$')
    plt.ylabel('$x_2$')




# 作図と保存

visualize_f(trajectory)

plt.savefig('fig_report05-02.png')
plt.savefig('fig_report05-02.jpg')
plt.savefig('fig_report05-02.pdf')
plt.savefig('fig_report05-02.svg')

In [None]:
#
# 作図用．編集の必要なし．
#

fig, ax = plt.subplots(figsize=(6, 5))

plt.plot(traj_fx, '.-')
plt.xlabel('iterations')
plt.ylabel('$f(x)$')
# plt.yscale('log')  # 縦軸を対数スケールにする

plt.savefig('fig_report05-02-traj_fx.png')
plt.savefig('fig_report05-02-traj_fx.jpg')
plt.savefig('fig_report05-02-traj_fx.pdf')
plt.savefig('fig_report05-02-traj_fx.svg')

In [None]:
#
# 作図用．編集の必要なし．
#

fig, ax = plt.subplots(figsize=(6, 5))

plt.plot(traj_norm_g, '.-')
plt.xlabel('iterations')
plt.ylabel('$||g(x)||$')
# plt.yscale('log')  # 縦軸を対数スケールにする

plt.savefig('fig_report05-02-traj_norm_g.png')
plt.savefig('fig_report05-02-traj_norm_g.jpg')
plt.savefig('fig_report05-02-traj_norm_g.pdf')
plt.savefig('fig_report05-02-traj_norm_g.svg')

## 課題5-03：二次関数の最小化問題


以下のコードを元にして次の$2$次関数$f(\boldsymbol{x})$の最小化を勾配法で解くプログラムを作成せよ．


$$
\begin{align*}
 f(\boldsymbol{x}) = 
 \frac{1}{2} \boldsymbol{x}^\top \boldsymbol{A} \boldsymbol{x} + \boldsymbol{b}^\top \boldsymbol{x}
\end{align*}
$$

ここでは，$\boldsymbol{x}$は任意の次元とする．

注）今回は簡単のため2変数の関数を使うが，実際には変数の数が少ない場合は連立方程式に帰着させる方が効率は良い．


講義資料で確認した通り，この関数の勾配は以下の通りである．

$$
\begin{align*}
 \boldsymbol{g}(\boldsymbol{x}) = \boldsymbol{A} \boldsymbol{x} + \boldsymbol{b}
\end{align*}
$$

今回はステップ幅$\alpha$には最適な値を用いることとする．

手計算課題でやったように，ある$\boldsymbol{x}$で更新を行った後の値$\boldsymbol{x} - \alpha \boldsymbol{g}$での目的関数値$f(\boldsymbol{x} - \alpha \boldsymbol{g})$を考える:

$$
\begin{align*}
 f(\boldsymbol{x} - \alpha \boldsymbol{g}) &= 
 \frac{1}{2} \left(
 \boldsymbol{x} - \alpha \boldsymbol{g}
 \right)^\top
 \boldsymbol{A}
 \left(
 \boldsymbol{x} - \alpha \boldsymbol{g}
 \right)
 +
 \boldsymbol{b}^\top
 \left(
 \boldsymbol{x} - \alpha \boldsymbol{g}
 \right) 	 
\\
&=
 \frac{1}{2} \boldsymbol{g}^\top \boldsymbol{A} \boldsymbol{g} \alpha^2
 - \frac{1}{2} (\boldsymbol{x}^\top \boldsymbol{A} \boldsymbol{g} + \boldsymbol{g}^\top \boldsymbol{A} \boldsymbol{x} + 2 \boldsymbol{b}^\top \boldsymbol{g}) \alpha
 + \frac{1}{2} \boldsymbol{x}^\top \boldsymbol{A} \boldsymbol{x} + \boldsymbol{b}^\top \boldsymbol{x}
\end{align*}
$$


最適な$\alpha$を見つけるために$\alpha$について微分して$0$とおくと，

$$
\begin{align*}
	\frac{\partial f(\boldsymbol{x} - \alpha \boldsymbol{g})}{\partial\alpha} &= 
	\boldsymbol{g}^\top \boldsymbol{A} \boldsymbol{g} \alpha
	- \frac{1}{2}(\boldsymbol{x}^\top \boldsymbol{A} \boldsymbol{g} + \boldsymbol{g}^\top \boldsymbol{A} \boldsymbol{x} + 2 \boldsymbol{b}^\top \boldsymbol{g}) 
	= 0
	\\
	\alpha &= \frac{1}{2}
	\frac{\boldsymbol{x}^\top \boldsymbol{A} \boldsymbol{g} + \boldsymbol{g}^\top \boldsymbol{A} \boldsymbol{x} + 2 \boldsymbol{b}^\top \boldsymbol{g}}{\boldsymbol{g}^\top \boldsymbol{A} \boldsymbol{g}}
\end{align*}
$$

ここまででも良いがさらに以下のように整理できる（以下の補足参照）：

$$
\begin{align*}
	\alpha &=
	\frac{1}{2}
	\frac{2 \boldsymbol{g}^\top \boldsymbol{A} \boldsymbol{x} + 2 \boldsymbol{b}^\top \boldsymbol{g}}{\boldsymbol{g}^\top \boldsymbol{A} \boldsymbol{g}}
	% \\
	% &
	=
	\frac{\boldsymbol{g}^\top (\boldsymbol{A} \boldsymbol{x} + \boldsymbol{b})}{\boldsymbol{g}^\top \boldsymbol{A} \boldsymbol{g}}
	=
	\frac{\boldsymbol{g}^\top \boldsymbol{g}}{\boldsymbol{g}^\top \boldsymbol{A} \boldsymbol{g}}
	% \\
	% &
	=
	\frac{\| \boldsymbol{g} \|^2}{\boldsymbol{g}^\top \boldsymbol{A} \boldsymbol{g}}
\end{align*}
$$








### 補足: 最適ステップ幅の式変形


最後の変形では$\boldsymbol{A}$が対象行列なら$\boldsymbol{a}^\top \boldsymbol{A} \boldsymbol{b} = \boldsymbol{b}^\top \boldsymbol{A} \boldsymbol{a}$となることを変形の途中で使っている．
$$
 \begin{align*}
  \boldsymbol{a}^\top \boldsymbol{A} \boldsymbol{b} &=
  \left( \boldsymbol{a}^\top \boldsymbol{A} \boldsymbol{b}  \right)^\top
  \ \text{ \# スカラー値(1$\times$1の行列)は転置しても同じ }
  \\
  & = 
  \left( \boldsymbol{a}^\top (\boldsymbol{A} \boldsymbol{b})  \right)^\top
  \\
  & = 
  \left(  (\boldsymbol{A} \boldsymbol{b})^\top \boldsymbol{a}  \right) 
  \ \text{ \# 掛け算の転置の規則 $(\boldsymbol{A} \boldsymbol{B})^\top = \boldsymbol{B}^\top \boldsymbol{A}^\top$ }
  \\
  & = 
  \left( \boldsymbol{b}^\top  \boldsymbol{A}^\top  \boldsymbol{a}  \right) 
  \ \text{ \# 同じ規則を$\boldsymbol{A}\boldsymbol{b}$に適用 }
  \\
  & = 
  \boldsymbol{b}^\top  \boldsymbol{A}  \boldsymbol{a}    \ \text{ \# $\boldsymbol{A}$が対象なため }
 \end{align*}
$$



以下の手順を参考に関数`min_quad_func`を作成せよ．



1. 目的関数$f(\boldsymbol{x})$の計算を行う．
  - この関数をnumpy計算するにはいくつかの方法がある．numpyの説明資料や課題を思い出すとよい．

2. 勾配$\boldsymbol{g}(\boldsymbol{x})$の計算を行う．勾配のノルムの計算も作成する
  - これまでは$\boldsymbol{x}$が2次元であることを仮定していてもよかったが，ここでは$\boldsymbol{x}$の次元が任意で動作するようにすること．

3. 最適な更新幅$\alpha$を計算し，$\boldsymbol{x}$を更新する．



$\boldsymbol{x}$の更新軌跡を表示して，振る舞いを確認する．
関数値と勾配ノルムの値もプロットできるように計算して保持しておくこと．


- レポートに含める内容:
  - 実行例
    - 初期値が$\boldsymbol{x}=(3, 4)$の場合
    - 初期値が上記以外の場合
  - それぞれの実行例について，$\boldsymbol{x}$の更新軌跡，反復ごとの関数値$f(x)$と勾配のノルム$\| \boldsymbol{g}(\boldsymbol{x}) \|$のプロット
    - 関数値と勾配ノルムは，それぞれについて，縦軸が線形軸のものと対数軸のもの







In [None]:
import numpy as np


def calc_f(x, A, b):
    """目的関数の計算

    Args:
        x (ndarray): 現在の変数xの値

    Returns:
        fx (float): 関数値f(x)
    """

    #
    # 1. ここにf(x)の計算を作成し返す
    # (テンプレートは暫定的に0を返してるので書き換える)
    #

    fx = 0  # これはダミーです

    return fx


def calc_grad(x, A, b):
    """勾配とそのノルムの計算

    Args:
        x (ndarray): 現在の変数xの値

    Returns:
        norm_grad (float): 勾配ベクトルのノルム
        grad (ndarray): 勾配ベクトル
    """

    #
    # 2. ここで, ２次元ベクトル"grad"に勾配を設定
    #
    grad = np.zeros_like(x)  # これはダミーです

    #
    # 2. 勾配のノルムの値を返り値で返す
    #
    # ヒント: 平方根を求める関数は np.sqrt(x) が利用可能
    # 参考: numpyにはノルムを求める関数も存在するのでわかる人はそちらを使っても良い

    norm_grad = 0  # これはダミーです

    return norm_grad, grad
    
    
def min_quad_func(x, A, b):
    """最小化を行う関数

    Args:
        x (ndarray): xの初期値
        A (ndarray): 行列A
        b (ndarray): ベクトルb

    Returns:
        (ndarray): xの最適解
        (bool): 収束したかどうかのフラグ
        (ndarray): xの軌跡
    """

    tol = 1e-4
    maxIter = 50
    maxBackTrack = 10
    is_converged = False
    trajectory = []  # 最適化の過程を保存する変数
    trajectory_fx = []
    trajectory_norm_g = []


    for iter in range(maxIter):
        
        # 現在の解を保存（プロット用）
        trajectory.append(x)

        #
        # 1. 現在の目的関数の値を計算する
        #

        fx = calc_f(x, A, b)
        trajectory_fx.append(fx)

        #
        # 2. 現在の勾配を計算する
        #

        norm_g, g = calc_grad(x, A, b)
        trajectory_norm_g.append(norm_g)

        print("Iteration {}: f(x)={}, x={}, g={}, ||g||={}".format(
            iter, fx, x, g, norm_g
        ))

        if norm_g < tol:
            is_converged = True
            break

        #
        # 3. 更新幅$\alpha$を計算し，$\*x$を更新する
        #
        alpha = 0  # これはダミーです
        x = 0  # これはダミーです


    return x, is_converged, np.array(trajectory), \
        np.array(trajectory_fx), np.array(trajectory_norm_g)   



# 最適化問題を定義するパラメータ
A = np.array([
  [4., -2.],
  [-2., 6.]
])
b = np.array([-2., -1.])

# 初期解
x = np.array([3.0, 4.0])
print("initial solution:", x)

x, is_converged, trajectory, traj_fx, traj_norm_g = min_quad_func(x, A, b)

# 最適解
print("optimal solution:", x)

In [None]:
#
# 作図用．編集の必要なし
#

import matplotlib.pyplot as plt
%matplotlib inline
from matplotlib import rcParams
rcParams["savefig.bbox"] = 'tight'


def visualize_f(trajectory, A, b):
    
    def f(x):
        return calc_f(x, A, b)

    fig, ax = plt.subplots(figsize=(6, 5))
    plt.scatter(trajectory[:, 0], trajectory[:, 1], lw=1, s=5)
    plt.plot(trajectory[:, 0], trajectory[:, 1], lw=1)


    # set plot range
    x_min = -5
    x_max = +5
    y_min = -5
    y_max = +5
    plt.xlim(x_min, x_max)
    plt.ylim(y_min, y_max)
    ax.axis('equal')
    
    # make a grid
    XX, YY = np.mgrid[x_min:x_max:200j, y_min:y_max:200j] 
    # evaluate f() at each point in the grid
    Z = np.array([f(x) for x in np.c_[XX.ravel(), YY.ravel()]])
    Z = Z.reshape(XX.shape) # reshape form 1D to 2D
    
    cs = plt.contour(XX, YY, Z, 
                    cmap='coolwarm',
                    levels=list(np.arange(0, 100, 5)),
                    )
    ax.clabel(cs, colors='k', fmt='%d',
              levels=list(np.arange(0, 100, 20)))
    plt.colorbar()

    plt.xlabel('$x_1$')
    plt.ylabel('$x_2$')


# 作図と保存

visualize_f(trajectory, A, b)

plt.savefig('fig_report05-02.png')
plt.savefig('fig_report05-02.jpg')
plt.savefig('fig_report05-02.pdf')
plt.savefig('fig_report05-02.svg')

In [None]:
#
# 作図用．編集の必要なし．
#

fig, ax = plt.subplots(figsize=(6, 5))

plt.plot(traj_fx, '.-')
plt.xlabel('iterations')
plt.ylabel('$f(x)$')
# plt.yscale('log')  # 縦軸を対数スケールにする

plt.savefig('fig_report05-03-traj_fx.png')
plt.savefig('fig_report05-03-traj_fx.jpg')
plt.savefig('fig_report05-03-traj_fx.pdf')
plt.savefig('fig_report05-03-traj_fx.svg')

In [None]:
#
# 作図用．編集の必要なし．
#

fig, ax = plt.subplots(figsize=(6, 5))

plt.plot(traj_norm_g, '.-')
plt.xlabel('iterations')
plt.ylabel('$||g(x)||$')
# plt.yscale('log')  # 縦軸を対数スケールにする

plt.savefig('fig_report05-03-traj_norm_g.png')
plt.savefig('fig_report05-03-traj_norm_g.jpg')
plt.savefig('fig_report05-03-traj_norm_g.pdf')
plt.savefig('fig_report05-03-traj_norm_g.svg')

## 課題5-04：最適配置問題

勾配法の仮想的な例として，製品の配送費用を最小化するための施設配置問題（を簡単化したもの）を考える．

配送したい場所が3箇所あり，その地図上の座標を
$\boldsymbol{x} = (x_1,x_2)^\top, \boldsymbol{y} = (y_1,y_2)^\top, \boldsymbol{z} = (z_1,z_2)^\top$
とする．

新たな施設（例えば，配送センターのようなもの）を座標
$\boldsymbol{p} = (p_1, p_2)^\top$
に作りたいとする．

この施設から各輸送先への輸送にかかるコストが距離に比例すると仮定し，その比例係数を$w_x, w_y, w_z$とすると，配置場所$\boldsymbol{p}$の関数として総コストが以下のように表現できる．
$$
\begin{align*}
 \mathrm{Cost}(\boldsymbol{p}) 
 & = 
 w_x \| \boldsymbol{x} - \boldsymbol{p} \|
 +
 w_y \| \boldsymbol{y} - \boldsymbol{p} \|
 +
 w_z \| \boldsymbol{z} - \boldsymbol{p} \|
 \\
 & = 
 w_x \sqrt{ \sum_{i = 1}^2 (x_i - p_i)^2 }
 + 
 w_y \sqrt{ \sum_{i = 1}^2 (y_i - p_i)^2 }
 + 
 w_z \sqrt{ \sum_{i = 1}^2 (z_i - p_i)^2 }
\end{align*}
$$
この値を最小化する$\boldsymbol{p}$を考える．

$\mathrm{Cost}(\boldsymbol{p})$
の微分を求め，バックトラック付き勾配法で$\boldsymbol{p}$を最適化するプログラムを以下に作成せよ．

ただし，実行例では

- $w_x = 1.8, w_y = 1, w_z = 1$，

配送先の座標を

- $x_1 = -7, x_2 = 3, y_1 = 1, y_2 = -2, z_1 = 6, z_2 = 7$

とせよ．
$\boldsymbol{p}$の初期値は適当に決めて良い．


- レポートに含める内容:
  - 微分$\frac{\partial\mathrm{Cost}(\boldsymbol{p})}{\partial \boldsymbol{p}}$の数式
  - 実行例
    - $\boldsymbol{p}$の初期値を変えたもの（2バターン以上）
    - 重み$w_x = 1.8, w_y = 1, w_z = 1$の値を変えたもの（2バターン以上）
  - それぞれの実行例について，$\boldsymbol{p}$の更新軌跡，反復ごとの関数値$f(p)$と勾配のノルム$\| \boldsymbol{g}(\boldsymbol{p}) \|$のプロット
    - 関数値と勾配ノルムは，それぞれについて，縦軸が線形軸のものと対数軸のもの



- 注1: 
$\mathrm{Cost}(\boldsymbol{p})$は厳密には微分不可能点を含む（二乗根の部分が厳密に0になる場合）が，この例題ではこのことが勾配法の実行上問題になることはほぼないため，微分可能な場合での微分を計算して実装すれば良い．
- 注2: 
変数($\boldsymbol{p}$)が二次元なのでこの問題自体は網羅的に$\boldsymbol{p}$を様々な値で調べても，良い解を見つけることはそれほど難しくない．一方で，設置したい新たな施設の数を増やすなどするとより問題が複雑になり，そのような方法は取りにくくなる．ただし，そのように複数の配置を考える場合は，互いにカバーする領域を分けるようにするなど，より複雑な条件が必要になることが多い．最適化問題に「条件」（例えば変数の値に範囲を設けるなど）を入れる場合は「制約付き最適化問題」と呼ばれ，今回の講義で扱う範囲を超えるが実用上非常に重要となる．
- 注3: ステップサイズ$\alpha$は固定でよい．また以下のコードで関数の引数は適宜変更すること．



In [None]:
import numpy as np


def calc_f(x):
    """目的関数の計算

    Args:
        x (ndarray): 現在の変数xの値

    Returns:
        fx (float): 関数値f(x)
    """

    #
    # 1. ここにf(x)の計算を作成し返す
    # (テンプレートは暫定的に0を返してるので書き換える)
    #

    fx = 0  # これはダミーです

    return fx


def calc_grad(x):
    """勾配とそのノルムの計算

    Args:
        x (ndarray): 現在の変数xの値

    Returns:
        norm_grad (float): 勾配ベクトルのノルム
        grad (ndarray): 勾配ベクトル
    """

    #
    # 2. ここで, ２次元ベクトル"grad"に勾配を設定
    #
    grad = np.zeros_like(x)  # これはダミーです

    #
    # 2. 勾配のノルムの値を返り値で返す
    #
    # ヒント: 平方根を求める関数は np.sqrt(x) が利用可能
    # 参考: numpyにはノルムを求める関数も存在するのでわかる人はそちらを使っても良い

    norm_grad = 0  # これはダミーです

    return norm_grad, grad




def min_func(w, x, y, z, p):

    alpha = 0.5
    tol = 1e-4
    maxIter = 50
    is_converged = False
    trajectory = []  # 最適化の過程を保存する変数
    trajectory_fp = []
    trajectory_norm_g = []

    for iter in range(maxIter):
        
        # 現在の解を保存（プロット用）
        trajectory.append(p)

        #
        # 1. 現在の目的関数の値を計算する
        #

        fp = calc_f(w, x, y, z, p)
        trajectory_fp.append(fp)

        #
        # 2. 現在の勾配を計算する
        #

        norm_g, g = calc_grad(w, x, y, z, p)
        trajectory_norm_g.append(norm_g)

        
        print("Iteration {}: f(p)={}, p={}, g={}, ||g||={}".format(
            iter, fp, p, g, norm_g
        ))

        if norm_g < tol:
            is_converged = True
            break

        #
        # 3. 更新幅$\alpha$を計算し，$\*p$を更新する
        #
        p = p - alpha * g


    return p, is_converged, np.array(trajectory), \
          np.array(trajectory_fp), np.array(trajectory_norm_g)
  



# 最適化問題を定義するパラメータ
w = np.array([1.8, 1, 1])
x = np.array([-7, 3])
y = np.array([1, -2])
z = np.array([6, 7])

# 初期解
p = np.array([3.0, 4.0])
print("initial solution:", p)

p, is_converged, trajectory, traj_fp, traj_norm_g = min_func(w, x, y, z, p)

# 最適解
print("optimal solution:", p)

In [None]:
#
# 作図用．編集の必要なし
#

import matplotlib.pyplot as plt
%matplotlib inline
from matplotlib import rcParams
rcParams["savefig.bbox"] = 'tight'


def visualize_f(trajectory, w, x, y, z):
    
    def f(p):
        return calc_f(w, x, y, z, p)

    fig, ax = plt.subplots(figsize=(6, 5))
    plt.scatter(trajectory[:, 0], trajectory[:, 1], lw=1, s=5)
    plt.plot(trajectory[:, 0], trajectory[:, 1], lw=1)

    plt.scatter(x[0], x[1])
    plt.text(x[0], x[1], 'x')
    plt.scatter(y[0], y[1])
    plt.text(y[0], y[1], 'y')
    plt.scatter(z[0], z[1])
    plt.text(z[0], z[1], 'z')

    # set plot range
    x_min = -10
    x_max = +10
    y_min = -10
    y_max = +10
    plt.xlim(x_min, x_max)
    plt.ylim(y_min, y_max)
    ax.axis('equal')
    
    # make a grid
    XX, YY = np.mgrid[x_min:x_max:200j, y_min:y_max:200j] 
    # evaluate f() at each point in the grid
    Z = np.array([f(p) for p in np.c_[XX.ravel(), YY.ravel()]])
    Z = Z.reshape(XX.shape) # reshape form 1D to 2D
    
    cs = plt.contour(XX, YY, Z, 
                    cmap='coolwarm',
                    levels=list(np.arange(0, 100, 2)),
                    )
    ax.clabel(cs, colors='k', fmt='%d',
              levels=list(np.arange(0, 100, 10)),
             )
    plt.colorbar()

    plt.xlabel('$x_1$')
    plt.ylabel('$x_2$')


# 作図と保存
visualize_f(trajectory, w, x, y, z)


plt.savefig('fig_report05-04.png')
plt.savefig('fig_report05-04.jpg')
plt.savefig('fig_report05-04.pdf')
plt.savefig('fig_report05-04.svg')


In [None]:
#
# 作図用．編集の必要なし．
#

fig, ax = plt.subplots(figsize=(6, 5))

plt.plot(traj_fp, '.-')
plt.xlabel('iterations')
plt.ylabel('$f(x)$')
# plt.yscale('log')  # 縦軸を対数スケールにする

plt.savefig('fig_report05-04-traj_fp.png')
plt.savefig('fig_report05-04-traj_fp.jpg')
plt.savefig('fig_report05-04-traj_fp.pdf')
plt.savefig('fig_report05-04-traj_fp.svg')

In [None]:
#
# 作図用．編集の必要なし．
#

fig, ax = plt.subplots(figsize=(6, 5))

plt.plot(traj_norm_g, '.-')
plt.xlabel('iterations')
plt.ylabel('$||g(x)||$')
# plt.yscale('log')  # 縦軸を対数スケールにする

plt.savefig('fig_report05-04-traj_norm_g.png')
plt.savefig('fig_report05-04-traj_norm_g.jpg')
plt.savefig('fig_report05-04-traj_norm_g.pdf')
plt.savefig('fig_report05-04-traj_norm_g.svg')