# Dynamic Window Approach

## 参考URL

https://myenigma.hatenablog.com/entry/2017/07/23/095511#Dynamic-Window-Approach<br>
https://qiita.com/MENDY/items/16343a00d37d14234437

## Global Path Planning

スタート地点からゴールまでのパスを計算する方法<br>
ロボットのダイナミクス（運動モデル）を考慮していない<br>
計算コストが大きい<br>

## Local Path Planning

ロボットのダイナミクスを考慮した上で、<br>
比較的近い距離までのパスプランニングを高速に実施するためのアルゴリズム<br>
車体のダイナミクスを考慮しているため、<br>
最終的な制御入力(前進速度やステアリング角度）まで計算します<br>

<br>
非常に近い距離までしかパスを引くことができないので、<br>
局所解(行き止まりなど）でパスが引けなくなるという問題があります。<br>

## 非ホロノミック

http://www.iis.u-tokyo.ac.jp/~suzukitk/research-nh-j.html　<br>
入力の次元と空間の次元が異なる場合でも，非ホロノミック性をもっている場合は入力の組み合わせ<br>
を選ぶことで与えられた自由度以上のことができるということ（大雑把）

## アルゴリズムメモ

### 取りうる速度と角速度の組み合わせ決定<br>
力学特性を考慮して，可能な走査範囲を特定している<br>

In [1]:
def _calc_range_velos(self, state): # 角速度と角度の範囲決定①
    # 角速度
    range_ang_velo = self.samplingtime * self.simu_robot.max_ang_accelation #取りうる角速度の範囲=最高角加速度×サンプリング時間
    min_ang_velo = state.u_th - range_ang_velo #最小速度= 現在の角θ - 取りうる最高速度θ th:theta 
    max_ang_velo = state.u_th + range_ang_velo
    # 最小値
    if min_ang_velo < self.simu_robot.lim_min_ang_velo: #限界角速度はどのようにして決定するか？→前回の実験で取得したデータから解析...?
        min_ang_velo = self.simu_robot.lim_min_ang_velo
    # 最大値
    if max_ang_velo > self.simu_robot.lim_max_ang_velo:
        max_ang_velo = self.simu_robot.lim_max_ang_velo

    # 速度
    range_velo = self.samplingtime * self.simu_robot.max_accelation #角速度の場合と同様
    min_velo = state.u_v - range_velo
    max_velo = state.u_v + range_velo
    # 最小値
    if min_velo < self.simu_robot.lim_min_velo:
        min_velo = self.simu_robot.lim_min_velo
    # 最大値
    if max_velo > self.simu_robot.lim_max_velo:
        max_velo = self.simu_robot.lim_max_velo

    return min_ang_velo, max_ang_velo, min_velo, max_velo

The history saving thread hit an unexpected error (DatabaseError('database disk image is malformed',)).History will not be written to the database.


### 予測軌跡
モデルに合わせて回す．予測時間（何秒後の地点を予測するか...?）を設定して回す<br>
計算時間が増えるのでパラメータ設定は慎重に行うように<br>

#### 概要
サンプリング時間⊿tごとの将来位置と将来角θを導出しパス（v,θからなる極座標表現の将来位置）を生成する<br>
※ここでいっぱい線が生えているように見えているものは⊿角における最小～最大速度を取ったときの将来座標の集合のため直線に見える<br>
つまりmain()側で⊿tごとに_make_pathアルゴリズムを駆動させる<br>
make_pathアルゴリズムで獲得した生成経路集合をpathリストで管理して，その経路に対して窓と障害物検知を対応させて経路を決定する．<br>
<br>
<b>要は歩行者というダイナミクスに対しての最適制御問題を解いているというわけ</b>
<br>
<br>
【tips】最適制御理論のイメージと解説<br>
https://www.usss.kyoto-u.ac.jp/uchugaku/seminar/2016/20160704_Ohtsuka.pdf

#### 補足（最適制御理論）

DWAは作動二輪などのホロノミックな系でも扱える最適制御理論である．<br>
人間みたいな単純な１次マルコフに従う系では必ずしもDWAである必要はない？<br>
普通の最適制御理論では最適レギュレータ問題や線形二次レギュレータ(LQR)が用いられるらしい<br><br>
【tips】線形二次レギュレータ<br>
https://myenigma.hatenablog.com/entry/2016/11/05/033219
<br>
<br>
線形システムに対して，評価関数を最小にする．ゲインの計算を一度行えば，<br>
そのあとの最適入力はそのゲインをもとに計算すれば良いので非常に強力である<br>
→もしかしたらDWAを使わなくともこれでよいのでは？感ある．要調査<br>
→→あんまり関係なかったっぽい
<br><br>
【tips】LQRによる経路追従問題の解説<br>
https://myenigma.hatenablog.com/entry/2017/08/08/153651

In [2]:
def _make_path(self, state): 
        # 角度と速度の範囲算出
        #_calc_range_velosを回して最小角速度，最大角速度，最小速度，最大速度を取得
        min_ang_velo, max_ang_velo, min_velo, max_velo = self._calc_range_velos(state)

        # 全てのpathのリスト
        paths = []

        # 角速度と速度の組み合わせを全探索
        # 最小角から最大角まで⊿角単位で探索
        for ang_velo in np.arange(min_ang_velo, max_ang_velo, self.delta_ang_velo):
            # 最小速度から最大速度まで⊿速度単位で探索
            for velo in np.arange(min_velo, max_velo, self.delta_velo):

                path = Path(ang_velo, velo)
                
                # 予測モデルによる将来位置予測
                # 予測するべきパラメータは時点の二次座標と対象までの角度θ
                # なのでここのself.simu_robot.predict_stateは自分の設定した将来位置予測モデルを使う．
                next_x, next_y, next_th
                    = self.simu_robot.predict_state(ang_velo, velo, state.x, state.y, state.th, self.samplingtime, self.pre_step)
                
                #パスにt+1秒後のパラメタを代入
                path.x = next_x
                path.y = next_y
                path.th = next_th

                # 作ったpathを追加
                paths.append(path)

        # 時刻歴Pathを保存
        self.traj_paths.append(paths)

        return paths

### ターゲットとの角度スコアリング

In [None]:
 def _heading_angle(self, path, g_x, g_y): # ゴールに向いているか
        # 終端の向き
        # 一番最後の時刻でのパス候補
        # ここはすべてのパスに対して行列でまとめて計算している
        last_x = path.x[-1]
        last_y = path.y[-1]
        last_th = path.th[-1]

        # 角度計算
        # g_y,g_xはターゲットの座標
        # 座標からatanを使って角度を計算している
        angle_to_goal = math.atan2(g_y-last_y, g_x-last_x)

        # score計算
        #ゴールとの角度差がどれくらいか．つまり子の方向をどれだけ向いているか？
        score_angle = angle_to_goal - last_th

        # ぐるぐる防止
        # 絶対値をとって大小比較
        score_angle = abs(angle_range_corrector(score_angle))

        # 最大と最小をひっくり返す
        # 必要性がよくわからない
        score_angle = math.pi - score_angle

        # print('score_sngle = {0}' .format(score_angle))

        return score_angle

### 並進速度のスコアリング

path.u_vはモデルの速度<br>
DWAではモデルの速度を一定と仮定しているため，<br>
初期設定として与えた速度をそのまま呼び出している<br>
ここで速度を一定としている理由ってなんだろう．別につど計算し直してもいいような気はする<br>
特に人間が制御対象なんで，必ずしも最適で一定の速度を出せるとは限らないような...?<br>
後に原著論文を参照のほど

In [1]:
    def _heading_velo(self, path): # 速く進んでいるか（直進）

        score_heading_velo = path.u_v

        return score_heading_velo

The history saving thread hit an unexpected error (DatabaseError('database disk image is malformed',)).History will not be written to the database.


### 障害物の検知

In [2]:
# obstaclesとはなにか？
def _calc_nearest_obs(self, state, obstacles):
    area_dis_to_obs = 5 # パラメータ（何メートル考慮するか，本当は制動距離）
    nearest_obs = [] # あるエリアに入ってる障害物
    
    # obs.xとは?
    #obstaclesは障害物管理メソッド
    #障害物のx,y,sizeを格納している
    for obs in obstacles:
        #ピタゴラスの定理
        temp_dis_to_obs = math.sqrt((state.x - obs.x) ** 2 + (state.y - obs.y) ** 2)
        
        if temp_dis_to_obs < area_dis_to_obs :
            nearest_obs.append(obs)
    # 返却は検知したオブジェクトの情報
    return nearest_obs

### 障害物回避

ここのアルゴリズムの判定が意味不明<br>
内積距離を求めてなにがしたい？
なんの集合（path）に対して障害物との距離を求めているか<br>
そもそも障害物との距離を求めるという過程がなぜ必要なのかがよくわからない

In [None]:
def _obstacle(self, path, nearest_obs):
    # 障害物回避（エリアに入ったらその線は使わない）/ (障害物ともっとも近い距離距離)))
    score_obstacle = 2
    temp_dis_to_obs = 0.0

    for i in range(len(path.x)):
        for obs in nearest_obs: 
            #距離出してるだけ
            temp_dis_to_obs = math.sqrt((path.x[i] - obs.x) * (path.x[i] - obs.x) + (path.y[i] - obs.y) *  (path.y[i] - obs.y))

            #なにに対して一番近いところ？謎
            #解説では内積距離の近いところを指しているけど．．．？
            if temp_dis_to_obs < score_obstacle:
                score_obstacle = temp_dis_to_obs # 一番近いところ

            # そもそも中に入ってる判定
            if temp_dis_to_obs < obs.size + 0.75: # マージン
                score_obstacle = -float('inf')
                break

        else:
            continue

        break

    return score_obstacle

### 評価

In [4]:
 def _eval_path(self, paths, g_x, g_y, state, obastacles):
        # 一番近い障害物判定
        nearest_obs = self._calc_nearest_obs(state, obastacles)

        score_heading_angles = []
        score_heading_velos = []
        score_obstacles = []

        # 全てのpathで評価を検索
        for path in paths:
            # (1) heading_angle
            score_heading_angles.append(self._heading_angle(path, g_x, g_y))
            # (2) heading_velo
            score_heading_velos.append(self._heading_velo(path))
            # (3) obstacle
            score_obstacles.append(self._obstacle(path, nearest_obs))

        # print('angle = {0}'.format(score_heading_angles))
        # print('velo = {0}'.format(score_heading_velos))
        # print('obs = {0}'.format(score_obstacles))

        # 正規化
        for scores in [score_heading_angles, score_heading_velos, score_obstacles]:
            scores = min_max_normalize(scores)

        score = 0.0
        # 最小pathを探索
        for k in range(len(paths)):
            temp_score = 0.0

            temp_score = self.weight_angle * score_heading_angles[k] + \
                         self.weight_velo * score_heading_velos[k] + \
                         self.weight_obs * score_obstacles[k]

            if temp_score > score:
                opt_path = paths[k]
                score = temp_score

        return opt_path

In [1]:


import math
import numpy as np
import matplotlib.pyplot as plt

%matplotlib nbagg
show_animation = True


class Config():
    # simulation parameters

    def __init__(self):
        # robot parameter
        self.max_speed = 1.0  # [m/s]
        self.min_speed = -0.5  # [m/s]
        self.max_yawrate = 40.0 * math.pi / 180.0  # [rad/s]
        self.max_accel = 0.2  # [m/ss]
        self.max_dyawrate = 40.0 * math.pi / 180.0  # [rad/ss]
        self.v_reso = 0.01  # [m/s]
        self.yawrate_reso = 0.1 * math.pi / 180.0  # [rad/s]
        self.dt = 0.1  # [s]
        self.predict_time = 3.0  # [s]
        self.to_goal_cost_gain = 1.0
        self.speed_cost_gain = 1.0
        self.robot_radius = 1.0  # [m]


def motion(x, u, dt):
    # motion model

    x[2] += u[1] * dt
    x[0] += u[0] * math.cos(x[2]) * dt
    x[1] += u[0] * math.sin(x[2]) * dt
    x[3] = u[0]
    x[4] = u[1]

    return x


def calc_dynamic_window(x, config):

    # Dynamic window from robot specification
    Vs = [config.min_speed, config.max_speed,
          -config.max_yawrate, config.max_yawrate]

    # Dynamic window from motion model
    Vd = [x[3] - config.max_accel * config.dt,
          x[3] + config.max_accel * config.dt,
          x[4] - config.max_dyawrate * config.dt,
          x[4] + config.max_dyawrate * config.dt]
    #  print(Vs, Vd)

    #  [vmin,vmax, yawrate min, yawrate max]
    dw = [max(Vs[0], Vd[0]), min(Vs[1], Vd[1]),
          max(Vs[2], Vd[2]), min(Vs[3], Vd[3])]

    return dw


def calc_trajectory(xinit, v, y, config):

    x = np.array(xinit)
    traj = np.array(x)
    time = 0
    while time <= config.predict_time:
        x = motion(x, [v, y], config.dt)
        traj = np.vstack((traj, x))
        time += config.dt

    return traj


def calc_final_input(x, u, dw, config, goal, ob):

    xinit = x[:]
    min_cost = 10000.0
    min_u = u
    min_u[0] = 0.0
    best_traj = np.array([x])

    # evalucate all trajectory with sampled input in dynamic window
    for v in np.arange(dw[0], dw[1], config.v_reso):
        for y in np.arange(dw[2], dw[3], config.yawrate_reso):
            traj = calc_trajectory(xinit, v, y, config)

            # calc cost
            to_goal_cost = calc_to_goal_cost(traj, goal, config)
            speed_cost = config.speed_cost_gain * \
                (config.max_speed - traj[-1, 3])
            ob_cost = calc_obstacle_cost(traj, ob, config)
            #print(ob_cost)

            final_cost = to_goal_cost + speed_cost + ob_cost

            # search minimum trajectory
            if min_cost >= final_cost:
                min_cost = final_cost
                min_u = [v, y]
                best_traj = traj

    return min_u, best_traj


def calc_obstacle_cost(traj, ob, config):
    # calc obstacle cost inf: collistion, 0:free

    skip_n = 2
    minr = float("inf")

    for ii in range(0, len(traj[:, 1]), skip_n):
        for i in range(len(ob[:, 0])):
            ox = ob[i, 0]
            oy = ob[i, 1]
            dx = traj[ii, 0] - ox
            dy = traj[ii, 1] - oy

            r = math.sqrt(dx**2 + dy**2)
            if r <= config.robot_radius:
                return float("Inf")  # collision

            if minr >= r:
                minr = r

    return 1.0 / minr  # OK


def calc_to_goal_cost(traj, goal, config):
    # calc to goal cost. It is 2D norm.

    goal_magnitude = math.sqrt(goal[0]**2 + goal[1]**2)
    traj_magnitude = math.sqrt(traj[-1, 0]**2 + traj[-1, 1]**2)
    dot_product = (goal[0]*traj[-1, 0]) + (goal[1]*traj[-1, 1])
    error = dot_product / (goal_magnitude*traj_magnitude)
    error_angle = math.acos(error)
    cost = config.to_goal_cost_gain * error_angle

    return cost


def dwa_control(x, u, config, goal, ob):
    # Dynamic Window control

    dw = calc_dynamic_window(x, config)

    u, traj = calc_final_input(x, u, dw, config, goal, ob)

    return u, traj


def plot_arrow(x, y, yaw, length=0.5, width=0.1):
    plt.arrow(x, y, length * math.cos(yaw), length * math.sin(yaw),
              head_length=width, head_width=width)
    plt.plot(x, y)


def main():
    # initial state [x(m), y(m), yaw(rad), v(m/s), omega(rad/s)]
    x = np.array([0.0, 0.0, math.pi / 8.0, 0.0, 0.0])
    # goal position [x(m), y(m)]
    goal = np.array([10, 10])
    # obstacles [x(m) y(m), ....]
    ob = np.matrix([[-1, -1],
                    [0, 2],
                    [4.0, 2.0],
                    [5.0, 4.0],
                    [5.0, 5.0],
                    [5.0, 6.0],
                    [5.0, 9.0],
                    [8.0, 9.0],
                    [7.0, 9.0],
                    [12.0, 12.0]
                    ])

    u = np.array([0.0, 0.0])
    config = Config()
    traj = np.array(x)

    for i in range(1000):
        u, ltraj = dwa_control(x, u, config, goal, ob)

        x = motion(x, u, config.dt)
        traj = np.vstack((traj, x))  # store state history

        if show_animation:
            plt.cla()
            plt.plot(ltraj[:, 0], ltraj[:, 1], "-g")
            plt.plot(x[0], x[1], "xr")
            plt.plot(goal[0], goal[1], "xb")
            plt.plot(ob[:, 0], ob[:, 1], "ok")
            plot_arrow(x[0], x[1], x[2])
            plt.axis("equal")
            plt.grid(True)
            plt.pause(0.0001)

        # check goal
        if math.sqrt((x[0] - goal[0])**2 + (x[1] - goal[1])**2) <= config.robot_radius:
            print("Goal!!")
            break

    print("Done")
    if show_animation:
        plt.plot(traj[:, 0], traj[:, 1], "-r")
        plt.show()


if __name__ == '__main__':
    main()

The history saving thread hit an unexpected error (DatabaseError('database disk image is malformed',)).History will not be written to the database.


<IPython.core.display.Javascript object>

Goal!!
Done


In [27]:


import math
import numpy as np
import matplotlib.pyplot as plt

%matplotlib nbagg
show_animation = True
x = np.array([0.0, 0.0, math.pi / 8.0, 0.0, 0.0])
xin = np.array(x)
x
# h = np.array([xin])
# h

array([0.        , 0.        , 0.39269908, 0.        , 0.        ])