In [1]:
%%html
<link rel="stylesheet" href="./style.css">
<div id="page_top"><a href="#top"></a></div>

# ヒューリスティックコンテスト

- 最適解を出すことが難しい問いに対して，できるだけ良い解を出すプログラムを書き，そのスコアを競うコンテスト

## tips

1. [乱数生成](#乱数生成)
2. [time関数](#time関数)

### 1. 乱数生成
<a id="乱数生成"></a>

In [18]:
import random

# 0以上1未満のfloat型の乱数を取得
r = random.random()
print(r)

# 指定した範囲の乱数を取得(a以上b以下の実数を生成)
a, b = 1, 3
r = random.uniform(a,b)
print(r)

# 指定した範囲の整数の乱数を取得(a以上b以下の整数を生成)
a, b = 1, 3
r = random.randint(a,b)
print(r)

# 配列の中身をランダムに取得
L = ["a", "b", "c", "d", "e"]
r = random.choice(L)
print(r)

# 配列の中身をシャッフル
L = ["a", "b", "c", "d", "e"]
random.shuffle(L)
print(L)

0.8075432720585638
1.0491422431822028
3
b
['e', 'a', 'd', 'b', 'c']


### 2. time関数
<a id="time関数"></a>

- 例えば[山登り法](#局所探索法)や[焼きなまし法](#焼きなまし法)において，ループ回数を設定するのではなく，実行時間制限のギリギリまで，繰り返し処理を行いたい.
- その際にtime関数を使用して，プログラムの実行時間を管理する．

In [2]:
import time
time_limit = 5.4
tm = time.time()

loops = 0
while time.time() - tm < time_limit:
    # 山登り法，焼きなまし法の更新処理を行う
    loops += 1

## 解法アプローチ

1. [貪欲法](#貪欲法)
2. [局所探索法](#局所探索法)
3. [焼きなまし法](#焼きなまし法)
4. [ビームサーチ](#ビームサーチ)
5. [評価関数の工夫](#評価関数の工夫)
6. [](#)
7. [](#)
8. [](#)
9. [](#)
10. [](#)

### 1. 貪欲法
<a id="貪欲法"></a>

- 一手先の評価値を最大化する手を打ち続ける方法
- 例えば巡回セールスマン問題の場合，今いる都市から，選ぶことのできる都市の中で一番近い都市に移動する

### 2. 局所探索法
<a id="局所探索法"></a>

- 小さい変更をランダムに行い，買いが改善されたら，その変更を採用することを繰り返し，徐々に買いの質を高める手法
- 必ずしも最適解にたどり着くという保証はなく，局所解に陥る可能性がある
- 山登り法とも言う

### 3. 焼きなまし法
<a id="焼きなまし法"></a>

- 局所探索法を改善した手法
- 局所解から抜け出すように，一定の確率でスコアが悪化する変更を許す
- スコアの落差を $\Delta$ が大きいほどその変更を行う確率 $p$ を下げることが多く，具体的に次式を利用することが多い．ここで $T$ は変更の許容確率を制御するパラメータである．$T$ が大きいほど悪化を許す確率が高くなり，低いほど悪化を許す確率は低くなる．
$$ p = \left\{ \begin{align*} 1 & \ (スコアが改善する場合) \\ \exp^{-\Delta / T} & \ (スコアが悪化する場合) \end{align*} \right.$$

```python
import math, random
mm = (30, 28)
for loop in range(NUM_LOOPS):
    T = mm[0] - mm[1] * loop / NUM_LOOPS # ループの回数を重ねるにつれて，悪化を許す確率を低くする(mmは任意の値に設定してよい)
    probability = math.exp(min(0, (now-new) /  T))
    if random.random() < probability:
        """ここに変更を記述"""
        now = new # スコアの更新
```

### 4. ビームサーチ
<a id="ビームサーチ"></a>

- 各段階において，スコアが上位 $k$ 個となるものを残して探索を進める手法．ここで $k$ をビーム幅と呼ぶ．

### 5. 評価関数の工夫
<a id="評価関数の工夫"></a>

- [例題](https://atcoder.jp/contests/tessoku-book/tasks/tessoku_book_aw)において，①評価関数を問題文に記載の通り（$X[j]=0$ となる $j$ の個数）とするより，②「配列 $X$ の各要素の絶対値の総和」としたほうが，同じ貪欲法でも良い解を得ることができる．
    - [①のコード](https://atcoder.jp/contests/tessoku-book/submissions/44479668): 37454点
    - [②のコード](https://atcoder.jp/contests/tessoku-book/submissions/44479684): 40978点