# 1年情報基礎 - アルゴリズム - 

## 二分探索（binary search）

二分探索も線形探索と同様の「探索」アルゴリズムです。ただ、二分探索は線形探索よりも、より効率が良い探索アルゴリズムです。  
線形探索では、リストの先端から一つづつたどって、探索値と比較していきました。二分探索では、ある値（中央値を用いることが多い）より探索値が大きいた小さいかを判定して、絞り込んでいくアルゴリズムです。探索候補を段々と半分にする（二分する）作業を繰り返すイメージです。
知りたい単語を辞書で調べるとき、辞書の先頭から一つ一つ調べていくよりも、適当に辞書を開いてみて、そのページより前にあるか、後にあるかを調べて絞り込んでいく作業に似ています。

<img src="https://raw.githubusercontent.com/masudakoji/jouhou-kiso-2022/main/images/Algorithm_BinarySearch/ss1.png" width="70%">

### 二分探索をする際の注意点

二分探索をする場合、対象となるリストは小さいものから順番に並び替えられている必要があります。先ほど辞書の例えを出しましたが、辞書はあいうえお順（もしくはABC順）に並んでいるかと思います。二分探索したいリストも同様にする必要があります。  
また、数値データ以外のリストの場合、大小関係が明確ではないので、そういう場合には二分探索は使えません。

### 並び替え

二分探索を行うためには、対象となるリストが小さいものから順番に並び替えられている必要があります。最初与えられたリストが、並び替えられていないリストの場合`sorted()`関数などを使って並び変える必要があります。

In [None]:
list_source = [4, 18, -1, 21, 26, 13, 6, -5, 9, 20]

このような、並び替えられていないリストを並び替えてみます。

In [None]:
list_sorted = sorted(list_source)

`sorted()`関数を使って並び替えて、新たに`list_sorted`というリストを作成しました。中身を見てみると次の通りです。

In [None]:
list_sorted

昇順に（小さいものから順番に）並び替えられていることがわかります。

### 探索範囲の設定

二分探索では、探索範囲を段々と狭めていくことで、探索を行います。探索範囲の定義の仕方として、探索範囲の開始位置と終了位置を指定します。開始位置・終了位置はインデックス番号を指定します。

<img src="https://raw.githubusercontent.com/masudakoji/jouhou-kiso-2022/main/images/Algorithm_BinarySearch/ss2.png" width="70%">

In [None]:
low = 0
high = len(list_sorted) - 1
print(f"開始位置(low): {low}")
print(f"終了位置(high): {high}")

最初は対象リスト全体が探索範囲になるかと思いますので、開始位置のインデックス番号は0です。また、リストの最後のインデックス番号は「リストの長さ-1」となります（今回はリストの長さが10なので、そこから1引いて9となります）

### 中央位置の設定

二分探索では、探索範囲の中央の値を取り出し、その値が「探索値と等しい」、「探索値より大きい」、「探索値より小さい」かを判定して対応します。そのために、中央位置のインデックス番号を算出する必要があります。

探索範囲の開始位置(low)、終了位置(high)が分かっているので、探索範囲の中央位置(mid)は以下のように算出できます。

<img src="https://raw.githubusercontent.com/masudakoji/jouhou-kiso-2022/main/images/Algorithm_BinarySearch/ss3.png" width="70%">

$$中央位置(\texttt{mid})=\frac{開始位置(\texttt{low})+終了位置(\texttt{high})}{2}$$

注意する点として、探索範囲の要素数が奇数であれば、中央位置は整数になります。

<img src="https://raw.githubusercontent.com/masudakoji/jouhou-kiso-2022/main/images/Algorithm_BinarySearch/ss4.png" width="70%">

開始位置: 0  
終了位置: 4  
中央位置: 2

探索範囲の要素数が偶数であれば、中央位置は小数になります。

<img src="https://raw.githubusercontent.com/masudakoji/jouhou-kiso-2022/main/images/Algorithm_BinarySearch/ss5.png" width="70%">

開始位置: 0  
終了位置: 5  
中央位置: 2.5

ただ、インデックス番号は整数である必要があります。そのため、「除算（割り算）した際の整数部分のみの取り出し」という機能を使って整数部分を取り出します。除算した際の整数部分のみの取り出しには、'//'という演算子を用います。

★「除算（割り算）した際の整数部分のみの取り出し」の演算子は Introduction_Python の資料に記載されています。

In [None]:
mid = (low + high)//2
print(f"開始位置(low): {low}")
print(f"終了位置(high): {high}")
print(f"中央位置(mid): {mid}")

このようにすれば、中央位置のインデックス番号が整数として得られます。

### 中央位置の値と探索値との比較

中央位置のインデックス番号が`mid`として得られたので、`list_sorted`における、中央位置の値は`list_sorted[mid]`で得られます。

#### 比較結果（中央位置の値と探索値が等しい）

中央位置の値と探索値が一致していれば、探索値が見つかった、ということですので、探索が完了した、とみなすことができます。

<img src="https://raw.githubusercontent.com/masudakoji/jouhou-kiso-2022/main/images/Algorithm_BinarySearch/ss6.png" width="70%">

#### 比較結果（中央位置の値の方が探索値より大きい）

中央位置の値の方が探索値より大きいならば、探索値は中央位置よりも左側（中央位置より小さい範囲）に存在しているはずです。その場合、新しい探索範囲を次のように設定することができます。

<img src="https://raw.githubusercontent.com/masudakoji/jouhou-kiso-2022/main/images/Algorithm_BinarySearch/ss7.png" width="70%">

In [None]:
high = mid-1
mid = (low + high)//2
print(f"開始位置(low): {low}")
print(f"終了位置(high): {high}")
print(f"中央位置(mid): {mid}")

開始位置(low)は変更しません。終了位置(high)については（古い）中央位置よりも1小さいところが新しい終了位置(high)となります。新しい中央位置(mid)も算出しておく必要があります。

#### 比較結果（中央位置の値の方が探索値より小さい）

中央位置の値の方が探索値より小さいならば、探索値は中央位置よりも右側（中央位置より大きい範囲）に存在しているはずです。その場合、新しい探索範囲を次のように設定することができます。

<img src="https://raw.githubusercontent.com/masudakoji/jouhou-kiso-2022/main/images/Algorithm_BinarySearch/ss8.png" width="70%">

In [None]:
low = mid+1
mid = (low + high)//2
print(f"開始位置(low): {low}")
print(f"終了位置(high): {high}")
print(f"中央位置(mid): {mid}")

開始位置(low)については（古い）中央位置よりも1大きいところが新しい開始位置(low)となります。終了位置(high)は変更しません。新しい中央位置(mid)も算出しておく必要があります。

### 二分探索アルゴリズム

これらのことを踏まえて、二分探索アルゴリズム全体を書くと次のようになります。

In [None]:
target = 4
print(f"探索値: {target}")
list_source = [4, 18, -1, 21, 26, 13, 6, -5, 9, 20]
list_sorted = sorted(list_source)
print(f"探索リスト: {list_sorted}")

# 初期の探索範囲の設定
low = 0
high = len(list_sorted) - 1
mid = (low + high)//2
print(f"low: {low}, high: {high}, mid: {mid}")

while True:
    if list_sorted[mid] == target:  # 中央位置の値と探索値が等しい
        print(f"インデックス{mid}に探索値{target}が存在しています")
        break
    elif list_sorted[mid] > target: # 中央位置の値の方が探索値より大きい
        print(f"中央位置の値({list_sorted[mid]})の方が探索値({target})より大きいです")
        high = mid-1
        mid = (low + high)//2
        print(f"新しい探索範囲 low: {low}, high: {high}, mid: {mid}")
    else:                            # 中央位置の値の方が探索値より小さい
        print(f"中央位置の値({list_sorted[mid]})の方が探索値({target})より小さいです")
        low = mid+1
        mid = (low + high)//2
        print(f"新しい探索範囲 low: {low}, high: {high}, mid: {mid}")

探索の結果、インデックス2に探索値4が存在していることがわかりました。

これで、二分探索アルゴリズムが完成したようにも思いますが、現時点では一つ大きな問題があります。二分探索自体は出来ていますが、探索値が探索リスト中に存在していなかった際にプログラムが終了しません。上のプログラムでも、うっかりリストにない値を探索値としないように気をつける必要があります。

### 終了条件の追加

二分探索では、探索範囲が段々と小さくなっていき、最終的に探索範囲が1か2にまで縮小します。それでも見つからなかった際に、新たな探索範囲を設定しようとした時に、"開始位置(low)>終了位置(high)"となってしまいます。こうなってしまうとそれ以上探索のしようがないですので、探索値が見つからなかったとして終了するようにします。

<img src="https://raw.githubusercontent.com/masudakoji/jouhou-kiso-2022/main/images/Algorithm_BinarySearch/ss9.png" width="70%">

<img src="https://raw.githubusercontent.com/masudakoji/jouhou-kiso-2022/main/images/Algorithm_BinarySearch/ss10.png" width="70%">

`while True`で無限ループを定義していますので、そこから抜けるためには`break`文を入れる必要があります。開始位置(low)>終了位置(high)となった時にbreak文で終了するような処理を入れれば良いので次のようになります。

In [None]:
target = 5
print(f"探索値: {target}")
list_source = [4, 18, -1, 21, 26, 13, 6, -5, 9, 20]
list_sorted = sorted(list_source)
print(f"探索リスト: {list_sorted}")

# 初期の探索範囲の設定
low = 0
high = len(list_sorted) - 1
mid = (low + high)//2
print(f"low: {low}, high: {high}, mid: {mid}")

while True:
    if low > high: # 終了条件
        print("探索値は見つかりませんでした")
        break
    if list_sorted[mid] == target:  # 中央位置の値と探索値が等しい
        print(f"インデックス{mid}に探索値{target}が存在しています")
        break
    elif list_sorted[mid] > target: # 中央位置の値の方が探索値より大きい
        print(f"中央位置の値({list_sorted[mid]})の方が探索値({target})より大きいです")
        high = mid-1
        mid = (low + high)//2
        print(f"新しい探索範囲 low: {low}, high: {high}, mid: {mid}")
    else:                            # 中央位置の値の方が探索値より小さい
        print(f"中央位置の値({list_sorted[mid]})の方が探索値({target})より小さいです")
        low = mid+1
        mid = (low + high)//2
        print(f"新しい探索範囲 low: {low}, high: {high}, mid: {mid}")