# 第11回 アルゴリズム入門：データの探索

___
[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/tsuboshun/begin-python/blob/gh-pages/_sources/workbook/lecture11.ipynb)

___

## この授業で学ぶこと

準備中

## 探索とは

データの集合の中から、特定の条件に適合する要素を見つけることを **探索** という。
このテキストでは、次の問題に限定して考える： 整数のリストと整数のキーが与えられるとき、リストの中にキーと一致する要素が存在するかを判定し、存在するときはそのインデックスを1つ求める。

このアルゴリズムを関数として実装しよう。
リストとキーを引数として受け取り、リストの中にキーが存在すればそのインデックスを返し、存在しなければ `None` を返す関数を作成する。

例えば、次のリストとキーのペアに対しては、インデックスの3を返す。

<pre>
data = [5, 1, 3, 7, 2]
key = 7
</pre>

次のリストとキーのペアに対しては、`None` を返す。
<pre>
data = [5, 1, 3, 7, 2]
key = 4
</pre>

探索は使用頻度の高い基本的な操作なので、数多くのアルゴリズムが考案されている。
今回はその中から代表的な線形探索と二分探索を紹介する。

なお、探索プログラムはリストの `index()` メソッドを使えば、次のように実装することができる。
ここではアルゴリズムの学習のため、`index()` メソッドには頼らずに、1からプログラムを作成することを考える。

In [None]:
def search(data, key):
    if key in data:
        return data.index(key)
    else:
        return None

In [None]:
data = [5, 1, 3, 7, 2]
key = 7
print(search(data, key))

data = [5, 1, 3, 7, 2]
key = 4
print(search(data, key))

## 線形探索

線形探索は、前から順に探すという単純なアルゴリズムである。
実装としては、for文により前から要素を1つずつ調べていき、キーに一致する要素を見つけたところでそのインデックスをreturn文で返す。
最後までキーに一致する要素が見つからなかった場合は、`None` をreturn文で返す。

以下に、未完成の `linear_search()` 関数を用意した。練習として、プログラムを完成させてみてほしい。

In [None]:
def linear_search(data, key):
    for i in range(len(data)):
            pass   # ここを書き換える
    return None

In [None]:
data = [5, 1, 3, 7, 2]
key = 7
print(linear_search(data, key))

data = [5, 1, 3, 7, 2]
key = 4
print(linear_search(data, key))

線形探索の計算量は、リストの要素数を $N$ として、最悪も平均も $O(N)$ である。
最悪の場合は、キーと一致する要素がリストの最後にあるか、存在しない場合である。
このときfor文の処理を $N$ 回繰り返すことになるので、最悪計算量は $O(N)$ となる。
平均的な場合は、for文の処理を $N/2$ 回繰り返すことになる。
計算量を表す際には、定数は無視されるため、平均計算量も $O(N)$ となる。

$O(N)$ は計算量として十分小さいので、実用上はこれで十分なことが多い。
ちなみに、リストの `index()` メソッドも線形探索を実装したものとなっている。

## 二分探索

In [None]:
def binary_search(data, key):
    left = 0
    right = len(data) - 1
    while left <= right:
        mid = (left + right) // 2
        if data[mid] == key:
            return mid
        elif data[mid] > key:
            right = mid-1
        else:
            left = mid+1
    return None

In [None]:
import time

def exec_time(func, data, key):
    start = time.time()
    func(data, key)
    end = time.time()
    return end - start