# 1年情報基礎 - アルゴリズム - 

アルゴリズムとは、ある特定の問題を解くための計算手順のことを言います。データ解析で様々な課題に取り組む際は、その課題を細分化して、解決を目指します。細分化するときには既存のアルゴリズムを活用できるように細分化できると、より効率的にプログラミングができます。
ここでは、いくつかの有名なアルゴリズムを紹介します。

## 線形探索（linear search）

「探索」という名前の通り、探したいデータを探索するアルゴリズムです。線形探索では、リストの先頭から順番にたどっていき、探索値（探したい値）と比較することで、探索します。

線形探索のアルゴリズムは次のようになります。

<img src="https://raw.githubusercontent.com/masudakoji/jouhou-kiso-2022/main/images/Algorithm_LinearSearch/ss1.png" width="60%">

リストの要素と探索値を順番に比較していることがわかります。

### 問題定義

今回は次のような問題を考えることとしましょう。

In [None]:
lista = [4, 5, 1, -2, 7, 9, -4, 0, 7, 1, 3]
target = 7

listaが、探索対象のリスト、targetが探索値です。

### 存在だけを確認したい場合

for文を使えば、リストに含まれる要素を先頭からたどっていけます。

In [None]:
for item in lista:
    if item == target:
        print("探索値{}が存在しています".format(target))

for文を使うことで`lista`の要素が、ループを回すごとに順番に`item`に収納されていきます。  
1周目のループでは`item`に4が収納され、  
2周目のループでは`item`に5が収納され、  
3周目のループでは`item`に1が収納され、  
となります。そして、`item`と探索値`target`を比較し、一致していれば（探索値を発見すれば）出力していることがわかります。

なお、printでf-文字列機能を使うと次のようにも書けます。

In [None]:
for item in lista:
    if item == target:
        print(f"探索値{target}が存在しています")

### インデックス番号を得たい場合

線形探索では、リストのインデックス番号を返すのが一般的です。この場合、調べたいリストと同じ長さで、[0, 1, 2, 3]のように0から始まるリストを作成し、順番にたどっていけばよいです。

リストの長さはlen()関数を使えば得られます。  
[0, 1, 2, 3]のように0から始まるリストはrange()関数を使えば得られます。  
これを利用すると次のように書けます。

In [None]:
for idx in range(len(lista)):
    if lista[idx] == target:
        print(f"インデックス{idx}に探索値{target}が存在しています")

### インデックス番号を得たい場合（enumerateを使う）

len()、range()を使う方法以外に、enumerate()を使う方法もあります。

enumerate()の括弧の中にリストを代入し、for文を書くと、インデックス番号と要素を同時に得られることを利用すると次のように書けます。

In [None]:
for idx, item in enumerate(lista):
    if item == target:
        print(f"インデックス{idx}に探索値{target}が存在しています")

インデックス番号が`idx`に、要素が`item`に収納されていくので、毎ループごとに、要素`item`と探索値`target`を比較しています。

### 探索値を見つけた時点で終了したい場合

これまでの例では、探索したいリストの最後まで探索していましたが、探索値を見つけた時点で終了したい場合、break文を使えばfor文の途中で抜けることが出来ます。

★ break文については、While文の資料（Control_Flow_WhileLoops）で説明しています。

In [None]:
for idx, item in enumerate(lista):
    if item == target:
        print(f"インデックス{idx}に探索値{target}が存在しています")
        break

インデックス4で探索値を発見したので、それ以降の探索は行われていないことがわかります。