# アルゴリズムとデータ構造（第1回の復習）

## プログラムの機能と構造
* プログラムは与えられた入力を処理して，何らかの出力を行う
* プログラムの例
>* 消費税計算: 入力が「税抜き金額」で出力が「消費税」
>* 画像のサイズ変更: 入力が「元の画像」で出力が「サイズ変更後の画像」
* プログラムを作成する際に考えること
>* 与えられたデータをどのように保管するか？ ⇒ **データ構造**
>* それをどのように処理するか？ ⇒ **アルゴリズム**

> <img src='./fig/program_input-output.jpg' width='450'>

## データ構造
* データは入出力だけではない ⇒ プログラム内部で一時的に保持するデータも考慮する必要がある
* データは複数ある ⇒ 入出力が複数の場合もある
* データの形式や大きさなどによって適切なデータ構造は異なる
>* 消費税計算のプログラムであれば，入出力は整数データ
>* 商品名を扱う場合は，文字データも扱えるようにする必要がある
>* 複数商品の平均金額を計算する場合は，小数データも扱えないとダメ
* 扱うデータの種類によって表現方法，範囲，格納方法等の異なるデータ構造を用意する必要がある
* 主なデータ構造の種類： 配列，連結リスト，スタック，キュー，木構造，グラフ

## アルゴリズム
* ソースコードを書く前に，問題解決のための処理手順などを考えておく必要がある
* 問題を解決するための一連の処理手順をアルゴリズムと呼ぶ
* アルゴリズムはプログラミング言語に依存しない
* 同じ問題解決に対して，様々なアルゴリズムが存在する
* 問題によってはアルゴリズムによって処理効率が大きく変わる
* したがって，やみくもにアルゴリズムを考えるのは望ましくない
* ある条件の時に誤った結果を出してしまったり，無駄な処理が含まれてしまったりする⇒悪いアルゴリズム
* 悪いアルゴリズムに従って書かれたソースコードは，当然悪いプログラムになる
* 多くのよいアルゴリズムを理解し，身に着けておけば，様々な場面で活用でき，最低限の労力でよいプログラムが作成できるようになる
* アルゴリズムの要件：誰がやっても同じ結果になる
* つまり，誰でもそのアルゴリズムに従って問題を解いたときに，正しく同じ結果を導くことができる
* この要件を満たすためには，誰がみても同じ理解となるように，アルゴリズムを表現する必要がある ⇒ フローチャートなどの利用


## アルゴリズムとデータ構造
* プログラムでは様々なデータが処理されるがメモリの容量には限りがある ⇒ 格納できるデータの大きさには限度がある
* 限られたコンピュータ資源を有効活用するためには，適切なデータ構造を選択し，それにあったアルゴリズムを用いる必要がある
* データ構造が変更されるとアルゴリズムの変更も余儀なくされる ⇒ アルゴリズムはデータ構造に左右される
  
**アルゴリズム＋データ構造＝プログラム**
* ニクラウス・ヴィルト (Niklaus Wirth）が残した言葉
* Pascalというプログラミング言語を設計したスイスの計算機科学者


# ユークリッドの互除法
* 「ユークリッドの互除法」は最大公約数を**効率的に**求めるための有名なアルゴリズム
* 2つの正の整数`a`と`b`に共通する約数（公約数）の中で最大のものを最大公約数と呼ぶ
* 例: 9と6の最大公約数
>* 9の約数 ⇒ 1, 3, 9 
>* 6の約数 ⇒ 1, 2, 3, 6 
>* よって，9と6の最大公約数は3となる
* このアルゴリズムにおいて，入力は2つの正の整数`a`と`b`，出力はAとBの最大公約数となる

## 最大公約数を求める単純なアルゴリズム
* ここで，整数`a`と整数`b`に対して，`a` > `b` が成り立っているものとする
* このアルゴリズムをフローチャートで表すと下図のようになる
>* 整数`a`と`b`を入力する
>* `a`と``b`を`i = 1～b`まで順番にそれぞれ割っていく
>* 余りがどちらも0の場合には`result`に割った数`i`を代入する
>* `b`まで計算が終わった時点で`result`に格納されている値が最大公約数となる

> <img src='./fig/gcd_naive_algorithm.jpg' width='250'>


In [None]:
def gcd_naive(a, b):
    for i in range(1, b+1):
        if (a % i == 0) and (b % i == 0):
            result = i
    return result

integer1 = 9
integer2 = 6

result = gcd_naive(integer1, integer2)
print(f'{integer1}と{integer2}の最大公約数: {result}')

*  上記コード例では，9と6を1～6まで順番に割っていき，余りがどちらも0の場合には`result`に割った数を代入する
*  計算と代入の処理の流れ:
>* 9 ÷ 1 = 9 余り 0，6 ÷ 1 = 6 余り 0 ⇒ `result = 1`
>* 9 ÷ 2 = 4 余り 1，6 ÷ 2 = 3 余り 0
>* 9 ÷ 3 = 3 余り 0，6 ÷ 3 = 2 余り 0 ⇒ `result = 3`
>* 9 ÷ 4 = 2 余り 1，6 ÷ 4 = 1 余り 2
>* 9 ÷ 5 = 1 余り 4，6 ÷ 5 = 1 余り 1
>* 9 ÷ 6 = 1 余り 3，6 ÷ 6 = 1 余り 0
* 最終的に`result`に格納されている3が最大公約数となる
*  この例の場合，余りの計算を12回実行していることになる
*  次のコードで，余りの計算（`%`の演算）回数を数えてみる
*  具体的には回数をカウントするための変数`cnt`を定義する
*  余りの計算は，`if`文の条件式の評価のときに2回行っているので，`if`文の直前で変数`cnt`の値に2を足している
*  変数`cnt`を使わなくても，`b * 2`で求めることもできる

In [None]:
def gcd_naive_with_counter(a, b):
    cnt = 0
    for i in range(1, b+1):
        cnt += 2
        if (a % i == 0) and (b % i == 0):
            result = i
    return (cnt, result)

integer1 = 9
integer2 = 6

result, times = gcd_naive_with_counter(integer1, integer2)
print(f'単純なアルゴリズムにおける余りの計算回数: {result}')
print(f'{integer1}と{integer2}の最大公約数: {times}')

## ユークリッドの互除法
* 単純なアルゴリズムでは，b × 2回の余りの計算が必要 ⇒ 効率的ではない
* ユークリッドの互除法は，単純なアルゴリズムよりも余りの計算回数を少なくできる効率的なアルゴリズムとなる

**ユークリッドの互除法のアルゴリズム（下図）**
* 2つの整数を変数`a`と`b`にそれぞれ代入（ただし，`a` > `b` > 0とする）
* `b`が0でない（`b != 0`）間，以下の繰り返し処理を行う:
>* `b`を`a`，`a`を`b`で割った余りを変数`b`に代入 ⇒ `a, b = b, a % b`
* `a`を最大公約数として出力（アルゴリズム終了）

> <img src='./fig/Euclidean_Algorithm.jpg' width='200'>

## ユークリッドの互除法の実装
* 次のコードは，ユークリッドの互除法を実装したコードとなる
* このコードでは，ユークリッドの互除法を関数「`gcd`」として定義している

**【`gcd`関数の処理】**
*  呼び出し側から2つの整数（実引数）を受け取り，仮引数`a`と`b`に代入する（ただし，`a`, `b` > 0 とする）
*  `a < b` であれば，`a`と`b`の値を入れ替える
*  `b`が0でない（`b != 0`）間，以下を繰り返す:
>*  `a, b = b, a % b` : `b`と`a % b`を`a`と`b`にそれぞれ代入
*  `a`を返す

In [None]:
def gcd(a, b):
    if a < b:
        a, b = b, a
    while b != 0:
        a, b = b, a % b
    return a

integer1 = 9
integer2 = 6

result = gcd(integer1, integer2)
print(f'{integer1}と{integer2}の最大公約数: {result}')

*  上記コード例における，計算と代入の処理の流れ:
>* `b`≠0 ⇒ 9 ÷ 6 = 1 余り 3 ⇒ `a, b = 6, 3`
>* `b`≠0 ⇒ 6 ÷ 3 = 2 余り 0 ⇒ `a, b = 3, 0`
>* `b`=0 ⇒ 繰り返し終了
* 最終的に`a`に格納されている3が最大公約数となる
*  この例において，単純なアルゴリズムでは12回の余りの計算が必要であったのに対して，ユークリッドの互除法では2回の余りの計算でよい
*  `gcd_naive_with_counter`関数と同様にして，余りの計算（`%`の演算）回数をカウントするための変数`cnt`を定義することで，ユークリッドの互除法（`gcd`関数）の余りの計算回数を求めることができる
*  具体的には，`gcd_naive_with_counter`関数と同様に`cnt`を定義したうえで，`while`ブロック内の`a % b`の演算を行うコードの直前に`cnt += 1`と記述すればよい

In [None]:
def gcd_with_counter(a, b):
    cnt = 0
    if a < b:
        a, b = b, a
    while b != 0:
        a, b = b, a % b
        cnt += 1
    return (cnt, a)

integer1 = 9
integer2 = 6

result, times = gcd_with_counter(integer1, integer2)
print(f'ユークリッドの互除法における余りの計算回数: {result}')
print(f'{integer1}と{integer2}の最大公約数: {times}')

# 探索アルゴリズム
*  探索とは，複数の要素の中から，目的の要素を探す処理を指す
*  探索対象の要素は，複数の要素をまとめて管理できるデータ構造（リストやディクショナリなどのデータ型）で取り扱う
*  例えば，下図ような数値データを要素として格納している配列があって，この中から特定の数値があるかを探す処理が探索となる
*  探索は非常に単純な処理ではあるが，この処理をコンピュータで実現する場合には，アルゴリズムを必要となる
*  探索の代表的なアルゴリズムには，線形探索法，二分探索法，ハッシュ法などがある
*  本講義では，線形探索法と二分探索法のアルゴリズムについて学習する
*  探索アルゴリズムは，数あるアルゴリズムの中でも，基本的で，かつ単純なものであるが，アルゴリズムの本質を理解する上では非常に重要なものといえる


> <img src="./fig/12_search.png" width="600">


## 線形探索アルゴリズム
*  線形探索アルゴリズム（Linear Search）は，データ構造内の要素を先頭から順番に1つずつ確認し，目的の要素を見つける単純な探索手法
*  リストなどに対して使われ，目的の要素が見つかるまで，先頭から末尾まで逐次比較（照合）していく
*  シンプルで理解しやすいアルゴリズムであるが，探索効率は他のアルゴリズムに比べて低いため，使いどころを考える必要がある

### 線形探索アルゴリズムの手順
**アルゴリズムの流れ**
*  探索対象の要素をリストとして与える
*  目的の要素（探索したい要素）を与える
*  探索対象のリストの先頭の要素と目的の要素が一致するか比較
*  一致すればその要素の位置（インデックス）を返し，一致しなければ次の要素と一致するか比較
*  すべての要素を確認し終えても見つからなければ「見つからない」こと表す「-1」を返す
  

**具体的な変数を入れたフローチャート**  

<img src="./fig/12_linear_search_flow.png" width="300">

*  このアルゴリズムの探索回数（比較回数）は，i+1回となる（下図左）
*  探索対象に目的の要素が存在する場合と存在しない場合のイメージ例を下図に示す（下図中央・右）

> <img src="./fig/12_linear_search_example.png" width="800">

### 線形探索アルゴリズムの実装例1
*  以下のコードは探索の過程がわかるように，各回の照合データ等を表示している．  
*  4, 5, 9, 11行目を除いたコードが，上のフローチャートのアルゴリズムに対応する．

In [None]:
data = [6, 5, 9, 2, 4, 1] # data = 探索対象
value = 2 # value = 目的の要素

print(f'データ全体 data: {data}')
print(f'探索するデータ: {value}\n')

result = -1
for i in range(len(data)): # 繰り返し処理
    print(f'照合データ: {data[i]}')
    if data[i] == value:
        print('HIT!\n')
        result = i
        break

# 結果を出力
if result != -1:
    print(f'探索データ{value}はdata[{result}]にあります．')
else:
    print(f'\n探索データ{value}は存在しません．')

### 線形探索アルゴリズムの実装例2: 関数として実装
*  線形探索アルゴリズムを関数「`linear_search`」として定義する
*  `linear_search`関数には，探索対象のリスト（`data`）と探索する値（`value`）の2つを引数として渡す（仮引数と実引数の名前はともに同じとした）  
*  処理内容は上のコードと同じ

In [None]:
def linear_search(data, value):
    for i in range(len(data)):
        print(f'照合データ: {data[i]}')
        if data[i] == value:
            print('HIT!\n')
            return i
    return -1

data = [6, 5, 9, 2, 4, 1]
value = 2

print(f'データ全体 data: {data}')
print(f'探索するデータ: {value}\n')

result = linear_search(data, value)
if result != -1:
    print(f'探索データ{value}はdata[{result}]にあります．')
else:
    print(f'\n探索データ{value}は存在しません．')

### 線形探索アルゴリズムの実装例3: 探索（照合）回数もカウント
*  さらに，`linear_search`関数を改良して，インデックスと探索回数（比較回数）の2つの値を戻り値とする関数「`linear_search2`」を定義する

In [None]:
def linear_search2(data, value):
    cnt = 0
    for i in range(len(data)):
        print(f'照合データ: {data[i]}')
        cnt += 1
        if data[i] == value:
            print('HIT!\n')
            return (i, cnt)
    return (-1, cnt)

data = [6, 5, 9, 2, 4, 1]
value = 2

print(f'データ全体 data: {data}')
print(f'探索するデータ: {value}\n')

result, times = linear_search2(data, value)
if result != -1:
    print(f'探索データ{value}はdata[{result}]にあります．')
    print(f'探索回数は{times}回です．')
else:
    print(f'\n探索データ{value}は存在しません．')
    print(f'探索回数は{times}回です．')

* 上のコードでは探索回数をカウントするための変数`cnt`を使っているが，この変数を導入しなくても，`for`文内の変数`i`を利用すれば探索回数を求めることができる

In [None]:
def linear_search3(data, value):
    for i in range(len(data)):
        print(f'照合データ: {data[i]}')
        if data[i] == value:
            print('HIT!\n')
            return (i, i + 1)
    return (-1, i + 1)

data = [6, 5, 9, 2, 4, 1]
value = 2

print(f'データ全体 data: {data}')
print(f'探索するデータ: {value}\n')

result, times = linear_search3(data, value)
if result != -1:
    print(f'探索データ{value}はdata[{result}]にあります．')
    print(f'探索回数は{times}回です．')
else:
    print(f'\n探索データ{value}は存在しません．')
    print(f'探索回数は{times}回です．')

### 線形探索アルゴリズムの特徴
*  探索対象の要素がソートされていない場合でも使える
*  探索対象の要素数が多いと効率が悪くなる
*  そのため，要素数がが多い場合は他の探索アルゴリズム（例えば二分探索など）が推奨される

## 二分探索アルゴリズム
*  二分探索アルゴリズム（Binary Search）は，ソートされたリストに対して効率的に目的の要素を探すアルゴリズム
*  このアルゴリズムはリストを半分ずつに分割しながら探索を進める

### 二分探索アルゴリズムの手順
**アルゴリズムの流れ**
*  探索対象の要素をリストとして与える
*  ただし，リストがソートされていることを前提する
*  目的の要素（探索したい要素）を与える
*  探索する範囲の中央にある要素と目的の要素を比較
>*  目的の要素が中央の要素より小さい場合: 探索範囲を左半分に絞り込む
>*  目的の要素が中央の要素より大きい場合: 探索範囲を右半分に絞り込む。
*  絞り込んだ範囲で再び中央の要素と比較し，同様の処理を繰り返す
*  探索範囲が1つの要素になるまで繰り返し，目的の要素が見つかればそのインデックスを返す
*  見つからなければ「見つからない」こと表す「-1」を出力
  
**二分探索の動作例**
例: ソートされたリスト`[1, 2, 4, 5, 6, 9]`に対して，目的の要素が2の場合:
*  リストの中央の要素4を比較

> <img src="./fig/binary_search_example1.jpg" width="400">

*  目的の要素2は4より大きいので，次は左側`[1, 2]`を探索
*  新たな中央の要素1と目的の要素を比較

> <img src="./fig/binary_search_example2.jpg" width="280">

*  目的の要素2は1より大きいので右側`[2]`を探索
*  新たな中央の要素2と目的の要素を比較
*  目的の要素2と一致するので，インデックス1を返す

> <img src="./fig/binary_search_example3.jpg" width="380">

*  合計探索回数（比較回数）は 3回

**具体的な変数を入れたフローチャート**  
*  `h`は探索する範囲（分割したリスト）の先頭（head）のインデックス
*  `t`は探索する範囲（分割したリスト）の末尾（tail）のインデックス
*  `m`は中央（middle）の要素のインデックス

<img src="./fig/12_binary_search_flow.png" width="800">


### 二分探索アルゴリズムの実装例1
*  以下のコードは探索の過程がわかるように，各回の照合データ等を表示している 
*  4, 5, 13, 15行目を除いたコードが，上のフローチャートのアルゴリズムに対応する
*  `m`のセット: `(h + t) // 2` ※小数切り捨て
>*  探索範囲の要素数が偶数の場合は，中央の2つの要素のうちインデックスが小さいほうを中央の要素とする
*  `h`の再セット: `h = m + 1`
>*  中央の要素より大きい場合は右側を探索 ⇒ 先頭のインデクスが変わる
*  `t`の再セット: `t = m - 1`
>*  中央の要素より小さい場合は左側を探索 ⇒ 末尾のインデクスが変わる


In [None]:
data = [1, 2, 4, 5, 6, 9] # data = 探索対象
value = 2 # value = 目的の要素

print(f'データ全体 data: {data}')
print(f'探索するデータ: {value}\n')

result = -1
# ここから「二分探索」
h = 0
t = len(data) - 1
while h <= t:
    m = (h + t) // 2
    print(f'照合データ: {data[m]}')
    if data[m] == value:
        print('HIT!\n')
        result = m
        break
    elif data[m] < value:
        h = m + 1
    else:
        t = m - 1
# ここまでが「二分探索」

# 結果を出力
if result != -1:
    print(f'探索データ{value}はdata[{result}]にあります．')
else:
    print(f'\n探索データ{value}は存在しません．')

### 二分探索アルゴリズムの実装例2: 関数として実装
*  二分探索アルゴリズムを関数「`binary_search`」として定義する
*  `binary_search`関数には，探索対象のリスト（`data`）と探索する値（`value`）の2つを引数として渡す（仮引数と実引数の名前はともに同じとした）
*  処理内容は上のコードと同じ

In [None]:
def binary_search(data, value):
    h = 0
    t = len(data) - 1
    while h <= t:
        m = (h + t) // 2
        print(f'照合データ: {data[m]}')
        if data[m] == value:
            print('HIT!\n')
            return m
        elif data[m] < value:
            h = m + 1
        else:
            t = m - 1
    return -1

data = [1, 2, 4, 5, 6, 9]
value = 2

print(f'データ全体 data: {data}')
print(f'探索するデータ: {value}\n')

result = binary_search(data, value)
if result != -1:
    print(f'探索データ{value}はdata[{result}]にあります．')
else:
    print(f'\n探索データ{value}は存在しません．')

### 二分探索アルゴリズムの実装例3: 探索（照合）回数もカウント
*  さらに，`binary_search`関数を改良して，インデックスと探索回数（比較回数）の2つの値を戻り値とする関数「`binary_search2`」を定義することもできる
*  具体的には，最大公約数を求めるアルゴリズムのコードと同様に，回数をカウントするための変数（カウンタ変数）を定義すればよい
*  比較回数を数えるので，比較を行う直前で，カウンタ変数の値を1増やす処理を行えばよい

In [None]:
def binary_search2(data, value):
    cnt = 0
    h = 0
    t = len(data) - 1
    while h <= t:
        cnt += 1
        m = (h + t) // 2
        print(f'照合データ: {data[m]}')
        if data[m] == value:
            print('HIT!\n')
            return (m, cnt)
        elif data[m] < value:
            h = m + 1
        else:
            t = m - 1
    return (-1, cnt)

data = [1, 2, 4, 5, 6, 9]
value = 2

print(f'データ全体 data: {data}')
print(f'探索するデータ: {value}\n')

result, times = binary_search2(data, value)
if result != -1:
    print(f'探索データ{value}はdata[{result}]にあります．')
    print(f'探索回数は{times}回です．')
else:
    print(f'\n探索データ{value}は存在しません．')
    print(f'探索回数は{times}回です．')

### 二分探索アルゴリズムの特徴
*  ほとんどの場合において，線形探索アルゴリズムよりも効率的
*  探索対象の要素数が多いときに高速に動作する
*  ただし，リストがソートされていないと使えない

# ソートアルゴリズム

## ソートとは
* データを小さい順（昇順）または大きい順（降順）に整列させることをソートと呼ぶ
* 代表的なソートアルゴリズム: 選択ソート，バブルソート，挿入ソート，クイックソート，シェルソート，マージソートなど
* 本講義では，選択ソート，バブルソート，及びクイックソートについて学習する

> <img src="./fig/sort.jpg" width="520">

## 選択ソート


### 選択ソートアルゴリズムの手順
**アルゴリズムの流れ**
*  対象とするデータの中から最小値（もしくは最大値）を見つけて，先頭のデータと交換する ⇒ これを繰返し実行する
  

**選択ソートの動作例**
例: リスト`A = [6, 5, 9, 2, 4]`を昇順にソートする場合:
*  5つの要素から最小の要素を探す
*  合計4回の比較で最小値 2 が見つかる
*  最小値の 2 とリストの先頭の要素 6 を入れ替える ⇒ 先頭の要素`A[0]`が確定する

> <img src="./fig/selectsort_example1.jpg" width="540">

*  まだ確定していない4つの要素`A[1:]`の中から最小の要素を探す
*  合計3回の比較で最小値 4 が見つかる
*  最小値の 4 とリストの2番目の要素 5 を入れ替える ⇒ `A[:1]`まで確定する

> <img src="./fig/selectsort_example2.jpg" width="550">

*  まだ確定していない3つの要素`A[2:]`の中から最小の要素を探す
*  合計2回の比較で最小値 5 が見つかる
*  最小値の 5 とリストの3番目の要素 9 を入れ替える ⇒ `A[:2]`まで確定する

> <img src="./fig/selectsort_example3.jpg" width="550">

*  まだ確定していない2つの要素`A[3:]`の中から最小の要素を探す
*  合計1回の比較で最小値 6 が見つかる
*  最小値の 6 とリストの4番目の要素 6 を入れ替える（つまり何もしない） ⇒ ソート完了
*  合計比較回数（探索回数）は 10回

> <img src="./fig/selectsort_example4.jpg" width="550">

**選択ソートの合計比較回数**  
* ソートするデータ数（リストの要素数）を$n$とする
* 合計比較回数:
$(n+1) + (n+2) + \cdots + 1 = \frac{n \times (n-1)}{2}$



**選択ソートのフローチャート**  
*  入力: ソート対象のリスト`data`

> <img src="./fig/selectsort_flow.jpg" width="380">


### 選択ソートアルゴリズムの実装例1: 関数として実装
*  ソート対象のリストを引数とした`select_sort`関数を定義する
*  `select_sort`関数はソート後のリストを戻り値としている

In [None]:
def select_sort(data):
    n = len(data)
    for i in range(0, n-1):
        m = i
        for j in range(i+1, n):
            if data[j] < data[m]:
                m = j
        data[i], data[m] = data[m], data[i]
    return data

a = [6, 5, 9, 2, 4]
print(f'ソート前のデータ: {a}')
result = select_sort(a)
print(f'ソート後のデータ: {result}')

### 選択ソートアルゴリズムの実装例2: 合計比較回数もカウント
*  ソート対象のリストを引数とした`select_sort2`関数を定義する
*  `select_sort2`関数はソート後のリストに加えて，合計比較回数も戻り値としている

In [None]:
def select_sort2(data):
    n = len(data)
    cnt = 0
    for i in range(0, n-1):
        m = i
        for j in range(i+1, n):
            cnt = cnt + 1
            if data[j] < data[m]:
                m = j
        data[i], data[m] = data[m], data[i]
    return (data, cnt)

a = [6, 5, 9, 2, 4]
print(f'ソート前のデータ: {a}')
result, times = select_sort2(a)
print(f'ソート後のデータ: {result}')
print(f'合計比較回数: {times}')

## バブルソート


### バブルソートアルゴリズムの手順
**アルゴリズムの流れ**
*  隣り合った2つの要素を比較し，要素を入れ替えていく
  
**バブルソートの動作例**
例: リスト`A = [6, 5, 9, 2, 4]`を昇順にソートする場合:
*  リストの末尾の2つである`A[3]`と`A[4]`を比較し，`A[4]`のほうが小さければ，2つの要素を入れ替える
*  `A[3]`である 2より`A[4]`である 4ほうが大きい ⇒ 入替なし

> <img src="./fig/bubblesort_example1.jpg" width="540">

*  同様の比較を左にシフトしながら順に行う
*  `A[2]`と`A[3]`の比較 ⇒ 入替発生

> <img src="./fig/bubblesort_example2.jpg" width="540">

*  `A[1]`と`A[2]`の比較 ⇒ 入替発生

> <img src="./fig/bubblesort_example3.jpg" width="540">

*  `A[0]`と`A[1]`の比較 ⇒ 入替発生

> <img src="./fig/bubblesort_example4.jpg" width="540">

*  この時点で最小値が`A[0]`に格納されることになる
*  ここまでの合計比較回数は 4回となる
*  `A[0]`が確定したので，`A[1:]`に対して同様の比較・入替を行い，`A[1]`を確定する

> <img src="./fig/bubblesort_example5.jpg" width="250">

*  ここまでの合計比較回数は 4+3=7回となる
*  同様にして，`A[2:]`に対して同様の比較・入替を行い，`A[2]`を確定する

> <img src="./fig/bubblesort_example6.jpg" width="250">

*  ここまでの合計比較回数は 4+3+2=9回となる
*  同様にして，`A[3:]`に対して同様の比較・入替を行い，`A[3]`を確定する

> <img src="./fig/bubblesort_example7.jpg" width="250">

*  リストは`A[4]`までなので，この時点でソートが完了する
*  よって，合計比較回数は 4+3+2+1=10回となる

**バブルソートの合計比較回数**  
* ソートするデータ数（リストの要素数）を$n$とする
* 合計比較回数:
$(n+1) + (n+2) + \cdots + 1 = \frac{n \times (n-1)}{2}$


**バブルソートのフローチャート**  
*  入力: ソート対象のリスト`data`

> <img src="./fig/bubblesort_flow.jpg" width="380">


### バブルソートアルゴリズムの実装例1: 関数として実装
*  ソート対象のリストを引数とした`bubble_sort`関数を定義する
*  `bubble_sort`関数はソート後のリストを戻り値としている

In [None]:
def bubble_sort(data):
    n = len(data)
    for i in range(0, n-1):
        for j in range(n-1, i, -1):
            if data[j-1] > data[j]:
                data[j], data[j-1] = data[j-1], data[j]
    return data

a = [6, 5, 9, 2, 4]
print(f'ソート前のデータ: {a}')
result = bubble_sort(a)
print(f'ソート後のデータ: {result}')

### バブルソートアルゴリズムの実装例2: 合計比較回数もカウント
*  ソート対象のリストを引数とした`bubble_sort2`関数を定義する
*  `bubble_sort2`関数はソート後のリストに加えて，合計比較回数も戻り値としている

In [None]:
def bubble_sort2(data):
    n = len(data)
    cnt = 0
    for i in range(0, n-1):
        for j in range(n-1, i, -1):
            cnt = cnt + 1
            if data[j-1] > data[j]:
                data[j], data[j-1] = data[j-1], data[j]
    return (data, cnt)

a = [6, 5, 9, 2, 4]
print(f'ソート前のデータ: {a}')
result, times = bubble_sort2(a)
print(f'ソート後のデータ: {result}')
print(f'比較回数: {times}')

## クイックソート
* クイックソートは，選択ソートやバブルソートよりも高速に（少ない比較回数で）ソートできる実用的なソートアルゴリズムである
* ただし，データの並び方によっては高速にならないこともあり得るが，多くの場合には高速なソートができる

### クイックソートアルゴリズムの手順
**アルゴリズムの流れ**
*  基準となるデータ（これをピボットと呼ぶ）を選ぶ
*  ピボットの値より小さいか，大きいかでデータを2つのグループに分割
*  分割したグループ内で同じことを繰り返す

  
**クイックソートの動作例**
例: リスト`A = [6, 5, 9, 2, 4]`を昇順にソートする場合:
*  ピボットを決める（ここでは右端である`A[4]`をピボットとした）

> <img src="./fig/quicksort_example1.jpg" width="350">

* ピボットの値と各要素を比較し，ピボット以下とそれより大きい要素に分割
* この分割に必要な比較回数: 4回

> <img src="./fig/quicksort_example2.jpg" width="460">

* 左側のグループの要素が1個なので，この時点で 2が最小値であることが確定する
* さらに，ピボットであった 4 の位置も確定する
* 同様の操作を分割した要素のグループごとに行い（確定しているグループは除く），すべての要素の位置が確定するまで繰り返す

> <img src="./fig/quicksort_example3.jpg" width="460">

* よって，合計比較回数は7回となる
* クイックソートの合計比較回数は，ソート前のリストの配置によって異なる

### クイックソートアルゴリズムの実装例1: 再帰関数として実装
*  ソート対象のリストを引数とした`quick_sort`関数を**再帰関数**として定義する
*  `quick_sort`関数はソート後のリストを戻り値としている

**`quick_sort`関数のイメージ: リスト`A = [6, 5, 9, 2, 4]`を昇順にソートする場合**
* 引数からピボットを取り出す
* ピボットを基準に小さいデータ（left）と大きいデータ（right）に分割 ⇒ これらを引数として関数を再帰的に呼び出す
* 引数のデータ数が1, または0のときは関数を呼び出さない（引数そのものを戻り値として返す）

> <img src="./fig/quicksort_recursion.jpg" width="750">


# 実習
上記の`quick_sort`関数を実装したコードを作成しなさい．

**`quick_sort`関数の概要**
* 2～3行目: 2つの空のリスト`left_set`と`right_set`を作成
* 5～6行目: 引数であるリスト`data`の要素数が0 or 1であれば，既に整列済みなので，引数をそのまま返す
* 8行目: リストの末尾をピボットとして取り出す
>* ピボットを変数`pivot`に格納
>* 残りの要素（ピボット以外）を`data`に格納
* 10～14行目: ピボット以外の各要素`data[i]`とピボット`pivot`を比較して`left_set`と`right_set`に分割
>* `for`文で繰り返す`i`の範囲は`0`～`len(data)-1`（`data`のインデックスに対応）
>* `data[i]`が`pivot`以下（`data[i] <= pivot`）であれば，リスト`left_set`に追加
>* そうでなければ，リスト`right_set`に追加
* 16～17行目: 分割した`left_set`と`right_set`を引数として，それぞれ再帰的に`quick_sort`関数を呼び出す
>* 戻り値は整列済みのリストとして返ってくる
>* 戻り値は元の引数に対応する変数にそれぞれ格納する
* 19行目: 整列済みの`left_set`, `pivot`, `right_set`を連結し，戻り値として呼び出し元に返す
>* リストの連結は`+`演算子を使う
>* `pivot`はリストではないので，`[pivot]`として連結する

**＜要件＞**
*  すでに入力されているコードは削除・変更しない
*  「# ここにコードを記述」のある行にだけコードを追加で記述する
*  コメントはすべて削除する
  
**実行結果**
```
ソート前のデータ: [6, 5, 9, 2, 4]
ソート後のデータ: [2, 4, 5, 6, 9]
```

In [None]:
def quick_sort(data):
    left_set = []
    right_set = []

    if len(data) <= 1:
        return # ここにコードを記述

    pivot = data.pop()

    for i in range(len(data)):
        if # ここにコードを記述
            left_set.append(data[i])
        else:
            right_set.append(data[i])

    left_set = # ここにコードを記述
    right_set = # ここにコードを記述

    return # ここにコードを記述

a =  [6, 5, 9, 2, 4]
print(f'ソート前のデータ: {a}')
result = quick_sort(a.copy())
print(f'ソート後のデータ: {result}')

# 参考資料
*  廣瀬豪, Pythonで学ぶアルゴリズムの教科書, インプレス, 2021
*  柴田淳, みんなのPython 第4版, SBクリエイティブ, 2016
*  廣瀬豪, Pythonで作って学べる　ゲームのアルゴリズム入門 Kindle版, ソーテック社, 2021
*  Eric Matthes (著), 鈴木たかのり, 安田善一郎 (翻訳), 最短距離でゼロからしっかり学ぶPython入門 必修編, 技術評論社, 2020
*  増井敏克, Pythonではじめるアルゴリズム入門 伝統的なアルゴリズムで学ぶ定石と計算量 Kindle版, 翔泳社, 2020



