マージソート

2つのソートされた配列を1つのソートされた配列にまとめながらソートを実行．

計算量はO(nlogn)

In [None]:
'''
2つのソート済み配列を統合する関数
left, rightはソート済みの2配列．配列1つでも動作するようrightのデフォルト値を設定している．
'''
def merge_arrays(left, right=[]):
  res = []
  i, j = 0, 0
  n, m = len(left), len(right)
  #どちらかの配列を調べ尽くしたらそこで終了
  while i < n and j < m:
    if left[i] <= right[j]:
      res.append(left[i])
      i += 1
    else:
      res.append(right[j])
      j += 1
  #片方が終了したら(どちらかがfalseになる)残りはソート済みなので，そのまま後ろに連結
  return res + left[i:] + right[j:]

In [None]:
'''
配列を分割してmerge_arraysに渡す関数
'''
def step(array):
  res = []
  for i in range(0, len(array), 2):
    res.append(merge_arrays(*array[i:i+2]))
  return res

In [None]:
#マージソート
def merge_sort(array):
  res = [[v] for v in array]
  while len(res[0]) != len(array):
    res = step(res)
  return res[0]

In [None]:
#各関数の動作確認
import random
random.seed(4)
test_array = [random.randint(0, 100) for i in range(15)]
test_array2 = [[v] for v in test_array]
print(test_array2)

#1回目のマージ
step1 = step(test_array2)
#先頭から2つずつソートされてまとめられている
print(step1)

#2回目のマージ
step2 = step(step1)
print(step2)

#3回目のマージ
step3 = step(step2)
print(step3)

#4回目のマージ
step4 = step(step3)
print(step4)

#merge_sortの動作確認
print("----------")
print(merge_sort(test_array))

[[30], [38], [13], [92], [50], [61], [19], [11], [8], [2], [51], [70], [37], [97], [7]]
[[30, 38], [13, 92], [50, 61], [11, 19], [2, 8], [51, 70], [37, 97], [7]]
[[13, 30, 38, 92], [11, 19, 50, 61], [2, 8, 51, 70], [7, 37, 97]]
[[11, 13, 19, 30, 38, 50, 61, 92], [2, 7, 8, 37, 51, 70, 97]]
[[2, 7, 8, 11, 13, 19, 30, 37, 38, 50, 51, 61, 70, 92, 97]]
----------
[2, 7, 8, 11, 13, 19, 30, 37, 38, 50, 51, 61, 70, 92, 97]


In [None]:
#再帰を使ったmerge sort
def merge_sort2(array):
  if len(array) <= 1:
    return array
  mid_idx = len(array) // 2
  left = array[:mid_idx]
  right = array[mid_idx:]
  return merge_arrays(merge_sort2(left), merge_sort2(right))

print(merge_sort2(test_array))

[2, 7, 8, 11, 13, 19, 30, 37, 38, 50, 51, 61, 70, 92, 97]


クイックソート

配列からpivotを1つ選び，その値より大きいか小さいかで配列を分割する．その分割した配列をさらにクイックソートしていく．

計算量はO(nlogn)

クイックソートの弱点：入力される配列がすでにソートされている場合，パフォーマンスが悪くなる．

In [5]:
def quick_sort(array):
  #空の配列はそのまま返す
  if array == []:
    return array
  #最後の配列はpivotにする
  p = array[-1]
  
  #pivotをランダムに選ぶ場合
  p = random.choice(array)
  left = []
  right = []
  pivots = []

  #pivotより大きいか小さいかで配列を分割
  for v in array:
    if v < p:
      left.append(v)
    elif v == p:
      pivots.append(v)
    else:
      right.append(v)
  
  #leftとrightの配列は再びquick_sortして返す
  return quick_sort(left) + pivots + quick_sort(right)
  

In [4]:
import random
#各関数の動作確認

test_array3 = [random.randint(0, 100) for i in range(15)]
print(test_array3)
print(quick_sort(test_array3))

[9, 27, 29, 12, 57, 38, 16, 54, 55, 23, 44, 64, 6, 88, 55]
[6, 9, 12, 16, 23, 27, 29, 38, 44, 54, 55, 55, 57, 64, 88]
