In [1]:
def merge_arrays(left, right=[]):
    res = []
    i, j = 0, 0
    n, m = len(left), len(right)
    # どちらかの配列を調べ尽くしたらそこで終了
    while i < n and j < m:
        if left[i] < right[j]:
            res.append(left[i])
            i += 1
        else:
            res.append(right[j])
            j += 1
    # 残りはそのまま後ろに連結する。
    return res + left[i:] + right[j:]

In [2]:
def step(array):
    res = []
    for i in range(0, len(array), 2):
        # 長さ2もしくは1の配列がスライスの結果として返る。
        res.append(merge_arrays(*array[i:i+2]))
    return res

In [3]:
import random
random.seed(4)
my_array = [random.randint(0, 100) for i in range(15)]
my_array = [[v] for v in my_array]
step1 = step(my_array)
step1

[[30, 38], [13, 92], [50, 61], [11, 19], [2, 8], [51, 70], [37, 97], [7]]

In [4]:
step2 = step(step1)
step2

[[13, 30, 38, 92], [11, 19, 50, 61], [2, 8, 51, 70], [7, 37, 97]]

In [5]:
step3 = step(step2)
step4 = step(step3)
step4

[[2, 7, 8, 11, 13, 19, 30, 37, 38, 50, 51, 61, 70, 92, 97]]

In [6]:
def merge_sort(array):
    # すべての数をリストに変換する
    res = [[v] for v in array]
    while len(res[0]) != len(array):
        res = step(res)
    # リストの中にリストが入ってしまうのでこれを取り出す
    return res[0]

In [7]:
my_array = [random.randint(0,100) for i in range(15)]
my_array

[28, 66, 68, 46, 35, 99, 22, 13, 33, 27, 3, 82, 33, 34, 24]

In [8]:
merge_sort(my_array)

[3, 13, 22, 24, 27, 28, 33, 33, 34, 35, 46, 66, 68, 82, 99]

In [9]:
def merge_sort(array):
    if len(array) <= 1:
        return array
    mid_idx = len(array) // 2
    left = array[:mid_idx]
    right = array[mid_idx:]
    return merge_arrays(merge_sort(left), merge_sort(right))

In [10]:
def quick_sort(array):
    # 空の配列はそのまま返す
    if not array:
        return array
    # 最後の要素をpivotにする。
    p = array[-1]
    left = []
    right = []
    pivots = []
    # pivotとの関係で要素を分割する
    for v in array:
        if v < p:
            left.append(v)
        elif v == p:
            pivots.append(v)
        else:
            right.append(v)
    # 左と右は再び関数を適用して返す。
    return quick_sort(left) + pivots + quick_sort(right)

In [11]:
my_array = [random.randint(0, 100) for i in range(15)]
my_array

[21, 39, 37, 80, 93, 47, 11, 77, 43, 85, 49, 64, 31, 22, 31]

In [12]:
quick_sort(my_array)

[11, 21, 22, 31, 31, 37, 39, 43, 47, 49, 64, 77, 80, 85, 93]

In [13]:
sample_data = []
for i in range(100):
    sample_data.append([random.randint(0, 5000) for i in range(2000)])

In [14]:
import time

def performance_check(method, data, num=3):
    s = time.time()
    for i in range(num):
        for v in data: method(v)
    e = time.time()
    return e - s

In [15]:
performance_check(merge_sort, sample_data)

2.5252842903137207

In [16]:
performance_check(quick_sort, sample_data)

1.3420770168304443

In [17]:
sorted_data = []
for i in range(100):
    sorted_data.append(sorted([random.randint(0, 5000) for i in range(2000)]))

In [18]:
performance_check(merge_sort, sorted_data)

1.789849042892456

In [19]:
performance_check(quick_sort, sorted_data)

63.00237321853638

In [20]:
def quick_sort(array):
    if array == []:
        return array
    p = random.choice(array)  # 変更点はここだけ。
    left = []
    right = []
    pivots = []
    for v in array:
        if v < p:
            left.append(v)
        elif v == p:
            pivots.append(v)
        else:
            right.append(v)
    # 左と右は再び関数を適用して返す。
    return quick_sort(left) + pivots + quick_sort(right)

In [21]:
performance_check(quick_sort, sorted_data)

1.9804668426513672

# 練習問題解答

## 4.1 

二分木では、高さが1つ増えると枝を2つ分けて伸ばすことができる。つまり、高さが$k$となる木には、$2^{k}$枚の葉を作ることができる。うまくイメージできない場合は、高さが2や3の時を図示してみるとよいだろう。

## 4.2

この章で作ったコードのうち、ソートされた配列同士をマージする部分だけを変えればよい。

In [23]:
from heapq import merge

def merge_sort(array):
    if len(array) <= 1:
        return array
    mid_idx = len(array) // 2
    left = array[:mid_idx]
    right = array[mid_idx:]
    return merge(merge_sort(left), merge_sort(right))

簡単なリストで実行するとわかるが、これまでのようにリストが戻り値にならない。

In [24]:
merge_sort([2, 3, 1])

<generator object merge at 0x10f290048>

組み込み関数listを使えばリストに変換できる。また、for文などで利用する場合は、このままinの後に書くことができる。

In [25]:
list(merge_sort([2, 3, 1]))

[1, 2, 3]

In [26]:
for v in merge_sort([2, 3, 1]):
    print(v)

1
2
3


ここで紹介したmerge関数と同じように、rangeやmap、reversedなどが戻り値としてリストそのものを返さない利点はメモリ効率にある。これらの関数の戻り値が巨大な場合は、当初からメモリを確保してしまうより、必要となったときに次々に値を返す方が余計なメモリを使わなく済むからだ。

## 4.3

いろいろな方法を考えることができる。実直に確認するには、次のようなコードを考えることができるだろう。

In [27]:
def is_sorted(array):
    n = len(array)
    if n == 0:
        return True
    for i in range(1, n):
        if array[i-1] > array[i]:
            return False
    return True

In [28]:
is_sorted([1, 2, 3, 3, 4])

True

In [29]:
is_sorted([1, 2, 5, 3, 4])

False

リスト内包表記を使ってコードを短くすることもできる。

In [30]:
def is_sorted(array):
    temp = [array[i] <= array[i+1] for i in range(len(array)-1)]
    return all(temp)

In [31]:
is_sorted([1, 2, 3, 3, 4])

True

In [32]:
is_sorted([1, 2, 5, 3, 4])

False

組み込み関数sortedを使った大胆な方法もあり得る。

In [33]:
def is_sorted(array):
    return sorted(array) == array

In [34]:
is_sorted([1, 2, 3, 3, 4])

True

In [35]:
is_sorted([1, 2, 5, 3, 4])

False

## 4.4

まず、rand_strを実装する。

In [36]:
import random

def rand_str(n):
    alphabet = 'abcdefghijklmnopqrstuvwxyz'
    res = random.sample(alphabet, n)
    return ''.join(res)

1〜10までの長さで、このような文字列を20個作り、リストにする。

In [37]:
rand_str_list = [rand_str(random.randint(1, 10)) for i in range(20)]

In [38]:
rand_str_list

['c',
 'xbw',
 'iucdw',
 'vtr',
 'wxhipt',
 'mxby',
 'gaqxc',
 'eihdvtwrg',
 'ygdw',
 'lgb',
 'vr',
 'yk',
 'xedmki',
 'jzldanocyq',
 'bk',
 'u',
 's',
 'odfxpc',
 'zhxstqblu',
 'bzcjhkm']

普通にソートすると、辞書順にならぶ。

In [39]:
sorted(rand_str_list)

['bk',
 'bzcjhkm',
 'c',
 'eihdvtwrg',
 'gaqxc',
 'iucdw',
 'jzldanocyq',
 'lgb',
 'mxby',
 'odfxpc',
 's',
 'u',
 'vr',
 'vtr',
 'wxhipt',
 'xbw',
 'xedmki',
 'ygdw',
 'yk',
 'zhxstqblu']

次のようにすると文字列の長さでソートすることができる。

In [40]:
sorted(rand_str_list, key=lambda x: len(x))

['c',
 'u',
 's',
 'vr',
 'yk',
 'bk',
 'xbw',
 'vtr',
 'lgb',
 'mxby',
 'ygdw',
 'iucdw',
 'gaqxc',
 'wxhipt',
 'xedmki',
 'odfxpc',
 'bzcjhkm',
 'eihdvtwrg',
 'zhxstqblu',
 'jzldanocyq']

keyの引数に渡した関数は、ソートする前に各要素に対して実行される。ここでは、各要素の長さがlen関数によって計算されるので、短いものから長いものへと文字列が並び替えられる。