# 教養としてのアルゴリズムとデータ構造

FIFOキューやスタックを実現できるデータ型 `deque` （デック）について説明します。

参考

- https://docs.python.org/ja/3/library/collections.html#collections.deque

なお、このノートを読まなくても課題を解くのに影響はありません。

# `deque` 

FIFOキューは配列の様な順序付けられたデータを格納するデータ構造において、データを格納する場合は一方の端からデータを挿入し、データを取り出すときは他方の端から取り出すデータ構造になっていました。また、スタックはデータの挿入・取り出しを同じ端からのみ行うデータ構造になっていました。

それらFIFOキューやスタックを一般化し、挿入・取り出しがどちらの端からでも可能であるデータ構造が**デック**（dequeue, double-ended queue の略）と呼ばれるデータ構造です。

Pythonではその様なデックやFIFOキュー、スタックを実装する場合、モジュール `collections` で定義されるデータ型 **`deque`** を使うと便利です。

`deque` も「デック」と発音され、こちらも double-ended queue の略です。`deque` は値を順序付けて管理するデータ構造でリストによく似ています。後で紹介する様に `deque` のメソッドには、リストと同じ名称・同じ機能を持つものが多く存在します。ですので、リストの扱いに慣れていれば直感的には `deque` は使い易いでしょう。

また、デックは double-ended queue の名が示す様に挿入・取り出しがどちらの端からでも可能ですので、リストでは $O(1)$ の計算量で実行できなかった先頭の要素の取り出しや先頭への要素の追加を（ほぼ？） $O(1)$ の計算量で実行することが可能です。

以下では `deque` の基本的な使い方を紹介します。

ではまず `collections` モジュールをインポートします。

In [None]:
import collections

## `deque` オブジェクトの作成

`deque` を使うには、まず `deque` オブジェクトを作成する必要があります。やり方は一般のオブジェクトの作成と同じです。

例えば、`deq1` を `deque` オブジェクトとするには、次の様にします。

---
```Python
deq1 = collections.deque()
```
---

実際に実行してみましょう。

In [None]:
deq1 = collections.deque()

データ型を確認します。

In [None]:
type(deq1)

コンストラクタは引数としてイテラブルを取ることが出来ます。

In [None]:
deq1 = collections.deque([10, 20, 30])
print(deq1)

## `deque` の基本操作

以下では、`deuque` の基本的な使い方を紹介します。

### 要素の参照

`deque` に格納されている値は、リスト同様、インデックスを用いて参照することが出来ます。


In [None]:
deq1 = collections.deque([10, 20, 30])
print(deq1[0])
print(deq1[1])
print(deq1[2])

In [None]:
deq1[0] + deq1[2]

### 要素の数

`deuque` の要素数を調べるには **`len`** 関数を使います。

In [None]:
deq1 = collections.deque([10, 20, 30])
print(len(deq1))


### 最後尾に要素を追加する

最後尾に要素を追加するには **`append`** メソッドを使います。

例えば、`deq1` が `deque` オブジェクトである場合、次の様にします。

---
```Python
deq1.append(追加する値) 
```
---

実際に実行してみましょう。

In [None]:
deq1 = collections.deque()
deq1.append(10)
print(deq1)

更に `append` を実行すると先に入れた値の後ろに要素が追加されます。

In [None]:
deq1.append(20)
deq1.append(30)
print(deq1)

リスト同様、様々なデータを格納することが可能です。

In [None]:
deq2 = collections.deque()
deq2.append(["a", "b", "c"])
deq2.append((-1, -2))
deq2.append("xyz")
deq2.append({"A": 100})
print(deq2)

### 先頭に要素を追加する

先頭に要素を追加するには、**`appendleft`** メソッドを使います。

例えば、`deq1` が `deque` オブジェクトである場合、次の様にします。

---
```Python
deq1.appendleft(追加する値) 
```
---


In [None]:
deq1 = collections.deque([10,20,30])
deq1.appendleft(40)
print(deq1)

### 最後尾から要素を取り出す

最後尾から要素を取り出すには **`pop`** メソッドを使います。

例えば、`deq1` が `deque` オブジェクトである場合、次の様にします。

---
```Python
deq1.pop() 
```
---

返り値が最後尾から取り出した要素になります。

In [None]:
deq1 = collections.deque([10,20,30])
a1 = deq1.pop()
print("popで取り出した値:", a1, ", dequeの中身:", deq1)

In [None]:
a1 = deq1.pop()
print("popで取り出した値:", a1, ", dequeの中身:", deq1)

In [None]:
a1 = deq1.pop()
print("popで取り出した値:", a1, ", dequeの中身:", deq1)

要素が存在しない場合はエラーが出るので注意して下さい。

In [None]:
deq1.pop()

リストの `pop` の様に引数を取ることは出来ません。

In [None]:
deq1 = collections.deque([10,20,30])
a1 = deq1.pop(1)

### 先頭から要素を取り出す

先頭から要素を取り出すには **`popleft`** メソッドを使います。

例えば、`deq1` が `deque` オブジェクトである場合、次の様にします。

---
```Python
deq1.popleft() 
```
---

返り値が取り出した要素になります。

In [None]:
deq1 = collections.deque([10,20,30])
a1 = deq1.popleft()
print("popleftで取り出した値:", a1, ", dequeの中身:", deq1)

要素が存在しない場合、やはりエラーが出るので注意して下さい。

In [None]:
a1 = deq1.popleft()
print("popleftで取り出した値:", a1, ", dequeの中身:", deq1)
a1 = deq1.popleft()
print("popleftで取り出した値:", a1, ", dequeの中身:", deq1)
deq1.popleft()

## `queue` モジュール

`deque` とは関係ありませんが、Pythonには `queue` モジュールと呼ばれるモジュールも存在します。

これを使うとやはりFIFOキューやスタックが実現可能ですが、この授業ではお勧めしません（使わないで下さい）が、簡単に紹介しておきます。

参考

- https://docs.python.org/ja/3/library/queue.html

In [None]:
import queue

FIFOキューを利用したい場合は、`Queue()` オブジェクトを作成します。

In [None]:
que1 = queue.Queue()

要素を最後尾に追加するには `put` メソッドを用います。

In [None]:
que1.put(10)

In [None]:
que1.put(20)

In [None]:
que1.put(30)

要素を（FIFOキューなので先頭から）取り出すには `get` メソッドを使います。なお、キューが空のときに `get` を実行し、かつ `timeout` という値として正数を指定しない（もしくは、何も指定しない）場合、ずっと実行中になるので注意して下さい（カーネルのリスタートが必要になります）。

In [None]:
que1.get(timeout=0.1)

In [None]:
que1.get(timeout=0.1)

In [None]:
que1.get(timeout=0.1)

In [None]:
que1.get(timeout=0.1)

スタックを利用したい場合は、`LifoQueue()` オブジェクトを作成します。

In [None]:
stk1 = queue.LifoQueue()

要素を（最後尾に）追加するには `put` メソッドを用います。

In [None]:
stk1.put(10)

In [None]:
stk1.put(20)

In [None]:
stk1.put(30)

要素を（最後尾から）取り出すには `get` メソッドを使います。やはり `timeout` を正数に指定しておきます。

In [None]:
stk1.get(timeout=0.1)

In [None]:
stk1.get(timeout=0.1)

In [None]:
stk1.get(timeout=0.1)

In [None]:
stk1.get(timeout=0.1)

## 速さの比較

リストとの速さを比較してみます。

まず最後尾への要素の追加にかかる時間を比較してみます。`size` 個の要素を追加してみます。

In [None]:
size = 100000

In [None]:
%%timeit -r 10 -n 10
list1 = []
for _ in range(size):
    list1.append(True)

In [None]:
%%timeit -r 10 -n 10
deq1 = collections.deque()
for _ in range(size):
    deq1.append(True)

In [None]:
%%timeit -r 10 -n 10
que1 = queue.Queue()
for _ in range(size):
    que1.put(True)

`deque` がリストより多少高速である様です。

可視化してみます。

In [None]:
%matplotlib inline
import random, time, matplotlib.pyplot as plt, collections
#時間を計測する関数
def getSearchTimes_ListVsDeque(list_func, unitnum, unitsize):
    #list_x1, list_ysを初期化
    list_x1 = [];list_ys = []
    for i in range(unitnum):
        size1 = (i+1) * unitsize
        #list_x1の値を格納
        list_x1.append(size1)
        # list_ysに格納する各探索結果を格納するリスト
        list_y1 = []
        for func1 in list_func:
            time_init = time.time()
            func1(size1)
            list_y1.append(time.time() - time_init)
        list_ys.append(list_y1)
    return list_x1, list_ys
#結果（計測した時間）を描画
def drawResultTimes_ListVsDeque(list_x, list_ys, list_f, listnum):
    list_searchname = ["deque", "list"]
    list_color = ["lightskyblue", "orange"]
    #plt.figure(figsize=(20, 10))
    for i in range(len(list_ys[0])):
        if list_f[i] is False:
            continue
        list_y = []
        for j in range(listnum):
            list_y.append(list_ys[j][i])
        plt.plot(list_x, list_y, color=list_color[i], label=list_searchname[i]) 
    plt.legend();
def list_tailinsert(size):
    list1 = []
    for i in range(size):
        list1.append(True)
def deque_tailinsert(size):
    deq1 = collections.deque()
    for i in range(size):
        deq1.append(True)
#各挿入の時間を計測する
unitnum1 = 10; unitsize1 = 700000 #繰り返し回数と一回当たりの挿入総数を設定
list_func = [deque_tailinsert, list_tailinsert]
list_x1, list_ys1 = getSearchTimes_ListVsDeque(list_func, unitnum1, unitsize1) #時間を計測する
drawResultTimes_ListVsDeque(list_x1, list_ys1, [True]*2, unitnum1) #結果（計測した時間）を描画

次に先頭への要素の追加を比較してみます。非常に時間がかかりますので、`size` の値を小さくします。

In [None]:
size = 10000

In [None]:
%%timeit -r 10 -n 10
list1 = []
for i in range(size):
    list1.insert(0, True)

In [None]:
%%timeit -r 10 -n 10
deq1 = collections.deque()
for i in range(size):
    deq1.appendleft(True)

こちらは `deque` が非常に高速であることが分かります。

こちらも可視化してみます。

In [None]:
def list_topinsert(size):
    list1 = []
    for i in range(size):
        list1.insert(0, True)
def deque_topinsert(size):
    deq1 = collections.deque()
    for i in range(size):
        deq1.appendleft(True)
#各挿入の時間を計測する
unitnum1 = 10; unitsize1 = 10000 #繰り返し回数と一回当たりの挿入総数を設定
list_func = [deque_topinsert, list_topinsert]
list_x1, list_ys1 = getSearchTimes_ListVsDeque(list_func, unitnum1, unitsize1) #時間を計測する
drawResultTimes_ListVsDeque(list_x1, list_ys1, [True]*2, unitnum1) #結果（計測した時間）を描画

要素の最後尾からの取り出しを比較します。

In [None]:
size = 100000

In [None]:
%%timeit -r 10 -n 10
list1 = [True] * size
for _ in range(size):
    list1.pop()

In [None]:
%%timeit -r 10 -n 10
deq1 = collections.deque([True] * size)
for _ in range(size):
    deq1.pop()

In [None]:
def list_tailpop(size):
    list1 = [True] * size
    for _ in range(size):
        list1.pop()
def deque_tailpop(size):
    deq1 = collections.deque([True] * size)
    for _ in range(size):
        deq1.pop()
#各取り出しの時間を計測する
unitnum1 = 10; unitsize1 = 1000000 #繰り返し回数と一回当たりの取り出し総数を設定
list_func = [deque_tailpop, list_tailpop]
list_x1, list_ys1 = getSearchTimes_ListVsDeque(list_func, unitnum1, unitsize1) #時間を計測する
drawResultTimes_ListVsDeque(list_x1, list_ys1, [True]*2, unitnum1) #結果（計測した時間）を描画

要素の先頭からの取り出しを比較します。やはり非常に時間がかかりますので、`size` を小さくします。

In [None]:
size = 10000

In [None]:
%%timeit -r 10 -n 10
list1 = [True] * size
for _ in range(size):
    list1.pop(0)

In [None]:
%%timeit -r 10 -n 10
deq1 = collections.deque([True] * size)
for _ in range(size):
    deq1.popleft()

In [None]:
#各取り出しの時間を計測する
unitnum1 = 10; unitsize1 = 10000 #繰り返し回数と一回当たりの取り出し総数を設定
list_func = [deque_toppop, list_toppop]
list_x1, list_ys1 = getSearchTimes_ListVsDeque(list_func, unitnum1, unitsize1) #時間を計測する
drawResultTimes_ListVsDeque(list_x1, list_ys1, [True]*2, unitnum1) #結果（計測した時間）を描画

最後に、使用するおおよそのメモリの大きさを比較しておきます。

In [None]:
import sys
size = 10000
list1 = [True] * size
deq1 = collections.deque([True] * size)
print("リスト：", sys.getsizeof(list1), ", deque：", sys.getsizeof(deq1))