## `collections` --- コンテナデータ型
`collections`モジュールでよく使われるのは、`Counter`オブジェクトです。  
リストの要素をカウントしてくれたり、ユニークな要素の数をカウントしてくれたり、なかなか重宝します。  
要素を辞書のキーとして保存し、そのカウントを辞書の値として保存する、といったものになります。  
  
その他、`ChainMap`オブジェクトや`OrderedDict`オブジェクトなど、要所要所で使えるかな？レベルのものもあります。  
"すごく使える"という感じではないので(処理速度が上がる、とか)、紹介程度にとどめます。

### `collections.Counter`

In [2]:
import collections

In [4]:
# 基本的な使い方
c = collections.Counter()

In [5]:
from collections import Counter

In [6]:
# 空のオブジェクト
c = Counter()

In [7]:
c = Counter({'red': 4, 'blue': 2})

In [8]:
c = Counter(cats=4, dogs=8)

#### `elements()`, `most_common()`, `subtract()`が使えます

In [9]:
c = Counter(a=4, b=2, c=0, d=-2)

In [10]:
c.elements()

<itertools.chain at 0x105528410>

In [11]:
sorted(c.elements())

['a', 'a', 'a', 'a', 'b', 'b']

In [12]:
c.most_common()

[('a', 4), ('b', 2), ('c', 0), ('d', -2)]

In [13]:
Counter('abracadabra').most_common(3)

[('a', 5), ('b', 2), ('r', 2)]

**`substrust`２つの`Counter`オブジェクトのうち、一方の要素をもとに引き算してくれます**

In [14]:
c = Counter(a=4, b=2, c=0, d=-2)

In [15]:
d = Counter(a=1, b=2, c=3, d=4)

In [16]:
c.subtract(d)

In [17]:
c

Counter({'a': 3, 'b': 0, 'c': -3, 'd': -6})

Counter オブジェクトを組み合わせて多重集合 (1 以上のカウントをもつカウンタ) を作るために、  
いくつかの数学演算が提供されています。  
足し算と引き算は、対応する要素を足したり引いたりすることによってカウンタを組み合わせます。  
積集合と和集合は、対応するカウントの最大値と最小値を返します。  
それぞれの演算はカウントに符号がついた入力を受け付けますが、カウントが 0 以下である結果は出力から除かれます。

In [18]:
c = Counter(a=3, b=1)

In [19]:
d = Counter(a=1, b=2)

In [20]:
c

Counter({'a': 3, 'b': 1})

In [21]:
d

Counter({'a': 1, 'b': 2})

In [22]:
c - d 

Counter({'a': 2})

In [23]:
c + d

Counter({'a': 4, 'b': 3})

In [24]:
c & d

Counter({'a': 1, 'b': 1})

In [25]:
c | d

Counter({'a': 3, 'b': 2})

### `deque`オブジェクト
  
**`append(x)`**  
`x` を `deque` の右側につけ加えるメソッド  
  
**`appendleft(x)`**  
`x` を `deque` の左側につけ加えるメソッド  
  
**`clear()`**  
`deque` からすべての要素を削除し、長さを 0 にするメソッド  
  
**`copy()`**
`deque` のコピーを作成するメソッド  
  
**`count(x)`**  
`deque` の `x` に等しい要素を数え上げるメソッド  
  
**`extend(iterable)`**  
イテラブルな引数 `iterable` から得られる要素を `deque` の右側に追加し拡張するメソッド  
  
**`extendleft(iterable)`**  
イテラブルな引数 `iterable` から得られる要素を `deque` の左側に追加し拡張するメソッド  
  
**`index(x[, start[, stop]])`**  
`deque` 内の `x` の位置を返すメソッド。最初に一致したものを返すか、見つからない場合には `ValueError` を返します。
  
**`insert(i, x)`**  
`x` を `deque` の位置 `i` に挿入するメソッド  
長さに制限のある `deque` の長さが `maxlen` を超える場合、`IndexError` を返します。

**`pop()`**  
`deque` の右側から要素をひとつ削除し、その要素を返すメソッド。要素がひとつも存在しない場合は `IndexError` を返します。  
  
**`popleft()`**  
`deque` の左側から要素をひとつ削除し、その要素を返すメソッド。要素がひとつも存在しない場合は `IndexError` を返します。
  
**`remove(value)`**  
`value` の最初に現れるものを削除するメソッド。要素が見付からないない場合は `ValueError` を返します。  
  
**`reverse()`**  
`deque` の要素を反転して内部反映させて、`None` を返すメソッド。  

In [26]:
from collections import deque

In [30]:
d = deque('bcdefghijk')

In [31]:
d

deque(['b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k'])

In [32]:
for elem in d:
    print(elem.upper())

B
C
D
E
F
G
H
I
J
K


In [33]:
# 要素の追加(右に追加される)
d.append('l') 

In [34]:
# 要素の追加(左に追加する)
d.appendleft('a')

In [35]:
d

deque(['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l'])

In [36]:
# 最後の要素を削除する
d.pop()

'l'

In [37]:
# 最初の要素を削除する
d.popleft()

'a'

In [38]:
d

deque(['b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k'])

In [39]:
list(d)

['b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k']

In [40]:
# 反転させる
list(reversed(d))

['k', 'j', 'i', 'h', 'g', 'f', 'e', 'd', 'c', 'b']

#### `Counter`を使いたくなるモチベーション１例
いろいろな場面がありつつも、やはり簡単に"頻度"が見れるのが、便利かなと思います。

In [41]:
### データ１例
import random

In [42]:
list_sample = []
for name in ['りんご','バナナ','みかん','なし','トマト','きゅうり','なす']:
    for num in range(random.randint(5,100)):
        list_sample.append(name)

In [44]:
list_sample[0:10]

['りんご', 'りんご', 'りんご', 'りんご', 'りんご', 'りんご', 'りんご', 'りんご', 'りんご', 'りんご']

In [45]:
list_sample[150:160]

['なし', 'なし', 'なし', 'なし', 'なし', 'なし', 'なし', 'なし', 'なし', 'なし']

In [46]:
len(list_sample)

344

In [48]:
c_sample = Counter(list_sample)

In [50]:
c_sample.most_common()

[('なし', 97),
 ('みかん', 65),
 ('きゅうり', 59),
 ('なす', 43),
 ('トマト', 42),
 ('バナナ', 25),
 ('りんご', 13)]

### `defaultdict`オブジェクト
新しい辞書型を用意するためのオブジェクト

In [51]:
s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]

In [52]:
from collections import defaultdict

In [53]:
d = defaultdict(list)

**リスト型を与えること(指定すること)で、キー=値のペアをリストから辞書へ簡単にグループ化できます**

In [54]:
for k, v in s:
    d[k].append(v)

In [55]:
sorted(d.items())

[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]

**整数型 にすると、 `defaultdict` を要素の数え上げに便利に使うことができます**

In [56]:
s = 'mississippi'

In [57]:
d = defaultdict(int)

In [58]:
for k in s:
    d[k] += 1

In [59]:
sorted(d.items())

[('i', 4), ('m', 1), ('p', 2), ('s', 4)]

### `OrderedDict`オブジェクト
バージョン3.6までの、Pythonの辞書（`dict`型オブジェクト）は、要素の順番を考慮はしてくれない(なかったはず...)。  
※Pythonのバージョンによって異なりますが、3.7以降は順番を考慮する仕様になっています  
  
そのような背景があって、
標準ライブラリの`collections`モジュールに順番が保持された辞書として`OrderedDict`が用意されています。  
**3.7以降、順序付き辞書の重要性は薄れました**

In [60]:
from collections import OrderedDict

In [61]:
d = OrderedDict.fromkeys('abcde')

In [62]:
d.move_to_end('b')

In [63]:
''.join(d.keys())

'acdeb'

In [64]:
d.move_to_end('b', last=False)

In [65]:
''.join(d.keys())

'bacde'

`move_to_end(key, last=True)`によって、
既存の `key` を順序付き辞書の両端に移動します。  
項目は、 `last` が真 (デフォルト) なら右端に、 `last` が偽なら最初に移動されます。 `key` が存在しなければ `KeyError` を返します

### `ChainMap` オブジェクト
複数の辞書を一つにまとめる方法として、このオブジェクトが用意されています。  
新しい辞書を作成して `update()` を繰り返すよりも早い(らしい)です。

In [66]:
from collections import ChainMap

In [67]:
baseline = {'music': 'bach', 'art': 'rembrandt'}

In [68]:
adjustments = {'art': 'van gogh', 'opera': 'carmen'}

In [69]:
list(ChainMap(adjustments, baseline))

['music', 'art', 'opera']

In [70]:
# `update`を用いると...
combined = baseline.copy()

In [71]:
combined.update(adjustments)

In [72]:
list(combined)

['music', 'art', 'opera']

In [73]:
### 本当に早いか検証
import time

In [74]:
def time_measure(f, lst):
    time_lst = []
    for i in range(10000):
        t1 = time.time()
        result = f(lst)
        t2 = time.time()
        time_lst.append(t2-t1)
    return result, sum(time_lst)/10000

In [77]:
# 100の長さでマッピング
def main():
    f1 = lambda dicts:{k: v for dic in dicts for k, v in dic.items()}
    f2 = lambda dicts:ChainMap(*dicts)

    d1 = dict(zip(range(100), range(100)))
    d2 = dict(zip("猫", "犬"))
    d3 = dict(zip(range(100), "大好き"*100))

    result, time = time_measure(f1, [d1, d2, d3])
    print("辞書内包処理の結合における処理時間", time)
    f = lambda _:[(k,v) for k,v in result.items()]
    _, time = time_measure(f, None)
    print("辞書内包処理、items()を実行した時の処理時間", time)
    f = lambda _:result["猫"]
    _, time = time_measure(f, None)
    print("辞書内包処理、キーを探索した時の処理時間", time)
    result, time = time_measure(f2, [d1, d2, d3])
    print("ChainMapを用いた結合における処理時間", time)
    f = lambda _:[(k,v) for k,v in result.items()]
    _, time = time_measure(f, None)
    print("ChainMapを用いた、items()を実行した時の処理時間", time)
    f = lambda _:result["猫"]
    _, time = time_measure(f, None)
    print("ChainMap、キーを探索した時の処理時間", time)

In [78]:
if __name__ == "__main__":
    main()

辞書内包処理の結合における処理時間 2.0047783851623535e-05
辞書内包処理、items()を実行した時の処理時間 1.096644401550293e-05
辞書内包処理、キーを探索した時の処理時間 5.285739898681641e-07
ChainMapを用いた結合における処理時間 1.6100883483886718e-06
ChainMapを用いた、items()を実行した時の処理時間 0.00010436348915100097
ChainMap、キーを探索した時の処理時間 1.4759540557861328e-06


In [79]:
# 辞書内包処理 / ChainMap 結合
2.0047783851623535e-05 / 1.6100883483886718e-06

12.451356394005806

In [80]:
# 辞書内包処理 / ChainMap items()
1.096644401550293e-05 / 0.00010436348915100097

0.10507931561808796

In [81]:
# 辞書内包処理 / ChainMap キーを探索
5.285739898681641e-07 / 1.4759540557861328e-06

0.3581236067586341

**辞書型を直接使ってあげたほうが...良さそう。特に、キーを探索するときは。。。**

## `calendar` --- 一般的な使い方

In [82]:
import calendar

In [83]:
print(calendar.month(2021, 7))

     July 2021
Mo Tu We Th Fr Sa Su
          1  2  3  4
 5  6  7  8  9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31



**デフォルトは月曜を始点としていますが、日曜を始点にする場合は...**

In [84]:
calendar.setfirstweekday(calendar.SUNDAY)

In [85]:
print(calendar.month(2021, 7))

     July 2021
Su Mo Tu We Th Fr Sa
             1  2  3
 4  5  6  7  8  9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31



**`calendar`モジュールには、主に以下のクラスがあります。**    
**`Calendar`, `TextCalendar`,`HTMLCalendar`,`LocaleTextCalendar`,`LocaleHTMLCalendar`**  

In [86]:
from calendar import TextCalendar

In [88]:
txt_calendar = TextCalendar(firstweekday=6)

In [89]:
print(txt_calendar.formatmonth(2021, 4))

     April 2021
Su Mo Tu We Th Fr Sa
             1  2  3
 4  5  6  7  8  9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30



In [91]:
from calendar import LocaleTextCalendar

In [92]:
# 日本語表記は...
loc_txt_calendar = LocaleTextCalendar(firstweekday=6, locale="ja_JP.UTF-8")

In [94]:
print(loc_txt_calendar.formatmonth(2021, 7))

      7月 2021
日  月  火  水  木  金  土
             1  2  3
 4  5  6  7  8  9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31



In [95]:
from calendar import Calendar

In [96]:
# `iterweekdays()` 曜日の数字を一週間分生成します
calendar_sample = Calendar()

In [97]:
list(calendar_sample.iterweekdays())

[0, 1, 2, 3, 4, 5, 6]

In [98]:
# `itermonthdates(year, month)` year 年 month (1–12) 月に対するイテレータを返します
calendar_sample = Calendar(firstweekday=6)

In [99]:
list(calendar_sample.itermonthdates(2021, 7))

[datetime.date(2021, 6, 27),
 datetime.date(2021, 6, 28),
 datetime.date(2021, 6, 29),
 datetime.date(2021, 6, 30),
 datetime.date(2021, 7, 1),
 datetime.date(2021, 7, 2),
 datetime.date(2021, 7, 3),
 datetime.date(2021, 7, 4),
 datetime.date(2021, 7, 5),
 datetime.date(2021, 7, 6),
 datetime.date(2021, 7, 7),
 datetime.date(2021, 7, 8),
 datetime.date(2021, 7, 9),
 datetime.date(2021, 7, 10),
 datetime.date(2021, 7, 11),
 datetime.date(2021, 7, 12),
 datetime.date(2021, 7, 13),
 datetime.date(2021, 7, 14),
 datetime.date(2021, 7, 15),
 datetime.date(2021, 7, 16),
 datetime.date(2021, 7, 17),
 datetime.date(2021, 7, 18),
 datetime.date(2021, 7, 19),
 datetime.date(2021, 7, 20),
 datetime.date(2021, 7, 21),
 datetime.date(2021, 7, 22),
 datetime.date(2021, 7, 23),
 datetime.date(2021, 7, 24),
 datetime.date(2021, 7, 25),
 datetime.date(2021, 7, 26),
 datetime.date(2021, 7, 27),
 datetime.date(2021, 7, 28),
 datetime.date(2021, 7, 29),
 datetime.date(2021, 7, 30),
 datetime.date(2021, 7,

In [101]:
# `itermonthdays2(year, month)` year 年 month 月に対する itermonthdates() と同じようなイテレータを返します、タプル型になります
list(calendar_sample.itermonthdays2(2021, 7))

[(0, 6),
 (0, 0),
 (0, 1),
 (0, 2),
 (1, 3),
 (2, 4),
 (3, 5),
 (4, 6),
 (5, 0),
 (6, 1),
 (7, 2),
 (8, 3),
 (9, 4),
 (10, 5),
 (11, 6),
 (12, 0),
 (13, 1),
 (14, 2),
 (15, 3),
 (16, 4),
 (17, 5),
 (18, 6),
 (19, 0),
 (20, 1),
 (21, 2),
 (22, 3),
 (23, 4),
 (24, 5),
 (25, 6),
 (26, 0),
 (27, 1),
 (28, 2),
 (29, 3),
 (30, 4),
 (31, 5)]

In [103]:
# itermonthdays(year, month)
list(calendar_sample.itermonthdays(2021, 7))

[0,
 0,
 0,
 0,
 1,
 2,
 3,
 4,
 5,
 6,
 7,
 8,
 9,
 10,
 11,
 12,
 13,
 14,
 15,
 16,
 17,
 18,
 19,
 20,
 21,
 22,
 23,
 24,
 25,
 26,
 27,
 28,
 29,
 30,
 31]

In [104]:
# monthdayscalendar(year, month) year 年 month 月の週のリストを返します。週は全て七つの日付の数字からなるリストです
list(calendar_sample.monthdayscalendar(2021, 7))

[[0, 0, 0, 0, 1, 2, 3],
 [4, 5, 6, 7, 8, 9, 10],
 [11, 12, 13, 14, 15, 16, 17],
 [18, 19, 20, 21, 22, 23, 24],
 [25, 26, 27, 28, 29, 30, 31]]

## 以上となります。