In [1]:
# ================= 様々なコンテナ型を扱う ================= 

In [2]:
#########################################################
# データの件数をカウントする(collections.Counter())
#########################################################

In [3]:
# collections.Counter([iterable-or-mapping], [, key=value, key=value, ...])
# text : 辞書型から派生したクラス。辞書にデータの件数をカウントする機能を追加している。
# param : iterable - イテレータオブジェクト, mapping - 辞書オブジェクト, key - Counterオブジェクトに登録するキー, value - なんでも
# return : Counterオブジェクト
import collections
c = collections.Counter()
c["spam"] += 1
c[100] += 2
print(c)
type(c)

Counter({100: 2, 'spam': 1})


collections.Counter

In [4]:
sample = "spam,hello,world,foo,hoge,hoge,spam,hello,hello,world,world,foo,spam,spam"
l = sample.split(",")

In [5]:
counter = collections.Counter(l)
print(counter)

Counter({'spam': 4, 'hello': 3, 'world': 3, 'hoge': 2, 'foo': 2})


In [6]:
print(counter["spam"])
print(counter["k-ta"]) # 存在しない要素を参照してもエラーにならない

4
0


In [7]:
# Counterオブジェクトのメソッド
# elements()
# text : 要素のキーを、値の数だけ繰り返すイテレータを返す
# return : iter
for i in counter.elements():
    print(i)

hoge
hoge
hello
hello
hello
foo
foo
spam
spam
spam
spam
world
world
world


In [8]:
# Counterオブジェクトのメソッド
# most_common([n])
# text : 値が大きい順に、キーと値のタプルのリストを返す。nに整数値を指定するト、最大n件の要素を返す。
# param : n - int
# retern : list
print(counter.most_common())
print(counter.most_common(3))

[('spam', 4), ('hello', 3), ('world', 3), ('hoge', 2), ('foo', 2)]
[('spam', 4), ('hello', 3), ('world', 3)]


In [9]:
# Counterオブジェクトのメソッド
# subtract([iterable-or-mapping])
# text : 要素から、iterableまたは、mappingの値を減算する。
# param : iterable - listなど, mapping - dictなど
# return : なし
counter = collections.Counter(l)
counter.subtract(["spam", "spam", "spam"])
print(counter)
counter = collections.Counter(l)
counter.subtract(dict(spam=3, hello=5))
print(counter)

Counter({'hello': 3, 'world': 3, 'hoge': 2, 'foo': 2, 'spam': 1})
Counter({'world': 3, 'hoge': 2, 'foo': 2, 'spam': 1, 'hello': -2})


In [10]:
# Counterオブジェクトがサポートする2項演算子
# + : 2つのCounterオブジェクトの要素を合わせる
# - : 左から右のCounterオブジェクトの要素を減算する。（減算の結果valueが負の値になる要素は含まれない）
# & : 2つのCounterオブジェクトに存在する要素をまとめる。要素の値は、小さい方の値となる。
# | : ２つ2つのCounterオブジェクトのどちらかに存在する要素をまとめる。要素の値は、大きい方の値となる。
sample1 = "spam,hello,world,foo,hoge,hoge,spam,hello,hello,world,world,foo,spam,spam"
sample2 = "spam,spam,hello,hello,hello,hello,k-ta,k-ta,hoge,hoge,midori,midori"
l1 = sample1.split(",")
l2 = sample2.split(",")
cnt1 = collections.Counter(l1)
cnt2 = collections.Counter(l2)
print("{0:-^100}".format("初期値"))
print(cnt1, end="   # cnt1\n")
print(cnt2, end="   # cnt2\n")
print("{0:-^100}".format(""))
# --------------------------------------------------------------------------------------------------
print(cnt1 + cnt2)
print(cnt1 - cnt2)
print(cnt1 & cnt2)
print(cnt1 | cnt2)

------------------------------------------------初期値-------------------------------------------------
Counter({'spam': 4, 'hello': 3, 'world': 3, 'hoge': 2, 'foo': 2})   # cnt1
Counter({'hello': 4, 'hoge': 2, 'k-ta': 2, 'spam': 2, 'midori': 2})   # cnt2
----------------------------------------------------------------------------------------------------
Counter({'hello': 7, 'spam': 6, 'hoge': 4, 'world': 3, 'k-ta': 2, 'midori': 2, 'foo': 2})
Counter({'world': 3, 'spam': 2, 'foo': 2})
Counter({'hello': 3, 'hoge': 2, 'spam': 2})
Counter({'spam': 4, 'hello': 4, 'world': 3, 'k-ta': 2, 'hoge': 2, 'midori': 2, 'foo': 2})


In [11]:
# Counterオブジェクトがサポートする累算演算子
# += : 左辺のCounterオブジェクトに右辺のCounterオブジェクトの要素の値を追加する。
# -= : 左辺から右辺のCounterオブジェクトの要素の値を減算する
# &= : 左辺から右辺のCounterオブジェクトに含まれない要素を削除する
# |= : ２つ2つのCounterオブジェクトのどちらかに存在する要素をまとめる。要素の値は、大きい方の値となる。
sample1 = "spam,hello,world,foo,hoge,hoge,spam,hello,hello,world,world,foo,spam,spam"
sample2 = "spam,spam,hello,hello,hello,hello,k-ta,k-ta,hoge,hoge,midori,midori"
l1 = sample1.split(",")
l2 = sample2.split(",")
cnt1 = collections.Counter(l1)
cnt2 = collections.Counter(l2)
print("{0:-^100}".format("初期値"))
print(cnt1.most_common(), end="   # cnt1\n")
print(cnt2.most_common(), end="   # cnt2\n")
print("{0:-^100}".format(""))
# --------------------------------------------------------------------------------------------------
cnt1 += cnt2
print(cnt1)

cnt1 = collections.Counter(l1)
cnt2 = collections.Counter(l2)
cnt1 -= cnt2
print(cnt1)

cnt1 = collections.Counter(l1)
cnt2 = collections.Counter(l2)
cnt1 &= cnt2
print(cnt1)

cnt1 = collections.Counter(l1)
cnt2 = collections.Counter(l2)
cnt1 |= cnt2
print(cnt1)

------------------------------------------------初期値-------------------------------------------------
[('spam', 4), ('hello', 3), ('world', 3), ('hoge', 2), ('foo', 2)]   # cnt1
[('hello', 4), ('hoge', 2), ('k-ta', 2), ('spam', 2), ('midori', 2)]   # cnt2
----------------------------------------------------------------------------------------------------
Counter({'hello': 7, 'spam': 6, 'hoge': 4, 'world': 3, 'k-ta': 2, 'midori': 2, 'foo': 2})
Counter({'world': 3, 'spam': 2, 'foo': 2})
Counter({'hello': 3, 'hoge': 2, 'spam': 2})
Counter({'hello': 4, 'spam': 4, 'world': 3, 'k-ta': 2, 'hoge': 2, 'midori': 2, 'foo': 2})


In [12]:
#########################################################
# 複数の辞書の要素をまとめて1つの辞書にする(collections.ChainMap())
#########################################################
import collections

In [13]:
# collections.ChainMap([map1, map2, ...])
# text : 複数の辞書オブジェクトを集約して、ひとつの辞書のように検索できるようにする。検索は登録された順番で行われる。
# param : map - dictなど
# return : ChainMapオブジェクト
d1 = {"first": "keita", "last": "midorikawa", "age": "25"}
d2 = {"year": "1990", "month": "12", "day": "25", "first": "k-ta"}
chain = collections.ChainMap(d1, d2)
print(chain)
print(chain["first"])

ChainMap({'first': 'keita', 'last': 'midorikawa', 'age': '25'}, {'first': 'k-ta', 'month': '12', 'day': '25', 'year': '1990'})
keita


In [14]:
# ChainMapの更新と追加
chain["first"] = "takuji"  # 辞書を更新
chain["name"] = "midorikawa keita"  # 辞書を追加
print(chain["first"])
print(chain["name"])

takuji
midorikawa keita


In [15]:
# 辞書d1をクリア
chain.clear()
print(chain)
print(d1)
print(d2)

ChainMap({}, {'first': 'k-ta', 'month': '12', 'day': '25', 'year': '1990'})
{}
{'first': 'k-ta', 'month': '12', 'day': '25', 'year': '1990'}


In [16]:
d1 = {"first": "keita", "last": "midorikawa", "age": "25"}
d2 = {"year": "1990", "month": "12", "day": "25", "first": "k-ta"}
chain = collections.ChainMap(d1, d2)
# collections.ChainMapのアトリビュート
# map
# text : 登録されたマッピングオブジェクトをリストで返す
print(chain.maps)

[{'first': 'keita', 'last': 'midorikawa', 'age': '25'}, {'first': 'k-ta', 'month': '12', 'day': '25', 'year': '1990'}]


In [17]:
# collections.ChainMapのアトリビュート
# parents
# text : 先頭に登録されたマッピングオブジェクト以外のマッピングオブジェクトを要素とする、新しいChainMapオブジェクトを作成する。
# return : ChainMapオブジェクト
new_chain = chain.parents
print(new_chain)

ChainMap({'first': 'k-ta', 'month': '12', 'day': '25', 'year': '1990'})


In [18]:
# collections.ChainMapのメソッド
# new_child(m=None)
# text : 引数m(mapping)ト登録されたすべてのマッピングオブジェクトを要素とする新しいChainMapオブジェクトを作成する。
# param : m - mapping
# return : ChainMapオブジェクト
d3 = dict(greet="Hello!")
new_chain = chain.new_child(d3)
print(new_chain)

ChainMap({'greet': 'Hello!'}, {'first': 'keita', 'last': 'midorikawa', 'age': '25'}, {'first': 'k-ta', 'month': '12', 'day': '25', 'year': '1990'})


In [19]:
#########################################################
# 登録順を保存する辞書(collections.OrderdDict)
#########################################################
import collections

In [20]:
# 通常のdict型では登録した順序は保存されない
sample_dict = dict(k1="midorikawa keita", k2="keita", k3="midorikawa", k4="25")
print(sample_dict)
for i in sample_dict:
    print("{key} : {value}".format(key=i, value=sample_dict[i]))

{'k3': 'midorikawa', 'k1': 'midorikawa keita', 'k4': '25', 'k2': 'keita'}
k3 : midorikawa
k1 : midorikawa keita
k4 : 25
k2 : keita


In [21]:
# collections.OrderedDict([(key1, value1), (key2, value2), ...])
# text : 要素を登録した順番を記録して、要素の一覧は常に登録された順番で取得する。
# param : keyとvalueのタプルのリスト
# return : OrderedDictオブジェクト
odict = collections.OrderedDict([("1", "midorikawa keita"), ("2", "keita"), ("3", "midorikawa"), ("4", "25")])
print(odict)
for i in odict:
    print("{key} : {value}".format(key=i, value=odict[i]))

OrderedDict([('1', 'midorikawa keita'), ('2', 'keita'), ('3', 'midorikawa'), ('4', '25')])
1 : midorikawa keita
2 : keita
3 : midorikawa
4 : 25


In [22]:
# 下記のやり方では順番は保存されない
odict2 = collections.OrderedDict(k1="midorikawa keita", k2="keita", k3="midorikawa", k4="25")
print(odict2)
odict3 = collections.OrderedDict({'k1': 'midorikawa keita', 'k2': 'keita', 'k3': 'midorikawa', 'k4': '25'})
print(odict3)

OrderedDict([('k3', 'midorikawa'), ('k1', 'midorikawa keita'), ('k4', '25'), ('k2', 'keita')])
OrderedDict([('k3', 'midorikawa'), ('k1', 'midorikawa keita'), ('k2', 'keita'), ('k4', '25')])


In [23]:
# OrderedDictオブジェクトのメソッド
# popitem(last=True)
# text : lastがTrueの場合は、最後に登録した要素を辞書から削除して返す。lastがTrueでなければ、最初に登録した要素を辞書から削除して返す。
# param : last - bool
# retrun : 削除したOrderedDictオブジェクト
odict = collections.OrderedDict([("1", "midorikawa keita"), ("2", "keita"), ("3", "midorikawa"), ("4", "25")])
print(odict)
ret = odict.popitem(last=True)
print(odict)
print(ret)
ret = odict.popitem(last=False)
print(odict)
print(ret)

OrderedDict([('1', 'midorikawa keita'), ('2', 'keita'), ('3', 'midorikawa'), ('4', '25')])
OrderedDict([('1', 'midorikawa keita'), ('2', 'keita'), ('3', 'midorikawa')])
('4', '25')
OrderedDict([('2', 'keita'), ('3', 'midorikawa')])
('1', 'midorikawa keita')


In [24]:
# OrderedDictオブジェクトのメソッド
# move_to_end(key, last=True)
# text : lastがTrueであれば指定したキーを末尾に移動する。lastがTrueでなければ、指定したキーを先頭に移動する。
# param : key - 要素のkey, last - bool
# retrun : なし
odict = collections.OrderedDict([("1", "midorikawa keita"), ("2", "keita"), ("3", "midorikawa"), ("4", "25")])
print(odict)
odict.move_to_end("1", last=True)
print(odict)
odict.move_to_end("4", last=False)
print(odict)

OrderedDict([('1', 'midorikawa keita'), ('2', 'keita'), ('3', 'midorikawa'), ('4', '25')])
OrderedDict([('2', 'keita'), ('3', 'midorikawa'), ('4', '25'), ('1', 'midorikawa keita')])
OrderedDict([('4', '25'), ('2', 'keita'), ('3', 'midorikawa'), ('1', 'midorikawa keita')])


In [25]:
#########################################################
# タプルを構造体として利用する(collections.namedtuple)
#########################################################
import collections

In [26]:
# collections.namedtuple(typename, field_names, verbose=False, rename=False)
# text : タプルの各要素にkeyをもたせることができる
# param : typename - 作成するtupleの新しいサブクラスの名前, field_names - タプルの各要素名を指定する(seq-or-カンマ区切りのstr)
# param2 : verbose - クラスを定義するスクリプトを出力, rename - Trueの時、不正な要素名を自動的に正しい名前に変更する
# return : namedtupleオブジェクト
Coordinate = collections.namedtuple(typename="subclass_name", field_names="x, y, z")
c = Coordinate(100, 50, 200)
print(c)

subclass_name(x=100, y=50, z=200)


In [27]:
NewTupleClass = collections.namedtuple("subclass_name", ["x", "y", "z"])
c2 = NewTupleClass(100, 200, 300)
print(type(c2))
print(c2)
print(c2.x)
print(c2[1], end="\n\n")
for i in c2:
    print(i)

<class '__main__.subclass_name'>
subclass_name(x=100, y=200, z=300)
100
200

100
200
300


In [28]:
#########################################################
# 両端リストを利用する(collections.deque)
#########################################################
import collections

In [42]:
# collections.deque(iterable, [maxlen])
# text : 両端キューと呼ばれるデータ構造で、キューの先頭と末尾への追加や削除はデータ数によらず一定の速度でできる。
# text : スライスはサポートしてない。list()のような使い方ができる
# param : iterable - dequeの初期値を指定する
# param2 : maxlen - dequeの最大要素数を指定する。最大要素数以上になると先頭または末尾の要素が削除される。
# dequeオブジェクト
deq = collections.deque("spam")
print(deq)
deq2 = collections.deque(["s", "p", "a", "m"])
print(deq2)
deq3 = collections.deque(range(1,11))
print(deq3)

deque(['s', 'p', 'a', 'm'])
deque(['s', 'p', 'a', 'm'])
deque([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])


In [43]:
# collections.dequeのメソッド
# append(x)
# text : dequeの末尾に追加する
# param : x - 何でも
# return : なし
deq.append("s")
print(deq)

deque(['s', 'p', 'a', 'm', 's'])


In [44]:
# collections.dequeのメソッド
# appendleft(x)
# text : dequeの先頭に追加する
# param : x - 何でも
# return : なし
deq.appendleft("s")
print(deq)

deque(['s', 's', 'p', 'a', 'm', 's'])


In [45]:
# collections.dequeのメソッド
# extend(iterable)
# text : dequeの末尾にリストなどのiterableオブジェクトを追加する
# param : iterable - listなど
# return : なし
deq.extend(["h", "a", "m"])
print(deq)

deque(['s', 's', 'p', 'a', 'm', 's', 'h', 'a', 'm'])


In [46]:
# collections.dequeのメソッド
# extendleft(iterable)
# text : dequeの先頭にリストなどのiterableオブジェクトを追加する。
# text2 : 先頭から順に登録していくため、引数にとったオブジェクトとは逆の順序でdequeに格納される。
# param : iterable - listなど
# return : なし
deq.extendleft(["g", "g", "e"])
print(deq)

deque(['e', 'g', 'g', 's', 's', 'p', 'a', 'm', 's', 'h', 'a', 'm'])


In [47]:
# collections.dequeのメソッド
# pop()
# text : dequeから末尾の値を取り除き、その値を返す。要素が存在しない場合はIndexError
# return : 取り除いたdequeオブジェクト
deq_r = deq.pop()
print(deq)
print(deq_r)

deque(['e', 'g', 'g', 's', 's', 'p', 'a', 'm', 's', 'h', 'a'])
m


In [48]:
# collections.dequeのメソッド
# popleft()
# text : dequeから先頭の値を取り除き、その値を返す。要素が存在しない場合はIndexError
# return : 取り除いたdequeオブジェクト
deq_r = deq.popleft()
print(deq)
print(deq_r)

deque(['g', 'g', 's', 's', 'p', 'a', 'm', 's', 'h', 'a'])
e


In [50]:
# 応用 : 移動平均の算出
import statistics
deq = collections.deque(maxlen=5)
for i in range(10):
    deq.append(i)
    if len(deq) >=5:
        print(list(deq), statistics.mean(deq))

[0, 1, 2, 3, 4] 2.0
[1, 2, 3, 4, 5] 3.0
[2, 3, 4, 5, 6] 4.0
[3, 4, 5, 6, 7] 5.0
[4, 5, 6, 7, 8] 6.0
[5, 6, 7, 8, 9] 7.0


In [5]:
# rotate(n)
# text : dequeオブジェクトを回転する。正の整数の場合は右方向、府の整数の場合は左方向
# param : int
# retun : なし
deq = collections.deque([1,2,3,4,5])
deq.rotate(1)
print(deq)
deq.rotate(-2)
print(deq)

deque([5, 1, 2, 3, 4])
deque([2, 3, 4, 5, 1])


In [1]:
######################################
# オブジェクトを整形して出力
######################################
import pprint

In [2]:
# pprint(object, stream=None, indent=1, width=80, depth=None)
# text : オブジェクトを整形して出力する
# param : object - 出力するオブジェクトを指定する, stream - 出力先のオブジェクトを指定する
# param2 : indent - ネストしたオブジェクトの子要素を出力するときのインデントカラム数
# param3 : width : 出力幅
# depth : ネストしたオブジェクトを出力する際の最大レベル
sample = {"name": "あらゆ","gender": "男","blog": {"name": "SYNCER","published": "2014-06-10","category": ["旅行","温泉","ドライブ"]}}
pprint.pprint(sample)

{'blog': {'category': ['旅行', '温泉', 'ドライブ'],
          'name': 'SYNCER',
          'published': '2014-06-10'},
 'gender': '男',
 'name': 'あらゆ'}
