## データ型とアルゴリズム


### ソート - sorted, sort, operator

- sorted() リストを返す 非破壊的
- reversed() イテレータを返す 非破壊的
- list.sort() None 破壊的
- list.reverse() None 破壊的


In [29]:
import random

seq = [random.randint(0, 1000) for _ in range(5)]
print(seq)
print(sorted(seq), seq)
print(sorted(seq, reverse=True))

# リストが文字列の場合
seq_str = ["spam", "ham", "egg"]
print(sorted(seq_str), seq_str)

"egg" < "ham"

# エラーパターン
print(sorted(["spam", "egg", 10]))

[340, 277, 120, 487, 906]
[120, 277, 340, 487, 906] [340, 277, 120, 487, 906]
[906, 487, 340, 277, 120]
['egg', 'ham', 'spam'] ['spam', 'ham', 'egg']


TypeError: '<' not supported between instances of 'int' and 'str'

In [19]:
# リスト以外の場合
# Tupleのソート
print(sorted((1, 9, 3, 7, 2, 0)))

# dictのソート
print(sorted({"a": 1, "b": 2, "c": 3}))
print(sorted({"a": 1, "b": 2, "c": 3}.items()))

# 文字のソート
print(sorted("Python3のコード"))

[0, 1, 2, 3, 7, 9]
['a', 'b', 'c']
[('a', 1), ('b', 2), ('c', 3)]
['3', 'P', 'h', 'n', 'o', 't', 'y', 'の', 'コ', 'ド', 'ー']


In [27]:
# シーケンスの順序を逆にする
rev_seq = [random.randint(0, 1000) for _ in range(5)]
rev = reversed(rev_seq)
print(rev, type(rev), list(rev), rev_seq)

<list_reverseiterator object at 0x105c5afb0> <class 'list_reverseiterator'> [589, 571, 422, 74, 505] [505, 74, 422, 571, 589]


In [31]:
li_seq = [random.randint(0, 1000) for _ in range(5)]
print(li_seq)
print(li_seq.sort(), li_seq)

li_rev_seq = [random.randint(0, 1000) for _ in range(5)]
print(li_rev_seq)
print(li_rev_seq.sort(), li_rev_seq)

[719, 942, 781, 610, 119]
None [119, 610, 719, 781, 942]
[282, 153, 140, 706, 852]
None [140, 153, 282, 706, 852]


In [32]:
# key引数
str_li = ["s", "V", "A", "b"]
# keyにstr.lowerを指定して、小文字で比較するようにする
print(sorted(str_li, key=str.lower))

['A', 'b', 's', 'V']


### operator

- ソートキーに使いやすい関数を提供する
  - itemgetter()
    - リストやタプルの要素やインデックス値でソートの順序を決めることができる
    - もしも、同じ値がある場合は、元の順序を保持したままでソートされる
  - attrgetter()
    - ドットで取得できるものを指定し、ソートすることができる


In [37]:
# itemgetter()
from operator import itemgetter

data = [(1, 40, 200), (3, 10, 100), (2, 20, 300), (1, 30, 300)]
print(sorted(data))
# インデックス2でソートし、そのほかはそのまま
print(sorted(data, key=itemgetter(2)))
# index2でソートし、同じ場合はindex0でソート
print(sorted(data, key=itemgetter(2, 0)))

# dictの場合
dic_data = {"a": 2, "c": 1, "b": 3}
# itemsは各要素でタプルになるので、index1で指定
print(sorted(dic_data.items(), key=itemgetter(1)))

users = [
    {"name": "ichro", "age": 51},
    {"name": "ohotani", "age": 17},
    {"name": "matsui", "age": 55},
]
# 年齢でソートする
print(sorted(users, key=itemgetter("age")))

[(1, 30, 300), (1, 40, 200), (2, 20, 300), (3, 10, 100)]
[(3, 10, 100), (1, 40, 200), (2, 20, 300), (1, 30, 300)]
[(3, 10, 100), (1, 40, 200), (1, 30, 300), (2, 20, 300)]
[('c', 1), ('a', 2), ('b', 3)]
[{'name': 'ohotani', 'age': 17}, {'name': 'ichro', 'age': 51}, {'name': 'matsui', 'age': 55}]


In [41]:
# attrgetter
from operator import attrgetter
from datetime import date

print(date(1970, 11, 28).month)
print(date(1970, 11, 28).day)

birth = [
    date(1995, 11, 11),
    date(1988, 2, 1),
    date(2025, 4, 30),
]
print(sorted(birth, key=attrgetter("month", "day")))

from dataclasses import dataclass


@dataclass
class User:
    name: str
    birthday: date


users_data = [
    User("ichiro", date(1995, 11, 11)),
    User("ohotani", date(1988, 2, 1)),
    User("matsui", date(2025, 4, 30)),
]
print(sorted(users_data, key=attrgetter("birthday.month", "birthday.day")))

11
28
[datetime.date(1988, 2, 1), datetime.date(2025, 4, 30), datetime.date(1995, 11, 11)]
[User(name='ohotani', birthday=datetime.date(1988, 2, 1)), User(name='matsui', birthday=datetime.date(2025, 4, 30)), User(name='ichiro', birthday=datetime.date(1995, 11, 11))]


### collections Counter

- [参考：collections](https://github.com/akagikouzanh/python-snippets-hub/blob/master/snippets/snippets_collections.ipynb)


### 列挙型による定数の定義を行う enum

- [enum --- 列挙型のサポート](https://docs.python.org/ja/3.13/library/enum.html)


In [2]:
import enum


# このような定義の仕方でも良いが
class Nengo(enum.Enum):
    SHOWA = 1
    HEISEI = 2
    REIWA = 3


class NengoAuto(enum.Enum):
    SHOWA = enum.auto()
    HEISEI = enum.auto()
    REIWA = enum.auto()

In [3]:
# ユニークを指定して、重複を防ぐ


@enum.unique
class Spam(enum.Enum):
    HAM = 1
    EGG = 1

ValueError: duplicate values found in <enum 'Spam'>: EGG -> HAM

In [5]:
# 定数の呼び出し
print(Nengo.REIWA)
# 定数の名前と値を見る
print(Nengo.SHOWA.name)
print(Nengo.SHOWA.value)

Nengo.REIWA
SHOWA
1


In [6]:
# 列挙型は定数を定義順にイテレータを取得する
# 重複の場合は1つしか取得しない
class Spam(enum.Enum):
    HAM = 1
    EGG = 2
    BACON = 1


list(Spam)

[<Spam.HAM: 1>, <Spam.EGG: 2>]

In [9]:
# 定数同士の比較
print(isinstance(Spam.HAM, Spam))
print(Spam.HAM == Spam.HAM)
print(Spam.HAM == Spam.BACON)

True
True
True


In [10]:
class OtherSpam(enum.Enum):
    HAM = 1
    EGG = 2
    BACON = 2

In [11]:
print(Spam.HAM == OtherSpam.HAM)
print(Spam.HAM == 1)

False
False


In [15]:
# 役立つ知識
class Color(enum.Enum):
    RED = enum.auto()
    BLACK = enum.auto()

    def __str__(self):
        return self.name


def print_color(color: Color) -> None:
    print(color)


print_color(Color.RED)
print_color(Color.BLACK)
# mypy入れればエラーになってくれる
print_color("Blue")

RED
BLACK
Blue


### イテレータの組み合わせで処理を組み立てる - itertools

- [itertools --- 効率的なループ用のイテレータ生成関数群](https://docs.python.org/ja/3.13/library/itertools.html)


In [18]:
# イテラブルオブジェクトを連結する

import itertools

# 複数のイテラブルオブジェクトを1つイテレータとして返す
it = itertools.chain(["A", "B"], "ab", range(3))
for element in it:
    print(element)

A
B
a
b
0
1
2


In [21]:
# 連続する値をまとめる
# グループ化したイテレータが返される
for val, group in itertools.groupby("aaabbcdddaabb"):
    print(f"{val}: {list(group)}")

a: ['a', 'a', 'a']
b: ['b', 'b']
c: ['c']
d: ['d', 'd', 'd']
a: ['a', 'a']
b: ['b', 'b']


In [23]:
# 上記のように連続していないと別グループとして扱われるため、
# ソートしてから返す

text = sorted("aaabbcdddaabb")
for val, group in itertools.groupby(text):
    print(f"{val}: {list(group)}")

a: ['a', 'a', 'a', 'a', 'a']
b: ['b', 'b', 'b', 'b']
c: ['c']
d: ['d', 'd', 'd']


In [25]:
# keyに関数を指定することで、関数の結果でグループ化することができる
def is_odd(num: int) -> bool:
    return num % 2 == 1


numbers = [10, 20, 31, 11, 3, 4]
for val, group in itertools.groupby(numbers, is_odd):
    print(f"{val}: {list(group)}")

False: [10, 20]
True: [31, 11, 3]
False: [4]


In [28]:
# イテレータから範囲を指定して値を取得する
li = list(range(10))
print(li)

# リストの最初の5要素を返す
islice_object = itertools.islice(li, 5)
print(islice_object)
print(list(islice_object))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
<itertools.islice object at 0x10ca3aca0>
[0, 1, 2, 3, 4]


In [31]:
# 複数のイテラブルオブジェクトの要素からタプルを作成する
it1 = (1, 2, 3)
it2 = ["abc", "ABC", "123"]
it3 = "あいう"

# 全ての値を返すと終了するが、長さの違うイテラブルオブジェクトの場合、もっとも短いものを基準とするため注意が必要
# 3.10からはstrictが追加され、長さが違う場合は例外が送出される
for v in zip(it1, it2, it3):
    print(v)

(1, 'abc', 'あ')
(2, 'ABC', 'い')
(3, '123', 'う')


In [33]:
it1 = (1, 2, 3, 4, 5)
it2 = ["abc", "ABC", "123"]

# zipとは異なり、もっとも長いものを基準にして値を返す、少ない部分はNoneとして返される
for v in itertools.zip_longest(it1, it2):
    print(v)

(1, 'abc')
(2, 'ABC')
(3, '123')
(4, None)
(5, None)


In [34]:
# fillvalueに値を指定するとNoneの代わりの値になる
for v in itertools.zip_longest("abcde", "123", "あいうえ", fillvalue="-"):
    print(v)

('a', '1', 'あ')
('b', '2', 'い')
('c', '3', 'う')
('d', '-', 'え')
('e', '-', '-')


#### データを組み合わせたイテレータを取得する


In [42]:
# デカルト積、ネストしたforループと同様

print(list(itertools.product("abc", [1, 2, 3])))
# 組み合わせる回数
print([r[0] + r[1] for r in itertools.product("ABC", repeat=2)])

# productと全く同じ結果
result = []
for i in "ABC":
    for j in "ABC":
        result.append(i + j)

print(result)

[('a', 1), ('a', 2), ('a', 3), ('b', 1), ('b', 2), ('b', 3), ('c', 1), ('c', 2), ('c', 3)]
['AA', 'AB', 'AC', 'BA', 'BB', 'BC', 'CA', 'CB', 'CC']
['AA', 'AB', 'AC', 'BA', 'BB', 'BC', 'CA', 'CB', 'CC']


In [53]:
# 順列を取得する
print(list(itertools.permutations("ABC")))
# 長さを指定
results = itertools.permutations("ABCD", 2)
print([r[0] + r[1] for r in results])

[('A', 'B', 'C'), ('A', 'C', 'B'), ('B', 'A', 'C'), ('B', 'C', 'A'), ('C', 'A', 'B'), ('C', 'B', 'A')]
['AB', 'AC', 'AD', 'BA', 'BC', 'BD', 'CA', 'CB', 'CD', 'DA', 'DB', 'DC']


In [67]:
# 重複なしの組み合わせを返す
# 組み合わせの長さを指定して返す
print(list(itertools.combinations("ABC", 2)))
results = itertools.combinations("ABCD", 2)
print([r[0] + r[1] for r in results])
# permutationsとの比較
results = itertools.permutations("ABCD", 2)
print([r[0] + r[1] for r in results])

[('A', 'B'), ('A', 'C'), ('B', 'C')]
['AB', 'AC', 'AD', 'BC', 'BD', 'CD']
['AB', 'AC', 'AD', 'BA', 'BC', 'BD', 'CA', 'CB', 'CD', 'DA', 'DB', 'DC']


In [70]:
# 重複あり(同じ要素の繰り返しを含む)の組み合わせ
print(list(itertools.combinations_with_replacement("ABC", 2)))
results = itertools.combinations("ABCD", 2)

[('A', 'A'), ('A', 'B'), ('A', 'C'), ('B', 'B'), ('B', 'C'), ('C', 'C')]


### ミュータブルなオブジェクトをコピーする

- [copy --- 浅いコピーおよび深いコピー操作](https://docs.python.org/ja/3.13/library/copy.html)


In [87]:
# 浅いコピー(shallow copy)
# ※ネストしたデータはコピーされないので注意(浅いコピーのため)

values = ["a", "b", "c", "d"]
v_ref = values

print(v_ref)
print(id(v_ref), id(values))

v_ref[1] = "e"
print(v_ref)
print(values)

import copy

values = ["a", "b", "c", "d"]
val_cp = copy.copy(values)
print(val_cp)
print(id(val_cp), id(values))
val_cp[1] = "e"
print(val_cp)
print(values)

# ネストした値
values = [[0, 1], [2, 3], [4, 5]]
val_cp = copy.copy(values)
print(val_cp)
print(id(val_cp[0]), id(values[0]))

val_cp.append([6, 7])
print(val_cp)
# 一階層目のため変更は影響していない
print(values)

val_cp[1][0] = 9
print(val_cp)
# これは変更されてしまう
print(values)

['a', 'b', 'c', 'd']
4507339008 4507339008
['a', 'e', 'c', 'd']
['a', 'e', 'c', 'd']
['a', 'b', 'c', 'd']
4508843520 4508843072
['a', 'e', 'c', 'd']
['a', 'b', 'c', 'd']
[[0, 1], [2, 3], [4, 5]]
4507931008 4507931008
[[0, 1], [2, 3], [4, 5], [6, 7]]
[[0, 1], [2, 3], [4, 5]]
[[0, 1], [9, 3], [4, 5], [6, 7]]
[[0, 1], [9, 3], [4, 5]]


In [86]:
values = [[0, 1], [2, 3], [4, 5]]
val_cp = copy.deepcopy(values)
print(val_cp)
print(id(val_cp[0]), id(values[0]))

val_cp[1][0] = 9
print(values)
print(val_cp)

[[0, 1], [2, 3], [4, 5]]
4507931008 4507934528
[[0, 1], [2, 3], [4, 5]]
[[0, 1], [9, 3], [4, 5]]


In [88]:
authors = ["natsume", "dazai", "masaoka"]
attrib = {"attribute": "author"}
book_authors = []

for name in authors:
    cp_attrib = copy.copy(attrib)
    cp_attrib["name"] = name
    book_authors.append(cp_attrib)


book_authors

[{'attribute': 'author', 'name': 'natsume'},
 {'attribute': 'author', 'name': 'dazai'},
 {'attribute': 'author', 'name': 'masaoka'}]

In [90]:
# インスタンスもコピー可能
class Author:
    def __init__(self, name: str, age: int) -> None:
        self.name = name
        self.age = age


auther1 = Author("natsume", 49)
auther2 = Author("dazai", 38)
auther3 = copy.deepcopy(auther1)
auther3.name = "tanaka"

print(auther1.name, auther1.age)
print(auther2.name, auther2.age)
print(auther3.name, auther3.age)

natsume 49
dazai 38
tanaka 49


In [92]:
# import copyせずに同じように浅いコピーする方法

values = [0, 1, 2, 3, 4, 5]
# スライスで全体を渡す
val_cp = values[:]

print(id(values), id(val_cp))

val_li = [0, 1, 2, 3, 4, 5]
val_dic = {"k1": "v1", "k2": "v2"}
val_set = {1, 2, 3, 4, 5}
val_li_cp = list(val_li)
val_dic_cp = dict(val_dic)
val_set_cp = set(val_set)

print(id(val_li), id(val_li_cp))
print(id(val_dic), id(val_dic_cp))
print(id(val_set), id(val_set_cp))

4509474496 4509482816
4509467520 4507268800
4507144256 4507267392
4508919040 4508919488
