# 第2章 リストと辞書

In [14]:
from __future__ import annotations
import numpy as np

## シーケンスのスライスは最大長を超えて指定できる

In [7]:
li = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

当然ですが、シーケンスの最大長を超えてインデックスを指定するとエラー。

In [10]:
try:
    li[30]
except IndexError:
    print("IndexError!")
    
# IndexError!

IndexError!


しかし、シーケンスの最大長を超えたスライスの指定は可能です。

In [12]:
try:
    li[:30]
    print("Slicing works!")
except IndexError:
    print("IndexError!")
    
# Slicing works!

Slicing works!


（余談）これを利用して、シーケンスの最大長を合わせる処理を実装することができますね。

In [24]:
def limit_list_len(li: list, max_len: int = 10):
    """リストの要素数を制限する関数"""
    return li[:max_len]

small_li = limit_list_len(list(range(5)))  # [0, 1, 2, 3, 4]
large_li = limit_list_len(list(range(100)))  # [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

## シーケンスのスライスを利用して、シーケンスの任意の要素間に値を挿入

In [45]:
li = [0, 1, 2, 3]

スライスの始端・両端に同じインデックスを指定して値を代入すると、シーケンスに値が挿入できます。

In [46]:
li[1:1] = ["hogehoge", "ほげ"]
print(li) # [0, 'hogehoge', 'ほげ', 1, 2, 3]

[0, 'hogehoge', 'ほげ', 1, 2, 3]


numpyでは同様のことを行うとエラー。

In [42]:
arr = np.array([1, 2, 3])

try:
    arr[1:1] = [4, 5, 6]
except ValueError:
    print("Numpy array can't do this!")
    
# Numpy array can't do this!

Numpy array can't do this!


しかし、要素数と要素の型を変更しない形での挿入(=上書き)は可能です。

In [44]:
try:
    arr[1:2] = 0
    print(arr)
    print("Numpy array CAN do this!")
except ValueError:
    print("Numpy array can't do this!")

# [1 0 3]
# Numpy array CAN do this!

[1 0 3]
Numpy array CAN do this!


## catch-allアンパックでスライスを使わずにシーケンスをアンパックする

アスタリスク付き引数(`*args`)を使うことで、スマートにシーケンスの要素のアンパックが行えます。

以下のコードを例とします。

In [51]:
descending_li = sorted([5, 434, 545, 21, 45, 65, 44, 23], reverse=True)

In [53]:
descending_li

[545, 434, 65, 45, 44, 23, 21, 5]

**最も値の大きい要素**と**2番目に大きい要素**、**残りの要素**という風にシーケンスをアンパックする際、スライスを使用すると以下のようになります。

In [59]:
biggest_elm, second_elm, others = descending_li[0], descending_li[1], descending_li[2:]

print(biggest_elm, second_elm, others)  # 545 434 [65, 45, 44, 23, 21, 5]

545 434 [65, 45, 44, 23, 21, 5]


これをアスタリスク付き引数で書き直すと、とてもスマートになります。

In [60]:
biggest_elm, second_elm, *others = descending_li

print(biggest_elm, second_elm, others)  # 545 434 [65, 45, 44, 23, 21, 5]

545 434 [65, 45, 44, 23, 21, 5]


**最も値の大きい要素**と**最も小さい要素**、**残りの要素**というアンパックも可能です。

In [61]:
biggest_elm, *others, smallest_elm = descending_li

print(biggest_elm, smallest_elm, others)  # 545 5 [434, 65, 45, 44, 23, 21]

545 5 [434, 65, 45, 44, 23, 21]


## 辞書の欠損値処理に使用する`get`

以下の辞書を例として、既にキーが登録されている場合は既存の値の数値部分に`+1`、登録されていない場合はキーを新しく登録する処理を実装します。

In [147]:
d = {"a": 1, "b": 2, "c": 3}

In [148]:
keys = ["a", "c", "d"]

通常の`if-else`文を用いて実装する場合は以下のようになります。

In [142]:
for key in keys:
    if key not in d:
        d[key] = 1
    else:
        d[key] += 1
        
print(d)  # {'a': 2, 'b': 2, 'c': 4, 'd': 1}

{'a': 2, 'b': 2, 'c': 4, 'd': 1}


これでも問題なく処理ができますが、`get`を用いて実装するとよりスマートに実装できます。

In [149]:
for key in keys:
    count = d.get(key, 0)
    d[key] = count + 1

print(d)  # {'a': 2, 'b': 2, 'c': 4, 'd': 1}

{'a': 2, 'b': 2, 'c': 4, 'd': 1}


## `defaultdict`で辞書の値の重複を処理する

以下の辞書を例とします。

In [189]:
d = {"a": {1, 2}, "b": {3, 4}, "c": {5, 6}}

重複を排除して辞書のキー・値を追加するには、以下の方法があります。

例： 辞書のキー`c`に値`6`を追加する

In [186]:
if (c := d.get("c", set())) is None:
    d["c"] = c = set()
c.add(6)

print(d)  # {'a': {1, 2}, 'b': {3, 4}, 'c': {5, 6}}

{'a': {1, 2}, 'b': {3, 4}, 'c': {5, 6}}


例2： 辞書のキー`e`に値`9`を追加する

In [187]:
if (e := d.get("e")) is None:
    d["e"] = e = set()
e.add(9)

print(d)  # {'a': {1, 2}, 'b': {3, 4}, 'c': {5, 6}, 'e': {9}}

このやり方でも重複することなく値を挿入できますが、`defaultdict`を使うことでより簡単な書き方ができます。

In [194]:
from collections import defaultdict

d = defaultdict(set)
d["c"].add(6)
d["c"].add(6)  # 重複した値は追加されない

print(d)  # defaultdict(<class 'set'>, {'c': {6}})

defaultdict(<class 'set'>, {'c': {6}})
