# 第1章 Pythonic思考

In [79]:
import random
import itertools

import numpy as np
import pandas as pd

## `欠損値 or 0`で欠損値をゼロ埋め

In [9]:
li = [None, 4, 5, 3, None, 2, "", 5]

new_li = []
for elm in li:
    new_li.append(elm or 0) # 欠損値や空文字列はFalseと評価されるので、or後の0に置き換えられる
    
print(new_li)
# [0, 4, 5, 3, 0, 2, 0, 5]

[0, 4, 5, 3, 0, 2, 0, 5]


## 最大長のイテレータに合わせて並列処理(`zip`)する`zip_longest`

In [32]:
a = [0, 1, 2, 3, 4]
b = [6, 7, 8, 9, 10]

組み込み関数の`zip`は、複数のイテレータ(リスト、タプルなど)を並列で処理します。

In [33]:
for i, j in zip(a, b):
    print(f"a = {i}, b = {j}")
    
# a = 0, b = 6
# a = 1, b = 7
# a = 2, b = 8
# a = 3, b = 9
# a = 4, b = 10

a = 0, b = 6
a = 1, b = 7
a = 2, b = 8
a = 3, b = 9
a = 4, b = 10


イテレータの長さが異なる場合、`zip`は最短のイテレータに合わせて処理を終了します。

In [34]:
c = [2, 3, 4]

for i, j, k in zip(a, b, c): # a, b は長さ5のリスト, cは長さ3のリスト
    print(f"a = {i}, b = {j}, c = {k}")

# a = 0, b = 6, c = 2
# a = 1, b = 7, c = 3
# a = 2, b = 8, c = 4

a = 0, b = 6, c = 2
a = 1, b = 7, c = 3
a = 2, b = 8, c = 4


一方で、組み込みモジュールの`itertools.zip_longest`関数は最大長のイテレータに合わせて処理します。

In [35]:
import itertools
for i, j, k in itertools.zip_longest(a, b, c):
    print(f"a = {i}, b = {j}, c = {k}")

# a = 0, b = 6, c = 2
# a = 1, b = 7, c = 3
# a = 2, b = 8, c = 4
# a = 3, b = 9, c = None
# a = 4, b = 10, c = None

a = 0, b = 6, c = 2
a = 1, b = 7, c = 3
a = 2, b = 8, c = 4
a = 3, b = 9, c = None
a = 4, b = 10, c = None


欠損部分を任意の値で埋めたい場合は、`fillvalue`の引数に値を設定します。

In [38]:
for i, j, k in itertools.zip_longest(a, b, c, fillvalue=0):
    print(f"a = {i}, b = {j}, c = {k}")

# a = 0, b = 6, c = 2
# a = 1, b = 7, c = 3
# a = 2, b = 8, c = 4
# a = 3, b = 9, c = 0
# a = 4, b = 10, c = 0

a = 0, b = 6, c = 2
a = 1, b = 7, c = 3
a = 2, b = 8, c = 4
a = 3, b = 9, c = 0
a = 4, b = 10, c = 0


## 代入式(`A := B`)でコードの冗長性を取り除く

walrus演算子(`:=`)を使うと、変数名への値の代入と評価を一度に行うことができます。

以下の辞書を使用して例示します。

In [82]:
d = {
    "a": random.choice([-1, 1]),
    "b": random.choice([-2, 2]),
    "c": None,
}

`a+b`が正の場合は`c`を`1`に、負の場合は`c`を`a+b`の値に書き換える処理を実装しましょう。

In [92]:
a_add_b = d["a"] + d["b"]
if a_add_b > 0:
    d["c"] = 1
else:
    d["c"] = a_add_b

print(d)  # {'a': 1, 'b': -2, 'c': -1}

{'a': 1, 'b': -2, 'c': -1}


ここにwalrus演算子を使用して書き換えます。

In [91]:
if (a_add_b := d["a"] + d["b"]) > 0:
    d["c"] = 1
else:
    d["c"] = a_add_b

print(d)  # {'a': 1, 'b': -2, 'c': -1}

{'a': 1, 'b': -2, 'c': -1}


わずかな違いですが、確実にコードの冗長性を減らすことができます。