# 4章 Pyの皮：コード構造
---
1章から3章までではさまざまなデータの例を見てきたが、データを使って大したことはまだ何もしていない。ほとんどのコード例は、対話型インタプリタを使っており、短かった。しかし、ここからはただのデータを見ているだけではなく、データを処理するPythonコードを実装していく。

Pythonは**空白**を使ってプログラムの構造を定義するという点で普通の言語とは大きく異なる。これは、新人が最初に気づくことのひとつで、ほかの言語の経験がある人にとっては奇妙に感じられるようだ。しかし、しばらくPythonを書いていると、このやり方が自然に感じられるようになり、いちいち意識しなくなる。タイピングが減った分、多くの仕事をするようにさえなってしまう。

## 4.6 内包表記
---
**内包表記**は、ひとつ以上のイテレータからPythonデータ構造をコンパクトに作れる形式だ。内包表記を使えば、ループや条件テストを寡黙な構文で結合できる。内包表記が使えているかどうかは、Python初心者レベルを卒業できているかどうかの目印になる。

### 4.6.1 リスト内包表記
---
1から5までの整数のリストは、次のように一度にひとつずつ要素を追加しても作れる。

例：
**1から5までの整数のリストを作る**

In [2]:
number_list = []
number_list.append(1)
number_list.append(2)
number_list.append(3)
number_list.append(4)
number_list.append(5)
number_list

[1, 2, 3, 4, 5]

forループとrange()関数でも作れる。

例：
**1から5までの整数のリストを作る**

In [3]:
number_list = []
for number in range(1, 6):
    number_list.append(number)
number_list

[1, 2, 3, 4, 5]

さらには、range()の出力を直接リストに変換しても作れる。

例：
**1から5までの整数のリストを作る**

In [4]:
number_list = list(range(1, 6))
number_list

[1, 2, 3, 4, 5]

これらはどれも有効なPythonコードであり、同じ結果を生み出すが、**リスト内包表記**を使った方がPythonらしいコードになる。リスト内包表記のもっとも単純な形式は、次の通りだ。

[ expression for item in iterable ]

リスト内包表記を使って先程の整数リストを作るには、次のようにする。

例：
**1から5までの整数のリストを作る（リスト内包表記）**

In [8]:
number_list = [number for number in range(1, 6)]
number_list

[1, 2, 3, 4, 5]

第1行の最初のnumber変数は、リストに入れる値を作るために必要だ。つまり、ループの実行結果をnumber_listに格納するのである。第2のnumberは、forループの一部だ。最初のnumberが式だということを示すために、少し書き換えた次のコードを試してみる。

例：
**0から4までの整数のリストを作る（リスト内包表記）**

In [9]:
number_list = [number - 1 for number in range(1, 6)]
number_list

[0, 1, 2, 3, 4]

リスト内包表記では、角かっこのなかにループが記述される。この内包表記のサンプルは最初のものよりも複雑だったが、もっと複雑なものがある。次に示すように、リスト内包表記には条件式も追加できる。

[ expression for item in iterable if condition ]

では、1から5までの奇数だけのリストを作る新しい内包表記を作ってみよう（number % 2は、奇数ではTrue、偶数ではFalseになることを覚えておこう）。

例：
**1から5までの奇数だけのリストを作る（リスト内包表記）**

In [12]:
a_list = [number for number in range(1, 6) if number % 2 == 1]
a_list

[1, 3, 5]

この内包表記は、次のような古くからの書き方と比べて少しコンパクトになっている。

例：
**1から5までの奇数だけのリストを作る（古くからの書き方）**

In [13]:
a_list = []
for number in range(1, 6):
    if number % 2 == 1:
        a_list.append(number)
a_list

[1, 3, 5]

最後に、ループをネストできるのと同じように、内包表記でもfor ...節を複数使うことができる。まず、古くからのネストされたループを買い手結果を表示してみる。

例：
**ネストされたループ（古くからの書き方）**

In [17]:
rows = range(1, 4)
cols = range(1, 3)
for row in rows:
    for col in cols:
        print(row, col)

1 1
1 2
2 1
2 2
3 1
3 2


次に、包括表記を使って結果を(raw, col)形式のタプルにして、cells変数に代入する。

例：
**ネストされたループ（リスト内包表記）**

In [18]:
rows = range(1, 4)
cols = range(1, 3)
cells = [(row, col) for row in rows for col in cols]
for cell in cells:
    print(cell)

(1, 1)
(1, 2)
(2, 1)
(2, 2)
(3, 1)
(3, 2)


なお、**タプルのアンパック**を使って、cellsリストを反復処理しながらタプルからrow、colの値を引き抜くこともできる。

例：
**ネストされたループ（リスト内包表記）**

In [19]:
rows = range(1, 4)
cols = range(1, 3)
cells = [(row, col) for row in rows for col in cols]
for row, col in cells:
    print(row, col)

1 1
1 2
2 1
2 2
3 1
3 2


リスト内包表記内のfor row ... for col ... には、それぞれ専用のifテストも付けられる。

### 4.6.2 辞書内包表記
---
ただのリストだけではない。辞書にも内包表記がある。もっとも単純な形式は、次である。

{ key_item : value_item for item in iterable }

リスト内包表記と同様に、辞書内包表記もifテストと複数のfor節を持てるようになっている。

例：
**辞書内包表記**

In [20]:
word = 'letters'
letter_counts = {letter: word.count(letter) for letter in word}
letter_counts

{'e': 2, 'l': 1, 'r': 1, 's': 1, 't': 2}

'letters'という文字列に含まれる7個の文字を反復処理し、その文字が何回現れたかを数える。しかし、すべてのeを2回、すべてのtを2回数えなければならないので、2回分のword.count(letters)の実行時間が無駄になる。しかし、2回目にeを数えたとき、すでにある辞書エントリを置き換えるだけなので、実害はない。同じことがtの計算にも言える。そこで、次のようにすれば、ほんの少しだけPythonらしさが増す。

例：
**辞書内包表記（set()を使う）**

In [21]:
word = 'letters'
letter_counts = {letter: word.count(letter) for letter in set(word)}
letter_counts

{'e': 2, 'l': 1, 'r': 1, 's': 1, 't': 2}

### 4.6.3 集合内包表記
---
誰だって仲間はずれにされるのはいやなので、集合でさえ内包表記を持っている。もっとも単純なバージョンは、今見たばかりに辞書内包表記とよく似ている。

{ item for item in iterable }

集合でも、長いバージョン（ifテスト、複数のfor節）が使える。

例：
**集合内包表記**

In [23]:
a_set = {number for number in range(1, 6) if number % 3 == 1}
a_set

{1, 4}

### 4.6.4 ジェネレータ内包表記
---
実は、タプルには内包表記がない。リスト内包表記の角かっこを普通のかっこに変えれば、タプル内包表記ができると思われたかもしれない。実際、次のように入力しても例外は起きないので、それで動作するように見える。

例：
**ジェネレータ内包表記**

In [25]:
number_thing = (number for number in range(1, 6))


かっこの間のものは、**ジェネレータ内包表記**であり、このコードは**ジェネレータオブジェクト**を返す。

例：
**ジェネレータ内包表記**

In [26]:
type(number_thing)

generator

ジェネレータについては、「4.8 ジェネレータ」で詳しく説明するが、イテレータにデータを供給する方法のひとつである。

次に示すように、このジェネレータオブジェクトは直接forループで処理出来る。

例：
**ジェネレータオブジェクトからforループを使い値を取り出す**

In [31]:
number_thing = (number for number in range(1, 6))
for number in number_thing:
    print(number)

1
2
3
4
5


ジェネレータ内包表記をlist()呼び出しでラップすれば、リスト内包表記のように動作させることができる。

例：
**ジェネレータオブジェクトをlist()でラップする**

In [29]:
number_thing = (number for number in range(1, 6))
number_list = list(number_thing)
number_list

[1, 2, 3, 4, 5]

ジェネレータは一度だけしか実行出来ない。リスト、集合、文字列、辞書はメモリ内にあるが、ジェネレータは一度にひとつずつその場で値を作り、イテレータに渡していってしまうので、作った値を覚えていない。そのため、ジェネレータをもう一度使ったり、バックアップしたりすることはできない。

例：

In [32]:
try_again = list(number_thing)
try_again

[]

ジェネレータは、ここで行ったようにジェネレータ内包表記から作ることができるほか、**ジェネレータ関数**からも作れる。まず、一般的な関数について話してから、ジェネレータ関数という特殊条件を取り上げる。