# Pythonプログラミング入門 第6回
イテレータとイテラブルについて説明します

参考
- https://docs.python.org/ja/3/tutorial/classes.html
- https://docs.python.org/ja/3/library/abc.html

# ▲イテレータとイテラブル
6-1で利用法を説明したイテレータや、暗黙的に利用してきたイテラブルについて、より詳しく説明します。

## ジェネレータ関数と無限イテレータ
3-3にて、リスト内包表記と似て非なるものとして、イテレータを返すジェネレータ式を説明しました。
例を再掲します。

In [1]:
it = (x * 3 for x in 'abc')
for x in it:
    print(x)

aaa
bbb
ccc


このジェネレータ式と同等のものを、関数形式で定義できます。

In [2]:
def gen():
    for x in 'abc':
        yield x * 3
it = gen()
for x in it:
    print(x)

aaa
bbb
ccc


関数`gen()`は、`return`で値を返すのではなく`yield`で値を返しています。
`gen()`が返すイテレータ`it`は、`yield`された値を`next()`を適用する度に順に生成します。
このような関数を、**ジェネレータ関数**もしくは単に**ジェネレータ**と呼びます。
また、ジェネレータ関数・ジェネレータ式が返すイテレータのことを特に、**ジェネレータイテレータ**と呼びます。

ジェネレータ関数は、ジェネレータ式と違って、途中状態を局所変数で管理できるので、より豊富なイテレータを構成できます。
例えば、次の`ascend()`は、与えられた整数から1ずつカウントアップする無限列のイテレータを返します。

In [3]:
def ascend(n):
    while True:
        yield n
        n += 1
        
for x in ascend(1):
    if x == 10:
        break # これがないと無限ループする
    else:
        print(x)

1
2
3
4
5
6
7
8
9


このように、ジェネレータ関数を使うことで、様々なイテレータを定義できるようになります。
因みに、`itertools`モジュール内には、`ascend()`を少しだけ拡張した関数`count()`が定義されています。

## イテラブルとfor文
さて、イテレータとコレクションが別物であるのに、なぜ同様にfor文で走査できるのでしょうか。
その答えは、組込み関数`iter()`にあります。

`iter()`にコレクションを与えると、それを前から順に走査するイテレータを返します。

In [4]:
it = iter('abc')
print(next(it))
print(next(it))
print(next(it))

a
b
c


`iter()`にイテレータを渡すと、何もせずにそのイテレータを返します。

In [5]:
it = iter('abc')
it2 = iter(it)
it is it2

True

実は、for文は、この`iter()`を`in`の後ろのオブジェクトに適用して得られたイテレータを使って、反復しています。
つまり、
```Python
for x in xs:
    print(x)
```
このfor文は、次のような反復処理と（変数`it`の導入を除いて）等価です。
```Python
it = iter(xs)
try:
    while True:
        x = next(it)
        print(x)
except StopIteration:
    pass
```

Pythonでは、イテレータという反復処理を表現した抽象的なオブジェクトを通すことで、具体的なデータ型の違いを忘れて、統一的に反復処理ができるように設計されています。

`iter()`を適用可能なオブジェクトのことを、**イテラブル（iterable）**と呼びます。

イテラブルを受け取る関数は、イテレータもコレクションも同様に受け取って処理します。
6-1において、コレクションやイテレータを取ると説明していた関数は、正確にはイテラブルを取ります。

## イテレータとイテラブルの定義

さて、イテレータとイテラブルがどんなものか分かったところで、それらをオブジェクト指向プログラミングの観点で改めて定義します。

**イテラブル**とは、`__iter__()`メソッドを持つオブジェクトです。`iter()`は、与えられたオブジェクトの`__iter__()`メソッドを呼び出しているだけです。したがって、`__iter__()`メソッドは、レシーバの持つ要素を走査するイテレータを返すことが期待されます。

**イテレータ**とは、`__iter__()`メソッドと`__next__()`メソッドを持つオブジェクトです。ただし、`__iter__()`メソッドは、そのレシーバをそのまま返します。`__next__()`は、次の要素を返すか、終わりに達していたら`StopIteration`を送出します。`next()`は、与えられたオブジェクトの`__next__()`メソッドを呼び出すだけです。この`__iter__()`メソッドと`__next__()`メソッドに関する規約を、[イテレータプロトコル](https://docs.python.org/ja/3.7/tutorial/classes.html#iterators)と呼ばれます。

クラス定義にて`__iter__()`と`__next()__`を定義すれば、そのインスタンスはイテレータとなります。
次の`Ascend`クラスは、前述のジェネレータ関数`ascend()`と同等のイテレータを返します。

In [6]:
class Ascend:
    def __init__(self, n):
        self.n = n
    def __iter__(self):
        return self
    def __next__(self):
        n = self.n
        self.n += 1
        return n
it = Ascend(1)
next(it)

1

In [7]:
next(it)

2

ここで、`__init__()`はコンストラクタに対応する特殊メソッドであり、`Ascend`インスタンスの属性`self.n`は、次の`next()`で返される値を保持します。
このように、メソッドによって特徴付けられた統一的な反復処理は、オブジェクト指向プログラミングの典型例です。

イテレータやイテラブルの定義にはメソッドを要求しますが、自前のイテレータを定義するときに、クラスを使う必要はありません。
ジェネレータ関数を通してイテレータを定義すれば、実際上十分です。
単純なイテレータであれば、ジェネレータ式でも十分でしょう。
尚、ジェネレータ関数はメソッドにもできます。
次の`CanaryList`は、それを操作するイテレータが、`next()`で値を生成する度に、その値をprintするように`list`を拡張したクラスです。

In [8]:
class CanaryList(list):
    def __iter__(self):
        for x in super().__iter__():
            print(x)
            yield x

for x in CanaryList([1,2,3]):
    pass

1
2
3


## コレクションの階層
これまで要素の集まりのことをコレクションと呼び、文字列・リスト・タプルなどをシーケンスと呼んできました。
このコレクションやシーケンスは、具体的なクラスを指したものではなかったのですが、Pythonでは、抽象クラスという形で、その実装要件が定義されています。

| 抽象クラス | 継承している抽象クラス | 抽象メソッド | 性質の説明 |
| :---           | :---               | :---         | :--- |
| `Container`    | 　                 | `__contains__()` | `in`演算子が適用できる |
| `Sized`        | 　                 | `__len__()` | 組込み関数`len()`が適用できる |
| `Iterable`     | 　                 | `__iter__()` | 組込み関数`iter()`が適用できる
| `Iterator`     | `Iterable`         | `__next__()` | 組込み関数`next()`が適用できる
| `Reversible`   | `Iterable`         | `__reversed__()` | 組込み関数`reverse()`が適用できる
| `Collection`   | `Container` `Sized` `Iterable` | 　 | |
| `Sequence`     | `Collection` `Reversible` | `__getitem__()` | 項目アクセス演算（`x[k]`）が適用できる |
| `Mapping`      | `Collection` | `__getitem__()` | 項目アクセス演算（`x[k]`）が適用できる |

ここので抽象メソッドとは、その抽象クラスが実装を要求するメソッドを意味します。
抽象クラスを継承する場合、その実装責任も継承します。
つまり、コレクションとは、`__contains__()`・`__len__()`・`__iter__()`メソッドを持ち、`in`・`len()`・`iter()`が適用可能なオブジェクトです。
この階層を見れば、`reverse()`がコレクション一般には適用できず、シーケンスを引数に取ることが一目で分かります。

多くの組込み関数やfor文・内包表現は、最も要件の緩い`Iterable`しか要求しないので、様々なデータ型を統一的に扱えるのです。

この階層の説明は、意図的に簡略化しています。
詳細は、[`collections.abc`モジュールのドキュメント](https://docs.python.org/ja/3/library/collections.abc.html)を参照してください。
