# イテレータ

ファイルオブジェクトはイテレータ（というオブジェクト）の一種。
`iterate`とは「繰り返す」という意味、つまりイテレータはその要素を一つづつ取り出す処理が
可能なオブジェクトのことで、`next`という関数でその処理を一回行うことが出来る。


In [1]:
# 変数ｆにファイルオブジェクト入っているとして

f = open('sample.txt', 'r')

In [2]:
# next()でファイルから1行取り出す
next(f)

'Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.\n'

In [3]:
# もう一度
next(f)

'Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur.\n'

In [4]:
# 更に
next(f)

'Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.\n'

In [5]:
# エラー
next(f)

StopIteration: 

`f.readline()`とよく似ているがファイルの終わりに到達したときの挙動が異なる。
具体的には、`readline()`は`''`という空文字列を返すが、`next()`ではStopIteration
というエラーを送出する。（StopIterationを受け取ったループは繰り返しをストップする）
関数`next()`が適用できて`next()`が何らかの値を返し、`StopIteration`を発するような
オブジェクトをイテレータという。


In [6]:
f.close()

## for文による繰り返しとファイルオブジェクト

一般に、イテレータはfor文の`in`の後に指定することが出来る。
繰り返しの各ステップで`next(f)`が呼び出されて、変数`line`がその値に設定され、for文の
中身が実行される。


In [7]:
with open('sample.txt', 'r') as f:
    for line in f:
        print(line)

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.

Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur.

Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.



ファイルオブジェクトに対して、一度for文で処理すると、繰り返し処理がファイルの終わりに
達しているので、もう一度同じファイルオブジェクトをfor文に渡しても何も実行されない。
ファイルをfor文に二度読ませたい場合は、もう一度ファイルをオープンして、オブジェクト
を新たに作成しなければいけない。

In [8]:
with open('sample.txt', 'r') as f:
    print('--- first time ---')
    for line in f:
        print(line)
    print('--- once again ---')
    for line in f:
        print(line)

--- first time ---
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.

Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur.

Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.

--- once again ---


In [9]:
def last_line(name):
    f = open(name, 'r')
    for line in f:
        pass
    f.close()
    return line

In [10]:
last_line('sample.txt')

'Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.\n'

## iter

リストに対してfor文を用いることができるが、果たしてリストはイテレータなのだろうか？


In [11]:
next([1,2,3])

TypeError: 'list' object is not an iterator

リストに`next()`を適用してもリストはイテレータではないというエラーが返ってくる。
にもかかわらず何故リストに対してfor文を適用できるのか。

実は、for文の`in`の後に指定されたオブジェクトに対して必ず`iter`という組み込み関数が適用される。
これによってイテレータではないオブジェクトも反復可能となる。

In [15]:
it = iter([1,2,3])

In [16]:
next(it)

1

In [17]:
next(it)


2

In [18]:
next(it)


3

In [19]:
next(it)


StopIteration: 

In [20]:
it = iter([1,2,3])

for x in it:
    print(x)

1
2
3


In [22]:
# もう一度・ファイルの場合と同様にオブジェクトを消費しつくすと処理する対象がなくなる。
for x in it:
    print(x)

for文がイテラブルでないオブジェクトでも反復処理できるのは、`in`の後に指定されたオブジェクトに対して
組み込み関数`iter`を適用してイテレータ化してから`next()`で呼び出しているからである。