# Iterations and comprehensions
## I. 基本概念
### I.1 相关对象和工具
- <font color=blue>**iterable**</font>: 
  - 支持iter call的对象，也就是定了<code>\_\_iter__</code> mehtod。<code>iter(obj)</code>会invoke <code>obj.\_\_iter__() </code>
  - 包括：
    1. 属于sequence的那些类型，如：list, string, tuple
    2. file object
    3. <font color=orange>**dictionary, keys of dictionary, range**</font>, 以及<font color=orange>**map, zip, emumerate, filter的返回值**</font>，等
- <font color=blue>**iterator**</font>: 
  - 从定义上讲，任何按下面规则定义了<code>\_\_next__</code> method的对象都是iterator。
    - <font color=blue>**规则**：<code>\_\_next__</code>每次返回对象中的一个元素，直到遍历所有元素后raise <code>StopIteration exception</code></font>
  - <code> iter(iterable)</code>的返回值就是典型的iterator
- <font color=blue>**iteration tools**</font>: 
  - 是使用iterable对象的工具。他们根据**iteration protocol**中的规则来用iterable构造iterator，并执行遍历。
    - <font color=red>**iterable**是遍历的对象，而**iterator**是为了执行遍历而由iteration tool生成的临时对象。</font>
  - 包括：for loop, list comprehension, map, zip, range, etc
- <font color=green>**特点：通常情况下，在实现遍历的不同方式中，iterator + iteration tool是运行效率更高的方式。**</font>
  - **fast**：比如list comprehension的实现就做了优化，runs at C language sppeed inside Python.
  - **memory efficient**: iterator的迭代是lazy的，不使用的时候不会生成所有element sequence来占用存储空间。

### I.2   iteration tool的工作方式：iteration protocol
- 一开始的call <code>iter(iterable)</code>，得到其返回值iterator
  - <font color=orange>有的iterable自身就是iterator，因此不需要这一步。比如：file object</font>
  - <font color=orange>**list, dictionary**等常规的iterable都有这一步。</font>
- 开始遍历：持续call <code>iterator.\_\_next__()</code>，得到其返回的object。
   - 如果返回正常的object，则按照代码中的需要将其用于计算过程，并继续下一次遍历。
   - 如果返回了<code>StopIteration exception</code>则结束遍历。

## II. 典型的iterable
### II.1 file object, map, zip和filter的返回值既是iterable，又是iterator
- <code>for line in file: ...</code>
- iteration tool工作方式：
  - file作为iterator自带了<code>next()</code> method.
  - for会在每次遍历中invoke <code>next()</code> method来执行遍历的内容。

In [10]:
# 用for loop按行读文件
with open('script.py', 'r') as f:
    print(iter(f) is f)
    for line in f:
        print(line.upper(), end='') # 文档每行结尾有'\n'，所以要suppress print中默认结尾加'\n'

True
IMPORT SYS
PRINT(SYS.PATH)
X = 2
PRINT(X ** 5)



### II.2 list, range等只是iterable
- iteration tool工作方式：
  - for loop会将iterable，这里的file object，传给<code>iter()</code>。
  - <code>iter(file_obj)</code>返回一个iterator。iterator自带了<code>next()</code> method.
  - for会在每次遍历中invoke <code>next()</code> method来执行遍历的内容。

### II.3 file object和其他built-in iterable的差异来源
- file中的元素只能遍历一遍，因此在file object的method里面，直接把<code>\_\_iter__ </code>和<code>\_\_next__</code>都implement了。
- list, dictionary等object支持多次遍历(multiple iteration)，每次call<code>\_\_iter__ </code>都要生成一个interator的实例，因此需要另外构建iterator对象，并在其中implement<code> \_\_next__</code> method。

## III. 典型的iteration tools
### III.1 for loop
略

### III.2 各种形式的comprehension
- 常见形态：
  - <font color=blue>**list comprehension**</font>: <code>[expression(i) for i in iterable]</code>
  - <font color=blue>**dict comprehension**</font>: <code>{key: v for key, v in zip(x, y)}</code>
  - <font color=blue>**generator comprehension**</font>: <code>(expression(i) for i in iterable)</code>
    - <font color=orange>注：用'()'得到的是generator comprehension，不是tuple comprehension</font>。
  - <font color=blue>**tuple comprehension**</font>: <code>tuple(expression(i) for i in iterable)</code>
    - <font color=green>用tuple comprehension的场景：生成的tuple sequence是immutable</font>
#### III.2.1 list comprehension
- 用法
  - 形态：<code>[func(i) for i in iterable]</code>
  - 以file为例：
    - <code>[func(line) for line in open('file_name')]</code>
    - 特点是不会一开始就读出来整个文档，而是处理一行读取一行。
    - 下面这种方式就是要先读出来整个文档，然后再逐行处理：
    ```python
    lines = open('file_name').readlines()
    [func(line) for line in lines]         # 虽然都是list comprehension，但执行效果不同
    ```

- 扩展形态
  - <font color=green>**嵌套方式依据python从左到右执行statement的原则来判断。**</font>
  1. 加条件
     - 形式：<code>[expression(i) for i in iterable if func(i)]</code>
  2. 双层遍历：
     - 形式1：<code>[expression(j)  for i in iterable for j in i]</code>
     - 形式2：<code>[expression(i,j)  for i in iterable_1 for j in iterable_2]</code>

#### III.2.2  generator comprehension
- **generator comprehension和其他几种常见comprehension的最主要区别**：
  - generator comprehension的返回值是一个generator，它在遍历的时候是lazy的
  - list, dict, tuple comprehension的返回值是对应的sequence object。

In [12]:
my_list = [1, 3, 5, 9, 2, 6]
filtered_list = [item for item in my_list if item > 3]
filtered_generator = (item for item in my_list if item > 3)
print(filtered_list)
print(filtered_generator)

[5, 9, 6]
<generator object <genexpr> at 0x797bbd4ee5e0>
