## This file include iterator, list comprehension, generator.

## Python迭代
+ 迭代：重复做一件事
+ 如果某个对象，在其内部实现了\__iter\__()或\__getitem\__()的方法，则其为可迭代对象
+ 可迭代(iterable)对象支持每次返回自己所包含的一个成员的对象,也就是可遍历对象


### 可迭代对象有：
+ 序列类型：list, str, tuple
+ 非序列类型：dict, file
+ 用户自定义包含\__iter\__()或\__getitem\__()方法的类


### for循环可用于任何可迭代对象  
+ for循环开始时，会通过迭代协议传递给iter()内置函数，从而能够从可迭代对象中获得一个迭代器，返回的对象含有需要的\__next\__()方法

In [1]:
l1 = [1, 2, 3]
print(dir(l1)) # 可以看到含有iter、getitem的方法，所以是可迭代对象

['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'clear', 'copy', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']


In [2]:
i1 = l1.__iter__()
print(i1)  # 返回一个迭代器对象，每次使用循环时，系统自动创建迭代器，来遍历每个元素
print(i1.__next__())
print(i1.__next__())
print(i1.__next__()) # 注意：迭代器不可逆，要想再迭代就要创建新的迭代器

<list_iterator object at 0x000001449EEA60B8>
1
2
3


### 迭代器(iterator):
+ 又称为游标(cursor)，它是程序设计的软件设计模式，是一种可在容器(container)上实现元素遍历的接口
+ 迭代器是一种特殊的数据结构，也是以对象的形式存在
+ 简单的理解就是：迭代器定义了遍历可迭代对象中的每个元素的顺序或方法

In [3]:
i2 = iter(l1) # 等价于 i2 = l1.__iter__()
print(i2.__next__())
print(i2.__next__())
print(i2.__next__())

1
2
3


## 列表解析：
+ 定义：根据已有列表，高效生成新列表的方式
+ 它是python迭代机制的一种应用，常用用于创建新的列表

In [4]:
l1 = [1, 2, 3, 4, 5]
l2 = []
for i in l1:
    l2.append(i ** 2)
print(l2)

# 使用列表解析
l3 = [i**2 for i in l1] # 这个列表解析比for循环要快得多
print(l3)

[1, 4, 9, 16, 25]
[1, 4, 9, 16, 25]


In [5]:
l4 = [i**2 for i in l1 if i>=3] # 加入额外判断
print(l4)

[9, 16, 25]


In [6]:
for i in [i**2 for i in range(1, 11)]:
    print(i//2)

0
2
4
8
12
18
24
32
40
50


In [7]:
for i in [i**2//2 for i in range(1, 11)]:
    print(i)

0
2
4
8
12
18
24
32
40
50


In [8]:
for i in [i**2//2 for i in range(1, 11) if i%2 == 0]:
    print(i)

2
8
18
32
50


In [9]:
# 导出文件夹下以.ipynb为结尾的文件并创建成列表
import os
list1 = os.listdir('../day5')
list2 = [i for i in list1 if i.endswith('.ipynb')] # 特别适合提取文件夹中特定的图片路径
print(list2)

['if_statement.ipynb', 'iterator_and_list_comprehension.ipynb', 'README.ipynb', 'while_and_for_statement.ipynb']


In [10]:
# 使用循环嵌套
l1 = ['x', 'y', 'z']
l2 = [1, 2, 3]
l3 = [(i, j) for i in l1 for j in l2]
print(l3)

[('x', 1), ('x', 2), ('x', 3), ('y', 1), ('y', 2), ('y', 3), ('z', 1), ('z', 2), ('z', 3)]


In [11]:
# 使用循环嵌套加上条件
l1 = ['x', 'y', 'z']
l2 = [1, 2, 3]
l3 = [(i, j) for i in l1 for j in l2 if j != 1]
print(l3)

[('x', 2), ('x', 3), ('y', 2), ('y', 3), ('z', 2), ('z', 3)]


## 生成器表达式：
+ 列表解析表达式是一次生成全部对象，如果没有使用到的对象就很占内存
+ 而生成器表达式是一次只生成一个对象，调用一次生成一次。使用“懒性计算”或称为“延迟求值”的机制
+ 其并不真正创建数字列表，而是返回一个生成器对象，此对象在每次计算出一个条目后，就“产生”(yield)出来
+ 序列过长，并且每次只需要获取一个元素时，应当考虑使用生成器表达式而不是列表解析
+ 生成器表达式的语法就是把列表解析的\[\]换成()

In [12]:
print((i**2 for i in range(1, 11))) # 注意返回的是生成器对象
g1 = (i**2 for i in range(1, 11))
print(g1.__next__())
print(g1.__next__())
print(g1.__next__())
print(g1.__next__())

<generator object <genexpr> at 0x000001449EE0CCF0>
1
4
9
16


In [13]:
for i in (i**2 for i in range(1, 11)):
    print(i//2)

0
2
4
8
12
18
24
32
40
50


### enumerate:
+ range可在非完备遍历中用于生成索引偏移，如range(1,100,2)
+ 若同时需要偏移的索引和偏移元素，则可以使用enumerate()函数，其内置函数返回一个生成器对象

In [14]:
url = "www.baidu.com"
g1 = enumerate(url) # 获取枚举的生成器
print(g1.__next__()) # 可以获取对象的索引以及元素本身
print(g1.__next__())
print(g1.__next__())
print(g1.__next__())

(0, 'w')
(1, 'w')
(2, 'w')
(3, '.')


In [15]:
for i,value in enumerate(url):
    if i < 4:
        print(i)
        print(value)

0
w
1
w
2
w
3
.
