# 第7章 迭代器、生成器与装饰器
* Python

## 7.1 迭代器
* **可迭代对象**：可以直接作用于for循环的对象统称为可迭代对象。
    * 如：list，tuple，dict，set，str等数据类型。
* **迭代器**：是访问可迭代对象元素的一种方式，能够通过一种使对象可迭代的方式对序列从第一个元素开始访问，直到所有的元素被访问为止。
* **注意：迭代器对序列的访问只能往前不会后退。**
* 迭代器有两个基本的方法：
    * （1）iter()方法：返回迭代器对象本身，即：创建迭代器；
    * （2）next()方法：返回迭代器的下一个元素，即：运行一次，迭代一次。

#### 例：创建一个字典，用for循环输出其所有键。

In [None]:
it={'a':101,'b':202,'c':303}
for keys in it:
    print(keys, end='')

* 上述for循环语句执行时，首先会从对象it中创建一个迭代器，即：

In [None]:
it_it=iter(it)  #创建迭代器
it_it

In [None]:
list(it_it)

In [None]:
next(it_it)  #运行一次，迭代一次

### 回顾：
* Python中常用的两个内置的**迭代工具函数**：
    * **enumerate()函数**：遍历序列中的元素以及它们的索引；
    * **zip()函数**：将多个序列中的元素“配对”，返回一个可迭代的zip对象。

In [None]:
a=['a','b','c']
list(enumerate(a))

In [None]:
enumerate(a)

In [None]:
b=[1,2,3,4]
list(zip(a,b))  #zip的多个序列长度不同时，以最短序列的长度为标准自动截取

In [None]:
zip(a,b)

## 7.2 生成器
* 生成器(generator)：是构造新的可迭代对象的一种简单方式。
* 一般的函数执行后只会返回单个值，而**生成器则是以延迟的方式返回一个值序列**；
    * 即：每返回一个值之后暂停，直到下一个值被请求时再继续返回。
* **要创建一个生成器，只需将函数中的return替换为yield**；
    * 即：在Python中，**带有yield的函数被称为生成器**。

In [None]:
def cube(n=10):
    print("Generating cubes from 1 to %d" %(n**3))
    for i in range(1,n+1):
        yield(i**3)

* 调用上述生成器时，没有 任何代码会被立即执行：

In [None]:
gen=cube()
gen

* 直到从该生成器中请求元素时，它才会开始执行其代码：

In [None]:
for x in gen:
    print(x, end='-')

* 如果想重复运行上述for循环，需要重新运行gen的赋值语句。

#### 例：使用生成器生成n以内的所有素数。

In [None]:
from math import sqrt
def primenumber(n):
    for i in range(2,n+1):
        k=0;j=2
        while j<=sqrt(i):
            if i/j==int(i/j):
                k=1
                break
            j+=1
        if k==0:
            yield i  #生成器

for i in primenumber(10):
    print(i,end=' ')

In [None]:
pn10=primenumber(10)
next(pn10)

In [None]:
next(pn10)

### 生成器表达式
* **生成器表达式**是构造生成器的最简单方式，类似列表、字典、集合**推导式**。
* 其创建方式为：把推导式两端的方括号(或花括号)修改为**圆括号**即可。

In [None]:
gen=(x**3 for x in range(10))
gen

In [None]:
list(gen)

In [None]:
next(gen),next(gen)  #上一语句中已经遍历结束，如还需要使用该生成器，需要重新运行gen赋值语句

In [None]:
sum(gen)

### 生成器“嵌套”：yield from
* Python3中允许一个生成器将其部分操作委派给另一个生成器；
    * 这样能使生成器像一个函数可以分为多个子函数一样简单。
* 对于简单的生成器：

In [None]:
yield from iterable

等价于

In [None]:
for item in iterable:
    yield item

#### 例：生成元素分别为指定整数的正序和倒序的列表：

In [None]:
def list_gen(x):
    for i in range(x):
        yield i
    for j in range(x,0,-1):
        yield j

list(list_gen(5))

In [None]:
def list_gen(x):
    yield from range(x)
    yield from range(x,0,-1)

list(list_gen(5))

* **对于生成器函数，yield from就像调用子函数一样。**
* 如，要生成指定整数范围内所有的素数：
    1. 首先可以先定义一个用于判断某个整数是否为素数的生成器；
    * 然后使用yield from生成指定范围内的所有素数。

In [1]:
from math import sqrt
def isPrimeNumber(n):
    k=0;j=2
    while j<=sqrt(n):
        if (n/j)==int(n/j):
            k=1
            break
        j+=1
    if k==0:
        yield n

In [2]:
def prime(n):
    for i in range(2,n+1):
        yield from isPrimeNumber(i)
list(prime(10))

[2, 3, 5, 7]

* Python标准库**itertools模块**中有一组用于许多常见数据算法的迭代器和生成器。
    * 如：starmap、islice、groupby等。

In [4]:
import itertools
dir(itertools)

* **itertools.starmap(func, iterable)**表示将func函数应用于**可迭代对象**iterable的每个元素，返回一个**迭代器**。

In [None]:
?itertools.starmap

In [9]:
ysm=itertools.starmap(pow, [(1,2),(3,4),(5,6)])  #
for i in ysm:
    print(i, end=' ')

1 81 15625 

* **itertools.islice()**对可迭代对象iterable进行**切片**，返回一个**迭代器**。
    * islice(iterable, start, stop[,step])
    * islice(iterable, stop)，此时start=0且step=1

In [None]:
?itertools.islice

In [10]:
lst=['China','Japan','UK','USA','Italy','Germay','Korea']
list(itertools.islice(lst,2,5,1))

['UK', 'USA', 'Italy']

In [15]:
list(itertools.islice(lst,5))

['China', 'Japan', 'UK', 'USA', 'Italy']

* **itertools.groupby(iterable, key=None)**根据关键词key对可迭代对象iterable进行**分组**，返回一个迭代器。
* 当key=None时，会将可迭代对象中**相邻的重复元素**挑出来放在一起。

In [31]:
?itertools.groupby

In [47]:
list(itertools.groupby('AAAABBBBCCAA'))

[('A', <itertools._grouper at 0x28bf5773b50>),
 ('B', <itertools._grouper at 0x28bf5773a60>),
 ('C', <itertools._grouper at 0x28bf5773520>),
 ('A', <itertools._grouper at 0x28bf5773430>)]

In [48]:
for key,group in itertools.groupby('AAAABBBBCCAA'):
    print(key,list(group))

A ['A', 'A', 'A', 'A']
B ['B', 'B', 'B', 'B']
C ['C', 'C']
A ['A', 'A']


In [53]:
for key,group in itertools.groupby([1,3,3,2,3,4]):
    print(key,list(group))

1 [1]
3 [3, 3]
2 [2]
3 [3]
4 [4]


## 7.3 装饰器
* 装饰器(decorator)可以在函数调用前后，**让已有函数在不做任何代码改动的情况下增加特定功能**。
    * 这种在代码运行期间动态增加功能的方式即**装饰器**。
* 装饰器本质上就是一个返回函数的高阶函数，即可以接受另一个函数作为参数的函数。
* 总结装饰器的几点属性：
    * 实质：是一个函数；
    * 参数：是要装饰的函数名（并非函数调用）；
    * 返回：是装饰完的函数名（也并非函数调用），内层函数（闭包）负责修饰被修饰函数；
    * 作用：为已经存在的对象添加额外的功能；
    * 特点：不需要对对象做任何的代码上的变动。

### （1）装饰器的声明
* 装饰器本质也是一个函数，因此**装饰器的定义(声明)方式与函数定义(声明)方式一样**。

#### 例：定义一个可以计算函数执行时间的装饰器timecal。

In [1]:
import time
def timecal(func):
    def wrapper(*args, **kw):
        start=time.time()
        func(*args, **kw)
        stop=time.time()
        print("Run time is %s" %(stop-start))
    return wrapper

* 在上面代码中，func是要装饰器的函数，目的是用装饰器timecal显示func函数运行的时间。
    * 该函数的**传入参数**是func(被装饰函数)，**返回参数**是内层函数wrapper(闭包)。
* 内层函数wrapper起到装饰给定函数的作用：
    * wrapper参数为(\*args, \*\*kwargs)，可以接受任意参数的调用。

### （2）装饰器的调用
* **装饰器调用方式**：用**\@语法糖**将装饰器放置于欲想在运行期间动态增加功能的函数定义处即可。

In [10]:
@timecal
def snn(n, start=1):
    "Calculate the sum of natural numbers within [start,n]"
    s=0
    for i in range(start,n+1): s+=i
    print("Sum of natural numbers within [%s,%s] is %s" %(start,n,s))

snn(100)

Sum of natural numbers within [1,100] is 5050
Run time is 0.0009989738464355469


* 在调用snn函数时，由于装饰器的存在，会自动显示出snn函数的执行时间(秒)。
* 把@timecal放置于snn函数的定义处，相当于执行如下语句：

In [11]:
timecal(snn(100))

Sum of natural numbers within [1,100] is 5050
Run time is 0.0009968280792236328


<function __main__.timecal.<locals>.wrapper(*args, **kw)>

### （3）装饰器本身也可以是带参数的
* 装饰器本身也可以是带参数的，只需要编写一个返回装饰器本身的高阶函数。

#### 例：定义一个高阶函数ttime，其返回值为装饰器timecal。

In [13]:
def ttime(prompt):  #高阶函数
    def timecal(func):  #装饰器
        def wrapper(*args, **kw):  #内层函数
            start=time.time()
            func(*args, **kw)
            stop=time.time()
            print("Run time is %s" %(stop-start))
        return wrapper
    return timecal

* **调用**：在定义被装饰的函数时，可在**@语法糖**中加入需要传递的参数：

In [14]:
@ttime("Notice:")  #此处装饰器的参数为一个字符串
def snn(n, start=1):
    "Calculate the sum of natural numbers within [start,n]"
    s=0
    for i in range(start,n+1): s+=i
    print("Sum of natural numbers within [%s,%s] is %s" %(start,n,s))

snn(100)

Sum of natural numbers within [1,100] is 5050
Run time is 0.0010006427764892578


* 把@ttime("Notice:")放置于snn函数的定义处，相当于执行如下语句：

In [15]:
ttime("Notice:")(snn(100))

Sum of natural numbers within [1,100] is 5050
Run time is 0.0


<function __main__.ttime.<locals>.timecal.<locals>.wrapper(*args, **kw)>

### （4）装饰器的效果
* 装饰器虽然不会改变所装饰函数的功能，但**会改变所装饰函数的\_\_name\_\_属性等元信息**。

#### 例：函数snn经过装饰后，其名称在系统中已经不是snn，而被修改为内层函数名称wrapper。

In [16]:
snn.__name__

'wrapper'

* Python内置的**functools.wraps模块**可以解决这个问题。
* functools.wraps本身也是一个装饰器，它将原函数的元信息拷贝到装饰器环境中，从而不会被所替换的新函数覆盖掉。

In [21]:
import functools
def ttime(prompt):
    def timecal(func):
        @functools.wraps(func)  #元信息拷贝
        def wrapper(*args, **kw):
            start=time.time()
            func(*args, **kw)
            stop=time.time()
            print("Run time is %s" %(stop-start))
        return wrapper
    return timecal
@ttime("Notice:")
def snn(n, start=1):
    "Calculate the sum of natural numbers within [start,n]"
    s=0
    for i in range(start,n+1): s+=i
    print("Sum of natural numbers within [%s,%s] is %s" %(start,n,s))

In [22]:
snn.__name__

'snn'

* 由于装饰器所具备的特性，其有很多经典的应用场景：权限校验、日志记录、性能测试、事务处理等。
* 装饰器可以提高代码复用的便利性。