# 有益的探索

## 思维导图

![思维导图](./图片等杂项/思维导图.png "思维导图")

![数据类型](./图片等杂项/数据类型.png "数据类型")

![更简洁](./图片等杂项/更简洁.png "更简洁")

![神器](./图片等杂项/神器.png "神器")



## 1.数据类型的底层实现

### 1.1 从奇怪的列表开始

#### 1.复制问题

In [1]:
list_1 = [1, [22, 33, 44], (5, 6, 7), {"name": "Sarah"}]

- 浅拷贝

In [2]:
# list_3 = list_1    #错误，只是相当于给了个别名
list_2 = list_1.copy()    #或者list_1[:]  \  list(list_1)也可以实现浅拷贝

- 对浅拷贝前后两列表分别进行操作

In [3]:
list_2[1].append(55)

print("list_1:  ", list_1)
print("list_2:  ", list_2)

list_1:   [1, [22, 33, 44, 55], (5, 6, 7), {'name': 'Sarah'}]
list_2:   [1, [22, 33, 44, 55], (5, 6, 7), {'name': 'Sarah'}]


- 为什么我改的是list_2,list_1也变了

#### 2. 列表的底层实现

**引用数组的概念**

列表内的元素可以分散的存储在内存中  
列表存储的，实际上是这些**元素的地址！！！** ——地址的存储在内存中是连续的

![引用数组](./图片等杂项/引用数组概念图.png "引用数组概念图")

In [2]:
list_1 = [1, [22, 33, 44], (5, 6, 7), {"name": "Sarah"}]
list_2 = list(list_1)    #浅拷贝

(1). 新增元素

In [3]:
list_1.append(100)
list_2.append("n")

print("list_1:  ", list_1)
print("list_2:  ", list_2)

list_1:   [1, [22, 33, 44], (5, 6, 7), {'name': 'Sarah'}, 100]
list_2:   [1, [22, 33, 44], (5, 6, 7), {'name': 'Sarah'}, 'n']


实现原理：
![新增元素实现原理](./图片等杂项/实现原理1.png "新增元素实现原理")

(2).修改元素

In [4]:
list_1[0] = 10
list_2[0] = 20

print("list_1:  ", list_1)
print("list_2:  ", list_2)

list_1:   [10, [22, 33, 44], (5, 6, 7), {'name': 'Sarah'}, 100]
list_2:   [20, [22, 33, 44], (5, 6, 7), {'name': 'Sarah'}, 'n']


实现原理：
![修改元素实现原理](./图片等杂项/实现原理2.png "修改元素实现原理")

(3). 对列表型元素进行操作

In [5]:
list_1[1].remove(44)
list_2[1] += [55, 66]

print("list_1:  ", list_1)
print("list_2:  ", list_2)

list_1:   [10, [22, 33, 55, 66], (5, 6, 7), {'name': 'Sarah'}, 100]
list_2:   [20, [22, 33, 55, 66], (5, 6, 7), {'name': 'Sarah'}, 'n']


发生问题原因：
![对列表型元素操作产生问题的原因](./图片等杂项/问题原理1.png "列表问题原理")

(4). 对元组型元素进行操作

In [6]:
list_2[2] += (8, 7)

print("list_1:  ", list_1)
print("list_2:  ", list_2)

list_1:   [10, [22, 33, 55, 66], (5, 6, 7), {'name': 'Sarah'}, 100]
list_2:   [20, [22, 33, 55, 66], (5, 6, 7, 8, 7), {'name': 'Sarah'}, 'n']


实现原因：元组是**不可变数据类型**，+=操作实际上是产生了一个新的元组。
![实现原理3](./图片等杂项/实现原理3.png "对元组型元素操作的原理")

(5). 对字典元素进行操作

In [7]:
list_1[-2]["age"] = 18

print("list_1:  ", list_1)
print("list_2:  ", list_2)

list_1:   [10, [22, 33, 55, 66], (5, 6, 7), {'name': 'Sarah', 'age': 18}, 100]
list_2:   [20, [22, 33, 55, 66], (5, 6, 7, 8, 7), {'name': 'Sarah', 'age': 18}, 'n']


实现原理：散列表
![实现原理4](./图片等杂项/实现原理4.png "对字典型元素操作的原理")

#### 3. 引入深拷贝

**浅拷贝后**
- 针对不可变元素（数字，字符串，元组）的操作，都各自生效了
- 针对可变元素（列表，集合，字典）的操作，发生了一些混淆

**引入深拷贝**
- 深拷贝将所有层级的相关元素全部复制，完全分开，泾渭分明，避免了上述问题

In [10]:
import copy

list_1 = [1, [22, 33, 44], (5, 6, 7), {"name": "Sarah"}]
list_2 = copy.deepcopy(list_1)
list_1[-1]["age"] = 18
list_2[1].append(55)

print("list_1:  ", list_1)
print("list_2:  ", list_2)

list_1:   [1, [22, 33, 44], (5, 6, 7), {'name': 'Sarah', 'age': 18}]
list_2:   [1, [22, 33, 44, 55], (5, 6, 7), {'name': 'Sarah'}]


### 1.2. 神秘的字典
#### 1. 快速查找

In [11]:
import time

ls_1 = list(range(1000000))
ls_2 = list(range(500)) + [-10]*500

start = time.time()
count = 0
for n in ls_2:
    if n in ls_1:
        count += 1
end = time.time()
print(f'查找{format(len(ls_2))}个元素，在ls_1列表中的有{count}个，共用时{round((end - start), 2)}秒')

查找1000个元素，在ls_1列表中的有500个，共用时3.7秒


In [13]:
import time

d = {i:1 for i in range(1000000)}
ls_2 = list(range(500)) + [-10]*500

start = time.time()
count = 0
for n in ls_2:
    try:
        d[n]
    except:
        pass
    else:
        count += 1
end = time.time()
print(f'查找{format(len(ls_2))}个元素，在ls_1列表中的有{count}个，共用时{round((end - start), 2)}秒')

查找1000个元素，在ls_1列表中的有500个，共用时0.0秒


#### 2. 字典的底层实现

通过稀疏数组来实现值得存储与访问  
稀疏数组有很多的na值，是一个动态数组，当存储的元素越来越多，会给数组进行相应的扩充

**字典的创建过程**

- 第一步：创建一个散列表（哈希表） （稀疏数组存散列表，N >> n）

In [14]:
d = {}

- 第二步：通过hash()计算键的散列（哈希）值

In [15]:
print(hash("python"))
print(hash(1024))
print(hash((1, 2)))

3763596298756728187
1024
-3550055125485641917


In [16]:
d["age"] = 18        # 增加键值对的操作，首先会计算键的散列值hash("age")
print(hash("age"))

395704067468293407


- 第三步：根据散列值确定其在散列表中的位置<br><br>

极个别时候，散列值会发生冲突，则内部有相应的解决冲突的办法

- 第四步：在该位置上存入值

**键值对的访问过程**

In [17]:
d["age"]

18

- 第一步：计算要访问的键的散列值
* 第二步：根据计算的散列值，通过一定的规则，确定其在散列表中的位置  
- 第三步：读取该位置上存储的值

      如果存在，则返回该值  
      如果不存在，则报错KeyError
      
实现原理：
![字典](./图片等杂项/字典.png "字典实现原理")

#### 小结

**(1). 字典数据类型，通过空间换时间，实现了快速的数据查找**

- 也就注定了字典的空间利用效率低下

**(2). 因为散列值对应位置的顺序与键在字典中显示的顺序可能不同，因此表现出来的字典是无序的**

- 回顾：N >> n 

    如果 N = n，会产生很多位置的冲突
* 为什么字典实现了比列表更快速的查找？

    列表每次查找是从头开始找的，字典不一样

### 紧凑的字符串

**通过紧凑数组实现字符串的存储**

- 数据在内存中是连续存放的，效率更高，节省空间
* 都是序列类型，为什么列表采用引用数组，而字符串采用紧凑数组？

    因为字符串存储的每个元素的是一个字符，可以直接预留相应的空间给它，但列表存储的元素类型多种多样，无法预料需要预留多大空间给它，且列表是可以变化的，对列表元素进行变化的时候，相应的空间也要变化，非常麻烦，因此把元素存储到外面去，只保留地址。
    
![字符串](./图片等杂项/字符串.png "字符串紧凑数组")

### 1.3. 是否可变

#### 1. 不可变类型：数字，字符串，元组

**在生命周期中保持内容不变

- 换句话说，就是改变了就不是它自己了（id变了）
* 不可变对象的 += 操作实际上创建了一个新的对象

In [19]:
x = 1
y = "Python"

print("x id: ", id(x))
print("y id: ", id(x))

x id:  140730121044776
y id:  140730121044776


In [20]:
x += 2
y += "3.7"

print("x id: ", id(x))
print("y id: ", id(x))

x id:  140730121044840
y id:  140730121044840


严格意义上，对于不可变类型，也要求其中元素类型是不可变类型时，才是真正不可变的

**元组其实也可以变**

In [21]:
t = (1,[2])
t[1].append(3)

print(t)

(1, [2, 3])


#### 2. 可变类型：列表，字典，集合
- id保持不变，但是里面的内容可以变
* 可变对象的 += 操作 实际在原对象的基础上就地修改

In [22]:
ls = [1, 2, 3]
d = {"Name": "Sarah", "Age": 18}

print("ls id: ", id(ls))
print("d id: ", id(d))

ls id:  2844788724224
d id:  2844792558336


In [23]:
ls += [4, 5]
d_2 = {"Sex": "female"}
d.update(d_2)           #把d_2中的元素更新到d中

print("ls id: ",id(ls))
print("d id: ", id(d))

ls id:  2844788724224
d id:  2844792558336


### 1.4. 列表操作的几个小例子

**[例1] 删除列表中的特定元素**

- 方法1 存在运算删除法

缺点：每次存在运算，都要从头对列表进行遍历，查找，效率低

In [24]:
alist = ["d", "d", "d", "2", "2", "d", "d", "4"]
s = "d"
while True:
    if s in alist:
        alist.remove(s)
    else:
        break
print(alist)

['2', '2', '4']


- 方法2 一次性遍历元素执行删除

In [1]:
alist = ["d", "d", "d", "2", "2", "d", "d", "4"]
for s in alist:
    if s == "d":
        alist.remove(s)     #remove(s)   删除列表中第一次出现的该元素
print(alist)

['2', '2', 'd', 'd', '4']


原因分析：在 for 循环遍历可迭代对象的时候，会先调用可迭代对像的__iter__ 方法，获取对应的迭代器，然后再调用迭代器的__next__方法将值一个个的遍历出来。所以 for i in a，实际上等价于 for i in a.\_\_iter\_\_()，也就是列表对应的迭代器:

```json
typedef struct {
    PyObject_HEAD
    Py_ssize_t it_index;
    PyListObject *it_seq; /* Set to NULL when iterator is exhausted */
} listiterobject;
```
对于当前而言，里面的 it_seq 便是指向 \["d", "d", "d", "2", "2", "d", "d", "4"\] 的指针，it_index 就是索引，遍历的时候实际上就是调用其内部的 \_\_next\_\_ 方法，在该方法内部会**通过索引 it_index 去获取列表中元素（it_index 带着 i 去找元素）**，每循环一次，it_index 自增 1，当出现索引越界的时候捕获 IndexError，然后 raise StopIteration，再被 for 循环捕获，从而循环结束。

因此，分析这段代码 

第一次循环：it_index 等于 0，所以 i 等于 "d" ，此时remove后，列表就会变成 \["d", "d", "2", "2", "d", "d", "4"\]，且 it_index 变成 1。

第二次循环：由于 it_index 等于 1，所以 i 等于 "d" ，此时remove后，列表就会变成 \["d", "2", "2", "d", "d", "4"\]，且 it_index 变成 2。

第三次循环：由于 it_index 等于 2，所以 i 等于 "2" ，此时remove后，列表就会变成 \["d", "2", "d", "d", "4"\]，且 it_index 变成 3。 

.......以这种过程进行下去，就产生了错误结果\['2', '2', 'd', 'd', '4'\]

**总结：it_index 指向的元素与我想要指向的元素不同**

解决方法：使用负向索引

In [2]:
alist = ["d", "d", "d", "2", "2", "d", "d", "4"]
for i in range(-len(alist), 0):
    if alist[i] == "d":
        alist.remove(alist[i])
print(alist)

['2', '2', '4']


**[例二] 多维列表的创建**

In [6]:
ls = [[0] * 10] * 5
ls

[[0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]

In [7]:
ls[0][0] = 1
ls

[[1, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [1, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [1, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [1, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [1, 0, 0, 0, 0, 0, 0, 0, 0, 0]]

为什么？<br>
问题出在 * 5 上，因为 * 运算符相当于浅复制，大列表中的小列表实际上是对同一个列表的n次引用，修改一个小列表中的元素,其余小列表的值都会改变。

怎么办？<br>
列表推导式

## 2. 更加简洁的语法

### 2.1. 解析语法

In [8]:
ls = [[0] * 10 for i in range(5)]
ls

[[0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]

In [9]:
ls[0][0] = 1
ls

[[1, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]

#### 1. 解析语法的基本结构——以列表解析为例（也称为列表推导）

\[expression **for value in iterable** if condition\]

- 三要素：表达式，可迭代对象，if条件（可选）

**执行过程**

（1）从可迭代对象中拿出一个元素

（2）通过if条件（如果有的话），对元素进行筛选

    若通过筛选：则把元素传递给表达式
    
    若未通过：则进入（1）步骤，进行下一次迭代
    
（3）将传递给表达式的元素，代入表达式进行处理，产生一个结果

（4）将（3）步产生的结果作为列表的一个元素进行存储

（5）重复（1）-（4）步，直至迭代对象迭代结束，返回新创建的列表

In [None]:
# 等价于如下代码
result = []
for value in iterale:
    if condition:
        result,append(expression)

[例] 求20以内奇数的平方

In [10]:
squares = []
for i in range(1, 21):
    if i % 2 == 1:
        squares.append(i ** 2)
print(squares)

[1, 9, 25, 49, 81, 121, 169, 225, 289, 361]


In [11]:
squares = [i ** 2 for i in range(1, 21) if i % 2 == 1]
print(squares)

[1, 9, 25, 49, 81, 121, 169, 225, 289, 361]


**支持多变量**

In [12]:
x = [1, 2, 3]
y = [1, 2, 3]

results = [i * j for i, j in zip(x, y)]
results

[1, 4, 9]

**支持循环嵌套**

In [14]:
colors = ["black", "white"]
sizes = ["S", "M", "L"]
tshirts = ["{} {}".format(color, size) for color in colors for size in sizes]
tshirts

['black S', 'black M', 'black L', 'white S', 'white M', 'white L']

#### 2.其他解析语法的例子

- 解析语法构造字典（字典推导）

In [19]:
squares = {i : i ** 2 for i in range(10)}
for k, v in squares.items():
    print(k, ": ", v,end = "\n")

0 :  0
1 :  1
2 :  4
3 :  9
4 :  16
5 :  25
6 :  36
7 :  49
8 :  64
9 :  81


- 解析语法构造集合（集合推导）

In [20]:
squares = {i ** 2 for i in range(10)}
squares

{0, 1, 4, 9, 16, 25, 36, 49, 64, 81}

- 生成器表达式

In [22]:
squares = (i ** 2 for i in range(10))
squares

<generator object <genexpr> at 0x00000126D161D700>

In [25]:
colors = ["black", "white"]
sizes = ["S", "M", "L"]
tshirts = ("{} {}".format(color, size) for color in colors for size in sizes)
for tshirt in tshirts:
    print(tshirt)

black S
black M
black L
white S
white M
white L


### 2.2. 条件表达式
    expr1 if condition else expr2

[例] 将变量n的绝对值赋值给变量x

In [1]:
n = 10
if n >= 0:
    x = n
else:
    x = -n
x

10

In [2]:
n = -10
x = n if n>= 0 else -n
x

10

**条件表达式和解析语法简单实用，且运行速度更快**

## 3. 三大神器

### 3.1. 生成器

In [3]:
ls = [i ** 2 for i in range(1000000)]

In [4]:
for i in ls:
    pass

缺点：占用大量内存

**生成器**

（1）采用惰性计算的方式
（2）无需一次性存储海量数据
（3）一边执行一边计算，只计算每次需要的值
（4）实际上一直在执行next()操作，直到无值可取

#### 1. 生成器的表达式

- 海量数据，不许存储

In [5]:
squares = (i ** 2 for i in range(1000000))

In [6]:
for i in squares:
    pass

- 求0-100的和

无需显式存储全部的数据，节省内存

In [7]:
sum((i for i in range(101)))

5050

#### 2. 生成器函数——yield

- 生成斐波拉契数列

数列前两个元素为1，1之后的元素为其前两个元素之和

In [8]:
def fib(max):
    ls = []
    n, a, b = 0, 1, 1
    while n < max:
        ls.append(a)
        a, b = b, a + b
        n = n + 1
    return ls


fib(10)

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

中间尝试：

In [9]:
def fib(max):
    n, a, b = 0, 1, 1
    while n < max:
        print(a)
        a, b = b, a + b
        n = n + 1

fib(10)

1
1
2
3
5
8
13
21
34
55


构造生成器函数——yield

在每次调用next()的时候执行，遇到yield语句返回，再次执行时从上次返回的yield语句处继续执行

In [1]:
def fib(max):
    n, a, b = 0, 1, 1
    while n < max:
        yield a
        a, b = b, a + b
        n = n + 1
        
fib(10)

<generator object fib at 0x000001269A7CDE00>

In [3]:
for i in fib(10):
    print(i)

1
1
2
3
5
8
13
21
34
55


### 3.2. 可迭代对象

#### 1. 可迭代对象

可直接作用于for循环的对象统称为可迭代对象：iterable

**（1）列表，元组，字符串，字典，集合，文件**

可以使用isinstance()判断一个对象是否是iterable对象

In [5]:
from collections.abc import Iterable

isinstance([1, 2, 3], Iterable)

True

In [6]:
isinstance({"name": "Sarah"}, Iterable)

True

In [7]:
isinstance('Python', Iterable)

True

（2）生成器

In [9]:
squares = (i ** 2 for i in range(3))
isinstance(squares, Iterable)

True

In [10]:
print(next(squares))
print(next(squares))
print(next(squares))

0
1
4


直到没有数据可取，抛出Stoplteration

In [11]:
print(next(squares))

StopIteration: 

可以被next()函数调用不断返回下一个值，直至没有数据可取得对象称为迭代器：Iterator

#### 迭代器

可以使用isinstance()判断一个对象是否是Iterator对象

**（1）生成器都是迭代器**

In [2]:
from collections.abc import Iterator

squares = (i ** 2 for i in range(5))
isinstance(squares, Iterator)

True

**（2）列表，元组，字符串，字典，集合不是迭代器**

In [15]:
isinstance([1, 2, 3], Iterator)

False

可以通过iter(iterable)创建迭代器

In [16]:
isinstance(iter([1, 2, 3]), Iterator)

True

for item in iterable 等价于：
    
    先通过iter()函数获取可迭代对象Iterbale的迭代器
    
    然后对获取到的迭代器不断调用next()方法来获取下一个值并将其赋值给item
    
    当遇到StopIteration的异常后循环结束

**（3）zip enumerate 等itertools里的函数是迭代器**

In [1]:
x = [1, 2]
y = ["a", "b"]
zip(x, y)

<zip at 0x213f98c1500>

In [4]:
for i in zip(x, y):
    print(i)
    
isinstance(zip(x, y),Iterator)

(1, 'a')
(2, 'b')


True

In [5]:
numbers = [1, 2, 3, 4, 5]
enumerate(numbers)

<enumerate at 0x213f98cbe70>

In [6]:
for i in enumerate(numbers):
    print(i)
isinstance(enumerate(numbers),Iterator)

(0, 1)
(1, 2)
(2, 3)
(3, 4)
(4, 5)


True

**（4）文件是迭代器**

In [3]:
with open(".\\图片等杂项\\测试文件.txt", "r", encoding = "utf-8") as f:
    print(isinstance(f, Iterator))

True


**（5）迭代器是可耗尽的**

In [9]:
squares = (i ** 2 for i in range(5))
for square in squares:
    print(square)

0
1
4
9
16


In [10]:
for square in squares:
    print(square)

（6）range()不是迭代器

In [11]:
numbers = range(10)
isinstance(numbers, Iterator)

False

In [15]:
print(len(numbers))     #有长度
print(numbers[0])       #可索引
print(9 in numbers)     #可存在计算
#以上这些迭代器都做不到
next(numbers)           #不可被next()调用

10
0
True


TypeError: 'range' object is not an iterator

In [16]:
for number in numbers:
    print(number)

0
1
2
3
4
5
6
7
8
9


不会被耗尽

In [17]:
for number in numbers:
    print(number)

0
1
2
3
4
5
6
7
8
9


可以称range()为懒序列

    它是一种序列
    
    但并不包含任何内存中的内容
    
    而是通过计算来回答问题
<br><br>    
可迭代对象，迭代器，生成器关系图
![关系图](./图片等杂项/关系图.png "关系图")

<br>

**三者概念与关系详解见——**[详解](https://www.zhihu.com/question/20829330/answer/2320711618)

### 3. 装饰器

#### 1. 需求的提出

（1）需要对已开发上线的程序添加某些功能

（2）不能对程序中函数的源代码进行修改

（3）不能改变程序中函数的调用方式

**比如说，要统计每个函数的运行时间**

In [19]:
def f1():
    pass

def f2():
    pass

def f3():
    pass

f1()
f2()
f3()

不希望修改函数源代码，也不希望函数调用方式发生改变——使用装饰器

#### 2. 函数对象

函数是Python中的第一类对象

（1）可以把函数赋值给变量

（2）对该变量进行调用，实现原函数的功能

In [20]:
def square(x):
    return x ** 2

print(type(square))      #square 是 function类的一个实例

<class 'function'>


In [23]:
pow_2 = square      #可以理解成给这个函数起了个别名
print(pow_2(5))
print(square(5))

25
25


可以将函数作为参数进行传递

#### 高阶函数

（1）接收函数作为参数

（2）或者返回一个函数

**满足上述条件之一的函数称之为高阶函数**

In [24]:
def square(x):
    return x ** 2

def pow_2(fun):  
    return fun    #高阶函数

f = pow_2(square)
f(8)

64

In [25]:
print(f == square)

True


#### 4. 嵌套函数

**在函数内部定义一个函数**

In [26]:
def outer():
    print("outer is running")
    
    def inner():
        print("inner is running")
        
    inner()
    
outer()

outer is running
inner is running


#### 5. 闭包

In [27]:
def outer():
    x = 1
    z = 10
    
    def inner():
        y = x + 100
        return y, z
    
    return inner

f = outer()       # 实际上f包含了inner函数本身 + outer函数的环境
print(f)

<function outer.<locals>.inner at 0x00000213FB9D0C20>


In [28]:
print(f.__closure__)     #__closure__属性中包含了来自外部函数的信息
for i in f.__closure__:
    print(i.cell_contents)

(<cell at 0x00000213FB9008B0: int object at 0x00007FFE40A3C328>, <cell at 0x00000213FB9BB880: int object at 0x00007FFE40A3C448>)
1
10


In [29]:
res = f()
print(res)

(101, 10)


**闭包：延伸了作用域的函数** 

**如果一个函数定义在另一个函数的作用域内，并且引用了外层函数的变量，则该函数称为闭包** 

**闭包是由函数及其相关的引用环境组合而成的实体（即：闭包 = 函数 + 引用环境**

- 一旦在内层函数重新定义了相同名字的变量，则变量成为局部变量

In [33]:
def outer():
    x = 1
    
    def inner():
        x = x + 100     # x在内层重新定义，变成了局部变量，运行会报错，找不到x的值
        return x
    
    return inner

f = outer()
f()

UnboundLocalError: cannot access local variable 'x' where it is not associated with a value

nonlocal允许内嵌的函数来修改闭包变量

In [34]:
def outer():
    x = 1
    
    def inner():
        nonlocal x    
        x = x + 100     
        return x
    
    return inner

f = outer()
f()

101

#### 6. 一个简单的装饰器

**嵌套函数的实现**

In [2]:
import time

def timer(func):
    
    def inner():
        print("inner run")
        start = time.time()
        func()
        end = time.time()
        print("{} 函数运行用时{:.2f}秒".format(func.__name__, (end - start)))
        
    return inner

def f1():
    print("f1 run")
    time.sleep(1)
    
f1 = timer(f1)       # 包含inner()和timer()的环境，如传递过来的参数
f1()    

inner run
f1 run
f1 函数运行用时1.00秒


**语法糖**

In [3]:
import time

def timer(func):
    
    def inner():
        print("inner run")
        start = time.time()
        func()
        end = time.time()
        print("{} 函数运行用时{:.2f}秒".format(func.__name__, (end - start)))
        
    return inner

@timer          #相当于实现了f1 = timer(f1)
def f1():
    print("f1 run")
    time.sleep(1)
    
    
f1()

inner run
f1 run
f1 函数运行用时1.00秒


#### 7. 装饰有参函数

In [5]:
import time

def timer(func):
    
    def inner(*args, **kwargs):
        print("inner run")
        start = time.time()
        func(*args, **kwargs)
        end = time.time()
        print("{} 函数运行用时{:.2f}秒".format(func.__name__, (end - start)))
        
    return inner

@timer
def f1(n):
    print("f1 run")
    time.sleep(1)
    
f1(2)

inner run
f1 run
f1 函数运行用时1.00秒


被装饰函数有返回值

In [3]:
import time

def timer(func):
    
    def inner(*args, **kwargs):
        print("inner run")
        start = time.time()
        res = func(*args, **kwargs)
        end = time.time()
        print("{} 函数运行用时{:.2f}秒".format(func.__name__, (end - start)))
        return res
    
    return inner

@timer
def f1(n):
    print("f1 run")
    time.sleep(1)
    return "wake up"
    
res = f1(2)
print(res)

inner run
f1 run
f1 函数运行用时1.00秒
wake up


#### 8. 带参数的装饰器

装饰器本身要传递一些额外的参数

- 需求：有时需要统计绝对时间，有时需要统计绝对时间的2倍

In [7]:
def timer(method):
    
    def outer(func):
        
        def inner(*args, **kwargs):
            print("inner run")
            if method == "origin":
                print("origin_inner run")
                start = time.time()
                res = func(*args, **kwargs)
                end = time.time()
                print("{} 函数运行时间 {:.2f}秒".format(func.__name__, (end - start)))
            elif method == "double":
                print("double_inner run")
                start = time.time()
                res = func(*args, **kwargs)
                end = time.time()
                print("{} 函数运行时间 {:.2f}秒".format(func.__name__, (end - start)))
            return res
        
        return inner
    
    return outer  #传给装饰函数参数后，返回一个内层函数，再用这个内层函数进行修饰

@timer(method = "origin")   #相当于timer = timer(method = "origin")   f1 = timer(f1)
def f1():
    print("f1 run")
    time.sleep(1)

@timer(method = "double")
def f2():
    print("f2 run")
    time.sleep(1)
    
    
f1()
f2()

inner run
origin_inner run
f1 run
f1 函数运行时间 1.00秒
inner run
double_inner run
f2 run
f2 函数运行时间 1.00秒


**理解闭包！——作用域的延伸**

#### 9. 何时执行装饰器

- 一装饰就执行，不必等调用

In [9]:
func_names = []
def find_function(func):
    print("run")
    func_names.append(func)
    return func

@find_function
def f1():
    print("f1 run")
    
@find_function
def f2():
    print("f2 run")
    
@find_function
def f3():
    print("f3 run")
    
    
#for func in func_names:
    #func()

run
run
run
f1 run
f2 run
f3 run


#### 10.回归本源

- 原函数的属性被掩盖了，用起装饰作用的函数覆盖原函数

In [15]:
import time
from functools import wraps

def timer(func):
    @wraps(func)  #可以保持原函数属性不变
    def inner():
        print("inner run")
        start = time.time()
        func()
        end = time.time()
        print("{} 函数运行用时{:.2f}秒".format(func.__name__, (end - start)))
        
    return inner

@timer          #相当于实现了f1 = timer(f1)
def f1():
    time.sleep(1)
    print("f1 run")
    
print(f1.__name__)
f1()

f1
inner run
f1 run
f1 函数运行用时1.00秒


理解：装饰器中最关键的是真正其装饰作用的函数，即最内层的函数（所以这个函数的参数和返回值要和被装饰函数保持一致），外层的其他函数包括装饰器起传参等附加作用

一个练习——素数生成器

In [21]:
def odd_list():
    n = 1
    while True:
        n += 2
        yield n

def filter_not_prime(n):
    return lambda x : x % n  

def primes():
    yield 2
    it = odd_list()
    while True:
        n = next(it)
        yield n
        it = filter(filter_not_prime(n), it)
        
for i, x in enumerate(primes()):
    if i > 25:
        break
    else:
        print(x)

2
3
5
7
11
13
17
19
23
29
31
37
41
43
47
53
59
61
67
71
73
79
83
89
97
101
