<a href="https://colab.research.google.com/github/yuecao1997/notebooks/blob/main/effective_python.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**EFFECTIVE PYTHON 阅读笔记**

# 第一章：培养Pythonic思维

## 1. 查询python版本

In [7]:
!python --version
!python3 --version
import sys
sys.version_info
sys.version

/bin/bash: /home/io004/anaconda3/lib/libtinfo.so.6: no version information available (required by /bin/bash)
Python 3.9.17
/bin/bash: /home/io004/anaconda3/lib/libtinfo.so.6: no version information available (required by /bin/bash)
Python 3.9.17


'3.9.17 (main, Jul  5 2023, 20:41:20) \n[GCC 11.2.0]'

## 2. 遵循PEP8 风格指南
**与空格有关：**
1. 使用空格来表示缩进，而不要用制表符
2. 和语法相关的每一层缩进都用4个空格来表示
3. 每行的字符数不要超过79
4. 对于占据多行的长表达式来说，除了首行之外的其余各行都应该在通常的缩进级别上再加上4个空格
5. 同一份文件中，函数和类之间应该用两个空行隔开
6. 同一个类中，方法与方法之间应该用一个空行隔开
7. 使用字典时，键与冒号之间不加空格，写在同一行的冒号和值之间应该加上一个空格
8. 给变量赋值时,赋值符号的左边和右边各加一个空格,并且只加一个空格就好
9. 给变量的类型做注解(annotation)时,不要把变量名和冒号隔开,但在类型信息前应该有一个空格


**与命名有关的建议:**
1. 函数、变量及属性用小写字母来拼写,各单词之间用下划到线相连,例如: lowercase_underscore。
2. 受保护的实例属性,用一个下划线开头,例如:`_leading_underrscore`私有的实例属性,用两个下划线开头,例如`__double_leading_underscore`
3. 类(包括异常)命名时,每个单词的首字母均大写,例如: `CapitalizedWord`
4. 模块级别的常量,所有字母都大写,各单词之间用下划线相连,例如: `ALL_CAPS`
5. 类中的实例方法,应该把第一个参数命名为`self`,用来表示该对象本身。类方法的第一个参数,应该命名为`cls`,用来表示这个类本身

**与表达式和语句有关的建议**
1. 采用行内否定,即把否定词直接写在要否定的内容前面,而不要放在整个表达式的前面,例如应该写`if a is not b`,而不是`if not a is b`
2. 不要通过长度判断容器或序列是不是空的,例如不要通过`if len(somelist) == 0`判断`somelist`是否为`[]`或`"`等空值,而是应该采用`if not somelist`这样的写法来判断,因为Python会把空值自动评估为False
3. 如果要判断容器或序列里面有没有内容(比如要判断`somelist`是否为`[1]`或`'hi'`这样非空的值),也不应该通过长度来判断,而是应该采用`if somelist`语句,因为Python会把非空的值自动判定为True
4. 不要把if语句、for循环、while循环及except复合语句挤在三行。应该把这些语句分成多行来写,这样更加清晰
5. 如果表达式一行写不下,可以用括号将其括起来,而且要适当地添加换行与缩进以便于阅读
6. 多行的表达式,应该用括号括起来,而不要用`\`符号续行

**与引入有关的建议**
1. `import`语句(含`from × import y`)总是应该放在文件开头。
2. 引入模块时,总是应该使用绝对名称,而不应该根据当前模块路径来使用相对名称。例如,要引入bar包中的foo模块,应该完整地写出`from bar import foo`,即便当前路径为bar包里,也不应该简写为import foo。
3. 如果一定要用相对名称来编写import语句,那就应该明确地写成:`from. import foo`.
4. 文件中的import语句应该按顺序划分成三个部分:首先引入标准库里的模块,然后引入第三方模块,最后引入自己的模块。属于同一个部分的import语句按字母顺序排列。

**可以在IDE中使用如Pylint等工具来检查代码是否符合PEP8规范**

## 3. 了解bytes与str的区别
python有两种类型可以表示字符序列
1. bytes， bytes包含的是原始的8位无符号值（ASCII）
2. str，str包含的是Unicode字符

可以使用bytes的decode方法，将二进制数据转换为Unicode数据，也可以使用str的encode方法，将Unicode数据转换为二进制数据

In [12]:
bytes_string = b'h\x65llo'
print(list(bytes_string))
print(bytes_string)
str_string = 'a\u0300 propos'
print(list(str_string))
print(str_string)

print(bytes_string.decode('UTF-8'))
print(str_string.encode('UTF-8'))

[104, 101, 108, 108, 111]
b'hello'
['a', '̀', ' ', 'p', 'r', 'o', 'p', 'o', 's']
à propos
hello
b'a\xcc\x80 propos'


## 4. 用`f-string`取代`str.format`

In [13]:
key = 'my_var'
value = 1.234
formatted = f'{key} = {value}'
print(formatted)
formatted = f'{key!r:<10} = {value:.2f}'
print(formatted)
places = 3
number = 1.23456    
print(f'My number is {number:.{places}f}')

my_var = 1.234
'my_var'   = 1.23
My number is 1.235


## 5. 用辅助函数取代复杂的表达式
不要把复杂的意思挤到同一行

尤其是需要重复使用的复杂表达式，应该写到辅助函数里面

用if/else结构写成的表达式，要比用or与and写成的Boolean表达式更容易理解

## 6. 把数据结构直接拆分到多个变量里，不要专门通过下标访问

例如：`for key, val in dt.items()`

In [1]:
# 通过unpacking原地交换两个变量的值
def bubble_sort(a):
    for _ in range(len(a)):
        for i in range(1, len(a)):
            if a[i] < a[i-1]:
                a[i-1], a[i] = a[i], a[i-1]
                
names =[ 'pretzels', 'carrots', 'arugula', 'bacon']
bubble_sort(names)
print(names)

['arugula', 'bacon', 'carrots', 'pretzels']


## 7. 用enumerate取代range

enumerate可以将任何一种迭代器封装成惰性生成器。这样的话，每次循环的时候只需从迭代器里面取出下一个元素即可，同时还会给出本轮循环的序号，即生成器每次产生的一对输出值。

还可以通过enumerate的第二个参数来指定序号的起始值

In [3]:
flavor_list = ['vanilla', 'chocolate', 'pecan', 'strawberry']
for i, flavor in enumerate(flavor_list):
    print(f'{i+1}: {flavor}')
print('----------------')
for i, flavor in enumerate(flavor_list, 1):
    print(f'{i}: {flavor}')

1: vanilla
2: chocolate
3: pecan
4: strawberry
----------------
1: vanilla
2: chocolate
3: pecan
4: strawberry


## 8. 用zip函数同时遍历两个迭代器
`zip`能够把两个或更多的迭代器封装成惰性生成器，每次循环时，他会分别从各个迭代器里面取出下一个元素，然后将这些元素组合成一个元组。

`zip`每次只从他封装的那些迭代器中各自取出一个元素，所以即使源列表很长，程序也不会因为占用过多资源而崩溃。

如果传入的迭代器长度不一，那么`zip`会在最短的那个迭代器耗尽时停止生成元组。

如果不确定所有列表的长度，就不要把他们传给`zip`，而是应该使用`itertools.zip_longest`函数来代替。

In [4]:
names = ['Cecilia', 'Lise', 'Marie']
counts = [len(n) for n in names]
for name, count in zip(names, counts):
    print(f'{name} has {count} letters')
print('----------------')
names.append('Rosalind')
for name, count in zip(names, counts):
    print(f'{name} has {count} letters')
print('----------------')
import itertools    
for name, count in itertools.zip_longest(names, counts):
    print(f'{name} has {count} letters')

Cecilia has 7 letters
Lise has 4 letters
Marie has 5 letters
----------------
Cecilia has 7 letters
Lise has 4 letters
Marie has 5 letters
----------------
Cecilia has 7 letters
Lise has 4 letters
Marie has 5 letters
Rosalind has None letters


## 9. 不要在for与while循环后写else块

在python中，支持`for/else` 和 `while/else`结构，在执行完循环体之后，如果没有遇到`break`语句，就会执行`else`块。

但是这两种结构都很少用到，而且容易误用。应避免使用!

In [8]:
for i in (range(3)):
    print(i)
else:
    print('done')    
print('----------------')

for i in (range(3)):
    print(i)
    if i==2:
        break
else:
    print('done')    
print('----------------')

while []:
    print('in while')
else:
    print('done while ')



0
1
2
done
----------------
0
1
2
----------------
done while 


## 10. 用赋值表达式减少重复代码
赋值表达式是python3.8新引入的语法，会用到海象运算符`:=`，`a:=b`读做a walrus b。这个运算符可以在表达式内部为变量赋值，解决持续已久的代码重复问题。

也对需要用到python中不具备的`switch/case` 或 `do/while`语句的场景提供了一种替代方案。

In [15]:
fresh_fruit = { 'apple':10, 'banana':8, 'lemon':5 }
if count := fresh_fruit.get('apple', 0):
    print(f'apple count: {count}')
if (count := fresh_fruit.get('lemon', 0))>5:
    print(f'lemon count is more than 5')
else:
    print(f'lemon count is less than or euqal to 5')
print('----------------')
def pick_fruit():
    pass
def make_juice(fruit, count):
    pass
bottles = []
while fresh_fruit := pick_fruit():
    for fruit, count in fresh_fruit.items():
        batch = make_juice(fruit, count)
        bottles.extend(batch)


apple count: 10
lemon count is less than or euqal to 5
----------------


# 第二章：列表与字典

## 11. 学会对序列做切片
凡是实现了`__getitem__`与`__setitem__`方法的类都可以进行切片操作

`somelist[start:end]`

如果起点和终点所确定的范围超过了列表的边界，那么系统会自动忽略不存在的元素。注意：切割时的索引可以越界，但是访问时不可以，这会让程序抛出异常。

切割后的列表是一个全新的列表，与原列表没有任何关系。`b=a[:]`，b为浅拷贝，系统会为b分配新的内存，b与a身份不同，`b=a`为直接赋值，b是对a的引用，b与a身份相同，修改b会影响a。

In [18]:
a = [1,2,3]
b = a[:]
a[0] = 10
print(a)
print(b)
b[1] = 20
print(a)
print(b)
print('----------------')
a = [1,2,3]
c = a
a[0] = 10
print(a)
print(c)
c[1] = 20
print(a)
print(c)

[10, 2, 3]
[1, 2, 3]
[10, 2, 3]
[1, 20, 3]
----------------
[10, 2, 3]
[10, 2, 3]
[10, 20, 3]
[10, 20, 3]


## 12. 不要在切片里同时指定起点、终点和步长

`somelist[start:end:stride]`，stride为步长，可以为负数，表示从右往左取值。

同时使用起点、终点和步长时，会让代码变得难以阅读，应该尽量避免。同时应尽量避免使用负数步长。

为了避免这种情况，可以分两步进行，同时由于切片会产生新分配的内存，因此应将能够最大程度减小列表长度的操作（使用步长）放在前面：

`b = a[::stride]`

`c = b[start:end]`

如果程序没有时间或内存分为两步操作，可以使用itertools模块的islice函数来代替切片操作，它的起止位置和步长都不能为负数。


In [16]:
a =list(range(10))
# 取偶数元素：
b = a[::2]
print(b)
# 取奇数元素：
c = a[1::2]
print(c)
# 反转列表：
d = a[::-1]
print(d)


[0, 2, 4, 6, 8]
[1, 3, 5, 7, 9]
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]


## 13. 通过带星号的unpacking操作来捕获多个元素，不要用切片
在使用`*`时，需要至少有一个普通变量和其搭配。

对于单层结构，同一级最多只能出现一次带星号的unpacking操作，否则会抛出异常。错误举例：

`a = [1, 2, 3, 4, 5, 6, 7, 8, 9]`

**!wrong!**

`first, *middle, *second, last = a`   

In [20]:
car_ages = [0, 9, 4, 3, 7, 2, 5, 1, 6, 8]
car_ages_descending = sorted(car_ages, reverse=True)
oldest, second_oldest,*others = car_ages_descending
print(oldest, second_oldest, others)
*others, second_youngest, youngest = car_ages_descending
print(youngest, second_youngest, others)

9 8 [7, 6, 5, 4, 3, 2, 1, 0]
0 1 [9, 8, 7, 6, 5, 4, 3, 2]


## 14. 用sort方法的key参数来表示复杂的排序逻辑
内置列表的sort方法支持对有自然顺序的内置类型进行排序，但是对于自定义类型，需要通过key参数来指定排序的逻辑。

对于有多种排序指标，且升降方向可能不同的情况，都可以倒着按照排序指标的重要性依次进行排序（最重要的放在最后），在每次排序内使用相应的reverse值，这样就可以得到想要的结果。

In [24]:
class Tool:
    def __init__(self, name, weight):
        self.name = name
        self.weight = weight
    def __repr__(self):
        return f'Tool({self.name!r}, {self.weight})'
tools = [ Tool('level', 3.5), Tool('hammer', 1.25), Tool('screwdriver', 0.5), Tool('chisel', 0.25) ]
tools.sort(key = lambda x: x.weight)
print(tools)
power_tools = [Tool('drill', 4), Tool('circular saw', 5), Tool('jackhammer', 40), Tool('sander', 4)]
# 首要比较元素是重量，次要是名字，在重量相同时，名字按字母顺序排序
power_tools.sort(key = lambda x: (x.weight, x.name))
print(power_tools)
# 重量降序，名字升序
power_tools.sort(key = lambda x: x.name)
power_tools.sort(key = lambda x: x.weight, reverse=True)
print(power_tools)

[Tool('chisel', 0.25), Tool('screwdriver', 0.5), Tool('hammer', 1.25), Tool('level', 3.5)]
[Tool('drill', 4), Tool('sander', 4), Tool('circular saw', 5), Tool('jackhammer', 40)]
[Tool('jackhammer', 40), Tool('circular saw', 5), Tool('drill', 4), Tool('sander', 4)]


## 15. 不要过分依赖给字典添加条目时所用的顺序

在python3.5之前，字典的顺序是随机的

但是自python3.6起，字典会保留键值对添加时的顺序！

## 16. 用get处理键不在字典中的情况，不要使用in与KeyError

`dt.get(key, default_val)`方法：

如果key在字典中，则返回相应的值，

如果key不在字典中，会返回default_val值，

如果不指定default_val值，则返回None。

In [None]:
counters ={'pumpernickel':2, 'sourdough':1}
# 如果键不存在，创建键，值为0,否则，之前的值加1
# 要这样：
count = counters.get('wheat', 0)
counters['wheat'] = count + 1
# 不要这样：
if key in counters:
    counters[key] += 1
else:
    counters[key] = 1

try:
    counters[key] += 1
except KeyError:
    counters[key] = 1

## 17. 用defaultdict处理缺失的键，不要用setdefault

python内置的`collection`类提供了`defaultdict`类，在访问键时，它会在键缺失的情况下，自动添加这个键以及相应的默认值，并返回这个默认值。

我们只需要在构造这种字典时，提供一个用来生成默认值的函数即可，每次发现键缺失时，这个函数就会被调用。

In [None]:
from collections import defaultdict
class Visits:
    def __init__(self):
        # 传入的函数用于创建默认值，当试图访问键不存在时，默认值为{}，key:{}这个键值对会被添加到字典中
        self.data = defaultdict(set)
    def add(self, country, city):
        # 若country不在字典中，self.data[country]会将country:{}添加到字典中，并且返回一个空集合，之后就可以调用集合的add方法了
        self.data[country].add(city)
visits = Visits()
visits.add('England', 'Bath')
visits.add('England', 'London')
print(visits.data)

## 18. 学会利用__missing__构造依赖键的默认值

构造defaultdict时，需要提供的用来生成默认值的函数必须是不需要参数的函数，所以无法创造出需要依赖键名的默认值。

对此可以通过继承`dict`类，并重写`__missing__`方法来实现。

如果访问的键不在字典中，`__missing__`方法将会被调用，将访问的键作为参数传入，据此返回相应的默认值

In [None]:
def open_picture(path):
    # 省略
    return path
class Pictures(dict):
    def __missing__(self, key):
        value = open_picture(key)
        self[key] = value
        return value

# 第三章：函数

## 19. 不要把函数返回的多个数值拆分到三个以上的变量中

如果要拆分的值确实很多，最好还是定义一个轻便的类或者namedtuple，并让函数返回这样的实例

## 20. 遇到意外情况时，应该抛出异常，而不是返回None

In [None]:
def carefully_divide(a, b):
    try:
        return a/b
    except ZeroDivisionError:
        raise ValueError('Invalid inputs')
# or
def carefully_divide(a: float, b: float) -> float:
    """Divides a by b.
    Raises:
        ValueError: when inputs cannot be divided.
    """
    try:
        return a / b
    except ZeroDivisionError:
        raise ValueError('Invalid inputs')

## 21. 了解如何在闭包里面使用外围作用域中的变量
闭包（函数）：定义在大函数中的小函数，小函数可以访问大函数中的变量，但是不能修改大函数中的变量。

如若想要改变大函数（对小函数来说是外围作用域）中的变量，可以使用nonlocal关键字，将变量声明为非局部变量，但是尽量不要这么做，以防污染外围作用域。

使用闭包的原因：1. 避免使用全局变量。2. 对于只有一个方法的对象，闭包是比声明一个类更加轻量级的方式。

In [1]:
def sort_priority(values, group):
    def helper(x):
        if x in group:
            return (0, x)
        return (1, x)
    values.sort(key=helper)
numbers = [8,3,1,2,5,4,7,6]
group = {2,3,5,7}
sort_priority(numbers, group)
print(numbers)

print("----------------")

def sort_priority2(numbers, group):
    found = False
    def helper(x):
        if x in group:
            found = True
            return (0, x)
        return (1, x)
    numbers.sort(key=helper)
    return found
found = sort_priority2(numbers, group)
print("found: ", found)
print(numbers)

print("----------------")

def sort_priority3(numbers, group):
    found = False
    def helper(x):
        nonlocal found
        if x in group:
            found = True
            return (0, x)
        return (1, x)
    numbers.sort(key=helper)
    return found
found = sort_priority3(numbers, group)
print("found: ", found)
print(numbers)


[2, 3, 5, 7, 1, 4, 6, 8]
----------------
found:  False
[2, 3, 5, 7, 1, 4, 6, 8]
----------------
found:  True
[2, 3, 5, 7, 1, 4, 6, 8]


## 22. 用数量可变的位置参数给函数设计清晰的参数列表

`*args`：用来处理位置参数，会将传入的位置参数打包成一个元组，传递给函数。

如果传入的是带*操作符的生成器，那么程序必须先把这个生成器里面的所有元素迭代完毕，形成元组，才能开始执行函数体内的代码。如果这个生成器里面的元素数量非常多，那么程序就可能会因为内存耗尽而崩溃。

因此，接受`*args`参数的函数，适合处理输入值不太多，并且数量可以提前预估的情况。

In [3]:
def log(message, *values):
    if not values:
        print(message)
    else:
        values_str = ', '.join(str(x) for x in values)
        print(f'{message}: {values_str}')
log('My numbers are', 1, 2)
log('Hi there')

print("----------------")

def my_generator():
    for i in range(10):
        yield i

def my_func(*args):
    print(args)

it = my_generator()
my_func(*it)
    

My numbers are: 1, 2
Hi there
----------------
(0, 1, 2, 3, 4, 5, 6, 7, 8, 9)


## 23. 用关键字参数来表示可选的行为

如果混用，位置参数必须在关键字参数之前。 

用带默认值的关键字参数来表示可选的行为，这样不会影响原有的函数调用代码

如果有一份字典，字典里面的内容能够用来调用函数，那么可以使用`**`操作符来将字典里面的键值以关键字的形式传递给函数。

带`**`操作符的参数可以与位置或关键字参数混用，只要不重复指定就行。

也可以对多个字典分别施加`**`操作符，只要不重复指定就行。

定义函数时，如果想让这个函数接受任意数量的关键字参数，那么可以在参数里表中写上万能形参`**kwargs`，它会把调用者传进来的参数收集到一个字典里面稍后处理。



In [16]:

def remainder(number, divisor):    
        return number % divisor

print(remainder(20, divisor=7))
print(remainder( divisor=7, number=20))

try:
    print(remainder(7, number=20))
except Exception as e:
    print(e)

# 错误： print(remainder(number=20, 7))
print("----------------")

my_kwargs = {
    'number':20,
    'divisor':7,
}
print(remainder(**my_kwargs))

print("----------------")

my_kwargs = {
    'divisor':7,
}
other_kwargs = {
    'number':20,
}
print(remainder(**my_kwargs, **other_kwargs))

6
6
remainder() got multiple values for argument 'number'
----------------
6
----------------
6


In [17]:
def print_parameters(**kwargs):
    for key, value in kwargs.items():
        print(f'{key} = {value}')

print_parameters(alpha=1.5, beta=9, gamma=4)

alpha = 1.5
beta = 9
gamma = 4


## 24. 用`None`和`docstring`来描述默认值会变的参数
参数的默认值只会在系统加载这个模块的时候计算一次，而不会在每次执行都重新计算，这通常意味着，这些默认值在程序启动后，就已经确定了，不会根据调用时的不同情况而发生变化。

若想要在python中实现这种效果，可以将默认值设置为`None`，并在函数的`docstring`中描述清楚这个参数为`None`时，函数会怎么运作。

In [20]:
from datetime import datetime
from time import sleep

def log(message, when=datetime.now()):
    print(f'{when}: {message}')
log('Hi there!')
sleep(0.1)  
log('Hi again!')

print("----------------")

def log(message, when=None):
    """Log a message with a timestamp.

    Args:
        message: Message to print.
        when: datetime of when the message occurred.
            Defaults to the present time.
    """
    if when is None:
        when = datetime.now()
    print(f'{when}: {message}')
log('Hi there!')
sleep(0.1)  
log('Hi again!')
print(log.__doc__)


2023-11-12 14:31:49.265193: Hi there!
2023-11-12 14:31:49.265193: Hi again!
----------------
2023-11-12 14:31:49.365616: Hi there!
2023-11-12 14:31:49.465881: Hi again!
Log a message with a timestamp.

    Args:
        message: Message to print.
        when: datetime of when the message occurred.
            Defaults to the present time.
    


## 25. 用只能以关键字指定和只能按位置传入的参数来设计清晰的参数列表

在函数的参数列表中，`/`符号左侧的参数是只能够通过位置制定的参数(positional-only argument)，

而`*`符号右侧的参数是只能够通过关键字指定的参数(keyword-only argument),

在这两个符号之前的参数，既可以通过位置指定，也可以通过关键字指定。

In [21]:
def safe_division_e(number, divisor, /,ndigits=10, *,
                  ignore_overflow=False,
                  ignore_zero_division=False):
    try:
        return round(number / divisor, ndigits)
    except OverflowError:
        if ignore_overflow:
            return 0
        else:
            raise
    except ZeroDivisionError:
        if ignore_zero_division:
            return float('inf')
        else:
            raise

print(safe_division_e(22,7))
print(safe_division_e(22,7,5))
print(safe_division_e(22,7,ndigits=2))



3.1428571429
3.14286
3.14


## 26. 用functools.wraps定义函数装饰器

用装饰器（decorator）来封装某个函数，从而让程序在执行这个函数之前和执行完函数之后，分别运行一些额外的代码。

调用者传给函数的参数值，函数返回给调用者的值，以及函数抛出的异常，都可以用装饰器访问并修改。

装饰器的本质是一个函数，它的参数是被装饰的函数，返回值也是一个函数。

使用装饰器，能够确保用户以正确的方式使用函数，也能够用来调试程序或实现函数注册功能，此外含有很多用途。

In [22]:
def trace(func):
    def wraper(*args, **kwargs):
        result = func(*args, **kwargs)
        print(f'{func.__name__}({args!r}, {kwargs!r})'
              f' -> {result!r}')
        return result
    return wraper

@trace
def fibonacci(n):
    """Return the n-th Fibonacci number"""
    if n in (0,1):
        return n
    return (fibonacci(n-2) + fibonacci(n-1))

fibonacci(4)

fibonacci((0,), {}) -> 0
fibonacci((1,), {}) -> 1
fibonacci((2,), {}) -> 1
fibonacci((1,), {}) -> 1
fibonacci((0,), {}) -> 0
fibonacci((1,), {}) -> 1
fibonacci((2,), {}) -> 1
fibonacci((3,), {}) -> 2
fibonacci((4,), {}) -> 3


3

In [24]:
print(fibonacci)
print(help(fibonacci))

<function trace.<locals>.wraper at 0x7fdab8afb310>
Help on function wraper in module __main__:

wraper(*args, **kwargs)

None


装饰器返回的值，也就是调用的`fibonacci`函数，它的名字并不叫`fibonacci`，而是`wrapper`。

这是由于trace函数返回的是它内部定义的wrapper函数，而不是fibonacci函数，所以fibonacci函数的名字会被替换成wrapper函数的名字。

这样会干扰那些需要利用instrospection（内省）机制来运作的工具，如debugger。

要想解决这个问题，可以改用`functools`内置模块中的`wraps`装饰器来修饰wrapper函数，这样就可以将内部函数（fibonacci）的元信息复制到外部函数（wrapper）中，从而让程序在调用内部函数时，能够正确地识别出它的名字。

python函数的很多标准属性，比如`__name__`、`__module__`、`__annotations__`等，也都应该在受到封装时得以保留，wraps可以帮助我们做到这一点，使程序表现出正确的行为。

In [25]:
from functools import wraps
def trace(func):
    @wraps(func)
    def wraper(*args, **kwargs):
        result = func(*args, **kwargs)
        print(f'{func.__name__}({args!r}, {kwargs!r})'
              f' -> {result!r}')
        return result
    return wraper
@trace
def fibonacci(n):
    """Return the n-th Fibonacci number"""
    if n in (0,1):
        return n
    return (fibonacci(n-2) + fibonacci(n-1))
fibonacci(4)
print(fibonacci)
print(help(fibonacci))

fibonacci((0,), {}) -> 0
fibonacci((1,), {}) -> 1
fibonacci((2,), {}) -> 1
fibonacci((1,), {}) -> 1
fibonacci((0,), {}) -> 0
fibonacci((1,), {}) -> 1
fibonacci((2,), {}) -> 1
fibonacci((3,), {}) -> 2
fibonacci((4,), {}) -> 3
<function fibonacci at 0x7fdacb9830d0>
Help on function fibonacci in module __main__:

fibonacci(n)
    Return the n-th Fibonacci number

None


# 第四章： 推导与生成

## 27. 用列表推导来取代map和filter
推导：comprehension，可以简单地迭代列表、字典、集合等数据结构，并根据迭代的结果创建出包含派生元素的新列表。

In [27]:
a = list(range(10))
squares = [x**2 for x in a] # list comprehension
even_squares = [x**2 for x in a if x%2 == 0]
print(squares)
print(even_squares)

# 用map和filter,可读性差
squares_prime = map(lambda x: x**2, a)
even_squares_prime = map(lambda x: x**2, filter(lambda x: x%2 == 0, a))

assert squares == list(squares_prime)
assert even_squares == list(even_squares_prime)



[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
[0, 4, 16, 36, 64]


## 28. 控制推导逻辑的子表达式不要超过两个

除了27条中展示的最基本的用法，列表推导还支持多层循环，但不要超过两层

在两层循环中，用两个for子表达式，按照从左到右的顺序解读； 也可以用嵌套的方式。

推导的时候可以使用多个if条件，如果这些if条件出现在同一层循环内，那么他们之间默认是and关系。

每一层的for表达式都可以带有if条件，但是尽量不要在多层循环的推导中这样做，代码会难以理解。

In [29]:
matrix = [[1,2,3],[4,5,6],[7,8,9]]
flat = [x for row in matrix for x in row]
print(flat)

squared = [[x**2 for x in row] for row in matrix]
print(squared)

a = [1,2,3,4,5,6,7,8,9,10]
b = [x for x in a if x>4 and x%2 == 0]
c = [x for x in a if x>4 if x%2 == 0]
assert b == c

[1, 2, 3, 4, 5, 6, 7, 8, 9]
[[1, 4, 9], [16, 25, 36], [49, 64, 81]]


# 29. 用赋值表达式消除推导中的重复代码

在条件语句中使用赋值表达式，可以避免在条件表达式之外的部分重复计算变量值。

In [30]:
stock = {
    'nails':25,
    'screws':35,
    'wingnuts':8,
    'washers':24,
}
order = ['screws', 'wingnuts', 'clips']
def get_batches(count, size):
    return count // size

# normal dict comprehension
found = {name: get_batches(stock.get(name, 0), 8) for name in order if get_batches(stock.get(name, 0), 8)}
print(found)

# dict comprehension with walrus operator
found = {name: batches for name in order if (batches := get_batches(stock.get(name, 0), 8))}
print(found)

{'screws': 4, 'wingnuts': 1}
{'screws': 4, 'wingnuts': 1}


## 30. 不要让函数直接返回列表，应该让它逐个生成列表里的值

用生成器（generator）来实现需要返回列表的函数，可以节省内存，提高性能。

生成器由包含`yield`表达式的函数创建。

调用生成器函数不会让其中的代码立刻执行，它会返回一个迭代器（iterator），把迭代器传给python的内置`next`函数，就可以将生成器推进到下一个`yield`表达式处，并返回`yield`表达式后面的值。



In [34]:
def index_words_iter(text):
    if text:
        yield 0
    for index, letter in enumerate(text):
        if letter == ' ':
            yield index+1

it = index_words_iter('Four score and seven years ago...')
print(next(it))
print(next(it))
it = index_words_iter('Four score and seven years ago...')
result = list(it)
print(result)

0
5
[0, 5, 11, 15, 21, 27]


## 31. 谨慎地迭代函数所收到的参数

迭代器是有状态的，只能产生一次结果，如果迭代器已经抛出过StopIteration异常，那么它就不能再产生任何结果了。

因此不能使用同一个迭代器对列表进行多次迭代。

若想要对一个列表进行多次迭代，可以新建一个容器类，让它实现迭代器协议：在类中实现`__iter__`方法，按照生成器的方式来写就好

可以使用类型检查来确定，函数的参数是普通的迭代器还是一个容器类型。

或者用`collections.abc`内置模块中的`Iterator`类来判断，它用在`isinstance`中，判断参数是否为`Iterator`实例，如果是，就抛出异常

In [37]:
from collections.abc import Iterator

def normalize_defensive(numbers):
    if iter(numbers) is numbers:
        raise TypeError('Must supply a container')
    if isinstance(numbers, Iterator):
        raise TypeError('Must supply a container')
    total = sum(numbers)
    result = []
    for value in numbers:
        percent = 100 * value / total
        result.append(成器已经抛出过StopIteration异常，那么它就不能再产生任何结果了。

若想要对一个列表进行多次迭代，可以新建一个容器类，让它实现迭代器协议：在类中实现`__iter__`方法，按照生成器的方式来写就好

可以使用类型检查来确定，函数的参数是普通的迭代器还是一个容器类型。

或者用`collections.abc`内置模块中的`Iterator`类来判断，它用在`isinstance`中，判断percent)
    return result

class ReadVisits:
    def __init__(self, data_path):
        self.data_path = data_path
    def __iter__(self):
        with open(self.data_path) as f:
            for line in f:
                yield int(line)

visits = [15, 35, 80]
percentages = normalize_defensive(visits)
assert sum(percentages) == 100.0

# visits = ReadVisits('my_numbers.txt')
# percentages = normalize_defensive(visits)
# assert sum(percentages) == 100.0

## 32. 考虑用生成器表达式来改写数据量较大的列表推导
生成器表达式的写法与列表推导类似，只是将`[]`换成`()`即可。

这样的程序并不会立刻给出全部结果，而是先将生成器表达式表示成一个迭代器返回.

这样的写法不会立刻产生结果，而是在迭代器被推进时才会产生结果，这样可以节省内存。

也可以把生成器表达式组合使用，形成多个生成器嵌套。这样的处理非常快，适合处理大量数据。



In [40]:
value = [1,2,3,4,5,6,7,8,9,10]
it = (x for x in value)
print(it)
print(next(it))
roots = ((x, x**0.5) for x in it)
print(next(roots))

<generator object <genexpr> at 0x7fdab8a1dba0>
1
(2, 1.4142135623730951)


## 33. 通过`yield from`把多个生成器连起来用

这样的程序，会先从嵌套进去的小生成器里面取值，如果该生成器已经用完，那么程序就会回到`yield from`所在的函数之中，进入下一个`yield from`逻辑

In [None]:
def move(period, speed):
    for _ in range(period):
        yield speed

def pause(delay):
    for _ in range(delay):
        yield 0
    
def animate():
    yield from move(4, 5.0)
    yield from pause(3)
    yield from move(2, 3.0)

## 34. 不要用`send`给生成器注入数据

如果希望生成器中的参数在迭代过程中是可以变化的：python的生成器支持`send`方法，可以让生成器变成双向通道。

`send`方法可以把参数发给生成器，让它成为上一条`yield`表达式的求值结果，并将生成器推进到下一条`yield`表达式，然后把`yield`右边的值返回给`send`的调用者

但是这样写的代码难以阅读，并且由于首次调用`send`方法时，还没有进行到`yield`表达式，所以只能传入`None`。

因此最好不要使用`send`方法

更好的方法是，将可变参数作为迭代器传给函数。

In [44]:
import math

def wave_modulating(steps):
    step_size = 2 * math.pi / steps
    amplitude = yield  # receive initial amplitude
    for step in range(steps):
        radians = step * step_size
        fraction = math.sin(radians)
        output = amplitude * fraction
        amplitude = yield output  # receive next amplitude

def run_modulating(it):
    amplitudes = [None, 7, 7, 7, 2, 2, 2, 2, 10, 10, 10, 10]
    for amplitude in amplitudes:
        output = it.send(amplitude)
        print(output)

run_modulating(wave_modulating(12))

print("----------------")

def wave_cascading(amplitude_it, steps):
    step_size = 2 * math.pi / steps
    for step in range(steps):
        radians = step * step_size
        fraction = math.sin(radians)
        amplitude = next(amplitude_it)
        output = amplitude * fraction
        yield output
def complex_wave_cascading(amplitude_it):
    yield from wave_cascading(amplitude_it, 3)
    yield from wave_cascading(amplitude_it, 4)
    yield from wave_cascading(amplitude_it, 5)
    
def run_cascading():
    amplitudes = [7, 7, 7, 2, 2, 2, 2, 10, 10, 10, 10, 10]
    it = complex_wave_cascading(iter(amplitudes))
    for amplitude in amplitudes:
        output = next(it)
        print(output)
run_cascading()


None
0.0
3.4999999999999996
6.06217782649107
2.0
1.7320508075688774
1.0000000000000007
2.4492935982947064e-16
-4.999999999999997
-8.660254037844384
-10.0
-8.66025403784439
----------------
0.0
6.062177826491071
-6.062177826491069
0.0
2.0
2.4492935982947064e-16
-2.0
0.0
9.510565162951535
5.877852522924733
-5.87785252292473
-9.510565162951536


## 35. 不要通过`throw`变换生成器的状态

