# 2 序列构成的数组
## 2.1内置序列类型
- 容器序列：list、tuple 和 collections.deque 这些序列能存放不同类型的数据。
- 扁平序列：str、bytes、bytearray、memoryview 和 array.array，这类序列只能容纳一种类型。


序列类型还能按照能否被修改来分类。
- 可变序列：list、bytearray、array.array、collections.deque 和 memoryview。
- 不可变序列：tuple、str 和 bytes。
## 2.2 列表推导和生成器表达式
### 2.2.1 列表推导

In [3]:
symble = "$¢£¥€¤"
codes = [ord(x) for x in symble if ord(x) > 100]
print('列表推导：', codes)
codes = list(filter(lambda x: x > 100, map(ord, symble)))
print('filter/map组合：', codes)


列表推导： [162, 163, 165, 8364, 164]
filter/map组合： [162, 163, 165, 8364, 164]


In [4]:
colors = ['black', 'white']
sizes = ['S', 'M', 'L']
tshirts = [(color, size) for color in colors for size in sizes]
print('笛卡尔积：', tshirts)


笛卡尔积： [('black', 'S'), ('black', 'M'), ('black', 'L'), ('white', 'S'), ('white', 'M'), ('white', 'L')]


### 2.2.2 生成器表达式 
生成器表达式的语法跟列表推导差不多，只不过把方括号换成圆括号而已。

In [5]:
# 生成器表达式逐个产出元素，从来不会一次性产出一个含有 6 个 T 恤样式的列表。
colors = ['black', 'white']
sizes = ['S', 'M', 'L']
for tshirts in (('%s %s') % (c, s) for c in colors for s in sizes):
    print(tshirts)


black S
black M
black L
white S
white M
white L


## 2.3 元组不仅仅时不可变的列表
### 2.3.1 元组和记录
如果只把元组理解为不可变的列表，那其他信息——它所含有的元素的总数和它们的位置——似乎就变得可有可无。但是如果把元组当作一些字段的集合，那么数量和位置信息就变得非常重要了。

In [6]:
# 经纬度
lax_coordinates = (33, -118)
# 市名、年份、人口（单位：百万）、人口变化（单位：百分比）和面积（单位：平方千米）
city, year, pop, chg, area = ('Tokyp', 2003, 32450, 0.66, 8014)
traveler_ids = [('USA', '31195855'), ('BRA', 'CE342567'), ('ESP', 'CE342567')]
for passport in traveler_ids:
    print('%s/%s' % passport)


USA/31195855
BRA/CE342567
ESP/CE342567


### 2.3.2 元组拆包
将元组中的元素分别赋值给不同的变量，可用 * 来表示忽略多余的元素

In [11]:
latitude, longitude = lax_coordinates
print('latitude:', latitude, '\nlongitude:', longitude, '\n')

_, longitude = lax_coordinates  # 使用_占位符取到想要的数据
print('longitude:', longitude, '\n')

a, b, *rest = range(5)  # 用*来处理剩下的元素
print(a, b, rest)


latitude: 33 
longitude: -118 

longitude: -118 

0 1 [2, 3, 4]


### 2.3.3 嵌套元组拆包
接受表达式的元组可以是嵌套式的，例如 (a, b, (c, d))。

In [12]:
# 每个元组内有 4 个元素，其中最后一个元素是一对坐标。
# 我们把输入元组的最后一个元素拆包到由变量构成的元组里，这样就获取了坐标。
# if longitude <= 0: 这个条件判断把输出限制在西半球的城市。
metro_areas = [
    ('Tokyo', 'JP', 36.933, (35.689722, 139.691667)),
    ('Delhi NCR', 'IN', 21.935, (28.613889, 77.208889)),
    ('Mexico City', 'MX', 20.142, (19.433333, -99.133333)),
    ('New York-Newark', 'US', 20.104, (40.808611, -74.020386)),
    ('Sao Paulo', 'BR', 19.649, (-23.547778, -46.635833)),
]
print('{:15} | {:^9} | {:^9}'.format('', 'lat.', 'long.'))
fmt = '{:15} | {:9.4f} | {:9.4f}'
for name, cc, pop, (latitude, longitude) in metro_areas:
    if longitude <= 0:
        print(fmt.format(name, latitude, longitude))


                |   lat.    |   long.  
Mexico City     |   19.4333 |  -99.1333
New York-Newark |   40.8086 |  -74.0204
Sao Paulo       |  -23.5478 |  -46.6358


### 2.3.4 具名元组
collections.namedtuple 是一个工厂函数，它可以用来构建一个带字段名的元组和一个有名字的类——这个带名字的类对调试程序有很大帮助。

In [23]:
from collections import namedtuple
City = namedtuple("City","name country population coordinates")
tokyo = City("Tokyo",'JP',36,(35,139))
print(tokyo)
print(tokyo.name)
print(tokyo[1])

print('*'*10+'具名元组的属性和方法'+'*'*10)
print(City._fields) # 输出包含类所有字段名称的元组
LatLong = namedtuple("LatLong","lar long")
delhi_data = ('Delhi NCR', 'IN', 21.935, LatLong(28.613889, 77.208889))
delhi = City._make(delhi_data) # 用_make()通过接受一个可迭代对象来生成类的实例
print(delhi._asdict()) # _asdict()把具名元组以collections.OrderedDict的形式返回

print('*'*20)
for k,v in delhi._asdict().items():
    print(k,'：',v)


City(name='Tokyo', country='JP', population=36, coordinates=(35, 139))
Tokyo
JP
**********具名元组的属性和方法**********
('name', 'country', 'population', 'coordinates')
{'name': 'Delhi NCR', 'country': 'IN', 'population': 21.935, 'coordinates': LatLong(lar=28.613889, long=77.208889)}
********************
name ： Delhi NCR
country ： IN
population ： 21.935
coordinates ： LatLong(lar=28.613889, long=77.208889)


## 2.4 切片

## 2.5 对序列使用+和*
如果在 a * n 这个语句中，序列 a 里的元素是对其他可变对象的引用的话，你就需要格外注意了

In [29]:
print('\n'+'*'*10+'写法一'+'*'*10+'\n')
board = [['_']*3 for i in range(3)]
print(board)
board[1][2] = 'x'
print(board)
print('\n'+'*'*10+'写法二'+'*'*10+'\n')
board = [['_']*3]*3
print(board)
board[1][2] = 'x'
print(board)


**********写法一**********

[['_', '_', '_'], ['_', '_', '_'], ['_', '_', '_']]
[['_', '_', '_'], ['_', '_', 'x'], ['_', '_', '_']]

**********写法二**********

[['_', '_', '_'], ['_', '_', '_'], ['_', '_', '_']]
[['_', '_', 'x'], ['_', '_', 'x'], ['_', '_', 'x']]


## 2.6 序列的增量赋值
增量赋值运算符 += 和 *= 的表现取决于它们的第一个操作对象。

In [31]:
# 可变序列
l = [1,2,3]
print(id(l)) # 刚开始时列表的 ID。
l *= 2
print(l)
print(id(l)) # 运用增量乘法后，列表的 ID 没变，新元素追加到列表上。
# 不可变序列
t  = (1,2,3)
print(id(t)) # 元组最开始的 ID。
t *= 2
print(t)
print(id(t)) # 运用增量乘法后，新的元组被创建。

2486609198656
[1, 2, 3, 1, 2, 3]
2486609198656
2486582196224
(1, 2, 3, 1, 2, 3)
2486609172320


## 2.7 list.sort 方法和内置函数sorted
list.sort 方法会就地排序列表，也就是说不会把原列表复制一份。这也是这个方法的返回值是 None 的原因，提醒你本方法不会新建一个列表。在这种情况下返回 None 其实是Python 的一个惯例：如果一个函数或者方法对对象进行的是就地改动，那它就应该返回None，好让调用者知道传入的参数发生了变动，而且并未产生新的对象。
   
与 list.sort 相反的是内置函数 sorted，它会新建一个列表作为返回值。这个方法可以接受任何形式的可迭代对象作为参数，甚至包括不可变序列或生成器（见第 14 章）。而不管sorted 接受的是怎样的参数，它最后都会返回一个列表。

In [32]:
# 参数：
# reverse : 是否降序 True/False
# key     : 一个只有一个参数的函数，默认为恒等函数。例：str.lower、len。
fruits = ['grape','respberry','apple','banana']
print(sorted(fruits))
print(fruits)
print(sorted(fruits,reverse=True))
print(sorted(fruits,key=len))

print(fruits.sort())
print(fruits)

['apple', 'banana', 'grape', 'respberry']
['grape', 'respberry', 'apple', 'banana']
['respberry', 'grape', 'banana', 'apple']
['grape', 'apple', 'banana', 'respberry']
None
['apple', 'banana', 'grape', 'respberry']


## 2,8 用bisect来管理已排序的序列
bisect 模块包含两个主要函数，bisect 和 insort，两个函数都利用二分查找算法来在有序序列中查找或插入元素。
### 2.8.1 用bisect来搜索
bisect(haystack, needle) 在 haystack（干草垛）里搜索 needle（针）的位置，该位置满足的条件是，把 needle 插入这个位置之后，haystack 还能保持升序。也就是在说这个函数返回的位置前面的值，都小于或等于 needle 的值。

In [45]:
import bisect
import sys
HAYSTACK = [1, 4, 5, 6, 8, 12, 15, 20, 21, 23, 23, 26, 29, 30]
NEEDLES = [0, 1, 2, 5, 8, 10, 22, 23, 29, 30, 31]
ROW_FMT = '{0:2d} @ {1:2d}    {2}{0:<2d}'
print('DEMO:', bisect.bisect.__name__)
print('haystack ->', ' '.join('%2d' % n for n in HAYSTACK))
for needle in reversed(NEEDLES):
    position = bisect.bisect(HAYSTACK, needle)
    offset = position * '  |'
    print(ROW_FMT.format(needle, position, offset))

DEMO: bisect_right
haystack ->  1  4  5  6  8 12 15 20 21 23 23 26 29 30
31 @ 14      |  |  |  |  |  |  |  |  |  |  |  |  |  |31
30 @ 14      |  |  |  |  |  |  |  |  |  |  |  |  |  |30
29 @ 13      |  |  |  |  |  |  |  |  |  |  |  |  |29
23 @ 11      |  |  |  |  |  |  |  |  |  |  |23
22 @  9      |  |  |  |  |  |  |  |  |22
10 @  5      |  |  |  |  |10
 8 @  5      |  |  |  |  |8 
 5 @  3      |  |  |5 
 2 @  1      |2 
 1 @  1      |1 
 0 @  0    0 


### 2.8.2 用bisect.insert插入新元素
insort(seq, item) 把变量 item 插入到序列 seq 中，并能保持 seq 的升序顺序。

In [53]:
import bisect
import random
SIZE=7
my_list = []
for i in range(SIZE):
    new_item = random.randrange(SIZE*2)
    bisect.insort(my_list, new_item)
    print('%2d ->' % new_item, my_list)

 0 -> [0]
 2 -> [0, 2]
13 -> [0, 2, 13]
 4 -> [0, 2, 4, 13]
 8 -> [0, 2, 4, 8, 13]
 5 -> [0, 2, 4, 5, 8, 13]
13 -> [0, 2, 4, 5, 8, 13, 13]


## 2.9 当列表不是首选
虽然列表既灵活又简单，但面对各类需求时，我们可能会有更好的选择。比如，要存放1000 万个浮点数的话，数组（array）的效率要高得多，因为数组在背后存的并不是 float对象，而是数字的机器翻译，也就是字节表述。这一点就跟 C 语言中的数组一样。再比如说，如果需要频繁对序列做先进先出的操作，deque（双端队列）的速度应该会更快。
### 2.9.1 数组
如果我们需要一个只包含数字的列表，那么 array.array 比 list 更高效。数组支持所有跟可变序列有关的操作，包括 .pop、.insert 和 .extend。另外，数组还提供从文件读取和存入文件的更快的方法，如 .frombytes 和 .tofile。

In [7]:
from array import array
from random import random
float = array('d',(random() for i in range(10)))
# 存入文件
fp = open('floats.bin', 'wb')
float.tofile(fp)
fp.close()
# 从文件读取
float2 = array('d')
fp = open('floats.bin', 'rb')
float2.fromfile(fp, 10)
fp.close()

print(float == float2)

True


### 2.9.2 内存视图
memoryview 是一个内置类，它能让用户在不复制内容的情况下操作同一个数组的不同切片。

### 2.9.3 Numpy 和 Scipy
NumPy 实现了多维同质数组（homogeneous array）和矩阵，这些数据结构不但能处理数字，还能存放其他由用户定义的记录。通过 NumPy，用户能对这些数据结构里的元素进行高效的操作。

SciPy 是基于 NumPy 的另一个库，它提供了很多跟科学计算有关的算法，专为线性代数、数值积分和统计学而设计。

In [7]:
import numpy
a = numpy.arange(12)
print('a      : ',a,'\ntype(a): ',type(a),'\na.shape: ',a.shape)
a.shape = 3,4
print(a)
print(a.transpose())

a      :  [ 0  1  2  3  4  5  6  7  8  9 10 11] 
type(a):  <class 'numpy.ndarray'> 
a.shape:  (12,)
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
[[ 0  4  8]
 [ 1  5  9]
 [ 2  6 10]
 [ 3  7 11]]


### 2.9.4 双向队列和其他形式的队列
collections.deque 类（双向队列）是一个线程安全、可以快速从两端添加或者删除元素的数据类型。

In [9]:
from collections import deque
dq = deque(range(10), maxlen=10)
print(dq)
dq.rotate(3)
print(dq)
dq.rotate(-4)
print(dq)
dq.appendleft(-1)
print(dq)


deque([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], maxlen=10)
deque([7, 8, 9, 0, 1, 2, 3, 4, 5, 6], maxlen=10)
deque([1, 2, 3, 4, 5, 6, 7, 8, 9, 0], maxlen=10)


# 3 字典和集合
本章内容的大纲如下：
- 常见的字典方法
- 如何处理查找不到的键
- 标准库中 dict 类型的变种
- set 和 frozenset 类型
- 散列表的工作原理
- 散列表带来的潜在影响（什么样的数据类型可作为键、不可预知的顺序，等等）
 ## 3.1 泛映射类型  

In [1]:
a = dict(one = 1, two = 2, three = 3)
b = {'one':1, 'two':2, 'three':3}
c = dict(zip(['one','two','three'],[1,2,3]))
d = dict([('one',1),('two',2),('three',3)])
e = dict({'three':3,'two':2,'one':1})
a == b == c == d == e

True

## 3.2 字典推导
字典推导（dictcomp）可以从任何以键值对作为元素的可迭代对象中构建出字典

In [4]:
DIAL_CODES = [(86, 'China'),
              (91, 'India'),
              (1, 'United States'),
              (62, 'Indonesia')]
country_codes = {country:code for code, country in DIAL_CODES}
print(country_codes)

codes_country ={code:country for code, country in DIAL_CODES  if code > 50 }
print(codes_country)

{'China': 86, 'India': 91, 'United States': 1, 'Indonesia': 62}
{86: 'China', 91: 'India', 62: 'Indonesia'}


## 3.3 常见的映射方法
映射类型的方法： dict、collections.defaultdict和collections.OrderedDict

In [14]:
# 用setdefauflt处理找不到的键
'''
当字典 d[k] 不能找到正确的键的时候，Python 会抛出异常，这个行为符合 Python 所信奉的
“快速失败”哲学。也许每个 Python 程序员都知道可以用 d.get(k, default) 来代替 d[k]，
给找不到的键一个默认的返回值（这比处理 KeyError 要方便不少）。但是要更新某个键对应
的值的时候，不管使用 __getitem__ 还是 get 都会不自然，而且效率低。
'''
d = {'one':[1]}

d.setdefault('one', [1]).append(2)
print(d)
# 上下效果等价，只不过后者至少要进行两次键查询——如果键不存在的话，就是三次，用 setdefault 只需要一次就可以完成整个操作。
if 'one' not in dict:
    d['one']=[1]
d['one'].append(3)
print(d)

{'one': [1, 2]}
{'one': [1, 2, 3]}


## 3.4 映射的弹性键查询
有时候为了方便起见，就算某个键在映射里不存在，我们也希望在通过这个键读取值的时候能得到一个默认值。有两个途径能帮我们达到这个目的，一个是通过 defaultdict 这个类型而不是普通的 dict，另一个是给自己定义一个 dict 的子类，然后在子类中实现__missing__ 方法。
### 3.4.1 defaultdict:处理找不到的键的一个选择

In [18]:
import collections
index = collections.defaultdict(list)
index['one']

[]

### 3.4.2 特殊方法__missing__

In [4]:

class StrKeyDict0(dict):
    def __missing__(self, key):
        if isinstance(key, str):
            raise KeyError(key)
        return self[str(key)]
    def get(self, key, default=None):
        try:
            return self[key]
        except KeyError:
            return default
    def __contains__(self, key):
        return key in self.keys() or str(key) in self.keys()


d = StrKeyDict0({'1':1, '2':2, '3':3})
d[2]

2

## 3.5 字典的变种
- collections.OrderedDict 
   
这个类型在添加键的时候会保持顺序，因此键的迭代次序总是一致的。OrderedDict的 popitem 方法默认删除并返回的是字典里的最后一个元素，但是如果像 my_odict.popitem(last=False) 这样调用它，那么它删除并返回第一个被添加进去的元素。

- collections.ChainMap  

该类型可以容纳数个不同的映射对象，然后在进行键查找操作的时候，这些对象会被当作一个整体被逐个查找，直到键被找到为止。这个功能在给有嵌套作用域的语言做解释器的时候很有用，可以用一个映射对象来代表一个作用域的上下文。

- collections.Counter
  
这个映射类型会给键准备一个整数计数器。每次更新一个键的时候都会增加这个计数器。所以这个类型可以用来给可散列表对象计数，或者是当成多重集来用——多重集合就是集合里的元素可以出现不止一次。Counter 实现了 + 和 - 运算符用来合并记录，还有像 most_common([n]) 这类很有用的方法。most_common([n]) 会按照次序返回映射里最常见的 n 个键和它们的计数。

## 3.6子类化UserDict


In [None]:
import collections
class StrKeyDict(collections.UserDict):

    def __missing__(self,key):
        if isinstance(key,str):
            raise KeyError(key)
        return self[str(key)]
    
    def __contains__(self, key):
        return str(key) in self.data
    
    def __setitem__(self, key, item):
        self.data[str(key)] = item


## 3.7 不可变映射类型

In [7]:
from types import MappingProxyType
d = {'1':'A'}
d_proxy = MappingProxyType(d)
print(d_proxy['1'])
d_proxy['2'] = 'X'

A


TypeError: 'mappingproxy' object does not support item assignment

In [10]:
d['2'] = 'B'
print(d_proxy)
print(d_proxy['2'])

{'1': 'A', '2': 'B'}
B


## 3.8 集合论
集合的本质是许多唯一对象的聚集。因此，集合可以用于去重。

In [15]:
set1 = set([1, 2, 3, 4, 5])
set2 = set([3, 4, 5, 6, 7, 8])
################################

found1 = len(set1 & set2)

################################

found2 = 0
for n in set1:
    if n in set2:
        found2 += 1

################################

found3 = len(set1.intersection(set2))

################################
found1 == found2 == found3

True

### 3.8.1 集合字面量



In [20]:
s = {1,2,3}
print(type(s))
print(frozenset(range(10)))

<class 'set'>
frozenset({0, 1, 2, 3, 4, 5, 6, 7, 8, 9})


### 3.8.2 集合推导

In [22]:
from unicodedata import name
print({chr(i) for i in range(32, 256) if 'SIGN' in name(chr(i),'')})

{'£', '+', '±', '%', '°', '§', '×', '$', '¶', '>', '=', '®', '#', '¬', 'µ', '<', '¢', '¤', '÷', '¥', '©'}


### 3.8.3 集合的操作

In [37]:
set1 = set([1, 2, 3, 4, 5])
set2 = set([3, 4, 5, 6, 7, 8])
print(set1 | set2) # 合集       set1.union(set2)
print(set1 & set2) # 交集       set1.intersection(set2)
print(set1 - set2) # 差集       set1.difference(set2)
print(set1 ^ set2) # 对称差集   set1.symmetric_difference(set2)


{1, 2, 3, 4, 5, 6, 7, 8}
{3, 4, 5}
{1, 2}
{1, 2, 6, 7, 8}


# 4 文本和字节序列
## 4.1 字符问题

In [39]:
s = 'café'
print(len(s))
b = s.encode()
print(b,len(b),b.decode())

4
b'caf\xc3\xa9' 5 café


## 4.2 字节概要

In [4]:
cafe = bytes('café', encoding='utf-8')
print(cafe,'\n',cafe[0],'\n',cafe[:1])


b'caf\xc3\xa9' 
 99 
 b'c'


In [39]:
import pandas as pd

def goodbad(df):
    names = {'0': (df['y']==0).sum() / len(df['y']),
             '1': (df['y']==1).sum() / len(df['y'])}
    return pd.Series(names)

data = pd.DataFrame({'x':['A','A','C','B','E','F','G','H'],
                     'y':[0,1,0,1,0,0,1,1]})

data.groupby('x').apply(goodbad)

Unnamed: 0_level_0,0,1
x,Unnamed: 1_level_1,Unnamed: 2_level_1
A,0.5,0.5
B,0.0,1.0
C,1.0,0.0
E,1.0,0.0
F,1.0,0.0
G,0.0,1.0
H,0.0,1.0


# 第5章 一等函数
- 在运行时创建
- 能赋值给变量或数据结构中的元素
- 能作为参数传给函数
- 能作为函数的返回结果
## 5.1 把函数视为对象

In [2]:
def factorial(n):
    "return n!"
    return 1 if n < 2 else n*factorial(n-1)

factorial(10),factorial.__doc__,type(factorial)

(3628800, 'return n!', function)

In [3]:
fact = factorial
fact

<function __main__.factorial(n)>

In [4]:
fact(5)

120

In [5]:
map(factorial,range(10))

<map at 0x2088a7bcdc0>

In [6]:
list(map(factorial,range(10)))

[1, 1, 2, 6, 24, 120, 720, 5040, 40320, 362880]

## 5.2 高阶函数
接受函数为参数，或者把函数作为结果返回的函数是高阶函数

In [8]:
# 示例：根据单词长度给一个列表排序
fruits = ['strawberry', 'fig', 'apple', 'cherry', 'raspberry', 'banana']
sorted(fruits,key=len)

['fig', 'apple', 'cherry', 'banana', 'raspberry', 'strawberry']

In [9]:
# 示例：根据反向拼写给一个单词列表排序
def reverse(word:str):
    return word[::-1]
sorted(fruits, key=reverse)

['banana', 'apple', 'fig', 'raspberry', 'strawberry', 'cherry']

In [11]:
# map、filter和reduce的现代替代品
# 示例：计算阶乘列表：map和filter与列表推导比较
temp = list(map(fact,range(6))) # 构建 0! 到 5! 的一个阶乘列表。
print(temp)
temp = [fact(x) for x in range(6)] # 使用列表推导执行相同的操作。
print(temp)
temp = list(map(factorial,filter(lambda x:x % 2,range(6)))) # 使用 map 和 filter 计算直到 5! 的奇数阶乘列表。
print(temp)
temp = [factorial(x) for x in range(6) if x % 2] # 使用列表推导做相同的工作，换掉 map 和 filter，并避免了使用 lambda 表达式。
print(temp)

[1, 1, 2, 6, 24, 120]
[1, 1, 2, 6, 24, 120]
[1, 6, 120]
[1, 6, 120]


In [12]:
# 示例：使用reduce和sum计算0~99之和
# 从 Python 3.0 起，reduce 不再是内置函数了。
# 导入 add，以免创建一个专求两数之和的函数。
# 计算 0~99 之和。
# 使用 sum 做相同的求和；无需导入或创建求和函数。
from functools import reduce
from operator import add
reduce(add, range(100)), sum(range(100))

(4950, 4950)

## 5.3 匿名函数
lambda 关键字在 Python 表达式内创建匿名函数。

In [21]:
# 示例：使用lambda表达式反转拼写，然后依此给单词排序
fruits = ['strawberry', 'fig', 'apple', 'cherry', 'raspberry', 'banana']
sorted(fruits, key=lambda x:x[::-1])

['banana', 'apple', 'fig', 'raspberry', 'strawberry', 'cherry']

## 5.4 可调用对象
- **用户定义的函数**：使用def语句或lambda表达式创建
- **内置函数**：使用C语言实现的函数，如len或str.strftime
- **内置方法**：使用C语言实现的方法，如dict.get
- **方法**：在类的定义体中定义的函数
- **类**：调用类时会运行类的 \_\_new\_\_ 方法创建一个实例，然后运行 \_\_init\_\_ 方法，初始化实例，最后把实例返回给调用方。因为 Python 没有 new 运算符，所以调用类相当于调用函数。
- **类的实例**：如果类定义了 \_\_call\_\_ 方法，那么它的实例可以作为函数调用
- **生成器函数**：使用 yield 关键字的函数或方法。调用生成器函数返回的是生成器对象。

## 5.5 用户定义的可调用类型

In [23]:
# 示例：调用BingoCage实例，从打乱的列表中取出一个元素
import random
from typing import Any
class BingoCage:
    def __init__(self,items):
        self._items = list(items)
        random.shuffle(self._items)
    
    def pick(self):
        try:
            return self._items.pop()
        except IndexError:
            raise LookupError('pick from empty BingoCage')
    
    def __call__(self):
        return self.pick()

bingo = BingoCage(range(3))
print(bingo.pick())
print(bingo())
print(callable(bingo))


2
0
True


## 5.6 函数内省

In [24]:
# 示例：列出常规对象没有而函数有的属性
class C:pass
obj = C()
def func():pass
sorted(set(dir(func))-set(dir(obj)))

['__annotations__',
 '__call__',
 '__closure__',
 '__code__',
 '__defaults__',
 '__get__',
 '__globals__',
 '__kwdefaults__',
 '__name__',
 '__qualname__']

## 5.7 从定位参数到仅限关键字参数

In [10]:
# 示例 tag函数用于生成HTML标签；使用名为cls的关键字参数传入“class”属性，这是一种变通方法，因为“class”是python的关键字
def tag(name, *content,cls=None,**attrs):
    """生成一个或多个HTML标签"""
    if cls is not None:
        attrs['class'] = cls
    if attrs:
        attr_str = ''.join(' %s="%s"' % (attr,value) 
                           for attr,value in sorted(attrs.items()))
    else:
        attr_str = ''
    if content:
        return '\n'.join('<%s%s>%s</%s>' %
                        (name, attr_str, c, name) for c in content)
    else:
        return '<%s%s />' % (name, attr_str)


my_tag = {'title': 'Sunset Boulevard','src': 'sunset.jpg'}
print(tag('p', 'hello', 'world', cls='sidebar',**my_tag))

<p class="sidebar" src="sunset.jpg" title="Sunset Boulevard">hello</p>
<p class="sidebar" src="sunset.jpg" title="Sunset Boulevard">world</p>


## 5.8 获取关于参数的信息

In [6]:
# 示例 在指定长度附近截取字符串的函数
def clip(text, max_len=80):
    """
    在max_len前面或后面的第一个空格处截断文本
    """
    end = None
    if len(text) > max_len:
        space_before = text.rfind(' ', 0, max_len)
        if space_before > 0:
            end = space_before
        else:
            space_after = text.rfind(' ', max_len)
            if space_after >= 0:
                end = space_after
        if end is None:
            end = len(text)
    return text[:end].rstrip()


In [18]:
[clip.__defaults__,
 clip.__code__.co_varnames,
 clip.__code__.co_argcount]

[(80,), ('text', 'max_len', 'end', 'space_before', 'space_after'), 2]

In [21]:
# 示例 提取函数的签名
from inspect import signature
sig = signature(clip)
print(sig)
print(str(sig))
for name, param in sig.parameters.items():
    print(param.kind,':',name,'=',param.default)

(text, max_len=80)
(text, max_len=80)
POSITIONAL_OR_KEYWORD : text = <class 'inspect._empty'>
POSITIONAL_OR_KEYWORD : max_len = 80


## 5.9 函数注解

In [2]:
# 示例 有注解的clip函数
def clip(text:str, max_len:'int > 0'=80) -> str: 
    """在max_len前面或后面的第一个空格处截断文本
    """
    end = None
    if len(text) > max_len:
        space_before = text.rfind(' ', 0, max_len)
        if space_before >= 0:
            end = space_before
        else:
            space_after = text.rfind(' ', max_len)
            if space_after >= 0:
                end = space_after
    if end is None: # 没找到空格
        end = len(text)
    return text[:end].rstrip()

clip.__annotations__

{'text': str, 'max_len': 'int > 0', 'return': str}

In [6]:
# 示例 从函数签名中提取注解
from inspect import signature
sig = signature(clip)
print(sig.return_annotation)
for param in sig.parameters.values():
    note = repr(param.annotation).ljust(13)
    print(note,':',param.name,'=',param.default)

<class 'str'>
<class 'str'> : text = <class 'inspect._empty'>
'int > 0'     : max_len = 80


## 5.10 支持函数式编程的包
### 5.10.1 operator模块

In [8]:
# 示例 使用reduce函数和一个匿名函数计算阶乘
from functools import reduce
def fact(n):
    return reduce(lambda a,b:a*b ,range(1,n+1))

# 示例 使用reduce和operator.mul 函数计算阶乘
from functools import reduce
from operator import mul
def fact(n):
    return reduce(mul,range(1,n+1))  # operator 模块为多个算术运算符提供了对应的函数，从而避免编写 lambda a, b: a*b 这种平凡的匿名函数。

In [12]:
# 示例 演示使用itemgetter排序一个元组列表
metro_data = [
    ('Tokyo', 'JP', 36.933, (35.689722, 139.691667)),
    ('Delhi NCR', 'IN', 21.935, (28.613889, 77.208889)),
    ('Mexico City', 'MX', 20.142, (19.433333, -99.133333)),
    ('New York-Newark', 'US', 20.104, (40.808611, -74.020386)),
    ('Sao Paulo', 'BR', 19.649, (-23.547778, -46.635833))
    ]
from operator import itemgetter
for city in sorted(metro_data,key = itemgetter(1)):
    print(city)

cc_name = itemgetter(1,0)
for city in metro_data:
    print(cc_name(city))

('Sao Paulo', 'BR', 19.649, (-23.547778, -46.635833))
('Delhi NCR', 'IN', 21.935, (28.613889, 77.208889))
('Tokyo', 'JP', 36.933, (35.689722, 139.691667))
('Mexico City', 'MX', 20.142, (19.433333, -99.133333))
('New York-Newark', 'US', 20.104, (40.808611, -74.020386))
('JP', 'Tokyo')
('IN', 'Delhi NCR')
('MX', 'Mexico City')
('US', 'New York-Newark')
('BR', 'Sao Paulo')


In [14]:
# 示例 定义一个namedtuple，名为metro_data，演示使用attrgetter处理它
from collections import namedtuple
LatLong = namedtuple("LatLong", 'lat long')
Metropolis = namedtuple('Metropolis', 'name cc pop coord')
metro_areas = [Metropolis(name, cc, pop, LatLong(lat, long)) for name, cc, pop, (lat, long) in metro_data]
print(metro_areas[0])
print(metro_areas[0].coord.lat)
from operator import attrgetter
name_lat = attrgetter('name', 'coord.lat')
for city in sorted(metro_areas, key=attrgetter('coord.lat')):
    print(name_lat(city))

Metropolis(name='Tokyo', cc='JP', pop=36.933, coord=LatLong(lat=35.689722, long=139.691667))
35.689722
('Sao Paulo', -23.547778)
('Mexico City', 19.433333)
('Delhi NCR', 28.613889)
('Tokyo', 35.689722)
('New York-Newark', 40.808611)


In [2]:
# 示例 methodcaller使用示例：第二个测试展示绑定参数的方式
from operator import methodcaller
s = 'The time has come'
upcase = methodcaller('upper')
print(upcase(s))
hiphenate = methodcaller('replace',' ','-')
print(hiphenate(s))

THE TIME HAS COME
The-time-has-come


### 5.10.2 使用functools.partial冻结参数

In [3]:
# 示例 使用partial把一个两参数函数改编成需要单参数的可调用对象
from operator import mul
from functools import partial
triple = partial(mul,3)
triple(7)

21

In [7]:
import unicodedata, functools
nfc = functools.partial(unicodedata.normalize,'NFC')
s1 = 'café'
s2 = 'cafe\u0301'
s1,s2

('café', 'café')

In [8]:
s1 == s2

False

In [9]:
nfc(s1) == nfc(s2)

True

In [11]:
# 示例 把partial应用到tag函数上
from functools import partial
picture = partial(tag, 'img',cls='pic-frame')
picture(src='wumpus.jpg')

'<img class="pic-frame" src="wumpus.jpg" />'

# 第6章 使用一等函数实现设计模式
## 6.1 案例分析：重构“策略”模式
### 6.1.1 经典的“策略”模式
“策略”模式：定义一系列算法，把它们一一封装起来，并且使它们可以相互替换。本模式使得算法可以独立于使用它的客户而变化。

In [1]:
# 示例 实现Order类，支持插入式折扣策略
from abc import ABC, abstractmethod
from collections import  namedtuple

Customer = namedtuple("Customer",'name fidelity')

class LineItem:
    def __init__(self,product,quantity,price):
        self.product = product
        self.quantity = quantity
        self.price = price
    
    def total(self):
        return self.price * self.quantity

class Order:    # 上下文
    def __init__(self, customer, cart, promotion=None):
        self.customer = customer
        self.cart = list(cart)
        self.promotion = promotion
    
    def total(self):
        if not hasattr(self, '__total'):
            self.__total = sum(item.total() for item in self.cart)
        return self.__total
    
    def due(self):
        if self.promotion is None:
            discount = 0
        else: 
            discount = self.promotion.discount(self)
        return self.total() - discount
    
    def __repr__(self):
        fmt = '<Order total: {:.2f} due: {:.2f}>'
        return fmt.format(self.total(), self.due())

class Promotion(ABC): # 策略：抽象基类

    @abstractmethod
    def discount(self, order):
        """返回折扣金额（正值）"""

class FidelityPromo(Promotion): # 第一个具体策略
    """为积分为1000或以上的顾客提供5%折扣"""

    def discount(self, order):
        return order.total() * 0.05 if order.customer.fidelity >= 1000 else 0

class BulkItemPromo(Promotion): # 第二个具体策略
    """单个商品为20个或以上时提供10%折扣"""

    def discount(self, order):
        discount = 0
        for item in order.cart:
            if item.quantity >= 20:
                discount ++ item.total() * 0.1
        return discount

class LargeOrderPromo(Promotion): # 第三个具体策略
    """订单中的不同商品达到10个或以上时提供7%折扣"""
    def discount(self, order):
        distinct_items = {item.product for item in order.cart}
        if len(distinct_items) >= 10:
            return order.total() * .07
        return 0


In [2]:
# 示例 使用不同促销折扣的Order类
joe = Customer('John Doe', 0)
ann = Customer('Ann Smith', 1100)
cart = [LineItem('banana', 4, .5),
        LineItem('apple', 10, 1.5),
        LineItem('watermellon', 5, 5.0)]
Order(joe, cart, FidelityPromo())

<Order total: 42.00 due: 42.00>

### 6.1.2 使用函数实现“策略”模式

In [6]:
# 示例 Order类和使用函数实现的折扣策略
from collections import namedtuple
Customer = namedtuple("Customer","name fidelity")

class LineItem(object):
    def __init__(self,product,quantity,price):
        self.product = product
        self.quantity = quantity
        self.price = price
    def total(self):
        return self.quantity*self.price

class Order(object):
    def __init__(self,cusomer:Customer,cart:list[LineItem],promotion=None):
        self.cusomer =cusomer
        self.cart = cart
        self.promotion = promotion
    
    def total(self):
        if not hasattr(self,'__total'):
            self.__total = sum(item.total() for item in self.cart)
        return self.__total
    
    def due(self):
        if self.promotion is None:
            discount = 0
        else:
            discount = self.promotion(self)
        return self.total()-discount

    def __repr__(self) -> str:
        fmt = '<Order total: {:.2f} due: {:.2f}>'
        return fmt.format(self.total(), self.due())

def fidelity_promo(order:Order):
    """为积分为1000或以上的顾客提供5%折扣"""
    return order.total() * 0.05 if order.cusomer.fidelity >= 1000 else 0

def bulk_item_promo(order:Order):
    """单个商品为20个或以上时提供10%折扣"""
    discount = 0
    for item in order.cart:
        if item.quantity >= 20:
            discount += item.total() * 0.1
    return discount

def large_order_promo(order:Order):
    """订单中的不同商品达到10个或以上时提供7&折扣"""
    distinct_item = {item.product for item in order.cart} 
    if len(distinct_item) >= 10:
        return order.total()*.07
    return 0

def best_promo(order:Order):
    """选择可用的最佳折扣"""
    # promos = [globals()[name] for name in globals()
    #           if name.endswith('_promo')
    #           and name != 'best_promo'] 
    promos = [fidelity_promo, bulk_item_promo, large_order_promo]
    return max(promo(order) for promo in promos)

In [7]:
joe = Customer('John Doe', 0) 
ann = Customer('Ann Smith', 1100)
cart = [LineItem('banana', 4, .5),
        LineItem('apple', 10, 1.5),
        LineItem('watermellon', 5, 5.0)]
Order(joe, cart, fidelity_promo),Order(ann, cart, best_promo)

(<Order total: 42.00 due: 42.00>, <Order total: 42.00 due: 39.90>)

## 6.2 命令模式

In [8]:
# 示例 MacroCommand的各个实例都在内部存储这命令列表
from typing import Any


class MecroCommand:
    """一个执行一组命令的命令"""
    def __init__(self, commands):
        self.commands = commands
    
    def __call__(self):
        for command in self.commands:
            command()

# 第7章 函数装饰器和闭包
## 7.1 装饰器基础知识

In [1]:
def deco(func):
    def inner():
        print('run deco()')
    return inner
#  写法1
@deco
def target():
    print("run target()")

#  写法2
def target():
    print("run target()")

target = deco(target)

In [4]:
target(),target

run deco()


(None, <function __main__.deco.<locals>.inner()>)

## 7.2 Python何时运行装饰器 

In [6]:
# 示例
registry = []

def register(func):
    print('running register(%s)' % func)
    registry.append(func)
    return func

@register
def f1():
    print('running f1()')

@register
def f2():
    print('running f2()')

def f3():
    print('running f3()')

print('registry ->', registry)
f1()
f2()
f3()

running register(<function f1 at 0x000002233EA70CA0>)
running register(<function f2 at 0x000002233E9098B0>)
registry -> [<function f1 at 0x000002233EA70CA0>, <function f2 at 0x000002233E9098B0>]
running f1()
running f2()
running f3()


## 7.3 使用装饰器改进“策略”模式

In [None]:
# 示例promos列表中的值使用promotion装饰器填充
promos = []

def promotion(promo_func):
    promos.append(promo_func)
    return promo_func

@promotion
def fidelity(order: Order):
    return order.total()*.05 if order.cusomer.fidelity >= 1000 else 0

@promotion
def bulk_item(order: Order):
    discount = 0
    for item in order.cart:
        if item.quantity >= 20:
            discount += item.total() * .1
    return discount

@promotion
def large_order(order: Order):
    distinct_items = {item.product for item in order.cart}
    if len(distinct_items) >= 10:
        return order.total() * .07
    return 0

def best_promo(order):
    return max(promo(order) for promo in promos)


## 7.4 变量作用域规则

In [7]:
# 示例 一个函数，读取一个局部变量和一个全局变量
def f1(a):
    print(a)
    print(b)

f1(3)

3


NameError: name 'b' is not defined

In [8]:
b = 6
f1(3)

3
6


In [1]:
# 示例 b 是局部变量，因为在函数的定义体中给它赋值了
b = 6
def f2(a):
    print(a)
    print(b)
    b=9
f2(3)

3


UnboundLocalError: local variable 'b' referenced before assignment

In [1]:
b = 6
def f3(a):
    global b
    print(a)
    print(b)
    b = 9

f3(3)

3
6


## 7.5 闭包

In [2]:
# 计算移动平均值的类
from typing import Any


class Averager():
    def __init__(self) -> None:
        self.series = []
    
    def __call__(self, new_value) -> Any:
        self.series.append(new_value)
        total = sum(self.series)
        return total/len(self.series)

avg = Averager()
print(avg(10))
print(avg(11))
print(avg(12))
print(avg.series)

10.0
10.5
11.0
[10, 11, 12]


In [3]:
# 计算移动平均值的高阶函数
def make_averager():
    series = []
    def averager(new_value):
        series.append(new_value)
        total = sum(series)
        return total/len(series)
    return averager

avg = make_averager()
avg(10),avg(11),avg(12)

(10.0, 10.5, 11.0)

In [5]:
# 审查make_averager创建的函数
print(avg.__code__.co_varnames) # 局部变量
print(avg.__code__.co_freevars) # 自由变量
# series 的绑定在返回的 avg 函数的 __closure__ 属性中。avg.__closure__ 中的各个元
# 素对应于 avg.__code__.co_freevars 中的一个名称。这些元素是 cell 对象，有个 cell_
# contents 属性，保存着真正的值。
print(avg.__closure__)
print(avg.__closure__[0].cell_contents)

('new_value', 'total')
('series',)
(<cell at 0x00000258EA99C430: list object at 0x00000258EA9A2600>,)
[10, 11, 12]


## 7.6 nonlocal声明

In [6]:
# 计算移动平均值的高阶函数，不保存所有历史值，但有缺陷
def make_averager():
    count = 0
    total = 0
    def averager(new_value):
        count += 1
        total += new_value
        return total/count
    return averager
avg = make_averager()
avg(10)
# 当 count 是数字或任何不可变类型时，count += 1 语句的作用其实与 count =
# count + 1 一样。因此，我们在 averager 的定义体中为 count 赋值了，这会把 count 变成
# 局部变量。total 变量也受这个问题影响。
# 上一示例没遇到这个问题，因为我们没有给 series 赋值，我们只是调用 series.append，
# 并把它传给 sum 和 len。也就是说，我们利用了列表是可变的对象这一事实。

UnboundLocalError: local variable 'count' referenced before assignment

In [7]:
# 计算移动平均值的高阶函数，不保存所有历史(使用nonlocal修正)
# nonlocal的作用是把变量标记为自由变量，即使在函数中为变量赋予新值了，也会变成自由变量。
def make_averager():
    count = 0
    total = 0
    def averager(new_value):
        nonlocal count, total
        count += 1
        total += new_value
        return total/count
    return averager
avg = make_averager()
avg(10)

10.0

## 7.7 实现一个简单的装饰器

In [8]:
# 一个简单的装饰器，输出函数的运行时间
import time
def clock(func):
    def clocked(*args):
        t0 = time.perf_counter()
        result = func(*args)
        elapsed = time.perf_counter() - t0
        name = func.__name__
        arg_str = ','.join(repr(arg) for arg in args)
        print('[%0.8fs] %s(%s) -> %r' % (elapsed, name, arg_str, result))
        return result
    return clocked

In [9]:
# 使用clock装饰器
import time
@clock
def snooze(seconds):
    time.sleep(seconds)

@clock
def factorial(n):
    return 1 if n<2 else n*factorial(n-1)

print('*' * 40, 'Calling snooze(.123)')
snooze(.123)
print('*' * 40, 'Calling factorial(6)')
print('6! =', factorial(6))

**************************************** Calling snooze(.123)
[0.13439810s] snooze(0.123) -> None
**************************************** Calling factorial(6)
[0.00000070s] factorial(1) -> 1
[0.00001620s] factorial(2) -> 2
[0.00002470s] factorial(3) -> 6
[0.00003290s] factorial(4) -> 24
[0.00004040s] factorial(5) -> 120
[0.00004950s] factorial(6) -> 720
6! = 720


## 7.8 标准库中的装饰器

In [10]:
# 使用functools.lru_cache做备忘
# 示例 生成第n个斐波那契数，递归方式非常耗时
@clock
def fibonacci(n):
    if n<2:
        return n
    return fibonacci(n-2) + fibonacci(n-1)

print(fibonacci(6))

[0.00000050s] fibonacci(0) -> 0
[0.00000060s] fibonacci(1) -> 1
[0.00018020s] fibonacci(2) -> 1
[0.00000020s] fibonacci(1) -> 1
[0.00000060s] fibonacci(0) -> 0
[0.00000020s] fibonacci(1) -> 1
[0.00001070s] fibonacci(2) -> 1
[0.00002100s] fibonacci(3) -> 2
[0.00021310s] fibonacci(4) -> 3
[0.00000010s] fibonacci(1) -> 1
[0.00000030s] fibonacci(0) -> 0
[0.00000030s] fibonacci(1) -> 1
[0.00000980s] fibonacci(2) -> 1
[0.00001850s] fibonacci(3) -> 2
[0.00000020s] fibonacci(0) -> 0
[0.00000020s] fibonacci(1) -> 1
[0.00001060s] fibonacci(2) -> 1
[0.00000020s] fibonacci(1) -> 1
[0.00000030s] fibonacci(0) -> 0
[0.00000030s] fibonacci(1) -> 1
[0.00001200s] fibonacci(2) -> 1
[0.00002400s] fibonacci(3) -> 2
[0.00004560s] fibonacci(4) -> 3
[0.00007400s] fibonacci(5) -> 5
[0.00029850s] fibonacci(6) -> 8
8


In [11]:
# 示例 使用缓存实现，速度更快
import functools
@functools.lru_cache()
@clock
def fibonacci(n):
    if n<2:
        return n
    return fibonacci(n-2) + fibonacci(n-1)

print(fibonacci(6))

[0.00000070s] fibonacci(0) -> 0
[0.00000070s] fibonacci(1) -> 1
[0.00029780s] fibonacci(2) -> 1
[0.00000050s] fibonacci(3) -> 2
[0.00030770s] fibonacci(4) -> 3
[0.00000040s] fibonacci(5) -> 5
[0.00031680s] fibonacci(6) -> 8
8


In [12]:
#  单分派泛函数
import html
def htmlize(obj):
    content = html.escape(repr(obj))
    return '<pre>{}</pre>'.format(content)



In [1]:
#  示例 singledispatch创建一个自定义的htmlize.register装饰器，把多个函数绑定在一起组成一个泛函数
from  functools import singledispatch
from collections import abc
import numbers
import html
@singledispatch
def htmlize(obj):
    content =  html.escape(repr(obj))
    return '<pre>{}</pre>'.format(content)
@htmlize.register(str)
def _(text):
    content = html.escape(text).replace('\n','<br>\n')
    return '<p>{}</p>'.format(content)
@htmlize.register(numbers.Integral)
def _(n):
    return '<pre>{0} (0x{0:})</pre>'.format(n)
@htmlize.register(tuple)
@htmlize.register(abc.MutableSequence)
def _(seq):
    inner = '</li>\n<li>'.join(htmlize(item) for item in seq)
    return '<ul>\n<li>' + inner + '</li>\n</ul>'

In [6]:
print(htmlize({1,2,3}))
print(htmlize(abs))
print(htmlize('asdaf'))
print(htmlize(42))
print(htmlize((3,4,'1',6)))



<pre>{1, 2, 3}</pre>
<pre>&lt;built-in function abs&gt;</pre>
<p>asdaf</p>
<pre>42 (0x42)</pre>
<ul>
<li><pre>3 (0x3)</pre></li>
<li><pre>4 (0x4)</pre></li>
<li><p>1</p></li>
<li><pre>6 (0x6)</pre></li>
</ul>


## 7.9 叠放装饰器

In [7]:
# @d1
# @d2
# def f():
#     print('f')
# 等同于：
# def f():
#     print('f')
# f = d1(d2(f))

## 7.10 参数化装饰器

In [9]:
# 示例 为了接受参数，新的register装饰器必须作为函数调用
registry = set()
def register(active = True):
    def decorate(func):
        print('running register(active=%s)->decorate(%s)' % (active, func))
        if active:
            registry.add(func)
        else:
            registry.discard(func)
        return func
    return decorate
@register(active=False) 
def f1():
    print('running f1()')
@register()
def f2():
    print('running f2()')
def f3():
    print('running f3()')



running register(active=False)->decorate(<function f1 at 0x0000019E14FCD310>)
running register(active=True)->decorate(<function f2 at 0x0000019E14FCDEE0>)


# 第8章 对象引用、可变性和垃圾回收
## 8.1 变量不是盒子

In [11]:
# 示例 变量a和b引用同一个列表，而不是那个列表的副本
a = [1,2,3]
b = a
b.append(4)
b,a

([1, 2, 3, 4], [1, 2, 3, 4])

## 8.2 标识、相等性和别名

In [12]:
# 示例 charles和lewis指代同一个对象
charles = {'name':'Charles L.Dodgson','born':1832}
lewis = charles
print(lewis is charles,id(charles), id(lewis))
lewis['balabce'] =950
charles

True 1778468589504 1778468589504


{'name': 'Charles L.Dodgson', 'born': 1832, 'balabce': 950}

In [13]:
alex = {'name': 'Charles L.Dodgson', 'born': 1832, 'balabce': 950}
alex == charles , alex is not charles

(True, True)

In [18]:
# 示例 一开始，t1和t2相等，但是修改t1中的一个可变元素后，二者不相等了
t1 = (1,2,[3,4])
t2 = (1,2,[3,4])
print(t1 == t2, id(t1[-1]))
t1[-1].append(5)
t1 == t2, id(t1[-1])

True 1778468688064


(False, 1778468688064)

## 8.3 默认做浅复制

In [1]:
# 示例 为一个包含另一个列表的列表做浅复制；把这段代码复制粘贴到 Python Tutor网站中，看看动画效果
l1 = [3, [66, 55, 44], (7, 8, 9)]
l2 = list(l1)
l1.append(100) 
l1[1].remove(55) 
print('l1:', l1)
print('l2:', l2)
l2[1] += [33, 22] 
l2[2] += (10, 11) 
print('l1:', l1)
print('l2:', l2)

l1: [3, [66, 44], (7, 8, 9), 100]
l2: [3, [66, 44], (7, 8, 9)]
l1: [3, [66, 44, 33, 22], (7, 8, 9), 100]
l2: [3, [66, 44, 33, 22], (7, 8, 9, 10, 11)]


In [2]:
# 示例 校车乘客在途中上车和下车
class Bus:
    def __init__(self,passengers=None):
        if passengers is None:
            self.passengers = []
        else:
            self.passengers = list(passengers)
    
    def pick(self,name):
        self.passengers.append(name)
    
    def drop(self,name):
        self.passengers.remove(name)

In [4]:
#  示例 使用copy和deepcopy产生的影响
import copy
bus1 = Bus(['Alice', 'Bill'])
bus2 = copy.copy(bus1)
bus3 = copy.deepcopy(bus1)
print(id(bus1), id(bus2), id(bus3))
print(id(bus1.passengers), id(bus2.passengers), id(bus3.passengers))
bus1.drop('Bill')
print(bus2.passengers)
print(id(bus1.passengers), id(bus2.passengers), id(bus3.passengers))
print(bus3.passengers)
# ➊ 使用 copy 和 deepcopy，创建 3 个不同的 Bus 实例。
# ➋ bus1 中的 'Bill' 下车后，bus2 中也没有他了。
# ➌ 审查 passengers 属性后发现，bus1 和 bus2 共享同一个列表对象，因为 bus2 是 bus1 的浅复制副本。
# ➍ bus3 是 bus1 的深复制副本，因此它的 passengers 属性指代另一个列表

2216178941520 2216173308368 2216178941568
2216179077952 2216179077952 2216179008320
['Alice']
2216179077952 2216179077952 2216179008320
['Alice', 'Bill']


## 8.4 函数的参数作为引用时

In [9]:
# 示例 函数可能会修改接受到的任何可变对象
def f(a,b):
    a += b
    return a
x=1
y=2
print(f(x,y),x,y)
a = [1,2]
b = [3,4]
print(f(a,b),a,b)
a = (1,2)
b = (3,4)
print(f(a,b),a,b)

3 1 2
[1, 2, 3, 4] [1, 2, 3, 4] [3, 4]
(1, 2, 3, 4) (1, 2) (3, 4)


## 8.5 del和垃圾回收

In [1]:
import weakref
s1 = {1,2,3}
s2 = s1
def bye():
    print('对象销毁')

ender = weakref.finalize(s1, bye)
ender.alive

True

In [2]:
del s1
ender.alive

True

In [3]:
s2 = '123'
ender.alive

对象销毁


False

## 8.6 弱引用

In [13]:
# 示例 弱引用是可调用的对象，返回的是被引用的对象；如果所指对象不存在了，返回 None [以下为控制台代码]
import weakref
a_set = {0,1}
wref = weakref.ref(a_set)
wref # <weakref at 0x000001C46895A720; to 'set' at 0x000001C468931F20>
wref() # {0, 1}
a_set = {3,4,5}
wref() # {0, 1}
wref() is None # False
wref() is None # True

True

### 8.6.1 WeakValueDictionary简介

In [1]:
# 示例 Cheese有个kind属性和标准的字符串表示形式
class Cheese:
    def __init__(self,kind):
        self.kind = kind
    def __repr__(self):
        return 'Cheese(%r)' % self.kind

In [4]:
# 示例 顾客：“你们店里到底有没有奶酪？”
import weakref
stock = weakref.WeakValueDictionary()
catalog = [Cheese('Red Leicester'), Cheese('Tilsit'),Cheese('Brie'),Cheese('Parmesan')]
for cheese in catalog:
    stock[cheese.kind] = cheese
print(sorted(stock.keys()))
del catalog
print(sorted(stock.keys()))
del cheese
print(sorted(stock.keys()))

['Brie', 'Parmesan', 'Red Leicester', 'Tilsit']
['Parmesan']
[]


In [4]:
# 示例 vector2d.py:目前定义的都是特殊方法
from array import array
import math
class vector2d:
    typecode = 'd'

    def __init__(self,x,y):
        self.__x = float(x)
        self.__y = float(y)
    
    @property
    def x(self):
        return self.__x
    
    @property
    def y(self):
        return self.__y
    
    def __iter__(self):
        return (i for i in (self.x, self.y))
    
    def __repr__(self):
        class_name = type(self).__name__
        return '{}({!r},{!r})'.format(class_name,*self)
    
    def __str__(self) -> str:
        return str(tuple(self))
    
    def __bytes__(self):
        return (bytes([ord(self.typecode)])+bytes(array(self.typecode,self)))
    
    def __eq__(self, other):
        return tuple(self) == tuple(other)
    
    def hash(self):
        return hash(self.x) ^ hash(self.y)
    
    def __abs__(self):
        return math.hypot(self.x,self.y)
    
    def __bool__(self):
        return bool(abs(self))
    # 9.6 格式化显示
    def angle(self):
        return math.atan2(self.y,self.x)
    
    def __format__(self, fmt_spec=''):
        if fmt_spec.endswith('p'):
            fmt_spec = fmt_spec[:-1]
            coords = (abs(self),self.angle())
            outer_fmt = '<{},{}>'
        else:
            coords = self
            outer_fmt = '({},{})'
        components = (format(c,fmt_spec) for c in self)
        return '({},{})'.format(*components)
    
    @classmethod
    def frombytes(cls, octets):
        typecode = chr(octets[0])
        memv = memoryview(octets[1:].cast(typecode))
        return cls(*memv)

In [5]:
format(vector2d(1,1),'p')

'(1.0,1.0)'

## 9.4 classmethod与staticmethod

In [9]:
# 示例 比较classmethod和staticmethod的行为
class Demo:
    @classmethod
    def klassmeth(*args):
        return args
    @staticmethod
    def statmeth(*args):
        return args

print(Demo.klassmeth())
print(Demo.klassmeth('spam'))
print(Demo.statmeth())
print(Demo.statmeth('spam'))

(<class '__main__.Demo'>,)
(<class '__main__.Demo'>, 'spam')
()
('spam',)
