# namedtuple表示简单类 #
自 Python 2.6 开始，namedtuple 就加入到 Python 里，用以构建只有少数属性但是没有方法的对象，比如数据库条目。

In [1]:
import collections
#创建一个简单的Card类,它有rank和suit两个属性。
Card = collections.namedtuple('Card', ['rank', 'suit'])
beer_card = Card('7', 'diamonds')
print(beer_card)

Card(rank='7', suit='diamonds')


# 通过特殊方法支持系统调用

In [2]:
from math import hypot

class Vector:
    #支持类的初始化
    def __init__(self, x=0, y=0):
        self.x = x
        self.y = y
    #字符串函数
    def __repr__(self):
        return 'Vector(%r, %r)' % (self.x, self.y)
    #支持abs()函数
    def __abs__(self):
        return hypot(self.x, self.y)
    #支持条件判断
    def __bool__(self):
        return bool(abs(self))
    #支持系统+操作
    def __add__(self, other):
        x = self.x + other.x
        y = self.y + other.y
        return Vector(x, y)
    #支持系统*操作
    def __mul__(self, scalar):
        return Vector(self.x * scalar, self.y * scalar)

In [3]:
print(Vector(2,3)+Vector(1,2))

Vector(3, 5)


# 生成器表达式
虽然也可以用列表推导来初始化元组、数组或其他序列类型，但是生成器表达式是更好的选择。这是因为生成器表达式背后遵守了迭代器协议，可以逐个地产出元素，而不是先建立一个完整的列表，然后再把这个列表传递到某个构造函数里。前面那种方式显然能够节省内存。

生成器表达式的语法跟列表推导差不多，只不过把方括号换成圆括号而已。

In [4]:
symbols = '$¢£¥€¤'
tup=tuple(ord(symbol) for symbol in symbols)
print(tup)

(36, 162, 163, 165, 8364, 164)


# 元组拆包，可以使用_ 占位符,用*来处理剩下的元素

In [6]:
import os
_, filename = os.path.split('/home/luciano/.ssh/idrsa.pub')
print(filename)
a, b, *rest = range(5)
print('%r,%r,%r' % (a,b, rest))

idrsa.pub
0,1,[2, 3, 4]


# 切片对象：slice(start, end, step)

In [7]:
invoice = """
0.....6................................40........52...55........
1909  Pimoroni PiBrella                    $17.50    3    $52.50
1489  6mm Tactile Switch x20                $4.95    2     $9.90
1510  Panavise Jr. - PV-201                $28.00    1    $28.00
1601  PiTFT Mini Kit 320x240               $34.95    1    $34.95
"""
SKU = slice(0, 6)
DESCRIPTION = slice(6, 40)
UNIT_PRICE = slice(40, 52)
QUANTITY = slice(52, 55)
ITEM_TOTAL = slice(55, None)
line_items = invoice.split('\n')[2:]
for item in line_items:
    print(item[UNIT_PRICE], item[DESCRIPTION])

   $17.50    Pimoroni PiBrella                 
    $4.95    6mm Tactile Switch x20            
   $28.00    Panavise Jr. - PV-201             
   $34.95    PiTFT Mini Kit 320x240            
 


# 数组的创建和保存

In [1]:
from array import array
from random import random
floats=array('d',(random() for i in range(10**7)))
print(floats[-1])
fp=open('floats.bin','wb')
floats.tofile(fp)
fp.close
floats2=array('d')
fp=open('floats.bin','rb')
floats2.fromfile(fp,10**7)
fp.close()
print(floats2[-1])

0.9622449713118566
0.9622449713118566


# 通过memoryview操作和改变数组的值

In [3]:
numbers=array('h',[-2,-1,0,1,2])
memv=memoryview(numbers)
print(len(memv))
print(memv[0])
#转换内存的类型
memv_oct=memv.cast('B')
print(memv_oct.tolist())
memv_oct[5]=4
print(numbers)

5
-2
[254, 255, 255, 255, 0, 0, 1, 0, 2, 0]
array('h', [-2, -1, 1024, 1, 2])


# 双向队列deque(线程安全)

In [1]:
from collections import deque
dp=deque(range(10),maxlen=10)
print(dp)
dp.rotate(3)
print(dp)
dp.rotate(-4)
print(dp)
dp.appendleft(-1)
print(dp)
dp.extend([11,22,33])
print(dp)
dp.extendleft([10,20,30,40])

deque([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], maxlen=10)
deque([7, 8, 9, 0, 1, 2, 3, 4, 5, 6], maxlen=10)
deque([1, 2, 3, 4, 5, 6, 7, 8, 9, 0], maxlen=10)
deque([-1, 1, 2, 3, 4, 5, 6, 7, 8, 9], maxlen=10)
deque([3, 4, 5, 6, 7, 8, 9, 11, 22, 33], maxlen=10)


# 实现只读映射
python系统库是没有只读映射的，但是可以通过MappingProxyType来实现只读代理

In [2]:
from types import MappingProxyType
d={1:'A'}
d_proxy=MappingProxyType(d)
print(d_proxy)
d_proxy[2]='x'

{1: 'A'}


TypeError: 'mappingproxy' object does not support item assignment

# Python使用struct处理二进制
有的时候需要用python处理二进制数据，比如，存取文件，socket操作时.这时候，可以使用python的struct模块来完成.可以用 struct来处理c语言中的结构体.
 

struct模块中最重要的三个函数是pack(), unpack(), calcsize()

pack(fmt, v1, v2, ...)     按照给定的格式(fmt)，把数据封装成字符串(实际上是类似于c结构体的字节流)

unpack(fmt, string)       按照给定的格式(fmt)解析字节流string，返回解析出来的tuple

calcsize(fmt)                 计算给定的格式(fmt)占用多少字节的内存
 

struct中支持的格式如下表：

|Format|C Type|Python|字节数|
|------|------|------|------|
|x|pad byte|no valu|1|
|c|char|string of length 1|1|
|b|signed char|integer|1|
|B|unsigned char|integer|1|
|?|_Bool|bool|1|
|h|short|integer|2|
|H|unsigned short|integer|2|
|i|int|integer|4|
|I|unsigned int|integer or long|4|
|l|long|integer|4|
|L|unsigned long|long|4|
|q|long long|long|8|
|Q|unsigned long long|long|8|
|f|float|float|4|
|d|double|float|8|
|s|char[]|string|1|
|p|char[]|string|1|
|P|void |long|


为了同c中的结构体交换数据，还要考虑有的c或c++编译器使用了字节对齐，通常是以4个字节为单位的32位系统，故而struct根据本地机器字节顺序转换.可以用格式中的第一个字符来改变对齐方式.定义如下：

|Character|Byte order|Size and alignment|
|----|-----|----|
|@|native|native            凑够4个字节|
|=|native|standard        按原字节数|
|<|little-endian|standard        按原字节数|
|>|big-endian|standard       按原字节数|
|!|network (= big-endian)|standard       按原字节数|


# 内置归约函数
all(iterable) 如果iterable的每个元素是真值，返回True。

any(iterable) 只要iterable中有元素是真值，就返回True。

# python中有很多可调用类型，可用callable()判断

In [3]:
print([callable(obj) for obj in (abs,str,13)])

[True, True, False]


# 获取关于参数的信息
函数对象有个 __defaults__ 属性，它的值是一个元组，里面保存着定位参数和关键字参数的默认值。仅限关键字参数的默认值在 __kwdefaults__ 属性中。然而，参数的名称在 __code__ 属性中，它的值是一个 code 对象引用，自身也有很多属性。
为了说明这些属性的用途，下面在 clip.py 模块中定义 clip 函数，然后再审查它。

In [2]:
def clip(text, max_len=80):
    """在max_len前面或后面的第一个空格处截断文本
    """
    end = None
    if len(text) > max_len:
        space_before = text.rfind(' ', 0, max_len)
        if space_before >= 0:
            end = space_before
        else:
            space_after = text.rfind(' ', max_len)
            if space_after >= 0:
                end = space_after
        if end is None:  # 没找到空格
            end = len(text)
    return text[:end].rstrip()

In [3]:
print(clip.__defaults__)
print(clip.__code__)
print(clip.__code__.co_varnames)
print(clip.__code__.co_argcount)

(80,)
<code object clip at 0x7f27d01e6e40, file "<ipython-input-2-4caebf7de8bb>", line 1>
('text', 'max_len', 'end', 'space_before', 'space_after')
2


可以看出，这种组织信息的方式并不是最便利的。参数名称在 __code__.co_varnames 中，不过里面还有函数定义体中创建的局部变量。因此，参数名称是前 N 个字符串，N 的值由 __code__.co_argcount 确定。顺便说一下，这里不包含前缀为 * 或 ** 的变长参数。参数的默认值只能通过它们在 __defaults__ 元组中的位置确定，因此要从后向前扫描才能把参数和默认值对应起来。在这个示例中 clip 函数有两个参数，text 和 max_len，其中一个有默认值，即 80，因此它必然属于最后一个参数，即 max_len。这有违常理。

幸好，我们有更好的方式——使用 inspect 模块。

In [4]:
from inspect import signature
sig=signature(clip)
print(sig)

(text, max_len=80)


In [5]:
for name, param in sig.parameters.items():
    print(param.kind, ':', name, '=', param.default)

POSITIONAL_OR_KEYWORD : text = <class 'inspect._empty'>
POSITIONAL_OR_KEYWORD : max_len = 80


这样就好多了。inspect.signature 函数返回一个 inspect.Signature 对象，它有一个 parameters 属性，这是一个有序映射，把参数名和 inspect.Parameter 对象对应起来。各个 Parameter 属性也有自己的属性，例如 name、default 和 kind。特殊的 inspect._empty 值表示没有默认值，考虑到 None 是有效的默认值（也经常这么做），而且这么做是合理的。

# 使用functools.partial冻结参数

In [6]:
import unicodedata, functools
nfc = functools.partial(unicodedata.normalize, 'NFC')
s1 = 'café'
s2 = 'cafe\u0301'
print(s1, s2)
print(s1 == s2)
print(nfc(s1) == nfc(s2))

café café
False
True


# 装饰器
装饰器是可调用的对象，其参数是另一个函数（被装饰的函数）。2 装饰器可能会处理被装饰的函数，然后把它返回，或者将其替换成另一个函数或可调用对象。
假如有个名为 decorate 的装饰器：

``` python
@decorate
def target():
    print('running target()')
```    
    
上述代码的效果与下述写法一样

``` python
def target():
    print('running target()')

target = decorate(target)
```
一个简单的装饰器，输出函数的运行时间

In [7]:
import time

def clock(func):
    def clocked(*args):  
        t0 = time.perf_counter()
        result = func(*args)  
        elapsed = time.perf_counter() - t0
        name = func.__name__
        arg_str = ', '.join(repr(arg) for arg in args)
        print('[%0.8fs] %s(%s) -> %r' % (elapsed, name, arg_str, result))
        return result
    return clocked

这是装饰器的典型行为：把被装饰的函数替换成新函数，二者接受相同的参数，而且（通常）返回被装饰的函数本该返回的值，同时还会做些额外操作。
示例中实现的 clock 装饰器有几个缺点：不支持关键字参数，而且遮盖了被装饰函数的 __name__ 和 __doc__ 属性。使用 functools.wraps 装饰器把相关的属性从 func 复制到 clocked 中。此外，这个新版还能正确处理关键字参数。

In [8]:
import time
import functools

def clock(func):
    @functools.wraps(func)
    def clocked(*args, **kwargs):
        t0 = time.time()
        result = func(*args, **kwargs)
        elapsed = time.time() - t0
        name = func.__name__
        arg_lst = []
        if args:
            arg_lst.append(', '.join(repr(arg) for arg in args))
        if kwargs:
            pairs = ['%s=%r' % (k, w) for k, w in sorted(kwargs.items())]
            arg_lst.append(', '.join(pairs))
        arg_str = ', '.join(arg_lst)
        print('[%0.8fs] %s(%s) -> %r ' % (elapsed, name, arg_str, result))
        return result
    return clocked

# 使用functools.lru_cache做备忘
functools.lru_cache 是非常实用的装饰器，它实现了备忘（memoization）功能。这是一项优化技术，它把耗时的函数的结果保存起来，避免传入相同的参数时重复计算。LRU 三个字母是“Least Recently Used”的缩写，

生成第 n 个斐波纳契数，递归方式非常耗时

In [9]:
@clock
def fibonacci(n):
    if n < 2:
        return n
    return fibonacci(n-2) + fibonacci(n-1)

if __name__=='__main__':
    print(fibonacci(6))

[0.00000072s] fibonacci(0) -> 0 
[0.00000095s] fibonacci(1) -> 1 
[0.00255179s] fibonacci(2) -> 1 
[0.00000048s] fibonacci(1) -> 1 
[0.00000048s] fibonacci(0) -> 0 
[0.00000048s] fibonacci(1) -> 1 
[0.00003457s] fibonacci(2) -> 1 
[0.00007057s] fibonacci(3) -> 2 
[0.00268817s] fibonacci(4) -> 3 
[0.00000024s] fibonacci(1) -> 1 
[0.00000024s] fibonacci(0) -> 0 
[0.00001407s] fibonacci(1) -> 1 
[0.00008583s] fibonacci(2) -> 1 
[0.00013113s] fibonacci(3) -> 2 
[0.00000024s] fibonacci(0) -> 0 
[0.00000048s] fibonacci(1) -> 1 
[0.00003409s] fibonacci(2) -> 1 
[0.00000048s] fibonacci(1) -> 1 
[0.00000024s] fibonacci(0) -> 0 
[0.00000072s] fibonacci(1) -> 1 
[0.00003457s] fibonacci(2) -> 1 
[0.00006819s] fibonacci(3) -> 2 
[0.00013518s] fibonacci(4) -> 3 
[0.00032330s] fibonacci(5) -> 5 
[0.00306702s] fibonacci(6) -> 8 
8


使用缓存实现，速度更快

In [10]:
import functools

@functools.lru_cache() 
@clock 
def fibonacci(n):
    if n < 2:
        return n
    return fibonacci(n-2) + fibonacci(n-1)

if __name__=='__main__':
    print(fibonacci(6))

[0.00000072s] fibonacci(0) -> 0 
[0.00000072s] fibonacci(1) -> 1 
[0.00014663s] fibonacci(2) -> 1 
[0.00000072s] fibonacci(3) -> 2 
[0.00018263s] fibonacci(4) -> 3 
[0.00000095s] fibonacci(5) -> 5 
[0.00021935s] fibonacci(6) -> 8 
8


# 单分派泛函数functools.singledispatch

In [None]:
from functools import singledispatch
from collections import abc
import numbers
import html

@singledispatch  ➊
def htmlize(obj):
    content = html.escape(repr(obj))
    return '<pre>{}</pre>'.format(content)

@htmlize.register(str)  ➋
def _(text):            ➌
    content = html.escape(text).replace('\n', '<br>\n')
    return '<p>{0}</p>'.format(content)

@htmlize.register(numbers.Integral)  ➍
def _(n):
    return '<pre>{0} (0x{0:x})</pre>'.format(n)

@htmlize.register(tuple)  ➎
@htmlize.register(abc.MutableSequence)
def _(seq):

❶ @singledispatch 标记处理 object 类型的基函数。

❷ 各个专门函数使用 @«base_function».register(«type») 装饰。

❸ 专门函数的名称无关紧要；_ 是个不错的选择，简单明了。

❹ 为每个需要特殊处理的类型注册一个函数。numbers.Integral 是 int 的虚拟超类。

❺ 可以叠放多个 register 装饰器，让同一个函数支持不同类型。

# 参数化装饰器
解析源码中的装饰器时，Python 把被装饰的函数作为第一个参数传给装饰器函数。那怎么让装饰器接受其他参数呢？答案是：创建一个装饰器工厂函数，把参数传给它，返回一个装饰器，然后再把它应用到要装饰的函数上。

# 对象表示形式
每门面向对象的语言至少都有一种获取对象的字符串表示形式的标准方式。Python 提供了两种方式。

repr()

　　以便于开发者理解的方式返回对象的字符串表示形式。

str()

　　以便于用户理解的方式返回对象的字符串表示形式。

正如你所知，我们要实现 __repr__ 和 __str__ 特殊方法，为 repr() 和 str() 提供支持。

In [1]:
from array import array
import math


class Vector2d:
    typecode = 'd'  #➊

    def __init__(self, x, y):
        self.x = float(x)   #➋
        self.y = float(y)

    def __iter__(self):
        return (i for i in (self.x, self.y))  #➌

    def __repr__(self):
        class_name = type(self).__name__
        return '{}({!r}, {!r})'.format(class_name, *self)  #➍

    def __str__(self):
        return str(tuple(self))  #➎

    def __bytes__(self):
        return (bytes([ord(self.typecode)]) +  #➏
                bytes(array(self.typecode, self)))  #➐

    def __eq__(self, other):
        return tuple(self) == tuple(other)  #➑

    def __abs__(self):
        return math.hypot(self.x, self.y)  #➒

    def __bool__(self):
        return bool(abs(self))  #➓

❶ typecode 是类属性，在 Vector2d 实例和字节序列之间转换时使用。

❷ 在 __init__ 方法中把 x 和 y 转换成浮点数，尽早捕获错误，以防调用 Vector2d 函数时传入不当参数。

❸ 定义 __iter__ 方法，把 Vector2d 实例变成可迭代的对象，这样才能拆包（例如，x, y = my_vector）。这个方法的实现方式很简单，直接调用生成器表达式一个接一个产出分量。3

3这一行也可以写成 yield self.x; yield.self.y。第 14 章会进一步讨论 __iter__ 特殊方法、生成器表达式和 yield 关键字。

❹ __repr__ 方法使用 {!r} 获取各个分量的表示形式，然后插值，构成一个字符串；因为 Vector2d 实例是可迭代的对象，所以 *self 会把 x 和 y 分量提供给 format 函数。

❺ 从可迭代的 Vector2d 实例中可以轻松地得到一个元组，显示为一个有序对。

❻ 为了生成字节序列，我们把 typecode 转换成字节序列，然后……

❼ ……迭代 Vector2d 实例，得到一个数组，再把数组转换成字节序列。

❽ 为了快速比较所有分量，在操作数中构建元组。对 Vector2d 实例来

# 备选构造方法
我们可以把 Vector2d 实例转换成字节序列了；同理，也应该能从字节序列转换成 Vector2d 实例。

In [None]:
@classmethod  ➊
    def frombytes(cls, octets):  ➋
        typecode = chr(octets[0])  ➌
        memv = memoryview(octets[1:]).cast(typecode)  ➍
        return cls(*memv)  ➎

❶ 类方法使用 classmethod 装饰器修饰。

❷ 不用传入 self 参数；相反，要通过 cls 传入类本身。

❸ 从第一个字节中读取 typecode。

❹ 使用传入的 octets 字节序列创建一个 memoryview，然后使用 typecode 转换。4

42.9.2 节简单介绍过 memoryview，说明了它的 .cast 方法。

❺ 拆包转换后的 memoryview，得到构造方法所需的一对参数。

# classmethod与staticmethod
Python 教程没有提到 classmethod 装饰器，也没有提到 staticmethod。学过 Java 面向对象编程的人可能觉得奇怪，为什么 Python 提供两个这样的装饰器，而不是只提供一个？

先来看 classmethod。上个示例展示了它的用法：定义操作类，而不是操作实例的方法。classmethod 改变了调用方法的方式，因此类方法的第一个参数是类本身，而不是实例。classmethod 最常见的用途是定义备选构造方法，例如上个示例中的 frombytes。注意，frombytes 的最后一行使用 cls 参数构建了一个新实例，即 cls(*memv)。按照约定，类方法的第一个参数名为 cls（但是 Python 不介意具体怎么命名）。

staticmethod 装饰器也会改变方法的调用方式，但是第一个参数不是特殊的值。其实，静态方法就是普通的函数，只是碰巧在类的定义体中，而不是在模块层定义。示例 9-4 对 classmethod 和 staticmethod 的行为做了对比。

# 可散列的Vector2d
按照定义，目前 Vector2d 实例是不可散列的，因此不能放入集合（set）中:

In [3]:
v1 = Vector2d(3, 4)
hash(v1)

TypeError: unhashable type: 'Vector2d'

为了把 Vector2d 实例变成可散列的，必须使用 __hash__ 方法（还需要 __eq__ 方法，前面已经实现了）。此外，还要让向量不可变.

In [5]:
class Vector2d:
    typecode = 'd'

    def __init__(self, x, y):
        self.__x = float(x)  #➊
        self.__y = float(y)

    @property  #➋
    def x(self):  #➌
        return self.__x  #➍

    @property  #➎
    def y(self):
        return self.__y

    def __iter__(self):
        return (i for i in (self.x, self.y))  #➏

❶ 使用两个前导下划线（尾部没有下划线，或者有一个下划线），把属性标记为私有的。6

6根据本章开头引用的那句话，这不符合 Ian Bicking 的建议。私有属性的优缺点参见后面的 9.7 节。

❷ @property 装饰器把读值方法标记为特性。

❸ 读值方法与公开属性同名，都是 x。

❹ 直接返回 self.__x。

❺ 以同样的方式处理 y 特性。

❻ 需要读取 x 和 y 分量的方法可以保持不变，通过 self.x 和 self.y 读取公开特性，而不必读取私有属性，因此上述代码清单省略了这个类的其他代码。

# Python的私有属性和“受保护的”属性
Python 不能像 Java 那样使用 private 修饰符创建私有属性，但是 Python 有个简单的机制，能避免子类意外覆盖“私有”属性。

举个例子。有人编写了一个名为 Dog 的类，这个类的内部用到了 mood 实例属性，但是没有将其开放。现在，你创建了 Dog 类的子类：Beagle。如果你在毫不知情的情况下又创建了名为 mood 的实例属性，那么在继承的方法中就会把 Dog 类的 mood 属性覆盖掉。这是个难以调试的问题。

为了避免这种情况，如果以 __mood 的形式（两个前导下划线，尾部没有或最多有一个下划线）命名实例属性，Python 会把属性名存入实例的 __dict__ 属性中，而且会在前面加上一个下划线和类名。因此，对 Dog 类来说，__mood 会变成 _Dog__mood；对 Beagle 类来说，会变成 _Beagle__mood。这个语言特性叫名称改写（name mangling）。

# operator 模块以函数的形式提供了 Python 的全部中缀运算符，从而减少使用 lambda 表达式