In [1]:
# Mount Google Driver
from google.colab import drive # import drive from google colab

ROOT = "/content/drive"     # default location for the drive
drive.mount(ROOT)           # we mount the google drive at /content/drive
# change to clrs directionary
%cd "/content/drive/My Drive/Colab Notebooks/fluent_python_notes"

Go to this URL in a browser: https://accounts.google.com/o/oauth2/auth?client_id=947318989803-6bn6qk8qdgf4n4g3pfee6491hc0brc4i.apps.googleusercontent.com&redirect_uri=urn%3aietf%3awg%3aoauth%3a2.0%3aoob&response_type=code&scope=email%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdocs.test%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdrive%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdrive.photos.readonly%20https%3a%2f%2fwww.googleapis.com%2fauth%2fpeopleapi.readonly

Enter your authorization code:
··········
Mounted at /content/drive
/content/drive/My Drive/Colab Notebooks/fluent_python_notes


In [3]:
%mkdir ch1
!touch ch1/__init__.py

mkdir: cannot create directory ‘ch1’: File exists


In [0]:
import imp

## 1.0 序论

- Python 最好的品质之一是一致性
- Pythonic -- Python 风格
- 数据模型其实是对 Python 框架的描述，规范语言自身构建模块的接口
- Python 解释器碰到特殊句法时，会使用特殊方法去激活一些基本的对象操作
  - 特殊方法以两个下划线开头，以两个下划线结尾，比如 `__getitem__`
  - 特殊方法能让自定义的对象实现和支持以下的语言构架，并与之交互
    - 迭代
    - 集合类
    - 属性访问
    - 运算符重载
    - 函数和方法的调用
    - 对象的创建与销毁
    - 字符串表示形式和格式化
    - 管理上下文(with 块)
  - 特殊方法也称做魔术方法(magic method)，也称作双下方法(dunder method)

## 1.1 一摞 Python 风格的纸牌

### 示例 1-1 一摞有序的纸牌

In [4]:
%%writefile ch1/frenchdeck.py
import collections

Card = collections.namedtuple('Card', ['rank', 'suit'])


class FrenchDeck:
  ranks = [str(n) for n in range(2, 11)] + list('JQKA')
  suits = 'spades diamonds clubs hearts'.split()
  
  def __init__(self):
    self._cards = [Card(rank, suit) for suit in self.suits
                      for rank in self.ranks]
  
  def __len__(self):
    return len(self._cards)

  def __getitem__(self, position):
    return self._cards[position]

Writing ch1/frenchdeck.py


In [0]:
import ch1.frenchdeck
imp.reload(ch1.frenchdeck)
from ch1.frenchdeck import FrenchDeck, Card

###### `collections.namedtuple` 用于构建只有少数属性，但是没有方法的对象，比如数据库条目

In [9]:
beer_card = Card('7', 'diamonds')
beer_card

Card(rank='7', suit='diamonds')

###### 使用 `len()` 函数来查看有多少张纸牌

In [10]:
deck = FrenchDeck()
len(deck)

52

 ###### 由于定义了 `__getitem__`  方法，所以可以使用 deck[0] 或 deck[-1] 进行遍历

In [0]:
deck[0]

Card(rank='2', suit='spades')

In [0]:
deck[-1]

Card(rank='A', suit='hearts')

 ###### 可以方便的使用 python 标准库里面的 `random.choice` 函数

In [0]:
from random import choice
for i in range(3):
  print(choice(deck))

Card(rank='6', suit='diamonds')
Card(rank='J', suit='diamonds')
Card(rank='4', suit='spades')


 ###### 由于 `__getitem` 方法将 `[]` 交给了 `self_cards` 列表，所以 `deck` 类自动支持切片操作#

In [0]:
deck[:3]

[Card(rank='2', suit='spades'),
 Card(rank='3', suit='spades'),
 Card(rank='4', suit='spades')]

In [0]:
deck[12::13]

[Card(rank='A', suit='spades'),
 Card(rank='A', suit='diamonds'),
 Card(rank='A', suit='clubs'),
 Card(rank='A', suit='hearts')]

 ###### 由于实现了 `__getitem__` 方法，所以纸牌变为可迭代的

In [0]:
for card in deck:  #doctest: +ELLIPSIS
  print(card)

Card(rank='2', suit='spades')
Card(rank='3', suit='spades')
Card(rank='4', suit='spades')
Card(rank='5', suit='spades')
Card(rank='6', suit='spades')
Card(rank='7', suit='spades')
Card(rank='8', suit='spades')
Card(rank='9', suit='spades')
Card(rank='10', suit='spades')
Card(rank='J', suit='spades')
Card(rank='Q', suit='spades')
Card(rank='K', suit='spades')
Card(rank='A', suit='spades')
Card(rank='2', suit='diamonds')
Card(rank='3', suit='diamonds')
Card(rank='4', suit='diamonds')
Card(rank='5', suit='diamonds')
Card(rank='6', suit='diamonds')
Card(rank='7', suit='diamonds')
Card(rank='8', suit='diamonds')
Card(rank='9', suit='diamonds')
Card(rank='10', suit='diamonds')
Card(rank='J', suit='diamonds')
Card(rank='Q', suit='diamonds')
Card(rank='K', suit='diamonds')
Card(rank='A', suit='diamonds')
Card(rank='2', suit='clubs')
Card(rank='3', suit='clubs')
Card(rank='4', suit='clubs')
Card(rank='5', suit='clubs')
Card(rank='6', suit='clubs')
Card(rank='7', suit='clubs')
Card(rank='8', sui

- 同时支持反向迭代

In [0]:
for card in reversed(deck):
  print(card)

Card(rank='A', suit='hearts')
Card(rank='K', suit='hearts')
Card(rank='Q', suit='hearts')
Card(rank='J', suit='hearts')
Card(rank='10', suit='hearts')
Card(rank='9', suit='hearts')
Card(rank='8', suit='hearts')
Card(rank='7', suit='hearts')
Card(rank='6', suit='hearts')
Card(rank='5', suit='hearts')
Card(rank='4', suit='hearts')
Card(rank='3', suit='hearts')
Card(rank='2', suit='hearts')
Card(rank='A', suit='clubs')
Card(rank='K', suit='clubs')
Card(rank='Q', suit='clubs')
Card(rank='J', suit='clubs')
Card(rank='10', suit='clubs')
Card(rank='9', suit='clubs')
Card(rank='8', suit='clubs')
Card(rank='7', suit='clubs')
Card(rank='6', suit='clubs')
Card(rank='5', suit='clubs')
Card(rank='4', suit='clubs')
Card(rank='3', suit='clubs')
Card(rank='2', suit='clubs')
Card(rank='A', suit='diamonds')
Card(rank='K', suit='diamonds')
Card(rank='Q', suit='diamonds')
Card(rank='J', suit='diamonds')
Card(rank='10', suit='diamonds')
Card(rank='9', suit='diamonds')
Card(rank='8', suit='diamonds')
Card(r

###### 如果一个集合类没有实现 `__contains__` 方法，即么 `in` 运算符就会按顺序做一次迭代搜索

In [0]:
Card('Q', 'hearts') in deck

True

In [0]:
Card('7', 'beasts') in deck

False

###### 排序

- 花色判定的顺序
  - 黑桃最大、红桃次之、方块再次、梅花最小

In [0]:
suit_values = dict(spades=3, hearts=2, diamonds=1, clubs=0)

def spades_high(card):
  rank_value = FrenchDeck.ranks.index(card.rank)
  return rank_value * len(suit_values) + suit_values[card.suit]

- 借助 `spades_high` 函数进行升序排序

In [0]:
for card in sorted(deck, key=spades_high):
  print(card)

Card(rank='2', suit='clubs')
Card(rank='2', suit='diamonds')
Card(rank='2', suit='hearts')
Card(rank='2', suit='spades')
Card(rank='3', suit='clubs')
Card(rank='3', suit='diamonds')
Card(rank='3', suit='hearts')
Card(rank='3', suit='spades')
Card(rank='4', suit='clubs')
Card(rank='4', suit='diamonds')
Card(rank='4', suit='hearts')
Card(rank='4', suit='spades')
Card(rank='5', suit='clubs')
Card(rank='5', suit='diamonds')
Card(rank='5', suit='hearts')
Card(rank='5', suit='spades')
Card(rank='6', suit='clubs')
Card(rank='6', suit='diamonds')
Card(rank='6', suit='hearts')
Card(rank='6', suit='spades')
Card(rank='7', suit='clubs')
Card(rank='7', suit='diamonds')
Card(rank='7', suit='hearts')
Card(rank='7', suit='spades')
Card(rank='8', suit='clubs')
Card(rank='8', suit='diamonds')
Card(rank='8', suit='hearts')
Card(rank='8', suit='spades')
Card(rank='9', suit='clubs')
Card(rank='9', suit='diamonds')
Card(rank='9', suit='hearts')
Card(rank='9', suit='spades')
Card(rank='10', suit='clubs')
Ca

###### 总结
- 虽然 `FrenchDeck` 类隐式继承了 `object` 类，但功能却不是继承而来的，而是通过数据模型和一些合成来实现这些功能的
- 通过实现 `__len__` 和 `__getitem__` 这两个特殊方法， `FrenchDeck` 就跟 Python 自有的序列数据类型一样
  - 可以支持迭代和切片操作
  - 可以使用标准库中的的 `random.choice`、`reversed` 和 `sorted` 这些函数
  - `__len__` 和 `__getitem__` 的具体实现可以代理给 `self._cards` 这个 python 列表

## 1.2 如何使用特殊方法

- 特殊方法的存在是为了给 Python 解释器调用的，除非有大量元编程存在，否则无须直接使用特殊方法 (`__init__` 方法除外)
- `__len__` 方法
  - 对于 Python 内置的数据类型，Cpython 的 `__len__`  实际上会直接返回 `PyVarObject` 里的 `ob_size` 属性，直接读取这个值比调用一个方法要快很多
    - PyVarObject 表示的是内存中长度可变的内置对象的 C 语言构体
- 特殊方法的调用往往是隐式的
  - 比如 `for item in x` 背后用的其实是 `iter(x)`，而这个函数背后则是 `x.__iter__()` 方法
- 通过内置函数来使用特殊方法(`len`、`iter`、`str` 等)是最好的选择
  - 这些内置函数不仅会调用特殊方法，而且对于内置的类来说，它们的速度更快
- 不要自己随意的添加特殊方法，比如 `__foo__`，因为这些名称在之后可能会被 Python 使用


### 1.2.1 模拟数值类型

###### 通过自定义二维向量 (vector) 类来实现加法运算

<img src=https://raw.githubusercontent.com/Lijunjie9502/PicBed/master/20200117143047.png width=400>

#### 示例1-2 一个简单的二维向量类

In [0]:
from math import hypot


class Vector:
  def __init__(self, x=0, y=0):
    self.x = x
    self.y = y

  def __repr__(self):
    return 'Vector(%r, %r)' % (self.x, self.y)

  def __abs__(self):
    return hypot(self.x, self.y)

  def __bool__(self):
    return bool(abs(self))

  def __add__(self, other):
    x = self.x + other.x
    y = self.y + other.y
    return Vector(x, y)

  def __mul__(self, scalar):
    return Vector(self.x * scalar, self.y * scalar)

In [0]:
v1 = Vector(2, 4)
v2 = Vector(2, 1)
v1 + v2

Vector(4, 5)

In [0]:
v = Vector(3, 4)
abs(v)

5.0

In [0]:
v * 3

Vector(9, 12)

In [0]:
abs(v * 3)

15.0

### 1.2.2 字符串表示形式

- Python 的内置函数 `repr`，能把一个对象用字符串的形式表达出来以便辩认
  - `repr` 通过 `__repr__` 这个特殊方法来获得一个对象的字符串表示形式
  - `__repr__` 返回的字符串应该准确、无歧义，并且尽可能的表达出如何用代码创建出这个被打印的对象
- `__repr__` 与 `__str__` 的区别
  - `__str__` 在 `str()` 函数被使用，或者在 `print` 函数打印一个对象时被调用
  - `__str__` 返回的字符串一般对终端用户更友好
  - 当一个对象没有 `__str__` 函数，而 Python 又需要调用它的时候，解释器会用 `__repr__` 作为替代
  - [参考](https://stackoverflow.com/questions/1436703/difference-between-str-and-repr)

### 1.2.3 算术运算符

- 通过 `__add__` 和 `__mul__`，为 `Vector` 类带来 `+` 和 `*` 两个算术运算符
  - 代码中只是读取了被操作的两个变量的值，并没有修改它们
  - 中缀运算符的基本原则就是不改变操作对象 

### 1.2.4 自定义布尔值

- 默认情况下，自定义的类的实例总被认为是 `True`，除非这个类对 `__bool__` 或 `__len__` 函数有自己的实现
- `bool(x)` 会先调用 `x.__bool__()`；如果不存在 `__bool__` 方法，那么 `bool(x)` 会尝试调用 `x.__len__()`,若返回 `0`，则 `bool` 会返回 `False`；否则返回 `True`
- 通过实现 `__bool__`， 定义的对象即可与 ["Built-in Types"]() 标准保持一致

###### Vector.__bool__ 更高效的实现

- ```python
  def __bool__(self)：
    return bool(self.x or self.y)
  ```
- or 运算符会返回 `x` 或者 `y` 本身的值：若 `x` 的值等价为真，则 `or` 返回 `x` 的值；否则返回 `y` 的值。为了使得 `__bool__` 的返回值符合规定，使用 `bool` 将返回值显示的转换为布尔类型

## 1.3 特殊方法一览

- [官方文档](https://docs.python.org/3/reference/datamodel.html)

###### 表 1-1：跟运算符无关的特殊方法

类别|方法名
--|-------
字符串/字节序列表示形式 | \_\_repr\_\_、\_\_str\_\_、\_\_format\_\_、\_\_bytes\_\_
数值转换 | \_\_abs\_\_、\_\_bool\_\_、\_\_complex\_\_、\_\_int\_\_、\_\_float\_\_、\_\_hash\_\_、\_\_index\_\_
集合模拟 | \_\_len\_\_、\_\_getitem\_\_、\_\_setitem\_\_、\_\_contains\_\_
迭代枚举 | \_\_iter\_\_、\_\_reversed\_\_、\_\_next\_\_
可调用模拟 | \_\_call\_\_
上下文管理 | \_\_enter\_\_、\_\_exit\_\_
实例创建与销毁 | \_\_new\_\_、\_\_init\_\_、\_\_del\_\_
属性管理 | \_\_getattr\_\_、 \_\_getattribute\_\_、\_\_setattr\_\_、\_\_delattr\_\_、\_\_dir\_\_
属性描述符 | \_\_get\_\_、\_\_set\_\_、\_\_delete\_\_
跟类相关的服务 | \_\_prepare\_\_、\_\_instancecheck\_\_、\_\_subclasscheck\_\_


###### 表 1-2：跟运算符相关的特殊方法

类别 | 方法名和对应的运算符
-- | ---
一元运算符 | \_\_neg\_\_ -、\_\_pos\_\_ +、 \_\_abs\_\_ abs()
众多比较运算符 | \_\_lt\_\_ <、 \_\_le\_\_ <=、\_\_eq\_\_ ==、\_\_ne\_\_ !=、\_\_gt\_\_ >、 \_\_ge\_\_ >=
算术运算符 | \_\_add\_\_ +、\_\_sub\_\_ -、\_\_mul\_\_ \*、\_\_truediv\_\_ 、\_\_floordiv\_\_ \\\、\_\_mod\_\_ %、\_\_divmod\_\_ divmod()、 \_\_pow\_\_ ** 或 pow()、\_\_round\_\_ round()
反向算术运算符 | \_\_radd\_\_、\_\_rsub\_\_、\_\_rmul\_\_、\_\_rtruediv\_\_、\_\_rfloordiv\_\_、\_\_rmod\_\_、\_\_rdivmod\_\_、\_\_rpow\_\_
增量赋值运算符 | \_\_iadd\_\_、\_\_isub\_\_、\_\_imul\_\_、\_\_itruediv\_\_、\_\_ifloordiv\_\_、\_\_imod\_\_、\_\_ipow\_\_
位运算符 | \_\_invert\_\_ ~、\_\_lshift\_\_ <<、\_\_rshift\_\_ >>、\_\_and\_\_ &、\_\_or\_\_ 、\_\_xor\_\_ ^
反向位运算符 | \_\_rlshift\_\_、\_\_rrshift\_\_、\_\_rand\_\_、\_\_ror\_\_、\_\_rxor\_\_
增量赋值位运算符 | \_\_ilshift\_\_、\_\_irshift\_\_、\_\_iand\_\_、\_\_ior\_\_、\_\_ixor\_\_

## 1.4 为什么 `len` 不是普通方法

- [Python 之禅](https://www.python.org/doc/humor/#the-zen-of-python): practicality beats purity.(实用胜于纯粹)
- `len` 之所以不是一个普通的方法，是为了让 python 自带的数据结构可以走后门，`abs` 也是同理
- `len` 同时也是特殊方法，这也可以把 `len` 用于自定义的数据类型
- 这种处理方式在保持内置类型的效率和保证语言的一致性之间找到了一个平衡点
  - 也印证了[Python 之禅](https://www.python.org/doc/humor/#the-zen-of-python) 中的一句话：Special cases aren't special enough to break the rules. (不能让特例特殊到开始破坏规则)

## 1.6 延伸阅读

- [Python 语言参考手册](https://docs.python.org/3/reference/datamodel.html)