# ch07. 函数是一等对象

## 7.2 把函数视为对象

> Python 的函数就是对象

In [2]:
def factorial(n):
    """返回 n! """
    return 1 if n < 2 else n * factorial(n - 1)

res = factorial(55)
print(res)

12696403353658275925965100847566516959580321051449436762275840000000000000


创建了一个 `factorial` 的函数

In [2]:
print(factorial.__doc__)

返回 n! 


`__doc__` 是函数**对象**众多属性中的一个

> `__doc__` 属性用于生成对象的帮助文本
> 可以使用 help(factorial) 得到 `__doc__` 属性的内容

In [4]:
help(factorial)

Help on function factorial in module __main__:

factorial(n)
    返回 n!



In [3]:
type(factorial)

function

factorial 是 function **类** 的实例

下面的示例，可以把 factorial 函数赋值给变量 fact，然后通过变量名调用

还可以把 factorial 函数作为参数传给 map 函数。

<mark>`map(function, iterable)` 调用会返回一个可迭代对象，所含的项是把第一个参数（一个函数）应用到第二个参数（一个可迭代对象）中各个元素得到的结果。</mark>

In [3]:
fact = factorial
print(fact)

print(fact(5))

<function factorial at 0x104a18a40>
120


In [4]:
map(factorial, range(6))

<map at 0x10483e230>

可以使用 `factorial` 或 `fact` 函数作为第一个参数，然后使用 `range(x)` 作为可迭代对象，通过 list 将 map 转换为一个列表

In [5]:
list(map(factorial, range(11)))

[1, 1, 2, 6, 24, 120, 720, 5040, 40320, 362880, 3628800]

In [6]:
list(map(fact, range(6)))

[1, 1, 2, 6, 24, 120]

有了一等函数，可以使用函数式风格编程

## 7.3 高阶函数

> 高阶函数: 接受函数为参数或者把函数作为返回结果的函数是高阶函数

比如：上面的 `map` 函数就是一个高阶函数

内置的 `sorted` 也是，通过可选的 key 参数提供一个函数，应用到每一项上进行排序。如果想根据单词长度排序，只需把 len 函数传给 key 参数，如下所示

In [9]:
fruits = ['strawberry', 'fig', 'apple', 'cherry', 'raspberry', 'banana']
print(sorted(fruits, key=len))

print(sorted(fruits, key=len, reverse=True))

['fig', 'apple', 'cherry', 'banana', 'raspberry', 'strawberry']
['strawberry', 'raspberry', 'cherry', 'banana', 'apple', 'fig']


任何**单参数**函数都能作为 key 参数的值。

比如：为了创建押韵词典，可以把各个单词反过来拼写，然后排序

In [10]:
def reverse(word):
    return word[::-1]

print(reverse("testing"))

gnitset


In [11]:
print(sorted(fruits, key=reverse))

['banana', 'apple', 'fig', 'raspberry', 'strawberry', 'cherry']


<span style="color: green"> 注意：列表内的单词没有变，只是把反向拼写当作了排序的条件，因此各种浆果都排在了一起 </span>

> 函数式编程中，最为人熟悉的高阶函数有 map, filter, reduce, 和 apply
>
> apply 函数已经被移除
>
> `map`, `filter`, `reduce` 这三个高阶函数还能用到，不过有更好的替代品

函数式编程通常会提供 map, filter 和 reduce 这三个高阶函数

Python3 中，map 和 filter 还是内置函数，但是由于引入了**列表推导式**和**生成器表达式**，就没有那么重要了

<mark>列表推导式或者生成器表达式兼具 map 和 filter 这两个函数的功能，而且代码可读性更高</mark>

In [13]:
print(list(map(factorial, range(6))))

print([factorial(n) for n in range(6)])

[1, 1, 2, 6, 24, 120]
[1, 1, 2, 6, 24, 120]


In [14]:
print(list(map(factorial, filter(lambda n: n % 2, range(6)))))

print([factorial(n) for n in range(6) if n % 2])

[1, 6, 120]
[1, 6, 120]


> 在 Python3 中，`map` 和 `filter` 返回生成器（一种迭代器），因此现在直接的替代品是**生成器表达式**
>
> 在 Python3 中，reduce 被放在了 `functools` 模块中了，这个函数常用于求和，但是内置的 `sum` 在执行求和时效果更好

In [15]:
from functools import reduce
from operator import add

print(reduce(add, range(100)))

4950


In [16]:
print(sum(range(100)))

4950


`sum` 执行同一个操作，无需导入并调用 `reduce` 和 `add`

`sum` 和 `reduce` 的整体运作方式是一样的，把某个操作连续应用到序列中的项上，累计前一个结果，把一系列值规约成一个值

<span style="color: green">内置的归约函数还有 `all` 和 `any` </span>

- `all(iterable)` 
  - `iterable` 中没有假值时返回 True, `all([])` 返回 True
- `any(iterable)`
  - 只要 `iterable` 中有元素是真值就返回 `True`, `any([])` 返回 False

## 7.4 匿名函数

`lambda` 关键字使用 Python 表达式创建匿名函数

lambda 函数主体中不能有 while, try d等语句

**高阶函数的参数列表中最适合使用匿名函数**

In [1]:
fruits = ['strawberry', 'fig', 'apple', 'cherry', 'raspberry', 'banana']
sorted(fruits, key=lambda word: word[::-1])

['banana', 'apple', 'fig', 'raspberry', 'strawberry', 'cherry']

<span style="color: green">lambda 表达式重构秘诀</span>

1. 编写注释，说明 lambda 表达式的作用
2. 找出一个名称概括注释
3. 把 lambda 表达式转换为 def 语句，使用那个名称定义函数
4. 删除注释

## 7.5 九种可调用对象

调用运算符(`()`)除了函数，还可以应用到其他对象上。

如果想判断对象是否可以调用，可以使用内置的`callable()`函数

Python 3.9 起可用的 9 种可调用对象

- 用户定义的函数
  - 使用 `def` 语句或 `lambda` 表达式创建的函数
- 内置函数
  - 如 `len`，`time.strftime`
- 内置方法
  - 使用 C 语言实现的方法，例如: `dict.get`
- 方法
  - 在类主体中定义的函数
- 类
  - 调用类时运行类的 `__new__` 方法创建一个实例，然后运行 `__init__` 方法，初始化实例，再把实例返回给调用方。**Python 中没有 new 运算符，调用类就相当于调用函数**
- 类的实例
  - 如果类定义了 `__call__` 方法，那么它的实例可以作为函数调用
- 生成器函数
  - 主体中有 `yield` 关键字的函数或方法，调用生成器函数返回一个生成器对象
- 原生协程函数
  - 使用 `async def` 定义的函数或者方法。调用原生协程函数返回一个协程对象
- 异步生成器函数
  - 使用 `async def` 定义，而且主体中有 `yield` 关键字的函数或方法。调用异步生成器函数返回一个异步生成器，供 `async for` 使用


> 生成器，原生协程和异步生成器函数的返回值不是应用程序数据，而是需要进一步处理的对象，要不产出应用程序数据，要不执行某种操作

## 7.6 用户定义的可调用类型

> 不仅 Python 函数是真正的对象，而且任何 Python 对象都可以表现得像函数。为此，只要实现 `__call__` 实例方法

以下示例实现的类实例可以使用任何可迭代对象构建

In [2]:
import random

class BingoCage:
    def __init__(self, item) -> None:
        self._item = list(item)     # *1 
        random.shuffle(self._item)  # *2
        
    def pick(self):                 # *3
        try:
            return self._item.pop()
        except IndexError:
            _msg = 'pick from empty BingoCage'
            raise LookupError(_msg) # *4
    
    def __call__(self):             # *5
        return self.pick()

*1 `__init__` 接受任何可迭代对象。在本地构建一个副本，防止传入的列表参数有什么意外的副作用

*3 主要方法

*4 若 `self._item` 为空，就抛出异常，并给出错误消息

*5 <mark>`bingo()` 是 `bingo.pick()` 的快捷方式</mark>

In [3]:
bingo = BingoCage(range(3))

print(bingo.pick())

print(bingo())

print(callable(bingo))

1
2
True


注意看，bingo 实例可以作为函数调用，而且内置的 `callable()` 判定它是可调用对象

实现 `__call__` 方法是创建类似函数的**对象**的简易方式，此时必须在内部维护一个状态，可以多次调用

`__call__` 的另一个用处是实现装饰器。装饰器必须可以调用，而且有时候需要在多次调用之间「记住」某些事

## 7.7 从位置参数到仅限关键字参数

> Python 函数最好的功能之一是提供了极为灵活的参数处理机制。
>
> 调用函数时，可以使用 `*` 和 `**` 拆包可迭代对象，映射各个参数

tag 函数用于生成 HTML 标签。可以使用名为 class_ 的仅限关键字参数传入 "class" 属性，这是一种变通方法，因为 'class' 是 Python 中的关键字

In [1]:
def tag(name, *content, class_=None, **attrs):
    if class_ is not None:
        attrs['class'] = class_

    attr_pairs = (f' {attr}="{value}"'
                  for attr, value in sorted(attrs.items()))
    attr_str = ''.join(attr_pairs)
    if content:
        elements = (f'<{name}{attr_str}>{c}</{name}>' for c in content)
        return '\n'.join(elements)
    return f"<{name}{attr_str} />"

In [2]:
print(tag('br'))

print(tag('p', 'hello'))

print(tag('p', 'hello', 'world'))

<br />
<p>hello</p>
<p>hello</p>
<p>world</p>


- 传入单个位置参数，生成一个指定名称的空标签
- 第一个参数后面的任意数量的参数被 *content 捕获，存入一个元组

In [3]:
tag('p', 'hello', id=33)

'<p id="33">hello</p>'

没有明确指定名称的关键字参数被 `**attrs` 捕获，存入一个字典

In [4]:
tag('p', 'hello', 'world', class_='sidebar')

'<p class="sidebar">hello</p>\n<p class="sidebar">world</p>'

`class_` 参数只能作为关键字参数传入

In [5]:
tag(content='testing', name='img')

'<img content="testing" />'

第一个位置参数也能作为关键字参数传入

In [6]:
my_tag = {
    "name": "img",
    "title": "Sunset Boulevard",
    "src": "sunset.jpg",
    "class": "framed"
}

tag(**my_tag)

'<img class="framed" src="sunset.jpg" title="Sunset Boulevard" />'

在 my_tag 前面加上 `**`，字典中所有项作为参数依次传入，同名键绑定到对应的具名参数上，余下的则被 `**attrs` 捕获

> 如果不想支持数量不定的位置参数，但是想支持仅限关键字参数，可以在签名中放一个 `*`

In [7]:
def f(a, *, b):
    return a, b

f(1, b=2)

(1, 2)

In [9]:
f(1, 2)

TypeError: f() takes 1 positional argument but 2 were given

---

**仅限位置参数**

从 3.8 开始，用户定义的函数签名可以指定仅限位置参数。

比如：`divmod(a, b)` 只能使用位置参数调用，不能写成 `divmod(a=10, b=4)`

> 下面的例子来自 "What's New In Python 3.8", 展示了如何模拟 `divmod` 的参数行为

In [None]:
def divmod(a, b, /):
    return (a//b, a % b)

> / 左边均是仅限位置参数，在 / 后面，可以指定其他参数，处理方式一同往常

---

## 7.8 支持函数式编程的包

### `operator` 模块

> 函数式编程中，经常需要把算术运算符当作函数使用。
>
> 例如，不使用递归计算阶乘
>
> 比如对一些数进行求积，可以使用 `reduce` 函数

In [11]:
from functools import reduce

def factorial(n):
    return reduce(lambda a, b: a * b, range(1, n+1))

In [13]:
factorial(20)

2432902008176640000

In [14]:
from functools import reduce
from operator import mul

def fact(n):
    return reduce(mul, range(1, n+1))

In [15]:
fact(20)

2432902008176640000

---

`operator` 模块中还有一类函数，<mark>工厂函数 `itemgetter` 和 `attrgetter` </mark>，能替代从序列中取出项或者读取对象属性的 `lambda` 表达式

<span style="color: green">`itemgetter` 的常见用途: 根据元组的某个字段对元组列表进行排序</span>

In [1]:
metro_data = [
    ('Tokyo', 'JP', 36.933, (35.689722, 139.691667)),
    ('Delhi NCR', 'IN', 21.935, (28.613889, 77.208889)),
    ('Mexico City', 'MX', 20.142, (19.433333, -99.133333)),
    ('New York-Newark', 'US', 20.104, (40.808611, -74.020386)),
]

from operator import itemgetter
from pprint import pprint

for city in sorted(metro_data, key=itemgetter(1)):
    pprint(city)

('Delhi NCR', 'IN', 21.935, (28.613889, 77.208889))
('Tokyo', 'JP', 36.933, (35.689722, 139.691667))
('Mexico City', 'MX', 20.142, (19.433333, -99.133333))
('New York-Newark', 'US', 20.104, (40.808611, -74.020386))


---

In [3]:
cc_name = itemgetter(1, 0)
for city in metro_data:
    pprint(cc_name(city))

('JP', 'Tokyo')
('IN', 'Delhi NCR')
('MX', 'Mexico City')
('US', 'New York-Newark')


<mark> 如果传给 `itemgetter` 多个索引参数，那么 `itemgetter` 构建的函数就会返回提取的值构成的元组， 以方便根据多个 key 排序 </mark>