# 5 一等对象：函数


一等对象定义为：

* 在运行时创建
* 能赋值给变量或数据结构中的元素
* 能作为函数的参数或返回值

## 5.1 把函数视为对象
创建一个函数，读取`__doc__`属性

In [1]:
def factorial(n):
    """return n!"""
    return 1 if n < 2 else n * factorial(n-1)

factorial(42)

1405006117752879898543142606244511569936384000000000

In [2]:
factorial.__doc__

'return n!'

In [3]:
type(factorial)

function

In [4]:
help(factorial)

Help on function factorial in module __main__:

factorial(n)
    return n!



1. `__doc__`是函数对象的一个属性
2. `factorial`是`function`类的一个实例
3. `__doc__`用于生成对象的帮助文本，在console中，`help(factorial)`可以输出`__doc__`内容

## 5.2 高阶函数

接受函数为参数或返回函数的函数是**高阶函数(higher-order function)**

`map`接收一个函数和一个可迭代对象作为参数，是高阶函数

示例：使用`sorted`高阶函数，根据单词长度给列表排序

In [5]:
fruits = ['strawberry', 'fig', 'apple', 'cherry', 'raspberry', 'banana']
sorted(fruits, key=len)

['fig', 'apple', 'cherry', 'banana', 'raspberry', 'strawberry']

在函数式编程范式中，最为人熟知的高阶函数有 `map`,`filter`,`reduce`和`apply`,

其中，`apply`在python3中过时.

函数式语言通常会提供 `map`、 `filter` 和 `reduce` 三个高阶函数（有时使用不同的名称）

列表推导或生成器表达式具有 map 和 filter 两个函数的功能，而且更易于阅读.

计算阶乘列表： `map` 和 `filter` 与列表推导比较

In [6]:
fact = factorial
list(map(fact, range(6)))

[1, 1, 2, 6, 24, 120]

In [7]:
[fact(n) for n in range(6)]

[1, 1, 2, 6, 24, 120]

In [8]:
map(factorial, filter(lambda  n: n%2, range(6)))

<map at 0x7f142878f470>

In [9]:
[factorial(n) for n in range(6) if n % 2]

[1, 6, 120]

在 Python 2 中， `reduce` 是内置函数，在 Python 3中， 则在`functools` 模块中

reduce 的通用思想是把某个操作连续应用到序列的元素上，累计之前的结果，把一系列值归约成一个值.

`all` 和 `any` 也是内置的归约函数

* `all(iterable)` 如果 `iterable` 的每个元素都是真值，返回 `True`； `all([])` 返回 `True`。

* `any(iterable)` 只要 `iterable` 中有元素是真值，就返回 `True`； `any([])` 返回`False`

## 5.3 匿名函数

lambda 关键字在 Python 表达式内创建匿名函数

lambda 函数的定义体只能使用纯表达式

lambda 函数的定义体中不能赋值，也不能使用 `while`和 `try` 等 Python 语句

In [10]:
fruits = ['strawberry', 'fig', 'apple', 'cherry', 'raspberry', 'banana']
sorted(fruits, key = lambda word: word[::-1])

['banana', 'apple', 'fig', 'raspberry', 'strawberry', 'cherry']

lambda 句法只是语法糖：与 `def` 语句一样， lambda 表达式会创建函数对象.

这是 Python 中几种可调用对象的一种.

## 5.4 可调用对象

除了用户定义的函数，调用运算符（即 ()）还可以应用到其他对象上.

如果想判断对象能否调用，可以使用内置的 `callable()` 函数.

Python 数据模型文档列出了 7 种可调用对象
1. 用户定义的函数，使用 def 语句或 lambda 表达式创建
2. 内置函数，使用 C 语言（CPython）实现的函数，如 `len` 或`time.strftime`
3. 内置方法，使用 C 语言实现的方法，如 `dict.get`
4. 方法，在类的定义体中定义的函数
5. 类
>调用类时会运行类的 `__new__` 方法创建一个实例，然后运行`__init__` 方法，初始化实例，最后把实例返回给调用方

6. 类的实例，类定义了 `__call__` 方法，那么它的实例可以作为函数调用
7. 生成器函数，使用 `yield` 关键字的函数或方法，调用生成器函数返回的是生成器对象

In [11]:
[callable(obj) for obj in (abs, str, 13)]

[True, True, False]

## 5.5　用户定义的可调用类型

Python对象可以表现得像函数，只要实现实例方法`__call__`

In [12]:
import  random

class BingoCage:
    def __init__(self, items):
        self._items = list(items) # 本地副本 也可以使用切片方法 self._items = items[:]
        random.shuffle(self._items)

    def pick(self):
        try:
            return self._items.pop()
        except IndexError:
            raise LookupError("pick from empty BingoCage!")

    def __call__(self):
        return self.pick()


bingo = BingoCage(range(3))
print(bingo.pick())
print(bingo())
print(callable(bingo))

0
2
True


## 5.6 函数内省

除了`__doc__`，函数还有很多属性，使用`dir`可知

In [13]:
dir(factorial)

['__annotations__',
 '__call__',
 '__class__',
 '__closure__',
 '__code__',
 '__defaults__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__get__',
 '__getattribute__',
 '__globals__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__kwdefaults__',
 '__le__',
 '__lt__',
 '__module__',
 '__name__',
 '__ne__',
 '__new__',
 '__qualname__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__']

用户定义的函数的属性

|名称|类型|说明|
| :----: | :----: | :----: |
| `__annotations__` | dict | 参数和返回值的注解|
| `__call__` | method-wrapper | 实现 () 运算符；即可调用对象协议|
|  `__closure__` | tuple | 函数闭包，即自由变量的绑定（通常是 None) |
| `__code__`|  code | 编译成字节码的函数元数据和函数定义体 |
|`__defaults__` | tuple | 形式参数的默认值 |
| `__get__`| method-wrapper | 实现只读描述符协议 |
| `__globals__`|  dict | 函数所在模块中的全局变量 |
| `__kwdefaults__` | dict | 仅限关键字形式参数的默认值 |
| `__name__` | str | 函数名称 |
| `__qualname__` | str | 函数的限定名称，如 Random.choice|

## 5.7 从定位参数到仅限关键字参数

Python3 提供了仅限关键字参数（keyword-only argument)

调用函数时使用 * 和 ** *展开* 可迭代对象，映射到单个参数

In [32]:
def tag(name, *content, cls=None, **attrs):
    if cls is not None:
        attrs['class'] = cls
    if attrs:
        attr_str = ''.join(
            ' %s="%s"' %(attr, value) for attr, value in sorted(attrs.items())
        )

    else:
        attr_str = ''
    if content:
        return '\n'.join('<%s%s>%s</%s>' % (name, attr_str, c, name) for c in content)

    else:
        return '<%s%s />' %(name, attr_str)


In [15]:
# 传入单个定位参数，生成一个指定名称的空标签
tag('br')

'<br />'

In [16]:
# 第一个参数后面的任意个参数会被 *content 捕获，存入一个元组
tag('p', 'hello')
tag('p', 'hello', 'world')


'<p>hello</p>\n<p>world</p>'

In [17]:
# tag 函数签名中没有明确指定名称的关键字参数会被 **attrs 捕获，存入一个字典
tag('p', 'hello', id=33)

'<p id="33">hello</p>'

In [18]:
# cls 参数只能作为关键字参数传入
tag('p', 'hello', 'world', cls='sidebar')

'<p class="sidebar">hello</p>\n<p class="sidebar">world</p>'

In [19]:
# 调用 tag 函数时，即便第一个定位参数也能作为关键字参数传入
tag(content='testing', name='img')

'<img content="testing" />'

In [20]:
# 在 my_tag 前面加上 **，字典中的所有元素作为单个参数传入
# 同名键会绑定到对应的具名参数上，余下的则被 **attrs 捕获
my_tag = {'name': 'img', 'title': 'Sunset Boulevard',
          'src': 'sunset.jpg', 'cls': 'framed'}
tag(**my_tag)

'<img class="framed" src="sunset.jpg" title="Sunset Boulevard" />'

In [21]:
# 支持不定的参数，在签名中加一个*
def f(a, *, b):
    return a, b

f(1, b=2)

(1, 2)

## 5.8 获取关于参数的信息

函数对象有个 `__defaults__` 属性，它的值是一个元组，里面保存着定位参数和关键字参数的默认值。

仅限关键字参数的默认值在`__kwdefaults__` 属性中。

然而，参数的名称在 `__code__` 属性中，它的值是一个 code 对象引用，自身也有很多属性

In [22]:
def clip(text, max_len=80):
    """
    在max_len前面或后面第一个空格处截断文本
    """
    end = None
    if len(text) > max_len:
        space_before = text.rfind(' ', 0, max_len)
        if space_before >= 0:
            end = space_before
        else:
            space_after = text.rfind(' ',  max_len)
            if space_after >= 0:
                end = space_after
        if end is None:
            end = len(text)
    return text[:end].rstrip()

clip.__defaults__

(80,)

In [23]:
clip.__code__

<code object clip at 0x7f1428790270, file "<ipython-input-22-cb854f5b0828>", line 1>

In [24]:
clip.__code__.co_varnames

('text', 'max_len', 'end', 'space_before', 'space_after')

In [25]:
clip.__code__.co_argcount

2

使用`inspect`模块

In [26]:
from inspect import signature
sig = signature(clip)
sig

<Signature (text, max_len=80)>

In [27]:
str(sig)



'(text, max_len=80)'

In [28]:
for name, param in sig.parameters.items():
    print(param.kind, ':', name, '=', param.default)

POSITIONAL_OR_KEYWORD : text = <class 'inspect._empty'>
POSITIONAL_OR_KEYWORD : max_len = 80


inspect.signature 函数返回一个inspect.Signature 对象

它有一个 parameters 属性，这是一个有序映射，把参数名和 inspect.Parameter 对象对应起来

Parameter 属性有自己的属性，例如 name、 default 和 kind

kind 属性的值是 _ParameterKind 类中的 5 个值之一，列举如下。

* POSITIONAL_OR_KEYWORD
　　可以通过定位参数和关键字参数传入的形参（多数 Python 函数的参数属于此类）。

* VAR_POSITIONAL
　　定位参数元组。

* VAR_KEYWORD
　　关键字参数字典。

* KEYWORD_ONLY
　　仅限关键字参数（Python 3 新增）。
* POSITIONAL_ONLY
　　仅限定位参数；目前， Python 声明函数的句法不支持，但是有些使用 C 语言实现且不接受关键字参数的函数（如 divmod）支持。

inspect.Signature 对象有个 bind 方法，它可以把任意个参数绑定到签名中的形参上，所用的规则与实参到形参的匹配方式一样

In [29]:
import inspect
sig = inspect.signature(tag)
my_tag = {'name': 'img', 'title': 'Sunset Boulevard',
          'src': 'sunset.jpg', 'cls': 'framed'}
bound_args = sig.bind(**my_tag)
bound_args

<BoundArguments (name='img', cls='framed', attrs={'title': 'Sunset Boulevard', 'src': 'sunset.jpg'})>

In [30]:
for name, value in bound_args.arguments.items():
    print(name, '=', value)


name = img
cls = framed
attrs = {'title': 'Sunset Boulevard', 'src': 'sunset.jpg'}


In [31]:
del my_tag['name']
bound_args = sig.bind(**my_tag)

TypeError: missing a required argument: 'name'

## 5.9 函数注解

Python 3 提供了一种句法，用于为函数声明中的参数和返回值附加元数据

In [None]:
def clip(text:str, max_len:'int > 0'=80) -> str:
    """
    在max_len前面或后面第一个空格处截断文本
    """
    end = None
    if len(text) > max_len: # 在前面找
        space_before = text.rfind(' ', 0, max_len)
        if space_before >= 0:
            end = space_before
        else: # 在后面找
            space_after = text.rfind(' ',  max_len)
            if space_after >= 0:
                end = space_after
    if end is None: # 找不到空格
        end = len(text)
    return text[:end].rstrip()

函数声明中的各个参数可以在 : 之后增加注解表达式

如果参数有默认值，注解放在参数名和 = 号之间

如果想注解返回值，在 ) 和函数声明末尾的 : 之间添加 -> 和一个表达式

表达式可以是任何类型。最常用的类型是类（如 str 或 int）和字符串（如 'int > 0'）

注解不会做任何处理，只是存储在函数的 __annotations__ 属性（一个字典）中

Python 对注解所做的唯一的事情是，把它们存储在函数的__annotations__ 属性里。

## 5.10  支持函数式编程的包

通过`operator`和`functools`等包，Python可以支持函数式编程

使用 reduce 函数和一个匿名函数计算阶乘

In [None]:
from functools import reduce

def fact(n):
    return reduce(lambda a, b: a*b, range(1, n+1))

operator 模块为多个算术运算符提供了对应的函数，可以减少lambda的使用

In [None]:
from functools import reduce
from operator import mul

def fact(n):
    return reduce(mul, range(1,n+1))

`operator` 模块中还有一类函数，能替代从序列中取出元素或读取对象属性的 lambda 表达式

`itemgetter(index)` 等价于 `lambda field: field[index]`:创建一个接受集合的函数，返回索引位上的元素

如果把多个参数传给 `itemgetter`，它构建的函数会返回提取的值构成的元组

`attrgetter` 与 `itemgetter` 作用类似，它创建的函数根据名称提取对象的属性。

如果把多个属性名传给 `attrgetter`，它也会返回提取的值构成的元组

下面是 `operator` 模块中定义的部分函数，很容易见名知意

In [None]:
import operator
[name for name in dir(operator) if not name.startswith('_')]

`operator` 模块中`methodcaller`传入一个**函数名字符串参数**,变成对应的函数变量



In [None]:
from operator import methodcaller
s = 'The time has come'
upcase = methodcaller('upper')
upcase(s)

`methodcaller` 还可以冻结某些参数，也就是部分应用（partial application）


In [None]:
hiphenate = methodcaller('replace', ' ', '_')
hiphenate(s)

### 使用`functools.partial`冻结参数

`functools.partial` 这个高阶函数用于部分应用一个函数。

部分应用是指，基于一个函数创建一个新的可调用对象，把原函数的某些参数固定。

In [None]:
from operator import mul
from functools import partial

triple = partial( mul, 3)
triple(7)

In [None]:
[triple(x) for x in range(1,10)]

`functools.partialmethod` 函数（Python 3.4 新增）的作用与`partial` 一样，不过是用于处理方法的
