# 一等函数

函数是一等对象。

## 一等对象

一等对象：
- 在运行时创建
- 能赋值给变量或数据结构中的元素
- 能作为参数传给函数
- 能作为函数的返回结果



In [7]:
def factorial(n):
    '''return n!'''
    return 1 if n < 2 else n * factorial(n-1)

# 将函数看作是对象传入方法中：
list(map(factorial, range(11)))

[1, 1, 2, 6, 24, 120, 720, 5040, 40320, 362880, 3628800]

In [8]:
dir(factorial)

['__annotations__',
 '__call__',
 '__class__',
 '__closure__',
 '__code__',
 '__defaults__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__get__',
 '__getattribute__',
 '__globals__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__kwdefaults__',
 '__le__',
 '__lt__',
 '__module__',
 '__name__',
 '__ne__',
 '__new__',
 '__qualname__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__']


## 可调用对象 Callable Object

### 一共7种：

- 用户定义的函数 ： def或lambda
- 内置函数
- 内置方法
- 方法：在类的定义体内定义的函数
- 类：\_\_new\_\_:创建一个实例；\_\_init\_\_初始化实例。\_\_call\_\_实例可以作为函数调用
- 类的实例：\_\_call\_\_实例可以作为函数调用
- 生成器函数： yield的函数或方法，返回生成器对象（14章）

In [2]:
# callable
import random

class BingoCage:
    
    def __init__(self, items):
        self._items = list(items)
        random.shuffle(self._items)
        
    def pick(self):
        try:
            return self._items.pop()
        except IndexError:
            raise LookupError('pick from an empty BingCage')
            
    def __call__(self):
        '''
        The class is callable only on defined the __call__ function
        '''
        return self.pick()
    
    
bingo = BingoCage(range(3))
bingo.pick()

1

In [3]:
bingo()

0

In [4]:
callable(bingo)

True

In [5]:
dir(BingoCage)

['__call__',
 '__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 'pick']

## 函数内省

In [9]:
class C:pass      #自定义类
obj = C()         #自定义类实例

def func():pass   #自定义函数

sorted( set(dir(func)) - set(dir(obj)))  #求差集

['__annotations__',
 '__call__',
 '__closure__',
 '__code__',
 '__defaults__',
 '__get__',
 '__globals__',
 '__kwdefaults__',
 '__name__',
 '__qualname__']

### 函数专有的属性
| 名称                 | 类型 | 说明 |
|:--------------------|:----|:----|
| \_\_annotations\_\_ | dict |参数和返回值的注解 |
|\_\_call\_\_ |method-wrapper|实现（）运算符；即可调用对象协议|
|\_\_closure\_\_ |tuple|函数闭包，即自由变量的绑定（通常是None）|
|\_\_code\_\_ |code|编译成字节码的函数元数据和函数定义体
|\_\_defaults\_\_ |tuple|形式参数的默认值
|\_\_get\_\_ |method-wrapper|实现只读描述符协议（20章）
|\_\_globals\_\_ |dict|函数所在模块中的全局变量
|\_\_kwdefaults\_\_ |dict|仅限关键字形式参数的默认值
|\_\_name\_\_ |str|函数名称
|\_\_qualname\_\_ |str|函数的限定名称

## 函数参数

- 仅限关键字参数
- 使用\*存无变量名的一个或以上个参数到元组中
- 使用\**存有变量名的一个或以上个参数到字典中






In [25]:
def tag(name, *content, cls=None, **attrs):
    """生成一个或多个HTML标签"""
    if cls is not None:
        attrs['class'] = cls
    
    if attrs:
        attr_str = ''.join(' %s="%s"'%(attr, value) 
                           for attr, value 
                           in sorted(attrs.items()))
    else:
        attr_str = ''
        
    if content:
        return '\n'.join('<%s%s>%s</%s>'%(name, attr_str, c, name)
                      for c in content)
    
    else:
        return '<%s%s />'%(name, attr_str)
    

In [26]:
# 传入单个定位参数，生成一个指定名称的空标签。
# name = 'br'
tag('br')

'<br />'

In [42]:
# 第一个参数后面的任意个参数会被 *content 捕获，存入一个元组。
# name = 'p'
# content = ('hello')
tag('p', 'hello')

'<p>hello</p>'

In [28]:
# name = 'p'
# content = ('hello', 'world')
tag('p', 'hello', 'world')

'<p>hello</p>\n<p>world</p>'

In [31]:
# tag 函数签名中没有明确指定名称的关键字参数会被 **attrs 捕 获，存入一个字典。

# name = 'p'
# content = ('hello')
# attrs['id'] = 33
tag('p', 'hello', id=33)

'<p id="33">hello</p>'

In [43]:
# cls 参数只能作为关键字参数传入。

# name = 'p'
# content = ('hello', 'world')
# cls = 'sidebar'
print(tag('p', 'hello', 'world', cls='sidebar'))

<p class="sidebar">hello</p>
<p class="sidebar">world</p>


In [45]:
# 调用 tag 函数时，即便第一个定位参数也能作为关键字参数传入。

# name = 'img'
# attrs['content'] = 'testing' 
tag(content='testing', name="img")

'<img content="testing" />'

In [41]:
# 在 my_tag 前面加上 **，字典中的所有元素作为单个参数传入，
# 同名键会绑定到对应的具名参数上，余下的则被 **attrs 捕获。

# name = 'img'
# attrs['title'] = 'Sunset Buolevard'
# attrs['src'] = 'sunset.jpg'
# cls = 'framed'

my_tag = {'name':'img', 'title':'Sunset Buolevard',
         'src':'sunset.jpg', 'cls':'framed'}
tag(**my_tag)

'<img class="framed" src="sunset.jpg" title="Sunset Buolevard" />'

定义函数 时若想指定仅限关键字参数(如上面参数中的 *cls*)，要把它们放到前面有 \* 的参数后面。如果不想支持数量不定的定位参数，但是想支持仅限关键字参数，在签名中 放一个 \*，如下所示:

In [46]:
def f(a, *, b):
    return a,b

f(1, b=2)  # b参数必须指定设置了

(1, 2)

# 获取关于参数的信息


In [57]:
def clip(text, max_len = 80):
    """
    在max_len前面或后面的第一个空格处截断文本
    """
    end = None
    if len(text) > max_len:
        space_before = text.rfind(' ', 0, max_len)
        if space_before >= 0:
            end = space_before
    else:
        space_after = text.rfind(' ', max_len)
        if space_after >= 0:
            end = space_after
    if end == None:
        end = len(text)
    return text[:end].rstrip()

clip('I will learn python by myself every night.', 18)

'I will learn'

In [58]:
'''
函数对象:
__defaults__: 定位参数和关键字参数的默认值元组
__kwdefaults__:仅限关键字参数默认值元组

参数的默认值只能通过它们在 __defaults__ 元组中的位置确定，
因此要从后向前扫描才能把参数和默认值对应起来。 
在这个示例中 clip 函数有两个参数，text 和 max_len，
其中一个有默认值，即 80，因此它必然属于最后一个参数，即max_len。这有违常理。
'''
clip.__defaults__

(80,)

In [59]:
"""
__code__.varname:函数参数名称，但也包含了局部变量名
"""
clip.__code__.co_varnames

('text', 'max_len', 'end', 'space_before', 'space_after')

In [60]:
"""
__code__.co_argcount:结合上面的变量，可以获得参数变量

需要注意，这里返回的数量是不包括前缀*或**参数的。
"""
clip.__code__.co_argcount

2

## 使用inspect模块提取函数签名

In [62]:
from inspect import signature

sig = signature(clip)
sig

<Signature (text, max_len=80)>

In [63]:
for name, param in sig.parameters.items():
    print (param.kind, ":", name, "=", param.default)

POSITIONAL_OR_KEYWORD : text = <class 'inspect._empty'>
POSITIONAL_OR_KEYWORD : max_len = 80


如果没有默认值，返回的是inspect.\_empty，因为None本身也是一个值。

| kind | meaning |
| :--- | ------: |
|POSITIONAL_OR_KEYWORD | 可以通过定位参数和关键字参数传入的形参（多数） |
|VAR_POSITIONAL| 定位参数元组 |
|VAR_KEYWORD| 关键字参数字典 |
|KEYWORD_ONLY| 仅限关键字参数（python3新增） |
|POSITIONAL_ONLY| 仅限定位参数，python声明函数的句法不支持 |

# 函数注解

In [67]:
"""
没有设置函数注解时，返回一个空字典
"""
clip.__annotations__

{}

In [70]:
def clip_ann(text:str, max_len:'int > 0' = 80) -> str:
    """
    在max_len前面或后面的第一个空格处截断文本
    """
    end = None
    if len(text) > max_len:
        space_before = text.rfind(' ', 0, max_len)
        if space_before >= 0:
            end = space_before
    else:
        space_after = text.rfind(' ', max_len)
        if space_after >= 0:
            end = space_after
    if end == None:
        end = len(text)
    return text[:end].rstrip()

In [71]:
clip_ann.__annotations__

{'text': str, 'max_len': 'int > 0', 'return': str}

Python 对注解所做的唯一的事情是，把它们存储在函数的
__annotations__ 属性里。仅此而已，Python 不做检查、不做强制、
不做验证，什么操作都不做。换句话说，注解对 Python 解释器没有任何 意义。注解只是元数据，可以供 IDE、框架和装饰器等工具使用。

# 函数式编程

涉及到两个包：
- operator
- functools

## operator

### 使用mul替代* （相乘）运算符

In [72]:
# 如何将运算符当作函数使用

# 传统做法：

from functools import reduce

def fact(n):
    return reduce(lambda a,b: a*b, range(1,n+1))

fact(5)

120

In [73]:
# 如果使用operator库，就可以避免使用匿名函数
from functools import reduce
from operator import mul

def fact_op(n):
    return reduce(mul, range(1,n+1))

fact_op(5)

120

### 使用itemgetter来代表[ ]序号运算符

In [76]:
metro_data = [
 ('Tokyo', 'JP', 36.933, (35.689722, 139.691667)),
 ('Delhi NCR', 'IN', 21.935, (28.613889, 77.208889)),
 ('Mexico City', 'MX', 20.142, (19.433333, -99.133333)),
 ('New York-Newark', 'US', 20.104, (40.808611, -74.020386)),
 ('Sao Paulo', 'BR', 19.649, (-23.547778, -46.635833)),
 ]

from operator import itemgetter
for city in  sorted(metro_data, key = itemgetter(1)):
    print(city)
    
    
# 这里的itemgetter(1)等价于 lambda fields:fields[1]

('Sao Paulo', 'BR', 19.649, (-23.547778, -46.635833))
('Delhi NCR', 'IN', 21.935, (28.613889, 77.208889))
('Tokyo', 'JP', 36.933, (35.689722, 139.691667))
('Mexico City', 'MX', 20.142, (19.433333, -99.133333))
('New York-Newark', 'US', 20.104, (40.808611, -74.020386))


In [77]:
cc_name = itemgetter(1,0)  # 将返回提取的值构成的元组
for city in metro_data:
    print( cc_name(city) )

('JP', 'Tokyo')
('IN', 'Delhi NCR')
('MX', 'Mexico City')
('US', 'New York-Newark')
('BR', 'Sao Paulo')


### 使用attrgetter获取指定的属性，类似ver.attr(点运算符）

In [78]:
from collections import namedtuple
metro_data = [
 ('Tokyo', 'JP', 36.933, (35.689722, 139.691667)),
 ('Delhi NCR', 'IN', 21.935, (28.613889, 77.208889)),
 ('Mexico City', 'MX', 20.142, (19.433333, -99.133333)),
 ('New York-Newark', 'US', 20.104, (40.808611, -74.020386)),
 ('Sao Paulo', 'BR', 19.649, (-23.547778, -46.635833)),
 ]

LatLog = namedtuple('LatLong','lat long')
Metropolis = namedtuple('Metropolis', 'name cc pop coord')
metro_areas = [Metropolis(name, cc, pop, LatLog(lat, long)) for name, cc
              , pop, (lat, long) in metro_data]

# 点运算符
metro_areas[0].coord.lat

35.689722

In [82]:
# 使用operator函数来代替操作符

from operator import attrgetter
name_lat = attrgetter('name', 'coord.lat')

# 用坐标lat排序
for city in sorted(metro_areas, key = attrgetter('coord.lat')):
    print(name_lat(city))

('Sao Paulo', -23.547778)
('Mexico City', 19.433333)
('Delhi NCR', 28.613889)
('Tokyo', 35.689722)
('New York-Newark', 40.808611)


### methodcaller为参数调用指定的方法

In [86]:
from operator import methodcaller
s = 'The time has come'

# 可以把upcase看作是一个创建出来的函数
upcase = methodcaller('upper')# 指定方法

upcase(s)

'THE TIME HAS COME'

In [87]:
# 冻结参数：replace(str, ' ', '-')--->部分应用
hiphenate = methodcaller('replace', ' ','-')

hiphenate(s)

'The-time-has-come'

### operator 中的函数列表

In [85]:
import operator
funcs = [name for name in dir(operator) if not name.startswith('_')]
for func in funcs:
    print(func)

abs
add
and_
attrgetter
concat
contains
countOf
delitem
eq
floordiv
ge
getitem
gt
iadd
iand
iconcat
ifloordiv
ilshift
imatmul
imod
imul
index
indexOf
inv
invert
ior
ipow
irshift
is_
is_not
isub
itemgetter
itruediv
ixor
le
length_hint
lshift
lt
matmul
methodcaller
mod
mul
ne
neg
not_
or_
pos
pow
rshift
setitem
sub
truediv
truth
xor


## functools
### functools.partial 冻结参数

partial 的第一个参数是一个可调用对象，后面跟着任意个要绑定的 定位参数和关键字参数。

In [88]:
from operator import mul
from functools import partial

# 将mul(a,b)的一个参数冻结为3
triple = partial(mul, 3)

triple(7)

21

In [89]:
# 当参数只接受只有一个参数的函数时
list(map(triple,range(1,10)))

[3, 6, 9, 12, 15, 18, 21, 24, 27]

### functools.partial 规范化函数

In [91]:
# 在需要经常使用的一些函数时，我们可以将其作为一个冻结变量，会更加方便
import unicodedata, functools
# 提炼常用函数 unicodedata.normalize('NFC',s)
nfc = functools.partial(unicodedata.normalize, 'NFC') 

s1 ='café'
s2 = 'cafe\u0301'

s1 == s2

False

In [92]:
nfc(s1) == nfc(s2)

True

In [94]:
def tag(name, *content, cls=None, **attrs):
    """生成一个或多个HTML标签"""
    if cls is not None:
        attrs['class'] = cls
    
    if attrs:
        attr_str = ''.join(' %s="%s"'%(attr, value) 
                           for attr, value 
                           in sorted(attrs.items()))
    else:
        attr_str = ''
        
    if content:
        return '\n'.join('<%s%s>%s</%s>'%(name, attr_str, c, name)
                      for c in content)
    
    else:
        return '<%s%s />'%(name, attr_str)
    
    
# 将tag函数参数进行部分冻结，使用将更方便：
from functools import partial
picture = partial(tag, 'img', cls='pic-frame')
picture(src = 'wum.jpeg')

'<img class="pic-frame" src="wum.jpeg" />'

In [95]:
picture

functools.partial(<function tag at 0x7fb46982aee0>, 'img', cls='pic-frame')

In [96]:
picture.func

<function __main__.tag(name, *content, cls=None, **attrs)>

In [97]:
tag

<function __main__.tag(name, *content, cls=None, **attrs)>

In [98]:
picture.args

('img',)

In [99]:
picture.keywords

{'cls': 'pic-frame'}

In [None]:
def clip