功能工具
================

Python提供了一些内置命令，例如map，filter，reduce和lambda（用于创建匿名函数）和列表理解。这些是功能语言中的典型命令，其中LISP可能是最著名的。

函数式编程非常强大，Python的优势之一是它允许使用（i）命令式/过程式编程风格，（ii）面向对象风格和（iii）函数风格进行编程。程序员可以选择从哪种样式中选择工具，以及如何混合使用它们以最佳地解决给定的问题。

在本章中，我们提供一些使用上面列出的命令的示例。

匿名功能
-------------------

到目前为止，我们在Python中看到的所有函数都是通过`def`关键字定义的，例如：

In [1]:
def f(x):
     return x ** 2

该功能的名称为“ f”。定义函数后（例如，Python解释器碰到了“ def”行），我们可以使用其名称来调用该函数，例如

In [2]:
y = f(6)

有时，我们需要定义一个只能使用一次的函数，或者我们想要创建一个函数但不需要为其命名（例如创建闭包）。在这种情况下，由于没有名称，因此称为*匿名*函数。在Python中，关键字lambda可以创建一个匿名函数。

我们首先创建一个（命名的）函数，检查其类型和行为：

In [3]:
def f(x):
    return x ** 2

f

<function __main__.f(x)>

In [4]:
type(f)

function

In [5]:
f(10)

100

现在，我们对匿名函数执行相同的操作：

In [6]:
lambda x: x ** 2

<function __main__.<lambda>(x)>

In [7]:
type(lambda x: x ** 2)

function

In [8]:
(lambda x: x ** 2)(10)

100

这完全以相同的方式工作，但是–由于匿名函数没有名称–我们需要在每次需要时（通过`lambda`表达式）定义函数。

匿名函数可以采用多个参数：

In [9]:
(lambda x, y: x + y)(10, 20)

30

In [10]:
(lambda x, y, z: (x + y) * z )(10, 20, 2)

60

我们将看到一些使用“ lambda”的示例，这些示例将阐明典型的用例。

地图
---

映射函数“ lst2 = map（f，s）”将函数“ f”应用于序列“ s”中的所有元素。
map的结果可以变成一个与s长度相同的列表：

In [11]:
def f(x): 
    return x ** 2
lst2 = list(map(f, range(10)))
lst2

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [12]:
list(map(str.capitalize, ['banana', 'apple', 'orange']))

['Banana', 'Apple', 'Orange']

通常，这与匿名函数“ lambda”结合使用：

In [13]:
list(map(lambda x: x ** 2, range(10) ))

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [14]:
list(map(lambda s: s.capitalize(), ['banana', 'apple', 'orange']))

['Banana', 'Apple', 'Orange']

过滤
------

过滤器函数lst2 = filter（f，lst）将函数f应用于序列s中的所有元素。函数“ f”应返回“ True”或“ False”。这将使列表仅包含序列`s`的元素*s*<sub>*i*</sub>，对于这些元素，`f`(*s*<sub>*i*</sub>)返回了True。

In [15]:
def greater_than_5(x):
    if x > 5:
            return True
    else:
            return False

list(filter(greater_than_5, range(11)))

[6, 7, 8, 9, 10]

使用`lambda`可以大大简化此过程：

In [16]:
list(filter(lambda x: x > 5, range(11)))

[6, 7, 8, 9, 10]

In [17]:
known_names = ['smith', 'miller', 'bob']
list(filter( lambda name : name in known_names, \
     ['ago', 'smith', 'bob', 'carl']))

['smith', 'bob']

清单理解
------------------

列表理解提供了一种简洁的方法来创建和修改列表，而无需使用map（），filter（）和/或lambda。所得的列表定义往往比使用这些构造构建的列表更清晰。每个列表理解都包含一个表达式，后跟一个“ for”子句，然后是零个或多个“ for”或“ if”子句。结果将是一个列表，该列表是通过在紧随其后的for和if子句的上下文中评估表达式而得出的。如果表达式的计算结果为元组，则必须将其括起来。

一些示例将使这一点更加清楚：

In [18]:
freshfruit = ['  banana', '  loganberry ', 'passion fruit  ']
[weapon.strip() for weapon in freshfruit]

['banana', 'loganberry', 'passion fruit']

In [19]:
vec = [2, 4, 6]
[3 * x for x in vec]

[6, 12, 18]

In [20]:
[3 * x for x in vec if x > 3]

[12, 18]

In [21]:
[3 * x for x in vec if x < 2]

[]

In [22]:
[[x, x ** 2] for x in vec]

[[2, 4], [4, 16], [6, 36]]

我们还可以使用列表推导来修改`range`命令返回的整数列表，以使列表中的后续元素增加非整数分数：

In [23]:
[x*0.5 for x in range(10)]

[0.0, 0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 3.5, 4.0, 4.5]

现在，让我们回顾一下“过滤器”部分中的示例

In [24]:
[x for x in range(11) if x>5 ]

[6, 7, 8, 9, 10]

In [25]:
[name for name in ['ago','smith','bob','carl'] \
      if name in known_names]

['smith', 'bob']

以及“地图”部分中的示例

In [26]:
[x ** 2 for x in range(10) ]

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [27]:
[fruit.capitalize() for fruit in ['banana', 'apple', 'orange'] ]

['Banana', 'Apple', 'Orange']

所有这些都可以通过列表理解来表达。

更多细节

- Python教程[5.1.4列表理解]（http://docs.python.org/tutorial/datastructures.html#list-comprehensions）

减少
------

“减少”功能采用二进制函数“ f（x，y）”，序列“ s”和起始值“ a0”。然后将函数“ f”应用于起始值“ a0”和序列中的第一个元素：“ a1 = f（a0，s [0]）”。然后，按如下方式处理序列的第二个元素（s [1]）：使用参数a1和s [1]调用函数f，即a2 = f（a1，s [ 1]）。以这种方式，处理整个序列。 Reduce返回单个元素。

例如，如果函数`f（x，y）`返回`x + y`，可用于计算序列中的数字总和：

In [28]:
from functools import reduce

In [29]:
def add(x, y):
    return x + y

reduce(add, [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 0)

55

In [30]:
reduce(add, [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 100)

155

我们可以修改函数“ add”以提供有关该过程的更多详细信息：

In [31]:
def add_verbose(x, y):
    print("add(x=%s, y=%s) -> %s" % (x, y, x+y))
    return x+y

reduce(add_verbose, [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 0)

add(x=0, y=1) -> 1
add(x=1, y=2) -> 3
add(x=3, y=3) -> 6
add(x=6, y=4) -> 10
add(x=10, y=5) -> 15
add(x=15, y=6) -> 21
add(x=21, y=7) -> 28
add(x=28, y=8) -> 36
add(x=36, y=9) -> 45
add(x=45, y=10) -> 55


55

使用不对称函数“ f”（例如“ add_len（n，s）”）（其中s是一个序列，并且该函数返回“ n + len（s）”（来自Thomas Fischbacher的建议））可能是有益的：

In [32]:
def add_len(n, s):
    return n + len(s)

reduce(add_len, ["This","is","a","test."],0)

12

和以前一样，我们将使用更详细的二进制函数版本来查看发生的情况：

In [33]:
def add_len_verbose(n, s):
    print("add_len(n=%d, s=%s) -> %d" % (n, s, n+len(s)))
    return n+len(s)

reduce(add_len_verbose, ["This", "is", "a", "test."], 0)

add_len(n=0, s=This) -> 4
add_len(n=4, s=is) -> 6
add_len(n=6, s=a) -> 7
add_len(n=7, s=test.) -> 12


12

了解reduce函数的作用的另一种方法是查看以下函数（由Thomas Fischbacher友好提供），该函数的行为类似于“ reduce”，但解释了其作用：

这是使用`explain_reduce`函数的示例：

In [34]:
def explain_reduce(f, xs, start=None):
    """This function behaves like reduce, but explains what it does,
    step-by-step.
    (Author: Thomas Fischbacher, modifications Hans Fangohr)"""
    nr_xs = len(xs)
    if start == None:
        if nr_xs == 0:
            raise ValueError("No starting value given - cannot " + \
                              "process empty list!")
        if nr_xs == 1:
            print("reducing over 1-element list without starting " + \
                  "value: returning that element.")
            return xs[0]
        else:
            print("reducing over list with >= 2 elements without " +\
                  "starting value: using the first element as a " +\
                  "start value.")
            return explain_reduce(f, xs[1:], xs[0])
    else:
        s = start
        for n in range(len(xs)):
            x = xs[n]
            print("Step %d: value-so-far=%s next-list-element=%s"\
                  % (n, str(s), str(x)))
            s = f(s, x)
        print("Done. Final result=%s" % str(s))
        return s

In [35]:
def f(a, b):
    return a + b

reduce(f, [1, 2, 3, 4, 5], 0)

15

In [36]:
explain_reduce(f, [1, 2, 3, 4, 5], 0)

Step 0: value-so-far=0 next-list-element=1
Step 1: value-so-far=1 next-list-element=2
Step 2: value-so-far=3 next-list-element=3
Step 3: value-so-far=6 next-list-element=4
Step 4: value-so-far=10 next-list-element=5
Done. Final result=15


15

reduce通常与lambda结合使用：

In [37]:
reduce(lambda x, y: x + y, [1, 2, 3, 4, 5], 0)

15

还有一个`operator`模块，它提供标准的Python运算符作为函数。例如，当Python评估`a + b`之类的代码时，将执行函数`operator.__add__（a，b）`。这些通常比“ lambda”表达式快。我们可以将上面的示例写为

In [38]:
import operator
reduce(operator.__add__, [1, 2, 3, 4, 5], 0)

15

使用“帮助（“操作员”）查看操作员功能的完整列表。

为什么不只使用for循环？
---------------------------

让我们比较一下本章开头介绍的示例（i）使用for循环和（ii）列表理解。再次，我们要计算数字0<sup>2</sup>, 1<sup>2</sup>, 2<sup>2</sup>, 3<sup>2</sup>, ... 对于给定的*n*，最多可达(*n* − 1)<sup>2</sup>。

使用 *n*=10 的for循环实现（i）：

In [39]:
y = []
for i in range(10):
    y.append(i**2)

使用列表理解的实现（ii）：

In [40]:
y = [x**2 for x in range(10)]

or using `map`:

或使用`map`：

In [41]:
y = map(lambda x: x**2, range(10))

使用列表理解和`map`的版本适合一行代码，而for循环则需要3行。此示例说明功能代码会产生非常简洁的表达式。通常，程序员犯的错误数是编写的每行代码，因此，我们拥有的代码行越少，需要查找的错误就越少。

通常，程序员会发现，与使用for循环分别处理列表中的每个元素相比，本章介绍的列表处理工具似乎不那么直观，但是随着时间的推移，它们开始重视一种更具功能性的编程风格。

速度
-----

与在列表元素上使用显式（for或while）循环相比，本章中描述的功能工具还可以更快。

下面的程序“ list _comprehension_ speed.py”使用4种不同的方法为*N*的大数值计算$\\sum\_{i=0}^{N-1} i^2$并记录执行时间：

-方法1：for循环（使用预先分配的列表，将*i* undefined</sup>存储在列表中，然后使用内置的sum函数）

-方法2：无列表的for循环（随着for循环的进行，更新总和）

-方法3：使用清单推导

-方法4：使用numpy。 （在第14章（14-numpy.ipynb）中讨论了Numpy）

这是一个可能的计算此的程序：

In [42]:
# NBVAL_IGNORE_OUTPUT
"""Compare calculation of \sum_i x_i^2 with
i going from zero to N-1.

We use (i) for loops and list, (ii) for-loop, (iii) list comprehension
and (iv) numpy.

We use floating numbers to avoid using Python's long int (which would
be likely to make the timings less representative).
"""

import time
import numpy
N = 10000000


def timeit(f, args):
    """Given a function f and a tuple args containing
    the arguments for f, this function calls f(*args),
    and measures and returns the execution time in
    seconds.

    Return value is tuple: entry 0 is the time,
    entry 1 is the return value of f."""

    starttime = time.time()
    y = f(*args)    # use tuple args as input arguments
    endtime = time.time()
    return endtime - starttime, y


def forloop1(N):
    s = 0
    for i in range(N):
        s += float(i) * float(i)
    return s


def forloop2(N):
    y = [0] * N
    for i in range(N):
        y[i] = float(i) ** 2
    return sum(y)


def listcomp(N):
    return sum([float(x) * x for x in range(N)])


def numpy_(N):
    return numpy.sum(numpy.arange(0, N, dtype='d') ** 2)

# main program starts
timings = []
print("N =", N)
forloop1_time, f1_res = timeit(forloop1, (N,))
timings.append(forloop1_time)
print("for-loop1: {:5.3f}s".format(forloop1_time))
forloop2_time, f2_res = timeit(forloop2, (N,))
timings.append(forloop2_time)
print("for-loop2: {:5.3f}s".format(forloop2_time))
listcomp_time, lc_res = timeit(listcomp, (N,))
timings.append(listcomp_time)
print("listcomp : {:5.3f}s".format(listcomp_time))
numpy_time, n_res = timeit(numpy_, (N,))
timings.append(numpy_time)
print("numpy    : {:5.3f}s".format(numpy_time))

# ensure that different methods provide identical results
assert f1_res == f2_res
assert f1_res == lc_res

# Allow a bit of difference for the numpy calculation
numpy.testing.assert_approx_equal(f1_res, n_res)

print("Slowest method is {:.1f} times slower than the fastest method."
      .format(max(timings)/min(timings)))

N = 10000000
for-loop1: 3.309s
for-loop2: 2.501s
listcomp : 2.322s
numpy    : 0.083s
Slowest method is 39.7 times slower than the fastest method.


实际的执行性能取决于计算机。相对性能可能取决于我们使用的Python版本及其支持库（例如numpy）。

使用当前版本（运行OS X的x84机器上的python 3.6，numpy 1.11），我们看到方法1和2（无列表且带预分配列表的for循环）最慢，紧随其后的是稍快的方法列表理解。最快的方法是数字4（使用numpy）。

`%% timeit`魔术
-------------------

如果我们使用IPython作为外壳（或运行Python内核的Jupyter笔记本中的单元），则有一种更加复杂的方法来测量上述时间：如果单元以`%%timeit`开头，则IPython将在该单元中重复运行命令并获得（平均）计时。这对于定时执行相对较快的命令特别有用。

让我们使用`timeit`魔术将列表理解与显式循环进行比较：

In [1]:
%%timeit
y = [x**2 for x in range(100)]

47.1 µs ± 446 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)


In [2]:
%%timeit
y = []
for x in range(100):
    y.append(x**2)

51.7 µs ± 314 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
