# 匿名函数基础

格式： lambda argument1, argument2,... argumentN : expression

关键字是lambda, 之后是一系列的参数，然后用冒号隔开，最后是这些参数组成的表达式

In [1]:
square = lambda x: x ** 2
square(3)

9

匿名函数 lambda 和常规函数一样，返回的都是一个函数对象（function object），它们的用法也极其相似，不过还是有下面几点区别:

1. 第一个区别，lambda 是一个表达式（expression），并不是一个语句（statement）:
    - 表达式是用一系列公式去表达的东西，比如x + 2, x ** 2等等
    - 所谓语句，则是完成了某些功能，比如赋值语句x = 1完成了赋值，print语句完成了打印，条件语句完成了选择功能，等等
    
因此lambda可以用在一些常规函数def不能用的地方，比如说
- 在列表内部

In [2]:
[(lambda x: x*x)(x) for x in range(10)]

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

- 再比如，lambda可以用作某些函数的参数

In [3]:
l = [(1, 20), (3, 0), (9, 10), (2, -1)]

l.sort(key=lambda x: x[1]) # 按列表中元组的第二个元素排序
print(l)


[(2, -1), (3, 0), (9, 10), (1, 20)]


常规函数 def 必须通过其函数名被调用，因此必须首先被定义。但是作为一个表达式的 lambda，返回的函数对象就不需要名字了。

2. 第二个区别，lambda 的主体是只有一行的简单表达式，并不能扩展成一个多行的代码块。

Python 之所以发明 lambda，就是为了让它和常规函数各司其职：lambda 专注于简单的任务，而常规函数则负责更复杂的多行逻辑

## 为什么需要匿名函数

通常，我们用函数的目的无非是这么几点：
- 减少代码的重复性；如果你的程序在不同地方包含了相同的代码，那么我们就会把这部分相同的代码写成一个函数，并为它取一个名字，方便在相对应的不同地方调用。
- 模块化代码。如果你的一块儿代码是为了实现一个功能，但内容非常多，写在一起降低了代码的可读性，那么通常我们也会把这部分代码单独写成一个函数

但你需要一个函数，但它非常简短，只需要一行就能完成；同时它在程序中只被调用一次而已。那么请问，你还需要像常规函数一样，给它一个定义和名字吗？不用，这种情况下，函数可以匿名。

举个例子，如果你想对一个列表中的所有元素做平方操作，而这个操作在你的程序中只需要进行一次，用 lambda 函数可以表示成下面这样：

In [12]:
l = [1, 2, 3, 4, 5]
squared = list(map(lambda x: x**2, l)) # 不加list()只返回map对象

In [13]:
squared

[1, 4, 9, 16, 25]

In [9]:
def multiply2(x):
    return x * 2
    
map(multiply2, [1, 2, 3, 4])  # Output [2, 4, 6, 8]

<map at 0x1131fa400>

函数 map(function, iterable) 的第一个参数是函数对象，第二个参数是一个可以遍历的集合，它表示对 iterable 的每一个元素，都运用 function 这个函数。两者一对比，我们很明显地发现，lambda 函数让代码更加简洁明了。

再举一个例子，在 Python 的 Tkinter GUI 应用中，我们想实现这样一个简单的功能：创建显示一个按钮，每当用户点击时，就打印出一段文字。如果使用 lambda 函数可以表示成下面这样

In [16]:
!pip install tkinter

Looking in indexes: https://pypi.org/simple/, https://****@nexus.lifeq.com/nexus/repository/pypi/simple/
[31mERROR: Could not find a version that satisfies the requirement tkinter[0m
[31mERROR: No matching distribution found for tkinter[0m


In [14]:
from tkinter import Button, mainloop 
button = Button(
    text='This is a button',
    command=lambda: print('being pressed')
) # 点击时调用lambda函数
button.pack()
mainloop()

ModuleNotFoundError: No module named '_tkinter'

## Python 函数式编程

所谓函数式编程，是指代码中每一块都是**不可变的**（immutable），都由纯函数（pure function）的形式组成。这里的纯函数，是指函数本身相互独立、互不影响，对于相同的输入，总会有相同的输出，没有任何副作用。

比如以下这个例子。对于一个列表，我想让列表中的元素值都变为原来的两倍，我们可以写成下面的形式

In [17]:
def multiply_2(l):
    for index in range(len(l)):
        l[index] *= 1
    return l 

这段代码就不是纯函数形式，因为列表中元素的值改变了，如果多次调用这个函数，那么每次得到的结果都不一样。真正的纯函数式形式是

In [19]:
def multiply_2_pure(l):
    new_list = []
    for item in l:
        new_list.append(item*2)
    return new_list 

函数式编程的优点，主要在于其纯函数和不可变的特性使程序更加健壮，易于调试（debug）和测试；缺点主要在于限制多，难写。当然，Python 不同于一些语言（比如 Scala），它并不是一门函数式编程语言，不过，Python 也提供了一些函数式编程的特性，值得我们了解和学习。

Python 主要提供了这么几个函数：map()、filter() 和 reduce()，通常结合匿名函数 lambda 一起使用。

【<font color=blue>关于map()、filter() 和 reduce()三个函数，需要注意的是：
1. map()在 Python 2.x 返回的是一个列表；而在 Python 3.x 中返回一个 map 类，可以看成是一个迭代器。
2. filter()在 Python 2.x 中返回的是过滤后的列表, 而在 Python 3.x 中返回的是一个 filter 类，可以看成是一个迭代器，有惰性运算的特性, 相对 Python2.x 提升了性能, 可以节约内存。
3. reduce() 函数在 Python3 中已经被从全局名字空间里移除了，它现在被放置在 functools 模块里，如果想要使用它，则需要通过引入 functools 模块来调用 reduce() 函数。</font>】

### map()函数

map(function, iterable)

它对iterable中每个元素，都运用function这个函数，最后**返回一个新的可遍历的集合【<font color=blue>这里原文有误，应该是返回一个map对象</font>】**。

In [20]:

l = [1, 2, 3, 4, 5]
new_list = map(lambda x: x * 2, l) # [2， 4， 6， 8， 10]
print(new_list)

<map object at 0x113b32a90>


In [21]:

l = [1, 2, 3, 4, 5]
new_list = list(map(lambda x: x * 2, l)) # [2， 4， 6， 8， 10]
new_list

[2, 4, 6, 8, 10]

看一下 Python 提供的函数式编程接口的性能。还是同样的列表例子，它还可以用 for 循环和 list comprehension（目前没有统一中文叫法，你也可以直译为列表理解等）实现，我们来比较一下它们的速度：

In [26]:
!python3 -mtimeit -s'xs=range(1000000)' 'list(map(lambda x: x*2, xs))'

10 loops, best of 3: 169 msec per loop


In [27]:
!python3 -mtimeit -s'xs=range(1000000)' 'map(lambda x: x*2, xs)'

1000000 loops, best of 3: 0.269 usec per loop


In [24]:
!python3 -mtimeit -s'xs=range(1000000)' '[x * 2 for x in xs]'

10 loops, best of 3: 89.4 msec per loop


In [25]:
!python3 -mtimeit -s'xs=range(1000000)' 'l = []' 'for i in xs: l.append(i * 2)'

10 loops, best of 3: 155 msec per loop


map() 是最快的。因为 map() 函数直接由 C 语言写的，运行时不需要通过 Python 解释器间接调用，并且内部做了诸多优化，所以运行速度最快

### filter(function, iterable)

filter() 函数表示对 iterable 中的每个元素，都使用 function 判断，并返回 True 或者 False，最后将返回 True 的元素组成一个新的可遍历的集合

In [28]:
l = [1, 2, 3, 4, 5]
new_list = filter(lambda x: x % 2 == 0, l)

In [29]:
new_list

<filter at 0x113b32c50>

In [30]:
l = [1, 2, 3, 4, 5]
new_list = list(filter(lambda x: x % 2 == 0, l))

In [31]:
new_list

[2, 4]

### reduce()函数

reduce(function, iterable) 函数中，function同样是一个函数对象，规定它有两个参数，<font color=red>表示对iterable中的每个元素以及上一次调用后的结果</font>，运用function进行计算，**最后返回的是一个单独的数值**

In [33]:
from functools import reduce

In [34]:
l = [1, 2, 3, 4, 5]
product = reduce(lambda x, y: x * y, l)

In [35]:
product

120

通常来说，在我们想对集合中的元素进行一些操作时，如果操作非常简单，比如相加、累积这种，那么我们优先考虑 map()、filter()、reduce() 这类或者 list comprehension 的形式。

- 在数据量非常多的情况下，比如机器学习的应用，那我们一般更倾向于函数式编程的表示，因为效率更高；
- 在数据量不多的情况下，并且你想要程序更加 Pythonic 的话，那么 list comprehension 也不失为一个好选择。

如果你要对集合中的元素，做一些比较复杂的操作，那么，考虑到代码的可读性，我们通常会使用 for 循环，这样更加清晰明了。

## 总结

这节课，我们一起学习了 Python 中的匿名函数 lambda，它的主要用途是减少代码的复杂度。
1. 需要注意的是 lambda 是一个表达式，并不是一个语句；它只能写成一行的表达形式，语法上并不支持多行。
2. 匿名函数通常的使用场景是：程序中需要使用一个函数完成一个简单的功能，并且该函数只调用一次。
3. 其次，我们也入门了 Python 的函数式编程，主要了解了常见的 map()，fiilter() 和 reduce() 三个函数，并比较了它们与其他形式（for 循环，comprehension）的性能，显然，它们的性能效率是最优的。

## 思考题

第一问：如果让你对一个字典，根据值进行由高到底的排序，该怎么做呢？以下面这段代码为例，你可以思考一下。

```

d = {'mike': 10, 'lucy': 2, 'ben': 30}
```

第二问：在实际工作学习中，你遇到过哪些使用匿名函数的场景呢？

In [36]:

d = {'mike': 10, 'lucy': 2, 'ben': 30}
sorted(d.items(), key=lambda x: x[1], reverse=True)

[('ben', 30), ('mike', 10), ('lucy', 2)]

hello,everyone:
数据清洗过程常用lambda 函数
data["工作日"] = data["日期"].map(lambda x: x.weekday())
data["工作日"] = data["工作日"].map(lambda x: 1 if x<5 else 0)

catshitfive
应用场景举个栗子：比如在 pandas 中对二维数据进行数据分析时，对于某些数据块我们需要用函数如apply applymap transform 等进行临时性一次性的转换变更以得到最终的分析结果，那么就可以用匿名函数配合着来使用，使代码更简洁易读高效