# Python для сбора данных

*Алла Тамбовцева, НИУ ВШЭ*

## Lambda-функции

### Lambda-функции в Python

Иногда возникает необходимость написать небольшую функцию, которая будет использоваться один раз, да и то в сочетании с какими-нибудь другими функциями или методами. В таком случае совсем необязательно создавать эту функцию с помощью `def` и присваивать ей имя. Можно воспользоваться специальными lambda-функциями, которые создаются в одну строчку и могут существовать без имени (их ещё назвают *анонимными*).

Для начала создадим какую-нибудь не-анонимную функцию, чтобы познакомиться с синтаксисом. Пусть это будет функция `sq`, которая принимает на вход какое-то число `x` и возвращает его квадрат.

In [1]:
sq = lambda x: x ** 2 # готово

Использовать эту функцию можно как функции, заданные через `def`:

In [2]:
sq(10)

100

In [3]:
sq(-7)

49

Если функция принимает на вход более одного аргумента, они просто перечисляются через запятую после `lambda`:

In [4]:
my_sum = lambda x, y: x + y

In [5]:
my_sum(0, 7)

7

In [6]:
my_sum(6, 7)

13

### Lambda-функции и функция `map()`

Теперь посмотрим на сочетание lambda-функций с встроенными функциями Python. Lambda-функции часто используют в сочетании с функциями `map()` и `filter()`, которые позволяют преобразовывать элементы списков/кортежей или отфильтровывать значения (более быстрая и удобная альтернатива списковым включениям).

Функция `map()` позволяет применять готовую функцию ко всем элементам списка/кортежа, безо всяких циклов и их аналогов:

In [7]:
list(map(int, ["23", "5", "7"]))

[23, 5, 7]

In [8]:
list(map(float, input().split())) # вводим 2.5 10

2.5 10


[2.5, 10.0]

In [9]:
list(map(sum, [(7, 2), (1, 7), (0, 5)]))

[9, 8, 5]

Обратите внимание: перед `map()` всегда добавляется `list()`. Это нужно для того, чтобы увидеть результаты явно и получить их в виде списка. Иначе мы просто получим «закрытый» объект типа `map()`, временно сохранённый в ячейку памяти ( вспомните историю про `zip()`):

In [10]:
map(sum, [(7, 2), (1, 7), (0, 5)])

<map at 0x109578710>

В примерах выше к спискам применялись уже существующие в Python функции `int()`, `float()` и `sum()`, но вместо них можно благополучно использовать свои функции, в том числе lambda-функции. Например, мы можем получить список квадратов чисел, написав соответствующую анонимную функцию через выражение с `lambda` (зачем её называть и сохранять, если она нам понадобится один раз):

In [11]:
L = [3, 7, 8, -5, 0]

list(map(lambda x: x ** 2, L))

[9, 49, 64, 25, 0]

In [12]:
words = ["HAPPY", "New", "Year"]

list(map(lambda x: x.lower(), words))

['happy', 'new', 'year']

### Lambda-функции и функция `filter()`

Если вы помните, когда мы обсуждали списки, мы говорили про метод `.index()`, который возвращает индекс какого-то элемента по его значению. Проблема в том, что в случае списка с повторяющимися значениями он возвращает только первое совпадение:

In [13]:
L = [0, 2, 7, 5, 4, 3, 2]
L.index(2) # только первая 2

1

Если мы захотим таким образом вернуть все элементы, удовлетворяющие некоторому условию, ничего не получится (понадобятся циклы, условия, списковые включения). А можно просто написать lambda-функцию, которая будет возвращать значения `True` или `False` в зависимости от соответствия условию, а потом передать полученный результат функции `filter()`,  которая отберет элементы с `True`:

In [14]:
list(filter(lambda x: x > 3, L))  # элементы списка L больше 3

[7, 5, 4]

In [15]:
list(filter(lambda x: x % 2 == 0, L))  # четные элементы списка L

[0, 2, 4, 2]

Условия можно совмещать:

In [16]:
list(filter(lambda x: (x > 3) & (x < 7), L))   # 3 < x < 7

[5, 4]

### Lambda-функции и сортировка

Lambda-функции активно используются и в сортировке, если сортировка проиводится по каким-то особым правилам. Вспомним простую сортировку с помощью функции `sorted()`: 

In [17]:
numbers = [10, 15, 2, 20, 45, 56, 1, -12, 24, -5]

In [18]:
sorted(numbers) # по возрастанию

[-12, -5, 1, 2, 10, 15, 20, 24, 45, 56]

In [19]:
sorted(numbers, reverse = True) # по убыванию

[56, 45, 24, 20, 15, 10, 2, 1, -5, -12]

Как быть, если мы хотим отсортировать элементы на основе их абсолютного значения? Написать правило сортировки через lambda-функцию, чтобы Python смотрел не на каждый элемент `x`, а на его абсолютное значение:

In [20]:
sorted(numbers, key = lambda x: abs(x)) # аргумент key

[1, 2, -5, 10, -12, 15, 20, 24, 45, 56]

Этот аргумент `key` – ключ сортировки – можно использовать и для сортировки наборов значений:

In [21]:
pairs = [(4, 6), (7, 1), (2, 5), (9, 10)]

sorted(pairs, key = lambda x: x[1]) # сортируем пары по 2-ому элементу

[(7, 1), (2, 5), (4, 6), (9, 10)]

In [22]:
triple = [(4, 6, 0), (0, 7, 1), (1, 2, 5), (2, 9, 10)]

sorted(triple, key = lambda x: x[2], reverse = True) # сортируем пары по 3-ому элементу

[(2, 9, 10), (1, 2, 5), (0, 7, 1), (4, 6, 0)]