#### Кортежи и множества

В Python и многих других языках для хранения гетерогенных по типу данных обычно используются объекты типа `tuple` – кортежи, которые ставятся в противовес спискам (напомню, что в них обычно хранят объекты одного и того же типа, даже если реализация явно не запрещает обратное). Кортежи являются неизменяемыми объектами, но во всем остальном они повторяют поведение списков. Чаще всего вы будете сталкиваться с ними, когда ваши/чужие функции будут возвращать несколько значений сразу, например:

```
def function(a: Any, b: Any) -> Tuple[Any, Any]:
    return a, b
```

Эта функция возвращает кортеж длины 2. Литералом кортежей являются круглые скобки, содержащие внутри запятые, хотя в определенных ситуациях эти детали можно опускать:

In [1]:
tup = (1, 2, 3)
another_tup = 1, 2, 3
yet_another_tup = 1,

Обратите внимание, что круглые скобки сами по себе кортежи создают не всегда. Вот такое выражение создаст пустой кортеж
```
a_tuple = ()
```
а такое уже нет
```
not_tuple = (len([1, 2, 3]))
```
зато такое создаст
```
a_tuple = (len([1, 2, 3]),)
```
и такое
```
a_tuple = len([1, 2, 3]), len([1, 2, 3])
```
Иными словами, литерал кортежа работает по остаточному принципу. Поскольку выражение внутри скобок в случае `(len([1, 2, 3]))` вычисляется как одно единственное число, нет очевидной необходимости заводить под него кортеж. Чтобы заставить язык это сделать, нам надо явно указать запятую перед закрывающей скобкой. К слову сказать, скобки вокруг выражений (как в случае с `(len([1, 2, 3]))` часто используются для того, чтобы разместить крупное выражение на нескольких строках.

Множества (`set`) очень похожи на словари с точки зрения технической реализации – и те и другие используют [хеш-таблицы](https://ru.wikipedia.org/wiki/Хеш-таблица) для быстрого поиска содержимого (словари хранят так ключи). По этой причине в `set` не может быть повторяющихся и изменяемых объектов (по крайней мере изменяемых объектов встроенных типов). Литерал множеств похож на литерал словарей:
```
a_set = {1, 2, 3}
```
Хотя пустое множество так не создать
```
this_is_not_an_empty_set = {}
```
Так получится пустой словарь. Пустое множество можно создать только при помощи конструктора
```
empty_set = set()
```
Сравните время, необходимое для поиска объекта в списке и множестве

In [2]:
a_list = list(range(100))
a_set = set(range(100))

In [3]:
%timeit 99 in a_list

1.05 µs ± 95.3 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [4]:
%timeit 99 in a_set

32.2 ns ± 1.45 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


С асимптотической точки зрения, поиск объекта в списке занимает время линейно пропорциональное длине списка – O(n), где n – длина списка. У множеств это время асимптотически не зависит от размера множества – O(1), в чем легко убедиться:

In [5]:
larger_list = list(range(1000))
larger_set = set(range(1000))

In [6]:
%timeit 999 in larger_list

9.74 µs ± 1.03 µs per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [7]:
%timeit 999 in larger_set

48.4 ns ± 5.62 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


Видно, что в случае со списком время поиска увеличилось на порядок, как и размер списка. А у множества практически ничего не поменялось.

#### Аргументы функций

Функции в питоне имеют четыре типа аргументов: позиционные, позиционные со значением по умолчанию, произвольные позиционные, произвольные ключевые. С обычными позиционными аргументами вы уже знакомы:

```
def function(a, b, c):
    ...
```

Здесь `a`, `b` и `c` являются обычными позиционными аргументами. Как вам известно, их может быть сколько угодно, но все эти аргументы нужно передать во время вызова, иначе вы получите ошибку. У позиционных аргументов могут быть значения по умолчанию:
```
def function(a, b=default_b, c=default_c):
    ...
```
Технически это могут быть абсолютно любые значения, но лучше не использовать изменяемые объекты, потому что значения по умолчанию, в отличие от тела функции, вычисляются только один раз при создании (компиляции) функции. Написанной выше функции обязательно мы должны передать только значение аргумента `a`. Мы можем передать значение для `b` и/или `c`, но не обязаны это делать. Значения аргументам по умолчанию присваиваются в порядке их передачи при вызове, т.е. позиционно. Иными словами, всё ровно так же, как и с обычными позиционными аргументами. Мы можем также передавать аргументы в произвольном порядке, указывая напрямую их имя.
```
function(val1, val2)
```
В этом случае значение `val2` будет присвоено аргументу `b`, а для `c` будет использовано значение по умолчанию.
```
function(val1, c=val2)
```
В этом случае `val2` присваивается переменной `c`, а `b` получает значение по умолчанию.

Бывают также случаи, когда нам надо передать заведомо неизвестное количество аргументов. Например, функция `print` может принимать любое количество позиционных переменных и печатать все. Это реализуется за счет произвольных позиционных аргументов:
```
def function(a, b, *args):
    ...
```
Такой аргумент в сигнатуре функции может быть только один. Называть его можно как угодно, хотя чаще всего используется `args` (сокращение от arguments) – решающее значение имеет только наличие астериска перем именем аргумента. При вызове функции в `*args` попадают все дополнительные аргументы, кроме фиксированных. При этом создается кортеж.

In [8]:
def function(a, b, *args):
    print(a, b, args)


function(1, 2, 3, 4, 5)

1 2 (3, 4, 5)


Произвольные ключевые аргументы можно создавать, добавляя в сигнатуру `**kwargs` (от keyword arguments). Как и в случае с `*args` название аргумента значения не имеет, и такой аргумент может быть только один. В `**kwargs` попадают все переданные по имени значения, которые явно не указаны в сигнатуре функции, и создается при этом словарь.

In [9]:
def function(a, b, **kwargs):
    print(a, b, kwargs)

    
function(1, 2, c=1, d=2)

1 2 {'c': 1, 'd': 2}


Сигнатура функции может содержать одновременно `*args`, `**kwargs` и аргументы со значением по умолчанию:
```
def function(a, b, c=default, *args, **kwargs):
    ...
```

#### Анонимные функции

Как известно, инструкция `def`, которой мы пользовались для создания функций, выражением не является, поэтому её нельзя писать там, где должны стоять выражения. Тем не менее, в Python есть ещё один способ создания функций – `lambda` выражения. Например,

```
lambda a, b: a + b
```
создаст функцию с аругментами `a` и `b`, вычисляющую сумму этих аргументов. Внутри `lambda` выражений можно писать только одно выражение (любой сложности). Поскольку выражение внутри них может быть только одно, его же значение возвращается функцией при вызове – `return` писать не надо. Как несложно заметить, в `lambda` выражениях, в отличие от `def` инструкций, не указывается имя функции. По этой причине такие функции называются анонимными. Чаще всего их используют как одноразовые обертки над выражениями, когда нам нужно передать в какую-то другую функцию аргумент типа `Callable`. Например, метод `apply` векторов `pandas.Series` принимает в качестве первого аргумента `Callable` объект и применяет его к каждому объекту в векторе.

In [10]:
import pandas as pd

a_series = pd.Series([1, 2, 3])
a_series

0    1
1    2
2    3
dtype: int64

In [11]:
a_series.apply(lambda x: x + 1)

0    2
1    3
2    4
dtype: int64

Кроме того, что они являются выражениями, не имеют имени и могут содержать внутри себя только одно выражение, анонимные функции ничем не отличаются от функций, создаваемых `def` инструкцией. Тем не менее, согласно правилам стиля языка не принято присваивать лямбда выражения переменным, чтобы обращаться к ним про имени. Иными словами, если вам нужна функция, к которой вы будете обращаться по имени, пользуйтесь `def` инструкцией. 

#### Выражения-генераторы и ленивые вычисления

Имея дело с тяжелыми вычислениями, завязанными на большое количество данных, нам бы не хотелось хранить все данные в памяти компьютера сразу. Хотелось бы, чтобы в каждый момент времени в памяти по возможности хранилось только то, что нужно. Эта концепция в программировании называется ленивыми вычислениями (lazy evaluations). С одним примером ленивости вы уже сталкивались – логические операторы вычисляются лениво. Для итеративных ленивых операций в Python, кроме прочего, есть выражения-генераторы (generator expressions). Синтаксис выглядит так:
```
genexp = (value for value in iterable)
```
Это выражение создает Iterable объект, который возвращает по одному каждое значение, хранящееся в объекте iterable. В левой части мы можем писать любое выражение, которое хотим вычислить. Например, можно вычислить квадраты всех целых чисел от 0 до бесконечности:
```
from itertools import count

squared = (number**2 for number in count(0))
```

В правой части можно добавить условие – давайте создадим бесконечный ряд четных чисел, начиная с 0:
```
even_numbers = (number for number in count(0) if not number % 2)
```
И `squared` и `even_numbers` не вычисляют всё сразу. Очевидно, эти вычисления заняли бы бесконечно много времени и памяти, если попытаться сделать всё сразу. Вместо этого генераторы вычисляют значения только тогда, когда его нужно вернуть. Это же касается длинных цепочек вычислений, основанных на генераторах. По этой причине генераторы, как и все итераторы, являются одноразовыми объектами – они не хранят историю вычислений (предыдушие значения):

In [12]:
from itertools import count

even_numbers = (number for number in count(0) if not number % 2)
squared_even = (number**2 for number in even_numbers)

next(squared_even), next(even_numbers)

(0, 2)

Как видите, когда мы попросили следующее значение от `even_numbers`, мы получили не `0`, а `2`, потому что значение `0` первый генератор уже вычислял и передавал в генератор `squared_even`, когда тому надо было вычислить своё значение. Об этой детали очень важно помнить, когда вы работаете с итераторами и генараторами в Python. Кстати, вы вероятно догадываетесь, что функция `itertools.count` возвращает генераторы, иначе как бы она вернула нам ряд чисел от 0 до +бесконечности.

Генераторы списков (list comprehensions) выглядят как выражения генераторы, но они не являются ленивыми.
```
listcomp = [value for value in iterable]
```
Их очень часто используют, чтобы быстро преобразовать значения в каком-то итерируемом объекте и/или отфильтровать их по какому-то условию и записать в список. С точки зрения результата, это равноценно вызову конструктора `list` от генератора
```
[value for value in iterable] == list(value for value in iterable)
```
Обратите внимание, что у выражений-генераторов можно опускать скобки при передаче в качестве аргумента в функции, если они являются единственным переданным аргументом. Генераторы списков часто используют вперемешку с выражениями-генераторами, чтобы в каких-то нужных местах получить неленивое многоразовое хранилище результатов предыдущих ленивых вычислений. Функциональными аналогами выражений генераторов являются встроенные функции `map` и `filter`.

#### Распаковка Iterable объектов

Любой объект, предоставляющий интерфейс интерации, можно распаковывать. Например, мы с вами знаем, что функция 

```
def function(a, b):
    return a, b
```

Возвращает кортеж из двух элементов. Его можно сразу же распаковать:

In [13]:
def function(a, b):
    return a, b


a, b = function(1, 2)
print(a, b)

1 2


Распаковка является позиционной. Очень удобно этим механизмом пользоваться при итерации. Например, у словарей есть метод `items`, который возвращает итератор пар (ключ, зачение) в виде кортежей.

In [14]:
[key for key, value in {"a": 0, "b": 1, "c": 2, "d": 3}.items() if not value % 2]

['a', 'c']

Распаковкой можно пользоваться (начиная с Python 3.6) и в литералах. Сравните результаты

In [15]:
[1, [2, 3, 4], 5], [1, *[2, 3, 4], 5]

([1, [2, 3, 4], 5], [1, 2, 3, 4, 5])