# Множество (set)

* **set** - множество. В нем нет одинаковых элементов. Его можно изменять.

* **frozenset** - множество. В нем нет одинаковых элементов. Его НЕЛЬЗЯ изменять.

**Порядок перебора элементов множества не определен.**

То есть в множестве определены операции **in**, **len**, возможен перебор **for .. in**, но нельзя взять i-тый элемент.

Можно взять `enumerate(a)`, но порядок перебора может быть разный.

## Создание множества

Множество пишем в {  }.

Пустое множество:
```python
a = set()   # только так
a = {}      # это НЕ множество, это словарь
```

Создаем множество:
```python
a = [1, 5, 17, 5, -22, 4, 4, 4]   # сделали list
print(a)                          # 1 5 17 5 -22 4 4 4
b = set(a)                        # сделали set из list
print(b)                          # 1 5 17 -22 4
c = {1, 5, 17, 5, -22, 4, 4, 4}   # сделали set
print(c)                          # 1 5 17 -22 4
```

## Что может быть элементом множества?

Только хешируемый объект. Т.е. объект, для которого определена функция **\_\_hash\_\_()** - она возвращает все время одно и то же значение на протяжении всей жизни объекта. Эти объекты можно сравнить на равенство, используя **\_\_eq\_\_()**

* int, float, str, tuple, frozenset - хешируемые объекты, могут быть добавлены в множество;
* list, dict, set - нехэшируемые, так как значение хеша зависит от значений их элементов (а они могут изменяться).

Хешируемый != неизменный. Объект класса Person может быть хешируемым, если в классе определена фукнция \_\_hash\_\_(). Она может возвращать, например, СНИЛС человека или любой другой его неизменяемый идентификатор.
При этом данные о человеке могут меняться (например, смена фамилии).


## Методы множества

```python
a = {1, 3, 5, 11, 12, 13}
b = {5, 1, 3, 21, 22, 23}
c = {1, 3, 5}
d = {3, 1, 5}
w = {2, 8}
```
| Операция | Значение | Результат |
|---|-----|---|
| a.add(7) | добавить 7 в множество a | |
| a.remove\(5\) | удалить 5 из a (если нет, KeyError exception)|{1, 3, 11, 12, 13}|
| a.discard\(5\) | удалить 5 из a если элемент есть |{1, 3, 11, 12, 13}|
| a.pop() | удаляет случайный элемент из множества (или KeyError, если множество пустое) | |
| a.clear() | удалить все элементы из а | |
| a.copy() | копия множества | |
| len(a) | число элементов в множестве | 6 |
| x in a | элемент х в множестве а | |
| x not in a | элемент х НЕ в множестве а | |
| a.**isdisjoint**(w) | True, если у множеств нет общих элементов | |
| c == d | множества с и d равны | |
| с &lt; a | c содержится в множестве a, но не равно ему | |
| c.issubset(a)<br/>с &lt;= a | c содержится в множестве a  | |
| a &gt; c | a содержит в себе c | |
| a.issuperset(c)<br/>a &gt;= c | a содержит в себе c, но не равно ему | |
| a.union(b)<br/>a &#124; b | объединение множеств (новое) | {1, 3, 5, 11, 12, 13, 21, 22, 23}|
| a.update(b)<br/>a &#124;= b | объединение множеств (изменяется а) | {1, 3, 5, 11, 12, 13, 21, 22, 23}|
| a.intersection(b)<br/>a &amp; b | пересечение множеств (новое) | {1, 3, 5} |
| a.intersection_update(b)<br/>a &amp;= b | оставляет во множестве а пересечение множеств а и b | {1, 3, 5} |
| a.difference(c)<br/>a - c | вычитание (новое множество) | {11, 12, 13} |
| a.difference_update(c)<br/>a -= c | удаляет из множества а все элементы, которые присутствуют в с | a = {11, 12, 13} |
| a.symmetric_difference(b)<br/>a ^ b | XOR (новое множество) | {11, 12, 13, 21, 22, 23} |
| a.symmetric_difference_update(b)<br/>a ^= b | XOR (изменяем а) | {11, 12, 13, 21, 22, 23} |


Применение множеств:
* убрать повторения;
* список уже обработанных имен и "уже обрабатывали?"

Если нет аргументов командной строки или указаны -h или --help:
```python
if len(sys.argv) == 1 or sys.argv[1] in {"-h", "--help"}
```


# Словарь (dict)

## Зачем нужны словари?

Если есть список дней недели, то мы по _номеру_ дня недели быстро получаем название дня недели.

Хотим решить обратную задачу - по строке названия дня недели получать его номер. Хотим решать быстрее, чем index.

Нужно получить пары "название дня недели" - "номер дня недели".

## Термины

**Словарь** - неупорядоченная коллекция пар ключ-значение.

* Неупорядоченная - значит порядок перебора не определен, нет понятие i-того элемента или среза.

* Ключ - **хешируемый** объект. Ключи **Уникальные**.

* Значение - любой объект.


In [2]:
weekdays = [None, 'Понедельник', 'Вторник', 'Среда', 'Четверг', 'Пятница', 'Суббота', 'Воскресенье']
weekdays[5]

'Пятница'

In [3]:
weekday_index = {
    'Понедельник': 1, 
    'Вторник': 2, 
    'Среда': 3, 
    'Четверг': 4, 
    'Пятница': 5, 
    'Суббота': 6, 
    'Воскресенье': 7
}
weekday_index['Пятница']

5

* Создание в { }
* Обращение к элементу в []

## Создание словаря

Пустой словарь:
```python
d1 = dict()
d2 = {}     # это словарь, а не множество
```
Непустой словарь:
**dict(d)** - shallow copy словаря d.

```python
d1 = dict({"id": 1948, "name": "Washer", "size": 3})        # литерал словаря
d2 = dict(id=1948, name="Washer", size=3)                   # именованные аргументы
d3 = dict([("id", 1948), ("name", "Washer"), ("size", 3)])  # из последовательности
d4 = dict(zip(("id", "name", "size"), (1948, "Washer", 3))) # из последовательности
d5 = {"id": 1948, "name": "Washer", "size": 3}              # из литерала словаря
```


In [5]:
capitals = {'Russia': 'Moscow', 'Ukraine': 'Kiev', 'USA': 'Washington', 'Myanmar':'Naypyidaw', 'Mongolia':'Ulaanbaatar', 'China':'Beijing'}
capitals = dict(Russia = 'Moscow', Ukraine = 'Kiev', USA = 'Washington', )
capitals = dict([("Russia", "Moscow"), ("Ukraine", "Kiev"), ("USA", "Washington")])
capitals = dict(zip(["Russia", "Ukraine", "USA"], ["Moscow", "Kiev", "Washington"]))
capitals

{'Russia': 'Moscow', 'Ukraine': 'Kiev', 'USA': 'Washington'}

In [7]:
# пишем красиво
capitals = {
    'Russia': 'Moscow', 
    'Ukraine': 'Kiev', 
    'USA': 'Washington', 
    'Myanmar':'Naypyidaw', 
    'Mongolia':'Ulaanbaatar', 
    'China':'Beijing'
}

**d.fromkeys(s, v)** - Возвращает словарь типа dict, ключами которого являются элементы последовательности s, а значениями либо None, либо v, если аргумент v определен.


In [9]:
d = {}.fromkeys ("ABCD", 3) # d == {'A': 3, 'B': 3, 'C': 3, 'D': 3}

## dict comprehensions

In [13]:
# словарь квадратов чисел
square1 = {x : x*x for x in range(10) }                             # dict comprehensions 
square2 = {0:0, 1:1, 2:4, 3:9, 4:16, 5:25, 6:36, 7:49, 8:64, 9:81}  # задаем явно пары ключ=значение

In [33]:
cities = ["Moscow", "Kiev", "Washington", "Minsk"]
states = ["Russia", "Ukraine", "USA", "Belarus"]
capitalsOfState = {state: city for city, state in zip(cities, states)}
capitalsOfState

{'Russia': 'Moscow',
 'Ukraine': 'Kiev',
 'USA': 'Washington',
 'Belarus': 'Minsk'}

## Перебор элементов словаря

In [34]:
print(capitalsOfState)
print(capitalsOfState.keys())
print(capitalsOfState.values())
print(capitalsOfState.items())

{'Russia': 'Moscow', 'Ukraine': 'Kiev', 'USA': 'Washington', 'Belarus': 'Minsk'}
dict_keys(['Russia', 'Ukraine', 'USA', 'Belarus'])
dict_values(['Moscow', 'Kiev', 'Washington', 'Minsk'])
dict_items([('Russia', 'Moscow'), ('Ukraine', 'Kiev'), ('USA', 'Washington'), ('Belarus', 'Minsk')])


In [35]:
for x in capitalsOfState:
    print(f'{capitalsOfState[x]} in {x}', end=', ')

Moscow in Russia, Kiev in Ukraine, Washington in USA, Minsk in Belarus, 

In [36]:
for x in capitalsOfState.keys():
    print(f'{capitalsOfState[x]} in {x}', end=', ')

Moscow in Russia, Kiev in Ukraine, Washington in USA, Minsk in Belarus, 

In [37]:
# отсортировав по ключам
for x in sorted(capitalsOfState.keys()):
    print(f'{capitalsOfState[x]} in {x}', end=', ')

Minsk in Belarus, Moscow in Russia, Washington in USA, Kiev in Ukraine, 

In [38]:
for x in capitalsOfState.values():
    print(x, end=', ')

Moscow, Kiev, Washington, Minsk, 

In [39]:
for k, v in capitalsOfState.items():
    print(f'{k}:{v}', end=', ')

Russia:Moscow, Ukraine:Kiev, USA:Washington, Belarus:Minsk, 

In [40]:
for k, v in sorted(capitalsOfState.items()):
    print(f'{k}:{v}', end=', ')

Belarus:Minsk, Russia:Moscow, USA:Washington, Ukraine:Kiev, 

## Выворачиваем словарь "наоборот"

По словарю страна:столица строим словарь столица:страна

In [43]:
stateByCapital = {capitalsOfState[state]: state for state in capitalsOfState}
stateByCapital

{'Moscow': 'Russia',
 'Kiev': 'Ukraine',
 'Washington': 'USA',
 'Minsk': 'Belarus'}

In [6]:
from pprint import pprint

print(capitals)

{'Russia': 'Moscow', 'Ukraine': 'Kiev', 'USA': 'Washington'}


In [44]:
square = {x : x*x for x in range(10) }                             # dict comprehensions 
square

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}

In [45]:
# написать по частям, рассказывая как конструируем
roots = {}
roots

{}

## Методы словарей

| Операция | Значение |
|--|---|
| value = A\[key\] | Получение элемента по ключу. Если элемента с заданным ключом в словаре нет, то возникает исключение KeyError |
| value = A.get(key) | Получение элемента по ключу. Если элемента в словаре нет, то get возвращает None. |
| value = A.get(key, *default_value*) | То же, но вместо None метод get возвращает default_value. |
| key in A | Проверить принадлежность ключа словарю. |
| key not in A | То же, что not key in A. |
| A\[key\] = value | Добавление нового элемента в словарь или изменяет старое значение на value |
| len(A) | Возвращает количество пар ключ-значение, хранящихся в словаре. |
| A.keys() | Возвращает список ключей |
| A.values() | Возвращает список значений (порядок в нем такой же, как для списка ключей) |
| A.items() | Возвращает список пар ключ, значение |


### get и []

In [48]:
# сколько кг фруктов есть в магазине
fruits = {'orange': 10, 'banana':16, 'apple': 20, 'grape': 5}

In [49]:
fruits['banana']

16

In [50]:
fruits.get('banana')

16

Если фрукта в магазине нет, то его 0 кг

In [51]:
fruits['mango']

KeyError: 'mango'

In [52]:
x = 'mango'
if x in fruits:
    print(fruits[x])
else:
    print(0)
    

0


In [53]:
fruits.get('mango', 0)

0

In [55]:
print(fruits.get('mango'))

None


In [56]:
fruits.get('mango', 'нет в наличии')

'нет в наличии'

## Тренируемся работать со словарями

Словарь фамилия:зарплата в тыс. руб.

* Открываем стартап, никого нет, d0
* В бригаде работает
| фамилия | зарплата |
|----|----|
| Иванов | 50 |
| Петров | 75 |
| Сидоров | 63 |

* Напечатать зарплатную ведомость
* Какая зарплата у Петрова?
* Иванову назначить зарплату 54 тыс.
* Добавить в бригаду Кузнецова с зарплатой 30
* Уволить Сидорова

## Фукнции с переменным числом аргументов, *args и **kwargs

Вспомним, что при вызове любой функции мы можем указать позиционные и именованные аргументы

In [92]:
def dist(x1, y1, x2, y2):
    dx = x1 - x2
    dy = y1 - y2
    return (dx * dx + dy * dy)**0.5

print(dist(1, 2, 4, 6))
print(dist(x1=1, y1=2, x2=4, y2=6))
print(dist(x1=1, x2=4, y1=2, y2=6))
print(dist(1, 2, x2=4, y2=6))

5.0
5.0
5.0
5.0


### Неизвестное количество позиционных аргументов

Напишем функцию, которая считает среднее арифметическое от всех переданных аргументов.

In [97]:
def average(*args):
    total = 0
    n = 0
    for x in args:
        print(f'{x=}')
        total += x
        n += 1
    return total / n

average(3, 17, 13, 14, 8)

x=3
x=17
x=13
x=14
x=8


11.0

* Название аргумента можно писать любое, договорились `args`, обязательно `*`
* До `*args` могут идти другие позиционные формальные параметры.

In [98]:
# в функции проблема, при вызове без аргументов делим на 0; напишем аргумент first
def average(first, *args):
    total = first
    n = 1
    for x in args:
        print(f'{x=}')
        total += x
        n += 1
    return total / n

average(3, 17, 13, 14, 8)

x=17
x=13
x=14
x=8


11.0

In [101]:
# В my_favorit_variable можно передать только именованный параметр
def average(first, *args, my_favorit_variable):
    total = first
    n = 1
    for x in args:
        print(f'{x=}')
        total += x
        n += 1
    print(f'{my_favorit_variable=}')
    return total / n

average(3, 17, 13, 14, my_favorit_variable=8)

x=17
x=13
x=14
my_favorit_variable=8


11.75

### Неизвестное количество именнованных аргументов

* Название аргумента можно писать любое, договорились `kwargs`, обязательно `**`
* До `**kwargs` могут идти другие позиционные формальные параметры и `*args`.

In [105]:
def foo(a, b, *args, **kwargs):
    print(f'{a=} {b=}')
    for x in args:                  # * нет
        print(x, end=' ')
    for k, v in kwargs.items():     # * нет
        print(f'{k}:{v}', end=' ')

foo(1, 2, 3, 4, 5, mango=10, apple=16)

a=1 b=2
3 4 5 mango:10 apple:16 

* `args` - список
* `kwargs` - словарь

Итого порядок:

* позиционные аргументы
* `*args`
* `**kwargs`

### Ещё о запаковке и распаковке pack и unpack

In [109]:
a = [3, -7, 'hello', 0.25]
print(a)      # print([3, -7, 'hello', 0.25])
print(*a)     # print(3, -7, 'hello', 0.25)

[3, -7, 'hello', 0.25]
3 -7 hello 0.25


In [114]:
d = {'mango':7, 'apple':16, 'banana':20}
print(d)
print(*d)

{'mango': 7, 'apple': 16, 'banana': 20}
mango apple banana


In [116]:
# в a положим список из всех остальных элементов (запаковка)
x, y, *a = (1, 2, 3, 4, 5, 6)
print(x, y, a)

1 2 [3, 4, 5, 6]


In [117]:
# если не хватит данных, список будет пустой
x, y, *a = (1, 2)
print(x, y, a)

1 2 []


In [118]:
# после неизвестного количества данных можно опять указать переменную
first, *a, last = map(int, input().split())
print(first)
print(a)
print(last)

 1 2 3 4 5 6


1
[2, 3, 4, 5]
6


In [123]:
def foo(a=1, b=0):
    print(f'a={a}')
    print(f'b={b}')

foo(**{'b':75, 'a':20})   # foo(b=75, a=20)

a=20
b=75


# Итераторы

* Доступ к содержимому агрегированных объектов без раскрытия их внутреннего представления;* Поддержкаи нескольких активных обходов одного и того же агрегированного объекта (желательно, но не обязательно)
* Представлениеия единообразного интерфейса с целью обхода различных агрегированных структур.

In [136]:
# for .. in .. одинаково для списка, кортежа, множества, словаря, строки, map...
a = [3, 'hello', -72, 0.25]
for x in a:
    print(x, end=' ')

3 hello -72 0.25 

Итератор — это интерфейс, предоставляющий доступ к элементам коллекции (массива или контейнера). Здесь важно отметить, что **итератор только предоставляет доступ, но не выполняет итерацию по ним**. Это может звучать довольно запутано, так что остановимся чуть подробнее. Тему итераторов можно разбить на три части:
* Итерируемый объект
* Итератор
* Итерация

**Итерируемым объектом** в Python называется любой объект, имеющий методы \_\_iter\_\_ или \_\_getitem\_\_, которые возвращают итераторы или могут принимать индексы. В итоге итерируемый объект это объект, который может предоставить нам итератор.

**Итератором** в Python называется объект, который имеет метод next (Python 2) или \_\_next\_\_. Вот и все. Это итератор. 

**Итерация** - это процесс получения элементов из какого-нибудь источника, например списка. Итерация - это процесс перебора элементов объекта в цикле. 


In [67]:
a = [3, 'hello', -72, 0.25]

* `a` - итерируемый объект
*  `iter(a)` - итератор
*  `next(a)` - получение очередного элемента итерируемого объекта

In [68]:
it = iter(a)
it

<list_iterator at 0x1d5ddb4b550>

In [69]:
x = next(it)
x

3

In [63]:
next(it)

'hello'

In [64]:
next(it)

-72

In [65]:
next(it)

0.25

In [66]:
next(it)

StopIteration: 

То есть `for x in a` это "синтаксический сахар" над вызовами `iter` и `next` для `a` 

Никаких задач на итераторы в курсе не будет. Только познакомились, что это такое.

# Генераторы

**Генераторы это итераторы, по которым можно итерировать только один раз**. 

Так происходит поскольку они не хранят все свои значения в памяти, а генерируют элементы "на лету". Генераторы можно использовать с циклом `for` или любой другой функцией или конструкцией, которые позволяют итерировать по объекту. В большинстве случаев генераторы создаются как функции. Тем не менее, они не возвращают значение также как функции (т.е. через **return**), в генераторах для этого используется ключевое слово **yield**. 

Мы знаем генераторы `map` и `range`.

Зачем? Чтобы не хранить ВСЕ значения в памяти, а давать их по мере необходимости. **Ленивые вычисления** - основа python.

In [71]:
# напишем свой генератор
def generator_function():
    for i in range(10):
        yield i

for item in generator_function():
    print(item, end=' ')

0 1 2 3 4 5 6 7 8 9 

Вычисление чисел Фибоначчи 1, 1, 2, 3, 5, 8, 13, 21...  $$f_n = f_{n-1} + f_{n-2}$$ $$f_0 = f_1 = 1$$

In [72]:
# generator version
def fibon(n):
    a = b = 1
    for i in range(n):
        yield a
        a, b = b, a + b
        
# использование:
for x in fibon(20):
    print(x, end=' ')

1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987 1597 2584 4181 6765 

In [73]:
# альтернатива - все числа поместить в список
def fibon_arr(n):
    a = b = 1
    result = []
    for i in range(n):
        result.append(a)
        a, b = b, a + b
    return result

print(fibon_arr(20))

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584, 4181, 6765]


### Связь генератора и итератора

Любая функция в Python, в теле которой встречается ключевое слово `yield`, называется генераторной функцией — при вызове она возвращает объект-генератор.

Объект-генератор реализует интерфейс итератора, соответственно с этим объектом можно работать, как с любым другим итерируемым объектом.

In [87]:
# бесконечный генератор
def fibon():
    a = b = 1
    while True:
        yield a
        a, b = b, a + b

gen = fibon()
next(gen)

1

In [84]:
next(gen)

1

In [85]:
next(gen)

2

In [86]:
next(gen)

3

In [89]:
for x in fibon():
    print(x, end=' ')
    if x > 1000:
        break

1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987 1597 

# Функции высших порядков

* Цель - уметь читать однострочники и понимать рецепты из интернета.
* Как сделать: при решении задач смотреть в форуме решений однострочники и разбирать, как они работают.

Фукнциями высших порядков назвают функции, которые принимают в виде аргумента другую функцию. *Именно не результат вызова, а функцию, как объект*.

Мы такие функции уже использовали:

In [124]:
a = [3, 567, -8, 0.1]
sorted(a, key=abs)  # аргументом передаем ссылку на фукнцию abs

[0.1, 3, -8, 567]

In [126]:
def last_digit(x):
    return abs(x) % 10
    # или
    # return str(x)[-1]

a = [3, 567, -8, -1]
sorted(a, key=last_digit)

[-1, 3, 567, -8]

In [134]:
words = '12 -32 144 76'.split()
print(words)
numbers = map(int, words)       # int - это функция
print(list(numbers))

['12', '-32', '144', '76']
[12, -32, 144, 76]


## map

**map**\(_function_to_apply_, _iterable_, _...\) - применяет функцию _function_to_apply_ ко всем элементам последовательности _iterable_. Если заданы дополнительные аргументы (последовательности), то функция _function_to_apply_ должна принимать столько аргументов, сколько последовательностей переданно далее в map.


In [137]:
words = '12 -32 144 76'.split()
print(words)
numbers = map(int, words)       # int - это функция
numbers

['12', '-32', '144', '76']


<map at 0x1d5df4ebd30>

In [138]:
print(numbers)

<map object at 0x000001D5DF4EBD30>


In [139]:
for x in numbers:
    print(x, end=' ')

12 -32 144 76 

In [140]:
# второй раз идти по map бесполезно - там ничего нет
for x in numbers:
    print(x, end=' ')

In [141]:
# Если нужно ходить по содержимому много раз, сделайте list
number_list = list(map(int, words))       # int - это функция
print(number_list)

[12, -32, 144, 76]


In [159]:
# функция возводит в квадрат
def square(x):
    return x * x

a = [4, 1, -5, 3, 9]
m = map(square, a)     # данные вычисляются по мере требования
for x in m:
    print(x, end=' ')

16 1 25 9 81 

In [160]:
# все данные лежат в памяти
b = [square(x) for x in a]
b

[16, 1, 25, 9, 81]

In [162]:
# то же самое, но через обычные циклы
b = []
for x in a:
    sqx = square(x)
    b.append(sqx)

b

[16, 1, 25, 9, 81]

In [164]:
# цепочка преобразований
# сумма квадратов (для ее вычисления не надо хранить все квадраты в памяти)
a = [4, 1, -5, 3, 9]
sum(map(square, a))     # данные вычисляются по мере требования

132

### map с несколькими последовательностями

$$ {\sum{a_i ^ {b_i}}}$$

In [150]:
a = [3, 5, 1, 10, 7, 2]
b = [4, 3, 25, 2, 1, 8]
def ipow(x, n):
    return x**n
sum(map(ipow, a, b))

570

In [151]:
# альтернатива через списки
c = [x**n for x, n in zip(a, b)]
sum(c)

570

## zip

**zip**(a, b, ...) - возвращает наборы элементов `((a[0], b[0], ...), (a[1], b[1], ..), (a[2], b[2], ...))`

Мы встречали при создании словарей

In [152]:
capitals = dict(zip(["Russia", "Ukraine", "USA"], ["Moscow", "Kiev", "Washington"]))
capitals

{'Russia': 'Moscow', 'Ukraine': 'Kiev', 'USA': 'Washington'}

In [153]:
countries = ["Russia", "Ukraine", "USA"] 
cities = ["Moscow", "Kiev", "Washington"]
for country, city in zip(countries, cities):
    print(f'Страна {country} со столицей {city}')

Страна Russia со столицей Moscow
Страна Ukraine со столицей Kiev
Страна USA со столицей Washington


![image.png](attachment:816e74c6-fb37-481a-bde6-551b22f5ce3a.png)

todo: перерисовать картинку из поколения python

## sum, min, max

* **sum**(seq) - сумма элементов последовательности *seq*
* **min**(seq) - минимальный элемент последовательности *seq*
* **max**(seq) - максимальный элемент последовательности *seq*

## filter

**filter**(func, sequence) - пропускает только те элементы из *sequence*, для которых *func(элемент) == True*. 

In [165]:
# оставим только положительные числа
def pos(x):
    return x > 0

a = [-3, 4, -11, -0.5, 21, 7]
list(filter(pos, a))

[4, 21, 7]

In [167]:
# то же через списки
b = [x for x in a if pos(x)]
b

[4, 21, 7]

In [168]:
# то же самое без list comprehention
b = []
for x in a:
    if pos(x):
        b.append(x)
b

[4, 21, 7]

## reduce

Сложим числа от 0 до 7. Перемножим числа от 1 до 7. Сравним код.
$$(((((((0+1)+2)+3)+4)+5)+6)+7)$$
$$((((((1*2)*3)*4)*5)*6)*7)$$

In [170]:
(((((((0+1)+2)+3)+4)+5)+6)+7)

28

In [171]:
((((((1*2)*3)*4)*5)*6)*7)

5040

In [172]:
numbers = [1, 2, 3, 4, 5, 6, 7]

total = 0
product = 1

for num in numbers:
    total += num
    product *= num

print(total)
print(product)

28
5040


* Результат накапливается в аккумуляторе acc
* начиная с первого элемента initial_value
* перебирая последовательность items
* над аккумулятором и очередным элементом выполняется операция operation

In [173]:
# это operation для сложения
def add(acc, val):
    return acc + val

# это operation для умножения
def mult(acc, val):
    return acc * val

numbers = [1, 2, 3, 4, 5, 6, 7]

def reduce(operation, items, initial_value=0):
    acc = initial_value
    for num in items:
        acc = operation(acc, num)
    return acc

print(reduce(add, numbers))
print(reduce(mult, numbers, 1))

28
5040


Вы посмотрели, что под капотом у фукнции 
`functools.reduce(func, iterable, initializer=None)`

Если начальное значение не задано, берется первое значение из последовательности iterable.


In [176]:
from functools import reduce

def func(a, b):
    return a + b

numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
total = reduce(func, numbers, 0)   # в качестве начального значения 0
print(total)

55


In [175]:
total = reduce(func, numbers)   # можно было суммировать без указания начального значения
print(total)

55


## Модуль operator

Чтобы не писать функции для стандартных математических операций, используйте функции, определенные в модуле `operator`

| Операция | Фукнция |
|----|----|
| `obj in seq` | `contains(seq, obj)` |
| `a + b` | `add(a, b)` |
| `a - b` | `sub(a, b)` |
| `a * b` | `mul(a, b)` |
| `a / b` | `truediv(a, b)` |
| `a // b` | `floordiv(a, b)` |
| `a % b` | `mod(a, b)` |
| `a ** b` | `pow(a, b)` |
| `-a` | `neg(a)` |
| `a == b` | `eq(a, b)` |
| `a != b` | `ne(a, b)` |
| `a < b` | `lt(a, b)` |
| `a <= b` | `le(a, b)` |
| `a > b` | `gt(a, b)` |
| `a g= b` | `ge(a, b)` |

In [183]:
from functools import reduce
from operator import add, mul

# это можно заменить на sum(range(7+1)
total = reduce(add, range(7+1))   # в качестве начального значения 0
print(total)

# а произведение придется писать так:
total = reduce(mul, range(1, 7+1))   # в качестве начального значения 0
print(total)

28
5040


## enumerate

In [184]:
a = [7, 12, -3, 5]
for i, x in enumerate(a):
    print(f'{i=}, {x=}')

i=0, x=7
i=1, x=12
i=2, x=-3
i=3, x=5


## all

`all(seq)` - `True`, если все элементы `seq` равны (приводятся к) `True`

То же самое, что:
```python
def all(iterable):
    for element in iterable:
        if not element:
            return False
    return True
```


In [185]:
all([True, True, True])

True

In [186]:
all([True, False, True])

False

In [187]:
print(all([1, 2, 3]))   
print(all([1, 2, 3, 0, 5]))
print(all([True, 0, 1]))
print(all(('', 'red', 'green')))
print(all({0j, 3+4j}))

True
False
False
False
False


In [188]:
# при проверке словаря проверяются ТОЛЬКО КЛЮЧИ
dict1 = {0: 'Zero', 1: 'One', 2: 'Two'}
dict2 = {'Zero': 0, 'One': 1, 'Two': 2}

print(all(dict1))
print(all(dict2))

False
True


## any

`any(seq)` - `True`, если хотя бы один элемент `seq` равны (приводятся к) `True`

То же самое, что:
```python
def any(iterable):
    for element in iterable:
        if element:
            return True
    return False
```


In [190]:
print(any([False, True, False]))       #  возвращает True, так как есть хотя бы один элемент, равный True
print(any([False, False, False]))      #  возвращает False, так как нет элементов, равных True

True
False


In [191]:
print(any([0, 0, 0]))
print(any([0, 1, 0]))
print(any([False, 0, 1]))
print(any(['', [], 'green']))
print(any({0j, 3+4j, 0.0}))

False
True
True
True
True


## lamda-выражения или анонимные фукнции

Функции, у которых нет имени.

Мы часто писали отдельные функции, которые выполняли что-то очень простое. Сложить два числа, из кортежа взять последний элемент, из целого числа взять единицы и тп.

Можно такие "мелкие" функции определять сразу в выражении, а не писать отдельно.

**Лямбда-функции** - это функции, для создания которых используется следующий синтаксис:

```python
lambda parametes: expression
```

_parameters_ - не обязательная часть. Обычно позиционые переменные через запятую. Можно использовать полный синтаксис, который допустим в def.

_expression_ :
* нельзя условные операторы или циклы (можно условные выражения);
* нельзя **return** или **yield**

Результатом лямбда-выражения является анонимная функция. При ее вызове вычисляется значение _expression_ при указанных значениях параметров. 

Если выражение _expression_ - кортеж, то он должен быть заключен в круглые скобки `()`

Пример: лямбда-функция, которая добавляет 's' если аргумент не 1 (окончание множественного числа).

In [194]:
def s_func(x):
    if x == 1 or x == 0:
        return ''
    else:
        return 's'

s = lambda x: "" if x == 1 or x == 0 else "s"                     # Анонимная функция присваевается переменной s.
count=7
print(f"{count} file{s(count)} processed")   # использование этой функции

count=1
print(f"{count} file{s(count)} processed")   # использование этой функции

7 files processed
1 file processed


Везде, где раньше мы передавали функцию, можем передать lambda-выражение:

* key в sort, sorted, min, max
* в map, filter, reduce, и т.д.

### Точно не нужно return?

Не нужно. Эти две функции вычисления площади треугольника по основаниию b и высоте h вызываются одинаково:

In [195]:
def area_func(b, h):
    return 0.5 * b * h

area = lambda b, h: 0.5 * b * h

print(area_func(6, 5))
print(area(6, 5))

15.0
15.0


### PEP-8 и лямбда-функции

Если код нужно использовать повторно (вызывать по имени), и функция пишется в одну строку, то лучше написать обычную функцию через `def`, а не использовать анонимную функцию (лямбду).

In [197]:
# плохо
area = lambda b, h: 0.5 * b * h

# хорошо
def area(b, h):
    return 0.5 * b * h

## Связки фукнций

### Пример лямбда-функции - сортировка по ключу

Пусть у нас есть список кортежей, которые описывают химические элементы (номер группы, порядковый номер, название).

In [199]:
elements = [(2, 12, "Mg"), (1, 11, "Na"), (1, 3, "Li"), (2, 4, "Be")]
print(sorted(elements))

[(1, 3, 'Li'), (1, 11, 'Na'), (2, 4, 'Be'), (2, 12, 'Mg')]


In [200]:
# не хотим учитывать группу, хотим по номеру элемента
sorted(elements, key=lambda e: (e[1], e[2]))   # не забываем про () если возвращаем кортеж

[(1, 3, 'Li'), (2, 4, 'Be'), (1, 11, 'Na'), (2, 12, 'Mg')]

In [201]:
# сначала по названию (приведем к нижнему регистру), потом по порядковому номеру
sorted(elements, key=lambda e: (e[2].lower(), e[1]))

[(2, 4, 'Be'), (1, 3, 'Li'), (2, 12, 'Mg'), (1, 11, 'Na')]

### defaultdict - словари со значением по умолчанию

Если элемента нет, то возвращается заданное значение по умолчанию.

In [204]:
import collections
minus_one_dict = collections.defaultdict(lambda: -1)
point_zero_dict = collections.defaultdict(lambda: (0, 0))
message_dict = collections.defaultdict(lambda: "No message available")

message_dict['hello'] = 'Здравствуйте'
print(message_dict['hello'])
print(message_dict['bye'])

Здравствуйте
No message available


### фильтры

In [210]:
number_list = range(-5, 5)
less_than_zero = list(filter(lambda x: x < 0, number_list))
print(*less_than_zero)

div3 = filter(lambda x: x % 3 == 0, range(-10, 10))
print(*div3)

-5 -4 -3 -2 -1
-9 -6 -3 0 3 6 9


### Пример: скалярное умножение векторов

$$\sum{a_i \cdot b_i}$$

In [215]:
a = [2, 4, -1]
b = [3, 1, 5]
print(sum(map(lambda z: z[0] * z[1], zip(a, b))))

5


### Пример: транспонирование матрицы

In [217]:
martix = [['a','b','c'],
          ['d', 'e', 'g'],
          ['n', 'x', 'y']]

matrix_rotate = tuple(zip(*martix))

for _ in matrix_rotate:
    print(list(_))

['a', 'd', 'n']
['b', 'e', 'x']
['c', 'g', 'y']


In [222]:
# по шагам:
print(*martix)

['a', 'b', 'c'] ['d', 'e', 'g'] ['n', 'x', 'y']


In [221]:
print(*zip(*martix))

('a', 'd', 'n') ('b', 'e', 'x') ('c', 'g', 'y')


### join для не строк

In [223]:
','.join(['Ann', 'Bob', 'Mike'])

'Ann,Bob,Mike'

In [226]:
';'.join([12, -3, 0.5])

TypeError: sequence item 0: expected str instance, int found

In [227]:
';'.join(map(str, [12, -3, 0.5]))

'12;-3;0.5'