# Занятие 2. Базовые контейнеры и встроенные функции

**Контейнеры** - типы данных, экземпляры (т.е. переменные этих типов данных) которых содержат в себе один или несколько других элементов.

- `list` - список
- `tuple` - кортеж
- `dict` - словарь
- `set` - множество

# list

**list** (cписок, массив, лист) - контейнер, в котором доступ к его элементам предоставляется по индексу (порядковому номеру). Можно добавлять, удалять и изменять элемента. Аналогичен `vector` из C++, но может содержать элементы разных типов (в том числе может содержать контейнеры).

Чтобы создать пустой список, можно использовать либо пустые квадратные скобки `[]`, либо использовать функцию `list()`:

In [None]:
a = []
b = list()

# убедимся, что два варианта создания пустого массива эквивалентны:
print(a == b)

True


Чтобы создать список с элементами, необходимо в квадратные скобки поместить элементы, разделяя их запятой:

In [None]:
list_example1 = [1, 0, 2.0, '3', [4]]

# Напечатаем наш список
print(list_example1)
print(type(list_example1))

[1, 0, 2.0, '3', [4]]
<class 'list'>


list

## Оператор `in`

**Оператор `in`**  используем чтобы проверить, присутствует ли в списке какой-либо элемент

In [None]:
print(list_example1)

[1, 0, 2.0, '3', [4]]


In [None]:
1.0 in list_example1

True

In [None]:
-1 in list_example1

False

In [None]:
3 in list_example1

False

Для проверки отсутствия элемента в списке удобно использовать оператор `not in`:

In [None]:
5 not in list_example1

True

In [None]:
"3" not in list_example1

False

Рассмотрим еще один пример:

In [None]:
2 in list_example1

True

**Замечание** - мы проверили ести ли элемент `2` (типа `int`) в нашем списке и получили `True`, но в списке есть только `2.0` (типа `float`). Python способен сравнивать числовые типы данных, например, `float` и `int`, и находить числовые элементы, игнорируя их тип. Аналогичное происходит с типом `bool`:

In [None]:
list_example1

[1, 0, 2.0, '3', [4]]

In [None]:
True in list_example1

True

In [None]:
False in list_example1

True

Еще пример:

In [None]:
list_example2 = [True, False]

In [None]:
1 in list_example2

True

In [None]:
0 in list_example2

True

In [None]:
2 in list_example2

False

## Функция `len`

Функция `len` - узнать количество элементов в контейнере (в том числе и в списке).

Можем прочитать элемент списка по его порядковому номеру в этом списке (индекс). Для доступа к элементы нужно после переменной списка в квадратных скобках указать индекс.

```
list_example1
[1, 0, 2.0, '3', [4]]

list_example1[0] # 1
```
В качестве индексов можно (и очень часто нужно) использовать переменные. Главное - чтобы они были типа int.

```
i = 0
list_example1[i]   # 1
```
Внутри квадратных скобок также можно использовать арифметические операции и вызывать функции:



```
list_example1[2 * i + int(1.0)]   # 0
```







Аналогично, можем изменять отдельные элементы списка:

In [None]:
 # Здесь и далее сепаратор '\t\t' и '\t' добавляется исключительно для красоты

print("До изменения:", list_example1, sep='\t\t')

list_example1[1] = -1
print("После изменения:", list_example1, sep='\t')

До изменения:		[1, 0, 2.0, '3', [4]]
После изменения:	[1, -1, 2.0, '3', [4]]


Индексы в Python могут быть и отрицательными! С помощью отрицательных индексов можно удобно получать доступ к элементам с конца списка. 

Например, чтобы получить последний и предпоследний элементы списка, можем использовать индексы `-1` и `-2`, соответственно:

In [None]:
print(list_example1)
print("Последний:", list_example1[-1], list_example1[len(list_example1) - 1], sep='\t')
print("Предпоследний:", list_example1[-2], list_example1[len(list_example1) - 2], sep='\t')

[1, -1, 2.0, '3', [4]]
Последний:	[4]	[4]
Предпоследний:	3	3


## Срезы

Списки так же поддерживают получение нескольких элементов с помощью **срезов** (slices) - способа получения элементов из определенного диапазона индексов с фиксированным шагом.

**Общий формат среза:** `variable[индекс_начала:индекс_конца_не_включая:шаг]`

In [None]:
list_example1

[1, -1, 2.0, '3', [4]]

In [None]:
list_example1[1:4:2]

[-1, '3']

Значение шага по умолчанию - `1`. Если не хотим его менять, можем его не указывать (включая последнюю `:`):

In [None]:
list_example1[1:4]

[0, 2.0, '3']

Значение начала по умолчанию - `0`:

In [None]:
list_example1[:4]

[1, -1, 2.0, '3']

Значения конца по умолчанию - последний индекс:

In [None]:
list_example1[1:]

[0, 2.0, '3', [4]]

Одно из интересных применений срезов - разворот списка:

In [None]:
list_example1

[1, -1, 2.0, '3', [4]]

In [None]:
list_example1[::-1]

[[4], '3', 2.0, -1, 1]

Срезы можно использовать не только для списков, но и для строк:

In [None]:
string = "Very long string with lots of words"

In [None]:
string[0::2]

'Vr ogsrn ihlt fwrs'

Срезы можно использовать и для изменения нескольких элементов списка:

In [None]:
list_example1

[1, 0, 2.0, '3', [4]]

In [None]:
list_example1[0:3:2]

[1, 2]

In [None]:
list_example1[0:3:2] = [1, 2]

In [None]:
list_example1

[1, 1, 2, 3, '3', [4]]

Заметьте, что мы заменили два подряд идущих элемента (с индексами 1 и 2) тремя новыми элементами. В Python это тоже возможно!

Списки можно складывать. Результатом сложения двух списков будет новый список, в котором сначала будут записаны элементы первого списка, затем - второго:

In [None]:
a = [1, 2, 3]
b = [4, 5, 6]

In [None]:
a + b

[1, 2, 3, 4, 5, 6]

In [None]:
b + a

[4, 5, 6, 1, 2, 3]

А вот вычитать нельзя:

In [None]:
a - b

TypeError: ignored

Многие действия с `list` выполняются с помощью методов. С некоторыми из них мы познакомимся сегодня. Более подробную информацию о методах списка можете найти здесь:
- [официальная документация](https://docs.python.org/3/tutorial/datastructures.html#more-on-lists) (англ)
- [краткий справочник](https://pythonworld.ru/tipy-dannyx-v-python/spiski-list-funkcii-i-metody-spiskov.html) (рус)

Чтобы добавить новый элемент в конец существующего списка, воспользуемся методом `append`:

In [None]:
list_example1

[1, 0, 2.0, '3', [4]]

In [None]:
list_example1.append("new_element")
list_example1

[1, 0, 2.0, '3', [4], 'new_element']

Удалить и получить элемент с конца массива можно с помощью `pop`:

In [None]:
list_example1

[1, 0, 2.0, '3', [4], 'new_element']

In [None]:
element = list_example1.pop()
element

'new_element'

In [None]:
list_example1

[1, 0, 2.0, '3', [4], 'new_element']

Можем не только по индексу получать элемент, но и наоборот - по значению найти где в списке такой элемент есть. Для этого использут метод `index`.

`L.index(element)` - возвращает индекс элемента `element` в списке `L`, если он там присутствует, иначе выдаст ошибку:

In [None]:
list_example1

[1, 1, 2, 3, '3', [4]]

In [None]:
list_example1.index('3')

4

Отсортировать массив можем двумя способами:

- с помощью функции `sorted`

In [None]:
list_example3 = [0, 1, True, 70.1, 90, 7, 8, 9, 1, 2, 3]

In [None]:
list_example3_sorted = sorted(list_example3)
list_example3_sorted

[90, 70.1, 9, 8, 7, 3, 2, 1, True, 1, 0]

In [None]:
list_example3

[0, 1, True, 70.1, 90, 7, 8, 9, 1, 2, 3]

- с помощью метода `sort`

In [None]:
sort_return = list_example3.sort()  # метод sort изменяет сам список, а не возвращает копию:
sort_return

In [None]:
list_example3

[0, 1, True, 1, 2, 3, 7, 8, 9, 70.1, 90]

Сортировать можно не только списки, состоящие из чисел:

In [None]:
list_example4 = ['11', '9', '4', '42', '8', 'a', 'bb', 'bac', 'символы']
sorted(list_example4)

['11', '4', '42', '8', '9', 'a', 'bac', 'bb', 'символы']

Сортировка списка строк выполняется по лексикографическому порядку.

А что насчет сортировки списка, состоящего из элементов разных типов? Увы, такая операция в общем случае не поддерживается:

In [None]:
list_example5 = [[1, 2], 1, 2]
sorted(list_example5)

TypeError: ignored

**Внимание!**

Если вы создаете новую переменную, равную другой изменяемой переменной, то обе переменные будут ссылаться на ту же область оперативной памяти. В результате изменение одной переменной повлечет за собой изменение и другой переменной.

Пример:

In [None]:
x = [1, 2, 3]
y = x
print("x:", x, sep='\t')
print("y:", y, sep='\t')

x:	[1, 2, 3]
y:	[1, 2, 3]


In [None]:
x.append(4.0)
print("x:", x, sep='\t')
print("y:", y, sep='\t')

x:	[1, 2, 3, 4.0]
y:	[1, 2, 3, 4.0]


Для проверки ссылаются ли переменные на одну и ту же область памяти удобно использовать функцию `id`:

In [None]:
id(x) == id(y)

True

или оператор `is`:

In [None]:
x is y

True

Если необходимо скопировать список, существует два основных способа:

- использовать срезы - это быстро и удобно, но копирование получится неглубоким:

In [None]:
y = x[:]
y

[1, 2, 3, 4.0]

In [None]:
id(x) == id(y)

False

Однако, это не сработает, если контейнер содержит другие контейнеры:

In [None]:
x = [1, 2, [3, 4]]
y = x[:]
y

[1, 2, [3, 4]]

In [None]:
id(x) == id(y)

False

In [None]:
id(x[2]) == id(y[2])

True

In [None]:
x[2].append("extra")
y[2]

[3, 4, 'extra']

- использовать встроенный модуль `copy` (это информация на будущее, модули разберем позже):

In [None]:
import copy

y = copy.deepcopy(x)
x[2] is y[2]

False

In [None]:
x[2].append("something_new")
y[2]

[3, 4, 'extra']

При изменении списка его `id` не меняется, т.е. он остается в той же области памяти:

In [None]:
print(id(x))
x.append("new_el")
print(id(x))

139736816893136
139736816893136


# tuple

**Tuple** (кортеж) - тип данных, который по сути является неизменяемым списком.

Создать кортеж можно с помощью круглых скобок:

In [None]:
tuple_example1 = (1, 2.0, '3', (4,))
print(tuple_example1)
print(type(tuple_example1))

(1, 2.0, '3', (4,))
<class 'tuple'>


**Замечание** - чтобы создать кортеж из одного элемента, необходимо после него поставить запятую:

In [None]:
tuple1 = (4)
tuple2 = (4,)

print(type(tuple1))
print(type(tuple2))

<class 'int'>
<class 'tuple'>


Возможно создать кортеж и без круглых скобок по бокам (по сути - будет присвоение "один ко многим"), но это порой ухудшает читаемость кода:

In [None]:
tuple_example2 = 'a', 5, 12.345, (2, 'b')
print(tuple_example2)
print(type(tuple_example2))

('a', 5, 12.345, (2, 'b'))
<class 'tuple'>


В Python возможно множественное присваивание:

In [None]:
a, b = 1, 2
a, b

(1, 2)

По сути, это эквивалентно:

In [None]:
(a, b) = (1, 2)
a, b

(1, 2)

Кортеж нельзя изменять. Давайте в этом убедимся:

In [None]:
tuple_example1

(1, 2.0, '3', (4,))

In [None]:
tuple_example1.append(5)

AttributeError: ignored

In [None]:
tuple_example1[0] = 9

TypeError: ignored

Но получать элементы по индексу и срезам, конечно, можно (кортеж тоже является `iterable`):

In [None]:
tuple_example1

(1, 2.0, '3', (4,))

In [None]:
tuple_example1[2]

'3'

In [None]:
tuple_example1.index('3')

2

In [None]:
tuple_example1[2:]

('3', (4,))

Как и list, кортежи можно складывать: 

In [None]:
tuple_example1 + tuple_example2

(1, 2.0, '3', (4,), 'a', 5, 12.345, (2, 'b'))

С кортежами можно делать все, что можно делать со списками, если это не изменяет кортеж:

In [None]:
len(tuple_example1)

4

In [None]:
1 in tuple_example1

True

**Вопрос** - зачем нужен tuple, если есть более удобный в использовании list?

**Преимущества кортежа:**

1. **Кортежи работают быстрее списков.** Если нужен константный массив, то лучше использовать кортежи.
2. **Защита данных от записи.** Кортежи позволяют явно защитить данные от изменений.
3. **Могут быть использованы как ключи для словарей.** Некоторые кортежи являются хэшируемыми, и поэтому могут использоваться в качестве ключей для словарей.

# Хеш-функция

**Хеш-функция** (англ. *hash function* от *hash* — "превращать в фарш", "мешанина") — специальная функция, осуществляющая преобразование массива входных данных **произвольной** длины в выходную битовую строку установленной длины, выполняемое определённым алгоритмом.

**Применение:**

- построение ассоциативных массивов (словари в Python)
- поиск дубликатов в наборах данных
- построение уникальных идентификаторов
- вычисление контрольных сумм от данных (сигнала) для обнаружения в них ошибок
- сохранение паролей

**Пример** - хеш-функция SHA-3:

![sha_3_example](https://habrastorage.org/r/w1560/getpro/habr/upload_files/834/ef2/809/834ef28098d1348e704e748a558fef67.jpeg)

Источник: [Хабр](https://habr.com/ru/post/534596/)



In [None]:
2 ** 256

115792089237316195423570985008687907853269984665640564039457584007913129639936

## Коллизии

В общем случае нет однозначного соответствия между хеш-кодом и исходными данными. Возвращаемые хеш-функцией значения менее разнообразны, чем значения входного массива.

**Коллизия** - случай, при котором хеш-функция преобразует более чем один массив входных данных в одинаковые хеш-коды.

"Хорошая" хеш-функция должна удовлетворять двум свойствам:

- быстрое вычисление
- минимальное количество коллизий

## Разрешение коллизий

В некоторых специальных случаях удаётся избежать коллизий вообще, например, если все ключи элементов известны заранее, то для них можно найти некоторую совершенную хеш-функцию, которая распределит их по ячейкам хеш-таблицы без коллизий.

Однако, коллизии в хеш-таблицах не так уж и редки. Поэтому механизм разрешения коллизий — важная составляющая любой хеш-таблицы.

Подробнее про хеш-функции можно почитать [здесь](https://habr.com/ru/post/534596/).

# dict

**Dict** (словарь, ассоциативный массив, хеш-таблица) - *key-value* хранилище, т.е. способен хранить пары объектов "ключ-значение" и получать значение объекта по его ключу. В качестве ключа может использоваться любой хэшируемый объект.

Аналогичен `map` из C++, но может работать с несколькими типами данных в рамках одного словаря.

Основные операции со словарем:
- добавить новую пару
- получить пару по ключу
- удалить пару по ключу

Выполнение операции в хеш-таблице начинается с вычисления хеш-функции от ключа. Получающееся хеш-значение $i=hash(key)$ - индекс в массиве $H$.

Создать словарь в Python можно либо с помощью фигурных скобок, либо с помощью функции `dict`:

In [None]:
dict_example = {'ivan': 100, 'peter': 200, -10: 'new', (1, -10): True}
print(dict_example)
print(type(dict_example))

{'ivan': 100, 'peter': 200, -10: 'new', (1, -10): True}
<class 'dict'>


In [None]:
dict_example = dict([
     ('ivan', 100),
     ('peter', 200),
     (-10, 'new'),
     ((1, -10), True)
])
print(dict_example)
print(type(dict_example))

{'ivan': 100, 'peter': 200, -10: 'new', (1, -10): True}
<class 'dict'>


In [None]:
dict_example = dict(
    ivan=100,
    peter=200,
    key='new'
)
print(dict_example)
print(type(dict_example))

{'ivan': 100, 'peter': 200, 'key': 'new'}
<class 'dict'>


In [None]:
dict_example = dict(
    ivan=100,
    peter=200,
    peter parker='new'
)
print(dict_example)
print(type(dict_example))

SyntaxError: ignored

Самым удобным способом создать словарь из двух списков (список ключей и список значений) является использование функции `zip`:

In [None]:
keys = ['ivan', 'peter', -10, (1, -10)]
values = [100, 200, 'new', True]

dict_example = dict(zip(keys, values))
print(dict_example)

{'ivan': 100, 'peter': 200, -10: 'new', (1, -10): True}


Ключом словаря может быть любой хешируемый (`hashable`) объект. Определение hashable из документации Python ([ссылка](https://docs.python.org/3/glossary.html#term-hashable)):

>Объект является хэшируемым, если у него имеется хеш-значение, которое **не меняется за все его время существования** (необходим метод **\_\_hash\_\_()**), и **может быть сравним с другими объектами** (необходим метод **\_\_eq\_\_()**). Хэшируемые объекты, которые являются равными, должны иметь одинаковое хеш-значение.



Посмотреть хеш-значение в Python можно с помощью функции `hash`. Примеры хеш-значений для разных типов:

In [None]:
hash(343)

343

In [None]:
hash(-343)

-343

In [None]:
hash(True)

1

In [None]:
hash('hello')

-1487066856015913251

In [None]:
hash((1, 2, 3))

2528502973977326415

**Внимание** - не все кортежи хешируемы! Необходимо еще услКортеж хешируем, если все его элементы тоже хешируемы:

In [None]:
hash((1, 2, (3, 4)))

-2725224101759650258

In [None]:
hash((1, 2, [3, 4]))

TypeError: ignored

**Внимание** - нужно быть очень аккуратным с хэшированием float и лучше их вообще не хэшировать:

In [None]:
hash(6.5)

1152921504606846982

In [None]:
hash(6.500000000000001)

1152921504606849030

In [None]:
hash(6.5000000000000001)

1152921504606846982

In [None]:
6.5 == 6.5000000000000001

True

In [None]:
hash(round(6.50443, 2))

1152921504606846982

**Замечание** - после перезапуска интерпретатора у сложных объектов (например, строк) будет уже другое значение хеш-функции.

In [None]:
password = "qwerty"
hash_password = hash(password)

test_password = "qserty"

if hash(test_password) == hash_password:

Для доступа к элементам словаря нужно передать ключ в квадратных скобках:

In [None]:
dict_example

{'ivan': 100, 'peter': 200, -10: 'new', (1, -10): True}

In [None]:
dict_example['ivan']

100

Изменение, добавление и удаление элементов так же происходит по ключам:

In [None]:
dict_example['ivan'] = 200
dict_example

{'ivan': 200, 'peter': 200, -10: 'new', (1, -10): True}

In [None]:
dict_example['ivan_the_great'] = 300
dict_example

{'ivan': 200, 'peter': 200, -10: 'new', (1, -10): True, 'ivan_the_great': 300}

In [None]:
del dict_example['ivan']
dict_example

{'peter': 200, -10: 'new', (1, -10): True, 'ivan_the_great': 300}

In [None]:
dict_example['ivan_the_greatest']

KeyError: ignored

Рассмотрим некоторые полезные методы словарей, полный список методов с описанием - [ссылка](https://python-reference.readthedocs.io/en/latest/docs/dict/).

Для безопасного получения значения из словаря используем методы `get` и `setdefault`:

In [None]:
dict_example

{'peter': 200, -10: 'new', (1, -10): True, 'ivan_the_great': 300}

In [None]:
key = 'basil'
res = dict_example.get(key, "default_value")
res

'default_value'

In [None]:
dict_example

{'peter': 200, -10: 'new', (1, -10): True, 'ivan_the_great': 300}

In [None]:
key = 'oleg'
res = dict_example.setdefault(key, "default_value")
res

'default_value'

In [None]:
dict_example

{'peter': 200,
 -10: 'new',
 (1, -10): True,
 'ivan_the_great': 300,
 'oleg': 'default_value'}

Можем получить все ключи и значения из словаря с помощью методов `keys`, `values` и `items`:

In [None]:
dict_example

{'peter': 200,
 -10: 'new',
 (1, -10): True,
 'ivan_the_great': 300,
 'oleg': 'default_value'}

In [None]:
dict_example.keys()

dict_keys(['peter', -10, (1, -10), 'ivan_the_great', 'oleg'])

In [None]:
dict_example.values()

dict_values([200, 'new', True, 300, 'default_value'])

In [None]:
dict_example.items()

dict_items([('peter', 200), (-10, 'new'), ((1, -10), True), ('ivan_the_great', 300), ('oleg', 'default_value')])

**Примечание** - ключи, значения и их пары возвращаются не в виде списка, а в виде служебных типов данных.

Можем объединить два словаря в один с помощью метода `update`:

In [None]:
dict_example2 = {1: 2, 2: 3, 3: 4}
dict_example3 = {3: 5, 4: 6, 5: 7}

In [None]:
dict_example2.update(dict_example3)
dict_example2

{1: 2, 2: 3, 3: 5, 4: 6, 5: 7}

# set

**Set** (множество) - набор уникальных объектов, аналогичен `ordered_set` из C++, но может содержать объекты разных типов. Можем добавлять и удалять элементы из множества, а также проверять наличие элемента в множестве. Принцип работы также основан на хеш-таблице.

Где удобно использовать множества:
- подсчет уникальных элементов в списке
- быстрая проверка элемента на вхождение

Для создания множества используются фигурные скобки и функция `set`:

In [None]:
set_example = {1, 2, 3}
print(set_example)
print(type(set_example))

{1, 2, 3}
<class 'set'>


In [None]:
set_example = set([2, 3, 4, 4])
print(set_example)
print(type(set_example))

{2, 3, 4}
<class 'set'>


**Замечание** - пустое множество создается только как `set()`, в случае `{}` создастся пустой словарь.

In [None]:
x = {}
print(type(x))

<class 'dict'>


Для добавления, удаления и проверки наличия элемента в множестве существуют методы `add` и `remove` и оператор `in`:

In [None]:
set_example = {1, '2', 3.0, 'four'}
set_example

{1, '2', 3.0, 'four'}

In [None]:
set_example.add(5)
set_example

{1, '2', 3.0, 5, 'four'}

In [None]:
set_example.remove(1)
print(set_example)

{3.0, 5, 'four', '2'}


In [None]:
'2' in set_example

True

In [None]:
1 in set_example

False

Поскольку множество содержит лишь **уникальные** элементы, то добавление одинаковых элементов не меняет множество:

In [None]:
set_example

{'2', 3.0, 5, 'four'}

In [None]:
set_example.add(1)
set_example

{1, '2', 3.0, 5, 'four'}

In [None]:
set_example.add(1)
set_example

{1, '2', 3.0, 5, 'four'}

In [None]:
set_example.add(1)
set_example.add(1)
set_example

{1, '2', 3.0, 5, 'four'}

## Задачка

Имеем множество:

In [None]:
s = {0, 1, 2}
s

{0, 1, 2}

Хотим добавить к нему `True`, `False` и `2.0`:

In [None]:
s.add(True)
s.add(False)
s.add(2.0)
s

{0, 1, 2}

Ожидаем увидеть множество: `{0, 1, 2, True, False, 2.0}`, но получили снова `{0, 1, 2}`.

**Вопрос** - почему множество не поменялось?

## Методы множеств

Рассмотрим основные методы множеств. С помощью метода `update` можем объединить два множества: 

In [None]:
a = {1, 2, 3}
b = set([2, 3, 4])

In [None]:
b.update(a) # объединить множество с другим множеством
print(a, b)

{1, 2, 3} {1, 2, 3, 4}


Помимо проверки на вхождение элемента в множество (`in`), имеются проверки на вхождения одного множества в другое:

In [None]:
b.issubset(a)    # является ли b подмножеством a

False

In [None]:
b.issuperset(a)  # является ли b надмножеством a

True

In [None]:
b.isdisjoint(a)  # являются ли непересекающимися

False

## Операции над множествами

In [None]:
a = {1, 2, 3, 5}
b = set([2, 3, 4, 5, 6])

print(a, b)

{1, 2, 3, 5} {2, 3, 4, 5, 6}


In [None]:
a - b  # все элементы a, которых нет в b

{1}

In [None]:
b - a  # все элементы b, которых нет в a

{4, 6}

In [None]:
a | b  # объединение множеств

{1, 2, 3, 4, 5, 6}

In [None]:
a & b  # пересечение

{2, 3, 5}

In [None]:
a ^ b  # все элементы, которые есть только в одном из двух множеств

{1, 4, 6}

Эти же операции можно использовать как методы объектов:

In [None]:
a.difference(b)             # a - b

{1}

In [None]:
a.union(b)                  # a | b

{1, 2, 3, 4, 5, 6}

In [None]:
a.intersection(b)           # a & b

{2, 3, 5}

In [None]:
a.symmetric_difference(b)   # a ^ b

{1, 4, 6}

In [None]:
a.difference_update(b)            # a -= b
a

{1}

In [None]:
a.update(b)                       # a |= b
a

{1, 2, 3, 4, 5, 6}

In [None]:
a.intersection_update(b)          # a &= b
a

{2, 3, 4, 5, 6}

In [None]:
a.symmetric_difference_update(b)  # a ^= b
a

{2, 3, 4, 5, 6}

Удаление элементов из множества осуществляется с помощью методов `remove` и `discard`:

In [None]:
a = {1, 2, 3}
a

{1, 2, 3}

In [None]:
a.remove(3)
a

{1, 2}

In [None]:
a.remove(3)
a

KeyError: ignored

In [None]:
a = {1,2,3}
a

{1, 2, 3}

In [None]:
a.discard(3)
a

{1, 2}

In [None]:
a.discard(3)
a

{1, 2}

Поскольку множество - изменяемый тип данных, его нельзя использовать в качестве ключа. Однако, у него есть свой аналог кортежа - **frozenset**, отличающееся лишь тем, что является неизменяемым:

In [None]:
s = {1, 2, 3}
fs = frozenset(s)

print(type(fs), fs)
print(type(s), s)

<class 'frozenset'> frozenset({1, 2, 3})
<class 'set'> {1, 2, 3}


In [None]:
d = {}
d[fs] = True
print(d[fs])

d[s] = False
print(d[s])

True


TypeError: ignored

In [None]:
d

{frozenset({1, 2, 3}): True}

# Дополнительные контейнеры

В Python имеется модуль `collections`, в котором содержится множество полезных, но редко используемых структур данных.

Хороший краткий обзор модуля collections можно почитать [здесь](https://pythonworld.ru/moduli/modul-collections.html) 

## defaultdict

Модификация словаря, которая позволяет автоматические создавать значения для отсутствующих ключей. Для этого необходимо передать в `defaultdict` имя функции, которая может принимать 0 аргументов:

In [None]:
from collections import defaultdict

dct = defaultdict(int)
dct

defaultdict(int, {})

In [None]:
dct[2], dct

(0, defaultdict(int, {2: 0}))

Вместо `int`, можно указывать и остальные функции, связанные с типами данных, например, `bool`, `list`, `float`: 

In [None]:
dct = defaultdict(list)
dct

defaultdict(list, {})

In [None]:
dct["random"]

[]

In [None]:
dct

defaultdict(list, {'random': []})

Забегая вперед, в качестве аргумента `defaultdict` удобно использовать лямбда-функции (анонимные функции):

In [None]:
dct = defaultdict(set)
dct["answer"]

set()

Подробнее мы познакомимся с функциями на следующем занятии.

## OrderedDict

C версии Python 3.7 сохранение порядка гарантируется и для `dict`, но операция сравнения для обычных диктов всё ещё не учитывает порядок в отличие от `OrderedDict`.

Кроме того, у `OrderedDict` есть метод `move_to_end` (подвинуть существующий элемент в конец), которого нет в обычном словаре.

In [None]:
from collections import OrderedDict

data1 = [(1, 'a'), (3, 'c'), (2, 'b')]
data2 = [(1, 'a'), (2, 'b'), (3, 'c')]

normal_dict1 = dict(data1)
ordered_dict1 = OrderedDict(data1)

normal_dict2 = dict(data2)
ordered_dict2 = OrderedDict(data2)

In [None]:
normal_dict1

{1: 'a', 3: 'c', 2: 'b'}

In [None]:
normal_dict2

{1: 'a', 2: 'b', 3: 'c'}

In [None]:
normal_dict1 == normal_dict2

True

In [None]:
ordered_dict1

OrderedDict([(1, 'a'), (3, 'c'), (2, 'b')])

In [None]:
ordered_dict2

OrderedDict([(1, 'a'), (2, 'b'), (3, 'c')])

In [None]:
ordered_dict1 == ordered_dict2

False

In [None]:
ordered_dict1.move_to_end(3)
ordered_dict1

OrderedDict([(1, 'a'), (2, 'b'), (3, 'c')])

In [None]:
ordered_dict1 == ordered_dict2

True

## deque

**deque** - сокращение от double ended queue (двухсторонняя очередь). Модификация списка, которая позволяет быстро добавлять в начало и конец или удалять их. Рассмотрим пример:

In [None]:
from collections import deque

dq = deque([1, 2, 3, 4, 5, 6])

In [None]:
dq.append('to_the_end')
dq

deque([1, 2, 3, 4, 5, 6, 'to_the_end'])

In [None]:
dq.appendleft('to_the_front')
dq

deque(['to_the_front', 1, 2, 3, 4, 5, 6, 'to_the_end'])

In [None]:
result = dq.pop()
result, dq

('to_the_end', deque(['to_the_front', 1, 2, 3, 4, 5, 6]))

In [None]:
result = dq.popleft()
result, dq

('to_the_front', deque([1, 2, 3, 4, 5, 6]))

In [None]:
dq[2]

3

In [None]:
lst = list(dq)
lst

[1, 2, 3, 4, 5, 6]

## Counter

Оставляю на разбор вам :) Ссылка на [документацию](https://docs.python.org/3/library/collections.html#collections.Counter).

# Условный оператор

В коде часто приходится проверять выполнимость или невыполнимость каких-то условий. Для этого используется условный оператор:

```python
if <условие1 (булевское выражение)> :
    <код, который выполнится, если условие верно>
elif <условие2 (булевское выражение)>:
    <код, который выполнится, если условие1 было неверно, а условие2 верно>
else:
    <код, который выполнится, если условие1 и условие2 были неверны>
```

Обратите внимание, что код, который должен выполняться внутри каждого условия, записывается с отступом в 4 пробела от уровня if, elif и else: в питоне области видимости переменных обозначаются отступами.

*То есть, отступы позволяют понять, где начинается код, который должен выполняться при выполнении условия в if, и где заканчивается*

Вместо условия (булевского выражения) можно подставить любой объект, который может быть приведен к типу `bool`.

**Пример:**

Пусть в нашем коде есть переменная `x`. Пусть мы хотим вывести на экран сообщение "x отрицателен", если x<0, "x равен нулю", если x=0 и "x положителен", если x>0. 

Код будет следующий:

In [None]:
x = -10

if x < 0:
    print("x отрицателен")
elif x == 0:
    print("x равен нулю")
elif x > 0:
    print("x положителен")
else:
    print("Что-то пошло не так...")
    
# этот код уже не "внутри" else, потому что записан без отступа в 4 пробела. Поэтому он выполнится 
# в любом случае после отработки if-elif-else
print("Done")

x отрицателен
Done


В качестве условия можно подставлять и более сложные булевские выражения:

In [None]:
age = 17

if age > 14 and age < 21:
    print(age)
    # тоже выполнится при выполнения условия после if, так как этот код тоже записан с отступом в 4 пробела
    print("you are a teenager")
elif age > 0 and age <= 14:
    print(age, "you are a kid")
else:
    print("you are an adult")

17
you are a teenager


In [None]:
age = 10

if 14 < age < 21:
    print(age)
    # тоже выполнится при выполнения условия после if, так как этот код тоже записан с отступом в 4 пробела
    print("you are a teenager")
elif 0 < age <= 14:
    print(age, "you are a kid")
else:
    print("you are an adult")

10 you are a kid


Внутрь `if` можно помещать и другой `if`:

In [None]:
x = 3
y = 5
if x == 3:
    if y > 6:
        # отступ в 4 пробела от внутреннего if
        print("y greater than 6")
    else:
        print("y not grater than 6")
        
    # отступ в 4 пробела от внешнего if, поэтому код выполнится если x==3 и при любом значении y
    print("x is equal to 3")

y not grater than 6
x is equal to 3


## Тернарный оператор

Если вы хотите использовать условный оператор лишь для получения одного значения, то удобно пользоваться тернарным оператором:

```python
[if_true] if [expression] else [if_false]
```

Рассмотрим это на примере проверки возраста:

In [None]:
age = 10

In [None]:
if age >= 18:
    result = "adult"
else:
    result = "child"
print(result)

child


In [None]:
result = 'adult' if age >= 18 else 'child'
print(result)

child


При использовании тернарных операторов в выражениях нужно быть аккуратным с порядком:

In [None]:
x, y = 3, 5

z = 3 + x if x > y else y
print(z)

z = 3 + (x if x > y else y) # Внимательнее с порядком вычислений
print(z)

5
8


Условия можно использовать подряд в тернарных операторах (но лучше не надо - ухудшает читаемость кода):

In [None]:
age = 15
'kid' if age < 13 else 'teenager' if age < 18 else 'adult'

'teenager'

Тернарный оператор можно представить в виде эквивалентного выражения:

In [None]:
nice = True

personality = "nice" if nice else "mean"
print("The cat is:", personality)

personality = ("mean", "nice")[nice]
print("The cat is:", personality)

The cat is: nice
The cat is: nice


# Циклы

Циклы в программирования позволяют выполнить набор команд некоторое (часто заранее неопределенное) количество раз.

В Python для этого есть два типа циклов.

## Цикл while

Часто необходимо продолжать выполнять какие-либо действия до тех пор, пока условие верно. Для этого пригождается циклы `while`. Его синтаксис выглядит следующим образом:

```python
while condition:
    do_something()
```

In [None]:
greetings = 0

while greetings < 3:
    print(greetings, 'Hello!')
    greetings = greetings + 1

0 Hello!
1 Hello!
2 Hello!


Для форсированного выхода (до достижения условия) из цикла используется оператор `break`:

In [None]:
i = 0
summ = 0

# Сумма первых 100 чисел
while True:
    i += 1
    summ += i
    if not i < 100:
        break

print(summ)

5050


In [None]:
help(sum)

Help on built-in function sum in module builtins:

sum(iterable, start=0, /)
    Return the sum of a 'start' value (default: 0) plus an iterable of numbers
    
    When the iterable is empty, return the start value.
    This function is intended specifically for use with numeric values and may
    reject non-numeric types.



**Замечания:**
1. хотелось бы назвать переменную для суммы как `sum`, но это имя стандартной функции, технически можно переопределить `sum` как переменную, но так крайне не рекомендуется делать
2. можно написать условие и действие на одной строке, если оно одно - это допустимо стилистически

Для форсированного перехода к следующей итерации цикла используется оператор `continue`:

In [None]:
i = 0
k = 5

summ = 0 # Сумма первых 100 чисел не кратных k  

while i < 100:
    i += 1
    if not i % k: continue  # not i % k эквивалентно i % k == 0
    
    summ += i

print(summ)

4000


В Python имеется конструкция `while-else`, которая проверяет был ли выход из цикла с помощью `break`:

In [None]:
numbers = [1, 3, 7, 8, 10, 6]
i = 0

while i < len(numbers):
    if numbers[i] == 5:
        print('Нашли пятёрку')
        break
    i += 1
else: # если break не сработал 
    print('Не нашли пятёрку')

Не нашли пятёрку


## Цикл for

В Python `for`-цикл устроен следующим образом:

```python
for variable in iterable_var:
    commands(varible)
```

`iterable_var` - переменная, являющаяся `iterable`. Это такой тип объектов, у которых можно запросить следующий их элемент с помощью метода `__next__` или функции `next()`.

Среди `iterable`-объектов выделяют **последовательности** (sequences), которые помимо получения следующего элемента могут выдавать элементы и по индексу.

**Примеры последовательностей:** 
- списки
- кортежи
- строки

**Примеры не-последовательностей:**
- множества
- словари
- генераторы


Примеры `for`-циклов по спискам, кортежам, строкам:

In [None]:
l = ['list', 1, 2, 3, 4, 5]

for item in l:
    print(item, end=' ')

list 1 2 3 4 5 

In [None]:
t = ('tuple', 1, 2, 3, 4, 5)
for item in t:
    print(item, end=' ')

tuple 1 2 3 4 5 

In [None]:
s = "string12345"

for item in s:
    print(item, end=' ')

s t r i n g 1 2 3 4 5 

Примеры `for`-циклов по множествам, словарям:

In [None]:
set_obj = {'set', 1, 2, 3, 4, 5}

for item in set_obj:
    print(item, end=' ')

(0, 1) (1, 2) (2, 3) (3, 4) (4, 5) (5, 'set') 

In [None]:
set_obj[0]

TypeError: ignored

In [None]:
d = {'dict': "value0", 1: "value1", 2: "value2", 3: "value3", 4: "value4", 5: "value5"}

for item in d.items():
    print(item, end=' ')

('dict', 'value0') (1, 'value1') (2, 'value2') (3, 'value3') (4, 'value4') (5, 'value5') 

**Примечание** - for-цикл для словаря выдаст ключи словаря, не значения.

Аналогично конструкции `while-else`, существует и конструкция `for-else`:

In [None]:
numbers = [1, 3, 7, 8, 5]

for n in numbers:
    if n == 5:
        print('Нашли пятёрку')
        break
        
else: # если break не сработал
    print('Не нашли пятёрку')

Нашли пятёрку


# range

Что делать, если просто хотим пройти по числам в диапазоне?

`range([start,] stop[, step])` возвращает неизменяемую последовательность чисел. 

По умолчанию `start=0`, `step=1`, и получаем `[0, stop)`. Помимо итерирования по `range`, можно проверять входит ли число в него:

In [None]:
for i in range(10, 1, -1):
    print(i)

10


In [None]:
r = range(1, 10, 2)
print(type(r), r)
print(list(r))
print(5 in r)

<class 'range'> range(1, 10, 2)
[1, 3, 5, 7, 9]
True


В результате пользоваться `for`-циклом можно пользоваться такими вариантами:

In [None]:
name_list = ['Alice', 'Bob', 'Charley']
for name in name_list:  # Перебираем элементы списка
    print('Hello, ' + name)

Hello, Alice
Hello, Bob
Hello, Charley


In [None]:
for i in range(len(name_list)):  # Перебираем индексы от 0 до L-1
    print('Hello, ' + name_list[i])

Hello, Alice
Hello, Bob
Hello, Charley


In [None]:
for pair in enumerate(name_list): # Перебираем пары индекс-элемент
    i, name = pair
    print(pair, i, name)

(0, 'Alice') 0 Alice
(1, 'Bob') 1 Bob
(2, 'Charley') 2 Charley


In [None]:
for i, name in enumerate(name_list): # Перебираем пары индекс-элемент
    print('Hello, ' + name_list[i] + "\t" + name)

Hello, Alice	Alice
Hello, Bob	Bob
Hello, Charley	Charley


In [None]:
i = 0
while i < len(name_list):
    print("Hello", name_list[i])
    i += 2


Hello Alice
Hello Charley


# list comprehensions

В Python есть очень удобная штука под названием list comprehension, выглядит она вот так:

```python
[выражение for var in iterable_var if condition]
```

Пример создания списка квадратов чётных чисел меньше 10:

In [None]:
result = [x ** 2 for x in range(10) if x % 2 == 0] # вот так можно создать список квадратов чётных чисел меньше 10
print(result, type(result))

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81] <class 'list'>


In [None]:
result = []
for x in range(10):
    if x % 2 == 0:
        result.append(x ** 2)
print(result)

[0, 4, 16, 36, 64]


Можно делать и вложенные list comprehension, но это ухудшает читаемость:

In [None]:
[(y, x) for x in range(2, 10) for y in range(x+1, 10) if y%x == 0]

[(4, 2), (6, 2), (8, 2), (6, 3), (9, 3), (8, 4)]

Аналогично существуют dict comprehension и set comprehension:

In [None]:
result = {x: x ** 2 for x in range(10)}
print(type(result), result)

<class 'dict'> {0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}


In [None]:
result = {x ** 2 for x in range(10)}
print(type(result), result)

<class 'set'> {0, 1, 64, 4, 36, 9, 16, 49, 81, 25}


In [None]:
string = "abc"

result = [string[i] for i in range(len(string)) if string[i] != 'c']
''.join(result)

'ab'

Увы, tuple comprehension не существует. Вместо это круглые скобочки дают нам генераторное выражение (generator expression), которые мы рассмотрим подробнее на следующем занятии:

In [None]:
result = [x if x != 7 else "error" for x in range(10)]
print(type(result), result)

<class 'list'> [0, 1, 2, 3, 4, 5, 6, 'error', 8, 9]


# itertools

В Python встрено огромное количество полезных модулей. В рамках нашего курса мы познакомимся с некоторыми из них.

Один из часто используемых модулей - модуль [itertools](https://docs.python.org/3/library/itertools.html).

Для того, чтобы подключить модуль, можно воспользоваться оператором импорта:

In [None]:
import itertools

Одна из функций этого модуля - функция `product`. Она позволяет удобно и лакончно записывать вложенные циклы разной глубины (цикл-в-цикле):

In [None]:
for i, j in itertools.product(range(2), "abc"):
    print(i, j)

Этот код эквивалентен следующему:

In [None]:
for i in range(2):
    for j in "abc":
        print(i, j)

Также можно применять для комбинаторики - перестановки, комбинации, комбинации с повторениями:

In [None]:
list(itertools.permutations([1, 2, 3]))

[(1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1)]

In [None]:
list(itertools.combinations([1, 2, 3], 2))

[(1, 2), (1, 3), (2, 3)]

In [None]:
list(itertools.combinations_with_replacement([1,2,3], 2))

[(1, 1), (1, 2), (1, 3), (2, 2), (2, 3), (3, 3)]

[Временная сложность операций](https://wiki.python.org/moin/TimeComplexity)