# Занятие 2:
## Контейнеры

### Контейнерные типы
Основные контейнеры (т.е. объекты содержащие в себе набор других объектов)
- `list` - список. Упорядоченный набор элементов с доступом по числовому индексу.
- `tuple` - кортеж (неизменяемый список). То же что и список, но создаётся один раз и далее не меняется.
- `dict` - словарь (отображение). Неупорядоченный набор пар ключ - значение с доступом по ключу. Ключи должны быть уникальными.
- `set` - множество. Неупорядоченный набор уникальных элементов.

### Контейнерные типы: список `list` и операции с ним
Список представляет собой упорядоченный набор произвольных элементов (не обязательно одного типа, но *как правило* одного).

#### Определение и индексация

In [None]:
# определяем список l1 из нескольких элементов просто перечисляя их через запятую внутри квадратных скобок:
l1 = [1, True, 'qwerty', 44, '$']
print(l1, type(l1))
# также можно задавать пустой список
l_empty = []
print(l_empty, type(l_empty))

[1, True, 'qwerty', 44, '$'] <class 'list'>
[] <class 'list'>


к элементам есть доступ по индексу, т.е. по их номеру в наборе через квадратные скобки [], индексация идёт с нуля. 
Элемент с индексом 0 первый в списке, с индексом 1 второй и тд.

In [None]:
print(l1[0]) 
print(l1[1])
print(l1[2])

1
True
qwerty


при этом отрицательные индексы считаются с конца списка: -1 это последний элемент, -2 предпоследний и тд.

In [None]:
print(l1[0])
print(l1[-1])
print(l1[-2])

1
$
44


по индексу можно не только читать, но и записывать отдельные элементы

In [None]:
l1 = [1, True, 'qwerty', 44, '$']
print(l1)  # печатаем исходное состояние списка
l1[0] = 'zero'  # записываем на нулевой индекс списка новое значение
print(l1)  # печатаем изменённый список

[1, True, 'qwerty', 44, '$']
['zero', True, 'qwerty', 44, '$']


Длину (количество элементов) спика можно узнать с помощью функции `len()`

In [None]:
print(len(l1))

5


#### Срезы (выборки по индексам)
Списки в Python поддерживают т.н. срезы (slices), позволяющие делать из них разнообразные выборки по индексам. 
```Python
l1 = l[start:]
```
Этот пример выберет из списка `l` элементы с индексами большими либо равными индексу `start`, создаст новый список и запишет его в переменную `l1`.
```Python
l2 = l[:stop]
```
Этот пример выберет из списка `l` элементы с индексами меньшими индекса `stop`, создаст новый список и запишет его в переменную `l2`.
```Python
l3 = l[::step]
```
Этот пример выберет из списка `l` элементы с индексами идущими через шаг `step` (т.е. при `step == 1` все элементы `l`, при `step == 2` элементы идушие через один, при `step == 3` через два и тд.), создаст новый список и запишет его в переменную `l3`.

Полный синтаксис операции среза выглядит так:
```Python
l[start:stop:step]
```
Эта операция выберет из списка `l` элементы с индексами начиная со `start` (включительно), до `stop` (исключительно) с шагом по индексу `step`.
При этом операция среза не модифицирует исходный список, а создаёт новый, но ссылаясь на те же элементы.

Приведём несколько примеров:

In [None]:
l2 = [11, 22, 33, 44, 55, 66, 77, 88, 99, 100]  # задаём список
print(l2)  # печатаем список
# обрезаем слева
l2_1 = l2[4:]
print(l2_1)
# обрезаем справа
l2_2 = l2[:4]
print(l2_2)
# выбираем элементы через один
l2_3 = l2[::2]
print(l2_3)

[11, 22, 33, 44, 55, 66, 77, 88, 99, 100]
[55, 66, 77, 88, 99, 100]
[11, 22, 33, 44]
[11, 33, 55, 77, 99]


Комбинации срезов

In [None]:
# выбираем элементы с нечётными индексами
l2_4 = l2[1::2]
print(l2_4)
# оставляем последние 5 элементов списка
l2_5 = l2[-5:]
print(l2_5)
# элементы с нечётными индексами с третьего по седьмой
l2_6 = l2[3:7:2]
print(l2_6)

[22, 44, 66, 88, 100]
[66, 77, 88, 99, 100]
[44, 66]


#### Операции со списками

In [None]:
l1 = ['one', 'two', 'three']
l2 = ['раз', 'два', 'три']
print(l1, l2)

# арифметическое сложение соединяет (конкатенирует) два списка
l3 = l1 + l2
print(l3)

['one', 'two', 'three'] ['раз', 'два', 'три']
['one', 'two', 'three', 'раз', 'два', 'три']


С помощью `.` вызываются встроенные функции (методы) объекта. Подробнее об этом будет позже, пока приведём список полезных встроенных функций типа `list`

In [None]:
l1 = ['one', 'two', 'three']
l2 = ['раз', 'два', 'три']
print(l1, l2)
# append добавляет элемент в конец списка. Этот метод изменяет оригинальный список!
l1.append('four')
print('append', l1)
# extend дополняет список элементами другого списка. Этот метод изменяет оригинальный список!
l1.extend(l2)
print('extend', l1)
# insert вставляет на указанную позицию (в данном случае индекс 2) новый элемент. Этот метод изменяет оригинальный список!
l1.insert(2, 'two-and-a-half')
print('insert', l1)
# remove удаляет первый элемент в списке имеющий заданное значение. Этот метод изменяет оригинальный список!
l1.remove('three')
print('remove', l1)
# pop удаляет элемент с заданным индексом и возвращает его значение
popped_el = l1.pop(4)
print('pop', popped_el, l1)

['one', 'two', 'three'] ['раз', 'два', 'три']
append ['one', 'two', 'three', 'four']
extend ['one', 'two', 'three', 'four', 'раз', 'два', 'три']
insert ['one', 'two', 'two-and-a-half', 'three', 'four', 'раз', 'два', 'три']
remove ['one', 'two', 'two-and-a-half', 'four', 'раз', 'два', 'три']
pop раз ['one', 'two', 'two-and-a-half', 'four', 'два', 'три']


In [None]:
# добавим элементы оригинального l2 ещё и в начало списка для наглядности следующих методов
l1 = l2 + l1
print(l1)
# count возвращает количество элементов в списке с заданным значением
count_dva = l1.count('два')
print(count_dva)
# index возвращает индекс первого элемента в списке с заданным значением
idx_dva = l1.index('два')
print(idx_dva)
# copy создаёт копию исходного списка собранную из тех же элементов.
l1_cp = l1.copy()
print(l1, l1_cp)
# sort сортирует элементы списка. Этот метод изменяет оригинальный список!
l1.sort()
print(l1)

['раз', 'два', 'три', 'four', 'one', 'two', 'two-and-a-half', 'два', 'два', 'раз', 'три', 'три']
3
1
['раз', 'два', 'три', 'four', 'one', 'two', 'two-and-a-half', 'два', 'два', 'раз', 'три', 'три'] ['раз', 'два', 'три', 'four', 'one', 'two', 'two-and-a-half', 'два', 'два', 'раз', 'три', 'три']
['four', 'one', 'two', 'two-and-a-half', 'два', 'два', 'два', 'раз', 'раз', 'три', 'три', 'три']


### Контейнерные типы: множество `set` и операции с ним
Множество - это неупорядоченный набор уникальных элементов.

**Неупорядоченный набор** означает что при добавлении в `set` элементов, они вставляются в произвольное место. Также это означает что `set` не поддерживает доступ к отдельным элементам по индексу через `[]` как это можно делать со списками.

In [None]:
s1 = {1, 2, 3}  # задаём множество перечислением элементов в фигурных скобках
print(s1)
# если среди перечисленных элементов есть повторяющиеся, интерпретатор сам уберёт повторы
s1 = {1, 3, 2, 3, 2, 1, 2, 3}
print(s1)

{1, 2, 3}
{1, 2, 3}


#### Операции с множествами: 

In [None]:
s1 = {1, 2, 3, 4, 5}
# добавление элемента
s1.add('new_el')
print(s1)
# удаление элемента по значению — выдаёт ошибку если этого элемента нет в множестве
s1.remove(2)
print(s1)
# удаление элемента по значению — если этого элемента нет в множестве, не делает ничего
s1.discard(30)
s1.discard(1)
print(s1)
# удаление произвольного элемента из множества
s1.pop()
print(s1)

{1, 2, 3, 4, 5, 'new_el'}
{1, 3, 4, 5, 'new_el'}
{3, 4, 5, 'new_el'}
{4, 5, 'new_el'}


Логические операции и сравнения множеств:

In [None]:
s1 = {1, 2, 3}
s2 = {1, 2, 3, 4, 5}
s3 = {1, 3, 5}

# union – объединение. создаёт новое множество составленное из элементов двух исходных
s13 = s1.union(s3)
print('union', s1, s3, s13)
# intersection – пересечение. создаёт новое множество составленное только из общих элементов двух исходных
s1i3 = s1.intersection(s3)
print('intersection', s1, s3, s1i3)
# symmetric_difference – разница. создаёт новое множество составленное из элементов исходных множеств, не являющихся общими
s1d3 = s1.symmetric_difference(s3)
print('symmetric_difference', s1, s3, s1d3)

union {1, 2, 3} {1, 3, 5} {1, 2, 3, 5}
intersection {1, 2, 3} {1, 3, 5} {1, 3}
symmetric_difference {1, 2, 3} {1, 3, 5} {2, 5}


- `==`, `!=`: равняется, не равняется. Если у двух множеств совпадают и равны все элементы, то множества равны
- `>`, `<`, `<=`, `>=`: проверки вида "является ли одно множество подмножеством другого". `a > b` даёт `True` если все элементы `b` содержатся в `a`.

In [None]:
s1 = {1, 2, 3}
s2 = {1, 2, 3, 4, 5}
s3 = {1, 3, 5}
s4 = {1, 2, 3}
# равенство, неравенство множеств
print(s1 == s4, s1 != s2)
# проверка является ли одно множество подмножеством другого
print(s1 < s2, s1 < s3)

True True
True False


### Контейнерные типы: словарь `dict` и операции с ним
Словарь это неупорядоченный набор пар ключ-значение, причём ключи являются уникальными. 
Можно представлять себе `dict` как таблицу из двух столбцов: keys, values. Например:
| keys | values |
|---|---|
| `'a'` |  `True`  |
| `'b'` |  `False` |
| `'c'` |  `True`  |

Передавая словарю ключ через квадратные скобки `[]` можно получить соответствующее ему значение.

In [None]:
d1 = {'a': 1, 'b': 2, 'c': 3}  # задаём переменную d1 как словарь
# получаем элемент соответствующий ключу 'a'
print('a:', d1['a'])
# получаем элемент соответствующий ключу 'b'
print('b:', d1['b'])
# так же как и в list элементы можно записывать 
print(d1)  # печатаем словарь до внесения изменений
d1['a'] = 'AAAAA'  # перезаписали элемент соответствующий ключу 'a'
d1['d'] = 4  # создали новый ключ 'd' и записали соответствующее ему значение
print(d1)  # печатаем словарь после внесения изменений

a: 1
b: 2
{'a': 1, 'b': 2, 'c': 3}
{'a': 'AAAAA', 'b': 2, 'c': 3, 'd': 4}


#### Операции со словарями

In [None]:
d1 = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}
# можно получить все ключи или все значения имеющиеся в словаре
print(d1.keys(), d1.values())
# также можно представить словарь в виде набора пар (кортежей) ключ-значение
print(d1.items())

dict_keys(['a', 'b', 'c', 'd', 'e']) dict_values([1, 2, 3, 4, 5])
dict_items([('a', 1), ('b', 2), ('c', 3), ('d', 4), ('e', 5)])


### Универсальные операции с контейнерами

#### Функция `len`
Размер контейнера можно узнать операцией `len`. Работает для `list`, `set`, `dict`, `tuple`

In [None]:
print(l1, len(l1))
print(d1, len(d1))
print(s1, len(s1))

[1, True, 'qwerty', 44, '$'] 5
{'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5} 5
{1, 2, 3} 3


#### Ключевое слово `in`, `not in`
Для всех перечисленных контейнеров работает универсальный способ проверить содержится ли в них тот или иной элемент.
Делается это с помощью ключевого слова `in` (содержится) или `not in` (не содержится).

In [None]:
l1 = [1, True, 'qwerty', 44, '$']
x = 23
print(1 in l1)
print('qwerty' in l1)
print('qwerty' not in l1)
print(x in l1)

True
True
False
False


### Цикл `for`: перебор элементов контейнера
Цикл `for` выглядит следующим образом:
```Python
for el in CONTAINER:
    BLOCK1
else:
    BLOCK2
```
Проходя этот цикл программа будет последовательно выбирать значения элементов контейнера `CONTAINER`, записывать их в переменную `el` (название переменной может быть любое) и выполнять блок кода `BLOCK1` для каждого из значений. В роли контейнера может выступать любой `iterable` (перечислимый) объект Python, например, приведённые выше `list`, `tuple`, `set`, `dict`. Блок `else` работает аналогично циклу `while`: если выход из цикла был произведен с помощью `break`, то `BLOCK2` не выполнится, а если выход из цикла произошёл поскольку в контейнере были перебраны все элементы, то `BLOCK2` выполнится. 

#### Примеры использования цикла `for`

In [None]:
# печатаем все элементы списка
l1 = [1, True, 'qwerty', 44, '$', [1, 2, 3]]  # задаём список
for el in l1:  # на каждой итерации цикла в переменную el будет записан следующий элемент списка l1 начиная с нулевого
    print(el)  # печатаем значение el на данной итерации

1
True
qwerty
44
$
[1, 2, 3]


In [None]:
# перебираем все элементы словаря: вариант 1
d1 = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}
for k in d1.keys():  # d1.keys() создаёт контейнер содержащий все ключи словаря, они последовательно записываются в el
    print(k, d1[k])  # выводим на печать ключ и соответствующее ему значение

a 1
b 2
c 3
d 4
e 5


In [None]:
# перебираем все элементы словаря: вариант 2
d1 = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}
# d1.items() создаёт контейнер содержащий все пары ключ-значение словаря. 
# в такой записи ключи (первые элементы пары) будут записываться в переменную k, а соответствующие им значения в переменную v
for k, v in d1.items():  
    print(k, v)  # выводим на печать ключ и соответствующее ему значение

a 1
b 2
c 3
d 4
e 5


In [None]:
# пусть у нас есть словарь
d1 = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}
# и мы хотим напечатать только ключи которых нет в множестве
s1 = {'c', 'e', 'w', 'k'}
# перебираем элементы словаря
for k, v in d1.items():
    if k not in s1:  # смотрим что k не содержится в s1
        print( k, v)  # если не содержится, то печатаем

a 1
b 2
d 4


### Приведение типов
Выше было рассмотрено автоматическое приведение типов, когда деление одной переменной типа `int` на другую давало значение типа `float`.

Также приведение типов можно делать явно, вызывая имя типа к которому нужно привести переменную как функцию

In [None]:
a = 10  # тип int
print(a, type(a))
a = float(a)  # приводим к типу float
print(a, type(a))
a = str(a)  # приводим к типу str
print(a, type(a))

10 <class 'int'>
10.0 <class 'float'>
10.0 <class 'str'>


В некоторых ситуациях с контейнерами можно действовать так же. Например, если нужно оставить в списке только уникальные элементы, можно привести его к типу `set`, а затем обратно к типу `list`. **Однако нужно понимать что очерёдность элементов при этом не сохранится!**

In [None]:
l1 = [1, 3, 2, 3, 2, 1, 2, 3]  # исходный список
s1 = set(l1)  # приводим к множеству, теряем упорядоченность
l1_unique = list(s1)  # приводим обратно к списку, уже в произвольном порядке
print(l1, '->', s1, '->', l1_unique)

[1, 3, 2, 3, 2, 1, 2, 3] -> {1, 2, 3} -> [1, 2, 3]


При преобразовании строки в список, строка превращается в список букв


In [None]:
s2 = 'qwererty'
print(s2, list(s2))

qwererty ['q', 'w', 'e', 'r', 'e', 'r', 't', 'y']


### Сокращённая запись `for`, создание контейнеров из других контейнеров
Сборку новых контейнеров из отобранных и преобразованных элементов других контейнеров часто записывают в одну строку. Например, создание списка `new_list` из преобразованных элементов другого списка `old_list`:
```Python
new_list = []
for el in old_list:
    if CONDITION:
        new_list.append(EXPR1)
    else:
        new_list.append(EXPR2)
```
можно значительно сократить следующим образом:
```Python
new_list = [EXPR1 for el in old_list if CONDITION else EXPR2]
```

In [None]:
# Пример 1: создание нового списка из положительных элементов старого
l1 = [0, 5, -3, 2, 4, -9, -1, 2, 7]
l1_new = [el for el in l1 if el > 0]
print(l1, '->', l1_new)

[0, 5, -3, 2, 4, -9, -1, 2, 7] -> [5, 2, 4, 2, 7]


In [None]:
# Пример 2: создание словаря из двух списков, функция zip
# есть два списка
ks = [1, 2, 3, 4, 5]
vs = ['a', 'b', 'c', 'd', 'e']
# нужно создать словарь с ключами из ks и значениями из vs
# функция zip(ks, vs) создаёт контейнер из попарно соединенных элементов из ks и vs, то есть
# [(1, 'a'), (2, 'b'), (3, 'c'), (4, 'd'), (5, 'e')]
d1 = {k: v for (k, v) in zip(ks, vs)}
print(d1)

{1: 'a', 2: 'b', 3: 'c', 4: 'd', 5: 'e'}


### Цикл `for` + `range`, преобразование списков.
Цикл `for` позволяет перебирать элементы контейнера. Запись 
```Python 
for el in CONTAINER:
```
будет последовательно копировать в `el` значения элементов контейнера. Это подходящий вариант, если нужно о контейнере что-то узнать или сделать из него какую-либо выборку.

В случае если нужно модифицировать элементы исходного контейнера, нужно обращаться к его элементам по индексам (ключам) через `[]`. Для того чтобы перебрать в цикле все индексы контейнера, используется конструкция 
```Python 
for ii in range(len(CONTAINER)):
    BLOCK
```
- Цикл `for` с функцией `range` вызванной от одного аргумента (в данном примере — длиной списка `CONTAINER`) будет последовательно записывать в `ii` значения `0, 1, … , len(CONTAINER) - 1`, то есть все индексы списка.
- Цикл `for` с функцией `range` вызванной от двух аргументов `range(start, stop)` будет последовательно записывать в `ii` значения `start, start + 1, start + 2, … , stop - 1`. То есть все индексы перебирать необязательно, можно начать с какого-то конкретного
- Цикл `for` с функцией `range` вызванной от трёх аргументов `range(start, stop, step)` будет последовательно записывать в `ii` значения от `start`, до `stop - 1` с шагом `step`

In [None]:
# Пример 1
l3 = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']
for ii in range(len(l3)):  # перебираем все индексы списка l3
    print(ii, l3[ii])

0 a
1 b
2 c
3 d
4 e
5 f
6 g
7 h


In [None]:
# Пример 2
l3 = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']
for ii in range(0, len(l3), 2):  # перебираем все чётные индексы списка l3
    print(ii, l3[ii])

0 a
2 c
4 e
6 g
