# 2.2 Контейнеры в Python

Переменные - это хорошо. А теперь подумаем, а если у нас много переменных. Длина, ширина, высота, порядковый номер... Ок, зазовем их $x,y,z,i$. А вот такой факт: ВКонтакте зарегистрировано около 38 миллионов человек. Для каждого свою переменную? А ручки беленькие не сотрутся в красненькие? А как потом обращаться к ним?! Вот к примеру, задача, проверить, кто сейчас онлайн. Примерный исходный код:

*Проверить, онлайн ли первый*

*Проверить, онлайн ли второй*

*...*

*Проверить, онлайн ли 1945003-й*

*...*

В общем, просто переменными дело явно не обойдется... 

## Списки (lists)

Контейнером для хранения множества данных в Python являются списки

In [1]:
l = ["first", "second", "middle", "last but one", "last"]

print(l)
print(type(l))

['first', 'second', 'middle', 'last but one', 'last']
<class 'list'>


Отлично, и что нам это дает? Ну, в первую очередь обращение к переменным по индексу. Например:

In [10]:
list1 = ["first", "second", "middle", "last but one", "last"]

print(list1[0], list1[2], list1[4])

first middle last


In [7]:
for i in l:
    print(i)

first
second
middle
last but one
last


Отлично. Теперь то же самое, но в цикле:

In [6]:
l = ["first", "second", "middle", "last but one", "last" ]
i = 0
while i < 5:
    print(l[i])
    i += 1

first
second
middle
last but one
last


Более того, ЛЮБОЙ элемент списка можно использовать как обычную переменную.

In [32]:
l = ["first", "second", "middle", "last but one", "last" ]
print(l)

l[2] = "That was a middle element"
print(l)

['first', 'second', 'middle', 'last but one', 'last']
['first', 'second', 'That was a middle element', 'last but one', 'last']


Списки могут хранить переменные совершенно разных типов:

In [5]:
l1 = [1, 2, 3]
l2 = [1.0, 2.0, 3.0]
l3 = ["MultiType", 2, [3, 4]]
print(l1)
print(l2)
print(l3)

[1, 2, 3]
[1.0, 2.0, 3.0]
['MultiType', 2, [3, 4]]


Супер, теперь давайте подумаем над следующим кодом:

In [16]:
a = list(range(10))
a

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

Именно, range генерирует последовательность объектов. Следующий из этого вывод: синтаксис цикла for так же подойдет и для созданного нами списка. (но range и list все-таки разные вещи)

In [33]:
l = ["first", "second", "middle", "last but one", "last", "the last" ]
for i in range(6):
    print(l[i])

first
second
middle
last but one
last
the last


In [17]:
for i in l:
    print(i)

first
second
That was a middle element
last but one
last


**Задание: подумать, что здесь происходит, и почему?**

In [2]:
l = ["first", "second", "middle", "last but one", "last" ]
for i in l:
    i += " Batman!!!"
print(l)

['first', 'second', 'middle', 'last but one', 'last']


In [3]:
for i in range(5):
    l[i] += " Batman!!!"
print(l)

['first Batman!!!', 'second Batman!!!', 'middle Batman!!!', 'last but one Batman!!!', 'last Batman!!!']


### Работа со списками

Итак, далее предположим, что у нас есть список, с которым мы работаем. Например, список l. Очень хорошо, когда мы знаем об этос списке все, но что делать если это не так?(А зачастую, так и есть).

Например, как нам вывести последний элемент, если мы не знаем, сколько элементов в списке? Вот так:

*(две строчки вывода одинаковые. Это чтобы вы не забывали разные возможности форматного вывода)*

In [67]:
l = ["first", "second", "middle", "last but one", "last" ]
print("Первый с конца:", l[-1])
print(f"Второй с конца: {l[-2]}")

Первый с конца: last
Второй с конца: last but one


Отлично. Усложняем задачу: нам надо вывести все элементы от второго, до последнего, затем от второго до предпоследнего, затем первые 3 элемента, затем от первого до третьего. 

Тут нас спасет двоеточие:

In [55]:
l = ["first", "second", "middle", "last but one", "last" ]

print(l[0:3])

['first', 'second', 'middle']


In [56]:
print(l[2:])

['middle', 'last but one', 'last']


In [59]:
print(l[2:-1])

['middle', 'last but one']


In [75]:
l = ["first", "second", "middle", "last but one", "last" ]
print(l[1:4]) # Почему тут 1:4, если нам от первого до третьего???!!! 

['second', 'middle', 'last but one']


Супер. Ну, теперь мы дошли до ключевого вопроса: вывести, сколько элементов в списке:

In [68]:
l = ["first", "second", "middle", "last but one", "last" ]
len(l)

5

In [72]:
l = ["first", "second", "middle", "last but one", "last" ]
for i in range(len(l)):
    print(l[i])

first
second
middle
last but one
last


In [73]:
l = ["first", "second", "middle", "last but one", "last" ]
for i in l:
    print(i)

first
second
middle
last but one
last


### Работа с несколькими списками.

Ну, теперь предположим, что мы хотим пополнить наш список новым элементом. Приятной особенностью окажется возможность складывать списки.

In [77]:
f = [1,2,3]
s = [4,5,6]

print(f + s)
print(s + f)

[1, 2, 3, 4, 5, 6]
[4, 5, 6, 1, 2, 3]


"Продвинутый" уровень создания списка (list comprehension): 

In [107]:
www = ["vk.com", "facebook.com"]
a = ["https://" + i for i in www]
a

['https://vk.com', 'https://facebook.com']

In [108]:
for i in www:
    print("https://" + i)

https://vk.com
https://facebook.com


Cюда же можно воткнуть и условия. Например, список квадратов четных чисел до 20:

In [109]:
[i**2 for i in range(21) if i%2 == 0]

[0, 4, 16, 36, 64, 100, 144, 196, 256, 324, 400]

In [110]:
for i in range(21):
    if i % 2 == 0:
        print(i ** 2)

0
4
16
36
64
100
144
196
256
324
400


**Внимание, посмотрите внимательно, что произошло!!**

In [None]:
f = [1,2,3]
s = f
print(f, s)

In [None]:
s[1] = 100
print(f, s)

Ух ты!!! Мы НЕ КОПИРУЕМ списки, а создаем синоним - другое имя для того же объекта в памяти.

Проблема разрешается созданием нового списка с тем же содержанием.

In [None]:
f = [1,2,3]
s = [i for i in f]
print(f, s)

In [None]:
s[1] = 100
print(f, s)

### Встроенные функции списков

**есть еще и встроенные функции??**

О, да! Еще как есть! И вот их список:

list.append(x)


list.extend(L)


list.insert(i, x)


list.remove(x)


list.pop([i])


list.index(x)


list.count(x)


list.sort()


list.reverse()

А подробную документацию по каждой из них можно найти [здесь](http://docs.python.org/2/tutorial/datastructures.html)

In [118]:
l = [1323,3,5,46]
l.sort()

print(l)

l.reverse()

print(l)

[3, 5, 46, 1323]
[1323, 46, 5, 3]


**Задание: найти в документации и объяснить, что происходит в исходном коде ниже (в чем разница двух удалений)**

In [None]:
l = [1,2,1,2,1]
del l[2]
print(l)
k = [1,2,1,2,1]
k.remove(2)
print(k)

## Кортежи (tuples)

Тупл в русской терминологии правильно называть кортежем. Но программисты на питоне, как правило, об этом не знают. Так что дружно называем их туплами.

Суть тупла - последовательность данных фиксированного размера. Синтаксис - как списки, но только в круглых скобках

In [127]:
t = (1,2,3)
print(t)

(1, 2, 3)


С туплами допустимо использование индексов как со списками. Но только в режиме "чтение", а не записи.

In [None]:
print(t[1])

In [None]:
t[1] = 2  # Этот код НЕ сработает

Туплы нельзя увеличивать в размере (append), изменять. Вообще, с туплами доступно по сути только две операции: count и index


In [129]:
t = (1, 1, 2, 3)

In [130]:
print(t.count(1)) # количество элементов
print(t.index(3)) # индекс элемента '3'

2
3


## Множества (set)

Принципиальное отличие множества от массива --- отсутствие повторяющихся элементов. Иногда это нужно с точки зрения формулировки, иногда с точки зрения результата. Синтаксис --- встроенная функция set

In [131]:
l = [2, 3, 4, 4] 
print(l)
set(l)

[2, 3, 4, 4]


{2, 3, 4}

In [132]:
a = [1,2,3,2,3,2,3,1,4,1,2,7,1]

b = set(a)

print(a)
print(b)

[1, 2, 3, 2, 3, 2, 3, 1, 4, 1, 2, 7, 1]
{1, 2, 3, 4, 7}


set - тоже iterable объект, т.е. возможно следующее:

In [134]:
for i in b:
    print(i)

1
2
3
4
7


Например, задача: 

1. посчитать, сколько различных букв в слове 'abracadabra'

In [144]:
# our code

abra = 'abracadabra'
set_abra = set(abra)
print(len(set_abra))

5


2. какие различные буквы в слове 'abracadabra'

In [149]:
# our code

for i in reversed(sorted(set(abra))):
    print(i)

r
d
c
b
a


С множеством доступны следующие операции:

проверка включения (много эффективней, чем по списку)

объединение $A \cup B$

пересечение $A \cap B$

вычитание множеств $A - B$

и т.п.

In [150]:
a = set('abracadabra')
b = set('turumburum')

In [151]:
a, b

({'a', 'b', 'c', 'd', 'r'}, {'b', 'm', 'r', 't', 'u'})

In [152]:
a.union(b)

{'a', 'b', 'c', 'd', 'm', 'r', 't', 'u'}

In [153]:
a.intersection(b)

{'b', 'r'}

In [154]:
a - b

{'a', 'c', 'd'}

In [155]:
b - a

{'m', 't', 'u'}

## Словари (dict)

Иногда не очень удобно обращаться к списку по целочисленному индексу. Иногда удобно обращаться, скажем, по строке. Или по какому-нибудь еще объекту (хешируему. Про хеши когда-нибудь потом. Или нет.)

Тогда нас спасают словари. Синтаксис -- фигурные скобки, внутри через запятую ключ: значение.

In [160]:
d = {1: "one", 2: "abra", 3: "cadabra"}
print(d[1])
print(d[2])
print(d[3])

one
abra
cadabra


Обращение к элементу, ключа которого нет в словаре, недопустимо. 

In [161]:
print(d[0])

KeyError: 0

In [166]:
d = {"one": 1, "two": 2, "three": 3}
print(d["one"])
print(d["two"])

1
2


Обращение к элементу, ключа которого нет в словаре, недопустимо. 

In [165]:
print(d["four"])

KeyError: 'four'

Зато можно для несуществующего ключа записать значение!!

In [167]:
d["four"] = 4
print(d)

{'one': 1, 'two': 2, 'three': 3, 'four': 4}


NB! пустой set VS пустой dict:

In [168]:
a = set()
b = {}

In [169]:
print(a, b)

set() {}


Ну и как уже повелось с контейнерами, этот тоже iterable, но итерации идут по ключам:

In [170]:
for i in d:
    print(i)

one
two
three
four


In [174]:
for i in d.keys():
    print(i)

one
two
three
four


Можно идти по значениям:

In [171]:
for i in d.values():
    print(i)

1
2
3
4


Можно по тому и другому:

In [172]:
for i in d.items():
    print(i)

('one', 1)
('two', 2)
('three', 3)
('four', 4)


In [173]:
for k, v in d.items():
    print(f"Key: {k}, value: {v}")

Key: one, value: 1
Key: two, value: 2
Key: three, value: 3
Key: four, value: 4


Самое полезное применение словарей -- подсчет повторений символов/слов:

Давайте посчитаем, сколько раз какой символ встречается в тексте песни "Get Jinxed".

FileNotFoundError: [Errno 2] No such file or directory: 'song.txt'