## План 

1. Введение (немного про Jupyter notebook)
2. Множества
3. Строки
4. Списки 
5. Кортежи
6. Словари

---

## Введение

Общее назначение коллекций - хранение заранее неопределенного количества информации под одним именем переменной.

Jupyter Notebook – это крайне удобный инструмент для создания красивых аналитических отчетов, так как он позволяет хранить вместе код, изображения, комментарии, формулы и графики. Кроме того этот формат позволяет запускать код непосредственно в браузере.

Для установки Jupyter Notebook необходимо установить его командой:

**python3 -m pip install --upgrade pip
python3 -m pip install jupyter**

Если вы используете Anaconda,  то Jupyter Notebook входит в состав этой платформы

После установки Jupiter Notebook можно запустить командой:

**jupyter notebook**

 Мы начинаем с множеств, затем рассмотрим строки, списки и кортежи, и, в заключении словари.

**Дополнительное замечание**: примеры, которые использованы здесь, нужны только для иллюстрации материала, так как зачастую есть более эффективные алгоритмы выполнения приведенных действий.

## Множества
Множество — это составной изменяемый тип данных, который позволяет нам хранить разнородные уникальные значения.

Для создания множества необходимо использовать ключевое слово **set**

In [1]:
a = set()
print(a)

set()


Кроме того, можно также создавать множества, уже заполненные данными:

In [2]:
x = 10
a = {1, 1.3, 'yandex', x, (0, 1), 10000}
print(a)

{(0, 1), 1, 1.3, 10, 10000, 'yandex'}


**Обратите внимание, что создавать пустое множество с помощью фигурных скобок нельзя, этот формат записи "забронирован" за словарем, так как они появились в языке раньше**

In [3]:
# множества можно обойти циклом for, но мы не знаем,
# в каком порядке будут перебраны элементы
for item in {1, 1.3, 'yandex', 10, (0, 1), 'hello'}:
    print(item)

(0, 1)
1
1.3
10
yandex
hello


### Преимущества множеств
Быстрый поиск данных -  с помощью множеств мы можем быстро проверить наличие какого-либо элемента в коллекции (значительно быстрее, чем при использовании, например, списков):

In [4]:
a = {1, 1.3, 'yandex', (0, 1)}
if 1 in a:
    print("Да")

Да


In [5]:
a = {1, 2, 3}
a.add(3)
print(a)

{1, 2, 3}


Кроме того для множеств есть готовая математика для объединения, пересечения, разности и симметричной разности.

In [6]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
# объединение
print(a | b)
# или
c = a.union(b)
# пересечение
print(a & b)
# или
c = a.intersection(b)
# разность
print(a - b)
# или
c = a.difference(b)
# симметричная разность
print(a ^ b)
# или
c = a.symmetric_difference(b)

{1, 2, 3, 4, 5, 6}
{3, 4}
{1, 2}
{1, 2, 5, 6}


"Сравнение" множеств:

In [1]:
s1 = {'a', 'b', 'c'}
print(s1 <= s1)  # True

s2 = {'a', 'b', 'd'}
print(s2 <= s1)  # False
s3 = {'a'}
print(s3 <= s1)  # True
s4 = {'a', 'z'}
print(s4 <= s1)

True
False
True
False


**Пример применения:**
1. Убрать повторы из списка

In [14]:
li = [1, 2, 3, "hello", 3, 4]
print(list(set(li)))

[1, 2, 3, 4, 'hello']


2. Узнать, есть ли в списке повторы

In [10]:
li = [1, 2, 3, 3, 3, 4]
if len(set(li)) != len(li):
    print("Есть повторы")

Есть повторы


### frozenset
В питоне есть тип frozenset - неизменяемые множества. Можно использовать как элементы других множеств и как ключ в словаре

In [3]:
fr_set = frozenset({1, 1.3, 'yandex', (0, 1)})
fr_set2 = frozenset({1, 2, 3, 4})
s = set()
s.add(fr_set)
s.add(fr_set2)
print(s)
fr_set2.add(5)


{frozenset({1, 2, 3, 4}), frozenset({(0, 1), 1, 1.3, 'yandex'})}


AttributeError: 'frozenset' object has no attribute 'add'

## Строки
Строки в python -  неизменяемая коллекция, которая (также как списки и кортежи) поддерживает адресацию по индексу и срезы.

In [15]:
# Поддерживаются как положительные индексы с нуля
text = "Hello"
print(text[0], text[3])
# Так и отрицательные индексы (с конца)
print(text[-1], text[-3])

H l
o l


In [16]:
text = "Hello, Yandex!"
print(text[:6:2])
print(text[::-1])

Hlo
!xednaY ,olleH


In [17]:
# Так как строки неизменяемые объекты, для них + и += действуют одинаково
text1 = "Hello, "
text2 = "Yandex!"
text3 = text1
text1 = text1 + text2
print(text1 is text3)
text1 = text3
text1 += text2
print(text1 is text3)

False
False


Строки можно обходить циклом for с гарантированным порядком обхода:

In [18]:
for letter in "Yandex":
    print(letter)

Y
a
n
d
e
x


**Обратите внимание:** у строк есть множество методов, но так как строки - неизменяемый объект, все они возвращают значение, а не изменяют сам объект. 
Методы строк (https://pythonworld.ru/tipy-dannyx-v-python/stroki-funkcii-i-metody-strok.html)
Методы списков(https://pythonworld.ru/tipy-dannyx-v-python/spiski-list-funkcii-i-metody-spiskov.html)

In [21]:
s = "Ya.nd.ex.."
# неправильно:
s.replace(".", "!")
print(s)
# правильно:
s = s.replace(".", "!")
print(s)

Ya.nd.ex..
Ya!nd!ex!!


In [22]:
#отдельные буквы в строке - тоже строка поэтому можно так
s = 'Hello'
print(s[0][0][0][0][0][0])

H


## Списки и кортежи
Списки являются очень гибкой структурой данных и широко используются в программах. Основные свойства:
* Список хранит несколько элементов под одним именем (как и множество)
* Элементы списка могут повторяться (в отличие от множества)
* Элементы списка могут быть упорядочены и проиндексированы, доступна операция среза
* Элементы списка можно изменять
* Элементами списка могут быть значения любого типа: целые и действительные числа, строки и даже другие списки.

In [23]:
# списки могут содержать другие списки
li1 = [1, 2, 3]
li2 = list()
li = []
li2.append(10)
li2.append(11)
li1.append(li2)
print(li1)
print(li)

[1, 2, 3, [10, 11]]
[]


In [24]:
# списки поддерживают сортировку:
li = [1, 6, 3, 5, 2]
print(sorted(li))
print(li)
print(li.sort())
print(li)

[1, 2, 3, 5, 6]
[1, 6, 3, 5, 2]
None
[1, 2, 3, 5, 6]


In [29]:
a = 10
b = 5
c = 4.234234243
print("a = {}, b = {}, c = {}".format(a, b, c))

a = 10, b = 5, c = 4.234234243


In [30]:
#при простом присваивании копируются не значение списка, а ссылка на список
a = [1, 2, 3]
b = a
b[-1] = 4
print(a)
print(b)
print(a == b, a is b)

[1, 2, 4]
[1, 2, 4]
True True


In [32]:
#для получения полной копии списка можно использовать:
a = [1, 2, 3]
b = list(a)
c = a.copy()
d = a[:]
print(a == b, a is b)
print(a == c, a is d)
print(a == d, a is d)
d[-1] = 100000
print(d, a)

True False
True False
True False
[1, 2, 100000] [1, 2, 3]


In [33]:
# При копировании вложенного списка вышуказанные способы копируют только ссылку на него
a = [1, 2, 3, [4, 5, 6]]
b = a[:]
b[-1].append(10)
print(a)
print(b)
# для копирования внутренних списков используйте метод deepcopy модуля copy
import copy
c = copy.deepcopy(a)
c[-1].append(99)
print(a)
print(c)

[1, 2, 3, [4, 5, 6, 10]]
[1, 2, 3, [4, 5, 6, 10]]
[1, 2, 3, [4, 5, 6, 10]]
[1, 2, 3, [4, 5, 6, 10, 99]]


In [35]:
# списки могут содержать ссылки на самих себя
li = [1]
li.append(li)
print(li[-1][-1][-1][-1][-1][-1][-1][0])

1


In [36]:
#с помощью методов списков append и pop легко реализовывать стеки и очереди
li = [1, 2, 3]
li.append(20)
print(li)
print(li.pop())
print(li)

[1, 2, 3, 20]
20
[1, 2, 3]


In [37]:
# для списков есть разница между + и +=
li1 = [1, 2, 3]
li2 = [4, 5, 6]
li3 = li1
li1 = li1 + li2
print(li1, li3)
print(li1 is li3)
li1 = li3
li1 += li2
print(li1, li3)
print(li1 is li3)

[1, 2, 3, 4, 5, 6] [1, 2, 3]
False
[1, 2, 3, 4, 5, 6] [1, 2, 3, 4, 5, 6]
True


In [40]:
# списки поддерживают срезы
li = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
print(li[:6:2])
print(li[::-1])
# для срезов работает присваивание
li[1:6:2] = [99, 98, 97]
print(li)

[1, 3, 5]
[10, 9, 8, 7, 6, 5, 4, 3, 2, 1]
[1, 99, 3, 98, 5, 97, 7, 8, 9, 10]


Списки можно обойти циклом for, в том порядке, в котором там лежат элементы

In [43]:
li = [1, 99, 3, 98, 5, 97, 7, 8, 9, 10]
for i in li:
    i += 1
    print(i)
print(li)
# тоже самое можно сделать с помощью цикла по индексу:
for i in range(len(li)):
    li[i] += 1
    print(li[i])
print(li)

2
100
4
99
6
98
8
9
10
11
[1, 99, 3, 98, 5, 97, 7, 8, 9, 10]
2
100
4
99
6
98
8
9
10
11
[2, 100, 4, 99, 6, 98, 8, 9, 10, 11]


В случае, когда мы попытаемся достать несуществующий в списке элемент по индексу, то у нас произойдет ошибка. Если же мы попытаемся сделать срез, который захватывает несуществующие элементы, он вернет нам только те элементы, которые есть (или пустой срез, если их нет)

In [44]:
li = [1, 2, 3]
print(li[1:20])
print(li[3:4])
print(li[3])

[2, 3]
[]


IndexError: list index out of range

Для формирования и обработки значений списков часто используются списочные выражения (list comprehension)

In [50]:
# Обычные
a = []
for i in range(10):
    a.append(i ** 2)
print(a)

b = [i ** 2 for i in range(10)]
for item in b:
    print(item)
print("еще раз")
for item in b:
    print(item)
    
c = (i ** 2 for i in range(10))
for item in c:
    print(item)
print("еще раз")
for item in c:
    print(item)


[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
0
1
4
9
16
25
36
49
64
81
еще раз
0
1
4
9
16
25
36
49
64
81
0
1
4
9
16
25
36
49
64
81
еще раз


In [4]:
# С условием
a = []
for i in range(10):
    if i % 2 == 0:
        a.append(i ** 2)
print(a)

b = [i ** 2 for i in range(10) if i % 2 == 0]
print(b)

[0, 4, 16, 36, 64]
[0, 4, 16, 36, 64]


In [51]:
# По нескольким переменным
rows = [str(x) for x in [1,2,3,4,5,6,7,8]]
cols = list("abcdefgh")
res = []
for i in rows:
    for j in cols:
        res.append(i+j)
print(res)

res = [i+j for i in rows for j in cols]
print(res)

['1a', '1b', '1c', '1d', '1e', '1f', '1g', '1h', '2a', '2b', '2c', '2d', '2e', '2f', '2g', '2h', '3a', '3b', '3c', '3d', '3e', '3f', '3g', '3h', '4a', '4b', '4c', '4d', '4e', '4f', '4g', '4h', '5a', '5b', '5c', '5d', '5e', '5f', '5g', '5h', '6a', '6b', '6c', '6d', '6e', '6f', '6g', '6h', '7a', '7b', '7c', '7d', '7e', '7f', '7g', '7h', '8a', '8b', '8c', '8d', '8e', '8f', '8g', '8h']
['1a', '1b', '1c', '1d', '1e', '1f', '1g', '1h', '2a', '2b', '2c', '2d', '2e', '2f', '2g', '2h', '3a', '3b', '3c', '3d', '3e', '3f', '3g', '3h', '4a', '4b', '4c', '4d', '4e', '4f', '4g', '4h', '5a', '5b', '5c', '5d', '5e', '5f', '5g', '5h', '6a', '6b', '6c', '6d', '6e', '6f', '6g', '6h', '7a', '7b', '7c', '7d', '7e', '7f', '7g', '7h', '8a', '8b', '8c', '8d', '8e', '8f', '8g', '8h']


In [52]:
# Вложенные
matrix = [
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12],
]
res = []
for i in range(4):
    res_row = []
    for row in matrix:
        res_row.append(row[i])
    res.append(res_row)
print(res)

res = [[row[i] for row in matrix] for i in range(4)]
print(res)

[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]


## Кортежи
Кортежи очень похожи на списки (они тоже являются индексированной коллекцией), но неизменяемы 

In [55]:
card = ('7', 'пик')                 # кортеж из двух элементов; тип элементов может быть любой
empty = ()                          # пустой кортеж (из 0 элементов)
t = (18 )# кортеж из 1 элемента - запятая нужна, чтобы отличить от обычных скобок
print(t)

(18,)


### Запаковка и распаковка

In [5]:
# благодаря запаковке и распаковке можно делать так
a, b = 10, 20
print(a, b)
# так
a, b = b, a
print(a, b)
# так
tu = (1, 2, 3, 4)
a, b, c, d = tu
print(a, b, c, d)
# и даже вот так
li = [1, 2, 3, 4, 5]
a, b, c, *d = li
print(a, b, c, d)
*a, b, c, d = li
print(a, b, c, d)
a, b, *c, d = li
print(a, b, c, d)

10 20
20 10
1 2 3 4
1 2 3 [4, 5]
[1, 2] 3 4 5
1 2 [3, 4] 5


В кортеже могут храниться изменяемые объекты (например списки), так как в них хранится не сам объект, а только ссылка на него, вложенные изменяемые объекты можно изменять

In [57]:
tu = 1, 2, 4, 5, [1, 2, 3]
print(tu)
tu[-1].append("Hello")
print(tu)

(1, 2, 4, 5, [1, 2, 3])
(1, 2, 4, 5, [1, 2, 3, 'Hello'])


Кортежи также можно обходить циклом for, с гарантированным порядком обхода

In [58]:
for i in (1, 2, 3, 4):
    print(i)

1
2
3
4


## Словари
	
Словарь — это тип данных, позволяющий, как и список, хранить много данных. В отличие от списка в словаре для каждому элементу соответствует ключ. Значением в словаре могут быть любые данные, ключом - только неизменяемые. Начиная с версии 3.6, словари в Python хранят порядок ключей.

In [63]:
import pprint
d1 = dict()
d2 = {}
d2['sample_key'] = list('sample_value')
d2['key2'] = 123
d1[(0, 0)] = d2
pprint.pprint(d1)
print(d1)

{(0, 0): {'key2': 123,
          'sample_key': ['s',
                         'a',
                         'm',
                         'p',
                         'l',
                         'e',
                         '_',
                         'v',
                         'a',
                         'l',
                         'u',
                         'e']}}
{(0, 0): {'sample_key': ['s', 'a', 'm', 'p', 'l', 'e', '_', 'v', 'a', 'l', 'u', 'e'], 'key2': 123}}


In [6]:
# можно получить как ключи и значения по отдельности, так и все вместе
d = {1: 1, 2: 4, 3: 9, 4: 16}
print(d.keys())
print(d.values())
print(d.items())
for k, v in d.items():
    print(f'{k} в квадрате будет {v}')
    print("{} в квадрате будет {}".format(k, v))

dict_keys([1, 2, 3, 4])
dict_values([1, 4, 9, 16])
dict_items([(1, 1), (2, 4), (3, 9), (4, 16)])
1 в квадрате будет 1
1 в квадрате будет 1
2 в квадрате будет 4
2 в квадрате будет 4
3 в квадрате будет 9
3 в квадрате будет 9
4 в квадрате будет 16
4 в квадрате будет 16


In [66]:
#При попытке получить элемент по несуществующему ключу возникнет ошибка
d = {1: 2, 2: 4, 3: 9, 4: 16}
print(d[10])

KeyError: 10

In [67]:
# Либо проверям вхождения ключа
d = {1: 2, 2: 4, 3: 9, 4: 16}
print(d[10] if 10 in d else 0)

# Либо используем get
print(d.get(10, 0))


0
0


In [None]:
# можно использовать словарные выражения для формирования словаря
d = {x: x ** 2 for x in (2, 4, 6)}
print(d)

In [68]:
# для получения полной копии лучше использовать copy.deepcopy
import copy
a = [1, 2, 3]
d = {'list': a}

c = d.copy()
c['list'][-1] = 10
print(d)

c = copy.deepcopy(d)
c['list'][-1] = 777
print(d)

{'list': [1, 2, 10]}
{'list': [1, 2, 10]}


In [72]:
a = {}
a['a'] = 1
a['b'] = 2
a['c'] = 3
a['b'] = 5
a['d'] = 6
print(list(a))

['a', 'b', 'c', 'd']


### Примеры использования

In [73]:
# частотная характеристика
d = {}
text = "привет яндекс лицей"
for letter in text:
    d[letter] = d.get(letter, 0) + 1
print(d)

{'п': 1, 'р': 1, 'и': 2, 'в': 1, 'е': 3, 'т': 1, ' ': 2, 'я': 1, 'н': 1, 'д': 1, 'к': 1, 'с': 1, 'л': 1, 'ц': 1, 'й': 1}


In [74]:
# хранение координат объектов
d = {}
d[(56, 55)] = "Москва" 
d[(85, 23)] = "Магадан"
d[(99, 33)] = "Лондон"
d[53, 33] = "Москва"
d[(99, 33)] = "Париж"
print(d)
# Можно развернуть словарь но при этом могут потеряться повторяющиеся значения
d2 = {v: k for k, v in d.items()}
print(d2)

{(56, 55): 'Москва', (85, 23): 'Магадан', (99, 33): 'Париж', (53, 33): 'Москва'}
{'Москва': (53, 33), 'Магадан': (85, 23), 'Париж': (99, 33)}
