# Почему set не имеет свойство упорядоченности

Это особенность реализации set, он реализован как хэшсет.

Если заполнять хешсет последовательно с меньших чисел до больших,
они станут занимать последовательные "корзины".

Номер корзины вычисляется как хеш код по модулю текущей вместимости хешсет. А вместимость в этой ситуации больше любого хешкода.

В реализации вычисления хэшей, хэши чисел до 2^61 - 2 являются самими этими числами, поэтому, если мы будем последовательно добавлять такие числа, то они будут упорядочены

In [1]:
s = {1, 2, 3 , 4 ,5}
s

{1, 2, 3, 4, 5}

Еще один пример

In [2]:
s = {11, 10, 2, 4, 5, 1}
s

{1, 2, 4, 5, 10, 11}

В реализации set в python вместимость "корзин", доступных по хэшу, N, значит, каждые N элементов или меньше будут упорядочены

In [None]:
dir(set)

In [3]:
ord('A')

65

In [4]:
ord('z')

122

In [5]:
import random

s = {1, 'b', 3, 0, -1, 'a', 'aa', 'bb', 'c', 1.3}
for i in range(8):
    print(len(s), s)
    s.add(random.randint(0, 100))
    
    print(len(s), s)
    s.add(chr(random.randint(65, 122)))
    print()
print(len(s), s)

10 {0, 1, 1.3, 3, 'a', 'bb', 'b', 'aa', 'c', -1}
11 {0, 1, 1.3, 3, 'a', 44, 'bb', 'b', 'aa', 'c', -1}

12 {0, 1, 1.3, 3, 'a', 44, 'h', 'bb', 'b', 'aa', 'c', -1}
13 {0, 1, 1.3, 3, 'a', 44, 14, 'h', 'bb', 'b', 'aa', 'c', -1}

14 {0, 1, 1.3, 3, 'a', 'X', 44, 14, 'h', 'bb', 'b', 'aa', 'c', -1}
15 {0, 1, 1.3, 3, 'a', 'X', 8, 44, 14, 'h', 'bb', 'b', 'aa', 'c', -1}

16 {0, 1, 1.3, 3, 'a', 'X', 8, '_', 44, 14, 'h', 'bb', 'b', 'aa', 'c', -1}
17 {0, 1, 1.3, 3, 'a', 'X', 8, '_', 44, 14, 'h', 49, 'bb', 'b', 'aa', 'c', -1}

17 {0, 1, 1.3, 3, 'a', 'X', 8, '_', 44, 14, 'h', 49, 'bb', 'b', 'aa', 'c', -1}
18 {0, 1, 1.3, 3, 'a', 'X', 8, '_', 44, 14, 'h', 49, 'bb', 'b', 'aa', 'c', -1, 63}

19 {0, 1, 1.3, 3, 8, 14, 'bb', 'b', 'a', 44, 'h', 49, 63, '_', 'aa', 'X', 'd', 'c', -1}
20 {0, 1, 1.3, 3, 8, 14, 'bb', 'b', 'a', 44, 'h', 49, 55, 63, '_', 'aa', 'X', 'd', 'c', -1}

21 {0, 1, 1.3, 3, 8, 14, 'bb', 'b', 'B', 'a', 44, 'h', 49, 55, 63, '_', 'aa', 'X', 'd', 'c', -1}
22 {0, 1, 1.3, 3, 8, 14, 'bb', 'b', 'B', '

# List comprehensions (дополнение к прошлой лекции)

### Простейший генератор списка

In [6]:
numbers = [i for i in range(5)]
print(numbers)

[0, 1, 2, 3, 4]


### С условием

In [8]:
numbers = [i for i in range(5)]
avg = sum(numbers) // len(numbers)
print(avg)
numbers = [element for element in numbers if element > avg]
print(numbers)

2
[3, 4]


### Некорректный с точки зрения производительности пример

In [9]:
numbers = [i for i in range(5)]
numbers = [element for element in numbers if element > sum(numbers) // len(numbers)]
print(numbers)

[3, 4]


### Вложенный цикл в list comprehensions

In [11]:
matrix = [[int(x) for x in input().split()] for i in range(3)]
print(matrix)

2 3 4 5 6
1 2 3 4 4
1 2 3 4
[[2, 3, 4, 5, 6], [1, 2, 3, 4, 4], [1, 2, 3, 4]]


### Создадим список, используя уже известные нам операции со списками

In [12]:
zeros = [[0] * 5] * 5
print(zeros)

[[0, 0, 0, 0, 0], [0, 0, 0, 0, 0], [0, 0, 0, 0, 0], [0, 0, 0, 0, 0], [0, 0, 0, 0, 0]]


### Попробуем поменять значение в первом элементе первого вложенного списка

In [13]:
zeros[0][0] = 1
print(zeros)

[[1, 0, 0, 0, 0], [1, 0, 0, 0, 0], [1, 0, 0, 0, 0], [1, 0, 0, 0, 0], [1, 0, 0, 0, 0]]


### Сделаем правильное решение задачи

In [14]:
zeros = [[0] * 5 for i in range(5)]
print(zeros)
zeros[0][0] = 1
print(zeros)

[[0, 0, 0, 0, 0], [0, 0, 0, 0, 0], [0, 0, 0, 0, 0], [0, 0, 0, 0, 0], [0, 0, 0, 0, 0]]
[[1, 0, 0, 0, 0], [0, 0, 0, 0, 0], [0, 0, 0, 0, 0], [0, 0, 0, 0, 0], [0, 0, 0, 0, 0]]


### List comprehension со строкой

In [15]:
text = "Строка символов"
codes = [ord(symbol) for symbol in text]
print(codes)

[1057, 1090, 1088, 1086, 1082, 1072, 32, 1089, 1080, 1084, 1074, 1086, 1083, 1086, 1074]


### List comprehensions со словарем

In [16]:
countries = {"Россия": ["русский"],
             "Беларусь": ["белорусский", "русский"],
             "Бельгия": ["немецкий", "французский", "нидерландский"],
             "Вьетнам": ["вьетнамский"]}
multiple_lang = [country for (country, lang) in countries.items() if len(lang) > 1]
print(multiple_lang)

['Беларусь', 'Бельгия']


In [17]:
countries = {country: capital for country, capital in
             [("Россия", "Москва"),
              ("Беларусь", "Минск"),
              ("Сербия", "Белград")]}
print(countries)

{'Россия': 'Москва', 'Беларусь': 'Минск', 'Сербия': 'Белград'}


### List comprehensions в виде итератора

In [18]:
numbers = (int(input()) for i in range(5))
print(numbers)

<generator object <genexpr> at 0x107fa4740>


### Итератор занимает меньше памяти

In [19]:
from sys import getsizeof

# Создаём итератор из одного миллиона целых чисел
numbers_iter = (i for i in range(10 ** 6))
# Выводим количество байт, занятых итератором
print(f"Итератор занимает {getsizeof(numbers_iter)} байт.")
# Создаём список
numbers_list = list(range(10 ** 6))
# Выводим количество байт, занятых списком
print(f"Список занимает {getsizeof(numbers_list)} байт.")

Итератор занимает 200 байт.
Список занимает 8000056 байт.


### Работа с итераторами, как правило, немного эффективнее

In [20]:
from timeit import timeit

print(round(timeit("s = '; '.join(str(x) for x in range(10 ** 7))", number=10), 3))
print(round(timeit("s = '; '.join([str(x) for x in list(range(10 ** 7))])", number=10), 3))

9.915
9.267


### Операция присваивания и идентификаторы памяти

In [21]:
x = 5
print(id(x))
x = 10
print(id(x))

4350270480
4350270640


### Оператор is

In [22]:
x = 1
y = x
print(id(x))
print(id(y))
print(x is y)

4350270352
4350270352
True


In [23]:
x = 1
y = 1

print(id(x))
print(id(y))

4350270352
4350270352


In [25]:
x = "str"
y = "str"

print(id(x))
print(id(y))

4349832672
4349832672


In [26]:
x = "str"
y = x

print(id(x))
print(id(y))

4349832672
4349832672


In [27]:
# неизменяемые
# int
# str
# tuple

# изменяемые
# set
# list
# dict
# frozenset


In [28]:
x = [el ** 2 for el in range(5)]
y = [el ** 2 for el in range(5)]
print(id(x))
print(id(y))
print(x == y)
print(x is y)

4428825792
4428494976
True
False


### Так как список изменяемый, после изменения списка ячейка в памяти останется той же

In [29]:
numbers = [1, 2, 3]
print(f"{numbers}, id = {id(numbers)}")
numbers += [4]
print(f"{numbers}, id = {id(numbers)}")

[1, 2, 3], id = 4429164928
[1, 2, 3, 4], id = 4429164928


In [30]:
x = 4

print(id(x))

x += 1

print(id(x))

4350270448
4350270480


### Оператор "=" создает новый объект

In [None]:
numbers = [1, 2, 3]
print(f"{numbers}, id = {id(numbers)}")
numbers = numbers + [4]
print(f"{numbers}, id = {id(numbers)}")

In [32]:
x = [1, 2, 3]
y = x
print(x is y)
x[0] = 0
print(x)
print(y)
print(x is y)

True
[0, 2, 3]
[0, 2, 3]
True


### Срез создает новый объект

In [33]:
x = [1, 2, 3]
y = x[:]
print(x is y)
x[0] = 0
print(x)
print(y)
print(x is y)

False
[0, 2, 3]
[1, 2, 3]
False


### Интересный момент со срезом вложенного списка

In [34]:
numbers = [[1, 2, 3],
           [4, 5, 6],
           [7, 8, 9]]
numbers_copy = numbers[:]
print(numbers_copy is numbers)
print([numbers_copy[i] is numbers[i] for i in range(len(numbers))])

False
[True, True, True]


In [35]:
numbers = [[1, 2, 3],
           [4, 5, 6],
           [7, 8, 9]]
numbers_copy = [elem[:] for elem in numbers]
print([numbers_copy[i] is numbers[i] for i in range(len(numbers))])

[False, False, False]


### Как создать действительно копию списка без заморочек как выше

In [37]:
from copy import deepcopy

numbers = [[1, 2, 3],
           [4, 5, 6],
           [7, 8, 9]]
numbers_copy = deepcopy(numbers)
print(numbers is numbers_copy)
print([numbers_copy[i] is numbers[i] for i in range(len(numbers))])

False
[False, False, False]


# Встроенные возможности работы с коллекциями

## Модуль itertools

In [38]:
import itertools

### Product возвращает итератор (об итераторах чуть позже)

In [39]:
import itertools

print(itertools.product("ABC", repeat=2))

<itertools.product object at 0x107ff9540>


### Также можно импортировать только одну функцию - product

In [40]:
from itertools import product

print(product("ABC", repeat=2))

<itertools.product object at 0x107ff2440>


### Выведем результат product -> декартово произведение

In [41]:
for i in itertools.product("ABC", repeat=2):
    print(i)

('A', 'A')
('A', 'B')
('A', 'C')
('B', 'A')
('B', 'B')
('B', 'C')
('C', 'A')
('C', 'B')
('C', 'C')


### Поменяем параметр repeat на 3

In [42]:
for i in itertools.product("ABC", repeat=3):
    print(i)

('A', 'A', 'A')
('A', 'A', 'B')
('A', 'A', 'C')
('A', 'B', 'A')
('A', 'B', 'B')
('A', 'B', 'C')
('A', 'C', 'A')
('A', 'C', 'B')
('A', 'C', 'C')
('B', 'A', 'A')
('B', 'A', 'B')
('B', 'A', 'C')
('B', 'B', 'A')
('B', 'B', 'B')
('B', 'B', 'C')
('B', 'C', 'A')
('B', 'C', 'B')
('B', 'C', 'C')
('C', 'A', 'A')
('C', 'A', 'B')
('C', 'A', 'C')
('C', 'B', 'A')
('C', 'B', 'B')
('C', 'B', 'C')
('C', 'C', 'A')
('C', 'C', 'B')
('C', 'C', 'C')


### Рассмотрим функцию count

In [43]:
from itertools import count

for value in count(0, 0.1):
    if value <= 1:
        print(round(value, 1))
    else:
        break

0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0


### Рассмотрим функцию cycle

In [44]:
from itertools import cycle

max_len = 10
s = ""
for letter in cycle("ABC"):
    if len(s) < 10:
        s += letter
    else:
        break
print(s)

ABCABCABCA


### Рассмотрим функцию repeat

In [46]:
from itertools import repeat

result = list(repeat("ABC", 5))
print(repeat("ABC", 5))
print(result)

repeat('ABC', 5)
['ABC', 'ABC', 'ABC', 'ABC', 'ABC']


### Рассмотрим функцию accumulate

In [47]:
from itertools import accumulate

for value in accumulate([1, 2, 3, 4, 5]):
    print(value)

1
3
6
10
15


### Рассмотрим chain по умолчанию

In [49]:
from itertools import chain

values = list(chain("АБВ", "ГДЕЁ", "ЖЗИЙК"))
print(values)

print(list("АБВГДЕЁЖЗИЙК"))

['А', 'Б', 'В', 'Г', 'Д', 'Е', 'Ё', 'Ж', 'З', 'И', 'Й', 'К']
['А', 'Б', 'В', 'Г', 'Д', 'Е', 'Ё', 'Ж', 'З', 'И', 'Й', 'К']


### Рассмотрим chain from_iterable

In [50]:
values = list(chain.from_iterable(["АБВ", "ГДЕЁ", "ЖЗИЙК"]))
print(values)

['А', 'Б', 'В', 'Г', 'Д', 'Е', 'Ё', 'Ж', 'З', 'И', 'Й', 'К']


### Рассмотрим product для нескольких коллекций

In [51]:
from itertools import product

values = list(product([1, 2, 3], "АБВГ"))
print(values)

[(1, 'А'), (1, 'Б'), (1, 'В'), (1, 'Г'), (2, 'А'), (2, 'Б'), (2, 'В'), (2, 'Г'), (3, 'А'), (3, 'Б'), (3, 'В'), (3, 'Г')]


### То же самое, но с repeat 2

In [52]:
from itertools import product

values = list(product([1, 2, 3], "АБВГ", repeat=2))
print(values)

[(1, 'А', 1, 'А'), (1, 'А', 1, 'Б'), (1, 'А', 1, 'В'), (1, 'А', 1, 'Г'), (1, 'А', 2, 'А'), (1, 'А', 2, 'Б'), (1, 'А', 2, 'В'), (1, 'А', 2, 'Г'), (1, 'А', 3, 'А'), (1, 'А', 3, 'Б'), (1, 'А', 3, 'В'), (1, 'А', 3, 'Г'), (1, 'Б', 1, 'А'), (1, 'Б', 1, 'Б'), (1, 'Б', 1, 'В'), (1, 'Б', 1, 'Г'), (1, 'Б', 2, 'А'), (1, 'Б', 2, 'Б'), (1, 'Б', 2, 'В'), (1, 'Б', 2, 'Г'), (1, 'Б', 3, 'А'), (1, 'Б', 3, 'Б'), (1, 'Б', 3, 'В'), (1, 'Б', 3, 'Г'), (1, 'В', 1, 'А'), (1, 'В', 1, 'Б'), (1, 'В', 1, 'В'), (1, 'В', 1, 'Г'), (1, 'В', 2, 'А'), (1, 'В', 2, 'Б'), (1, 'В', 2, 'В'), (1, 'В', 2, 'Г'), (1, 'В', 3, 'А'), (1, 'В', 3, 'Б'), (1, 'В', 3, 'В'), (1, 'В', 3, 'Г'), (1, 'Г', 1, 'А'), (1, 'Г', 1, 'Б'), (1, 'Г', 1, 'В'), (1, 'Г', 1, 'Г'), (1, 'Г', 2, 'А'), (1, 'Г', 2, 'Б'), (1, 'Г', 2, 'В'), (1, 'Г', 2, 'Г'), (1, 'Г', 3, 'А'), (1, 'Г', 3, 'Б'), (1, 'Г', 3, 'В'), (1, 'Г', 3, 'Г'), (2, 'А', 1, 'А'), (2, 'А', 1, 'Б'), (2, 'А', 1, 'В'), (2, 'А', 1, 'Г'), (2, 'А', 2, 'А'), (2, 'А', 2, 'Б'), (2, 'А', 2, 'В'), (2, 'А', 

### Рассмотрим функцию permutations

In [53]:
from itertools import permutations

values = list(permutations("АБВ"))
print(values)

[('А', 'Б', 'В'), ('А', 'В', 'Б'), ('Б', 'А', 'В'), ('Б', 'В', 'А'), ('В', 'А', 'Б'), ('В', 'Б', 'А')]


In [54]:
from itertools import permutations

values = list(permutations("АБВ", r=2))
print(values)

[('А', 'Б'), ('А', 'В'), ('Б', 'А'), ('Б', 'В'), ('В', 'А'), ('В', 'Б')]


### Рассмотрим функцию combinations

In [55]:
from itertools import combinations

values = list(combinations("АБВ", 2))
print(values)

[('А', 'Б'), ('А', 'В'), ('Б', 'В')]


### Рассмотрим функцию combinations_with_replacement

In [56]:
from itertools import combinations_with_replacement

values = list(combinations_with_replacement("АБВ", 2))
print(values)

[('А', 'А'), ('А', 'Б'), ('А', 'В'), ('Б', 'Б'), ('Б', 'В'), ('В', 'В')]


### Рассмотрим функцию enumerate

In [57]:
for index, value in enumerate("ABC", 1):
    print(index, value)

1 A
2 B
3 C


In [58]:
for index, value in enumerate("ABC"):
    print(index, value)

0 A
1 B
2 C


### Рассмотрим функцию zip

In [59]:
print(list(zip("ABC", [1, 2, 3])))

[('A', 1), ('B', 2), ('C', 3)]


### Рассмотрим функцию zip с аргументами разной длины

In [60]:
print(list(zip("ABCDE", [1, 2, 3])))

[('A', 1), ('B', 2), ('C', 3)]


### Рассмотрим функцию zip с аргументами разной длины и параметром strict

In [61]:
print(list(zip("ABCDE", [1, 2, 3], strict=True)))

ValueError: zip() argument 2 is shorter than argument 1

In [62]:
print(list(zip("ABCDE", [1, 2, 3], "ADBDBD", [1, 3, 4])))

[('A', 1, 'A', 1), ('B', 2, 'D', 3), ('C', 3, 'B', 4)]


## Модуль collections

In [63]:
import collections

### Counter

In [64]:
list_of_letters = list('Пам-пам-бабам')
print(list_of_letters)
letter_cnt = collections.Counter(list_of_letters)
letter_cnt

['П', 'а', 'м', '-', 'п', 'а', 'м', '-', 'б', 'а', 'б', 'а', 'м']


Counter({'а': 4, 'м': 3, '-': 2, 'б': 2, 'П': 1, 'п': 1})

### Получение количества вхождений символа

In [65]:
letter_cnt['а']

4

### Если элемент не существует, ошибки не будет

In [66]:
letter_cnt['ю']

0

### Можно добавить элемент

In [67]:
letter_cnt['в'] = 0
letter_cnt

Counter({'а': 4, 'м': 3, '-': 2, 'б': 2, 'П': 1, 'п': 1, 'в': 0})

### Можно удалить элемент

In [68]:
del letter_cnt['в']
letter_cnt

Counter({'а': 4, 'м': 3, '-': 2, 'б': 2, 'П': 1, 'п': 1})

### Удаление несуществующего элемента не вызовет ошибку

In [69]:
del letter_cnt['в']

### Получение самых часто встречающихся символов

In [70]:
letter_cnt.most_common(3)

[('а', 4), ('м', 3), ('-', 2)]

In [71]:
letter_cnt.most_common()

[('а', 4), ('м', 3), ('-', 2), ('б', 2), ('П', 1), ('п', 1)]

In [72]:
letter_cnt.most_common()[:-3:-1]

[('п', 1), ('П', 1)]

### Можно получить значения

In [73]:
letter_cnt.values()

dict_values([1, 4, 3, 2, 1, 2])

In [74]:
sum(letter_cnt.values())

13

### Counter можно преобразовать во встроенные коллекции

In [75]:
list(letter_cnt)

['П', 'а', 'м', '-', 'п', 'б']

In [76]:
set(letter_cnt)

{'-', 'П', 'а', 'б', 'м', 'п'}

In [77]:
dict(letter_cnt)

{'П': 1, 'а': 4, 'м': 3, '-': 2, 'п': 1, 'б': 2}

### Можно инициализировать Counter сразу словарем

In [78]:
emotion_cnt = collections.Counter({'like':2, 'dislike':3})
emotion_cnt

Counter({'dislike': 3, 'like': 2})

### Получение всех элементов

In [79]:
list(emotion_cnt.elements())

['like', 'like', 'dislike', 'dislike', 'dislike']

### Сложение Counter

In [80]:
letter_cnt + emotion_cnt

Counter({'а': 4,
         'м': 3,
         'dislike': 3,
         '-': 2,
         'б': 2,
         'like': 2,
         'П': 1,
         'п': 1})

### Вычитание 

In [81]:
emotion_cnt - collections.Counter(like=1, dislike=3)

Counter({'like': 1})

### Пересечение

In [83]:
c = collections.Counter(a=4, b=2, c=0, d=-2)
d = collections.Counter(a=1, b=2, c=3, d=4)

print(c)
c & d

Counter({'a': 4, 'b': 2, 'c': 0, 'd': -2})


Counter({'b': 2, 'a': 1})

### Объединение

In [84]:
c | d

Counter({'a': 4, 'd': 4, 'c': 3, 'b': 2})

### In-place метод вычитания

In [85]:
c.subtract(d)
c

Counter({'a': 3, 'b': 0, 'c': -3, 'd': -6})

### Можно получить ключи только с положительными значениями

In [86]:
+c

Counter({'a': 3})

### Можно получить ключи только с отрицательными значениями

In [87]:
-c

Counter({'d': 6, 'c': 3})

### Можно очистить Counter

In [88]:
c.clear()
c

Counter()

### Еще одна коллекция - defaultdict

In [89]:
d = {}

d['hahah']

KeyError: 'hahah'

In [96]:
d = collections.defaultdict(str)
d['name'] = 'James' 
d['surname'] = 'Bond'
d['patronymic'] = None
d['patronymic']

In [97]:
d

defaultdict(str, {'name': 'James', 'surname': 'Bond', 'patronymic': None})

In [104]:
d = collections.defaultdict(None)


In [105]:
d

defaultdict(None, {})

In [108]:
d['name'] = None
d['surname'] = None
# d['patronymic']

In [109]:
d

defaultdict(None, {'name': None, 'surname': None})

### Задание defaultdict

In [110]:
dict_of_lists = collections.defaultdict(list)
for i in range(5):
    dict_of_lists[i].append(i)
dict_of_lists

defaultdict(list, {0: [0], 1: [1], 2: [2], 3: [3], 4: [4]})

In [111]:
s = 'mississippi'
d = collections.defaultdict(int)
for k in s:
    d[k] += 1

sorted(d.items())

[('i', 4), ('m', 1), ('p', 2), ('s', 4)]

In [112]:
s = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)]
d = collections.defaultdict(set)
for k, v in s:
    d[k].add(v)

sorted(d.items())

[('blue', {2, 4}), ('red', {1, 3})]

### Еще одна коллекция - OrderedDict

In [117]:
d = collections.OrderedDict.fromkeys('abcde')
d

OrderedDict([('a', None), ('b', None), ('c', None), ('d', None), ('e', None)])

In [118]:
''.join(d.keys())

'abcde'

In [119]:
d.move_to_end('b')
''.join(d.keys())

'acdeb'

In [120]:
d

OrderedDict([('a', None), ('c', None), ('d', None), ('e', None), ('b', None)])

### Попытка переместить в конец

In [121]:
d.move_to_end('b', last=False)
''.join(d.keys())

'bacde'

In [122]:
d.move_to_end('e', last=False)
''.join(d.keys())

'ebacd'

### Еще одна коллекция - ChainMap

In [123]:
letters = {'a':1, 'b':2}
vowels = {'a':1, 'b':0, 'c':0, 'd': 0, 'e':1}
chain = collections.ChainMap(letters, vowels)
chain

ChainMap({'a': 1, 'b': 2}, {'a': 1, 'b': 0, 'c': 0, 'd': 0, 'e': 1})

### Можно получить значение по ключу

In [124]:
chain['e']

1

### Получение значения по ключу, который входит в 2 элемента

In [125]:
chain['b']

2

### Что будет при изменении элемента снаружи

In [126]:
letters['c'] = 3
chain

ChainMap({'a': 1, 'b': 2, 'c': 3}, {'a': 1, 'b': 0, 'c': 0, 'd': 0, 'e': 1})

### Получение ключей

In [127]:
list(chain.keys())

['a', 'b', 'c', 'd', 'e']

### Получение значений

In [128]:
list(chain.values())

[1, 2, 3, 0, 1]

### Добавление нового элемента в chain

In [129]:
consons = {'a':0, 'b':1, 'c':1}
chain.new_child(consons)

ChainMap({'a': 0, 'b': 1, 'c': 1}, {'a': 1, 'b': 2, 'c': 3}, {'a': 1, 'b': 0, 'c': 0, 'd': 0, 'e': 1})

### Еще одна коллекция - namedtuple

In [131]:
cols = ['fname', 'pname', 'lname', 'age']
User = collections.namedtuple('User2', cols)
user1 = User('Петр', 'Иванович', 'Сидоров', 30)
user1

User2(fname='Петр', pname='Иванович', lname='Сидоров', age=30)

### Получение значений по ключу

In [132]:
user1.lname

'Сидоров'

### Пример использования

In [133]:
Point = collections.namedtuple('Point', ['x', 'y'])
p = Point(3, 4)
p.x**2 + p.y**2

25

### Поддержка индексации

In [134]:
p[0]**2 + p[1]**2

25

In [135]:
p[0]

3

In [136]:
p[1]

4

### Перенос в словарь

In [137]:
p._asdict()

{'x': 3, 'y': 4}

### Получение атрибута по имени в строковом формате

In [138]:
getattr(p, 'x')

3

### Задание из словаря (чуть дальше поговорим об операторе **)

In [139]:
d = {'x': 0, 'y': 1}
Point(**d)

Point(x=0, y=1)

### Получение всех полей

In [140]:
user1._fields, p._fields

(('fname', 'pname', 'lname', 'age'), ('x', 'y'))

### Еще один способ инициализации

In [141]:
t = [11, 22]
Point._make(t)

Point(x=11, y=22)

### Изменение значения поля

In [143]:
p = Point(x=11, y=22)
p = p._replace(x=33)

In [144]:
p

Point(x=33, y=22)

# Потоковый ввод/вывод

In [145]:
from sys import stdin

### Пример потокового ввода

In [146]:
#Нужно запускать в виде отдельного скрипта, в ноутбуке не будет работать (stdin.py)

from sys import stdin

lines = []
for line in stdin:
    lines.append(line)
print(lines)

[]


### Убираем переносы строки

In [147]:
#Нужно запускать в виде отдельного скрипта, в ноутбуке не будет работать (stdin2.py)

from sys import stdin

lines = []
for line in stdin:
    lines.append(line.rstrip("\n"))
print(lines)

[]


### Упрощаем код и жизнь

In [None]:
#Нужно запускать в виде отдельного скрипта, в ноутбуке не будет работать (stdin3.py)

from sys import stdin

lines = stdin.readlines()
print(lines)

### Если надо все и в одном месте

In [148]:
#Нужно запускать в виде отдельного скрипта, в ноутбуке не будет работать (stdin4.py)

from sys import stdin

text = stdin.read()
print([text])

['']


### Читаем из файла

In [149]:
help(open)

Help on function open in module io:

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
    Open file and return a stream.  Raise OSError upon failure.
    
    file is either a text or byte string giving the name (and the path
    if the file isn't in the current working directory) of the file to
    be opened or an integer file descriptor of the file to be
    wrapped. (If a file descriptor is given, it is closed when the
    returned I/O object is closed, unless closefd is set to False.)
    
    mode is an optional string that specifies the mode in which the file
    is opened. It defaults to 'r' which means open for reading in text
    mode.  Other common values are 'w' for writing (truncating the file if
    it already exists), 'x' for creating and writing to a new file, and
    'a' for appending (which on some Unix systems, means that all writes
    append to the end of the file regardless of the current seek position).
    In

### Открываем файл для чтения

In [150]:
file_in = open("stdin.py", encoding="UTF-8")

### Читаем файл

In [151]:
file_in = open("stdin.py", encoding="UTF-8")
for line in file_in:
    print(line)
file_in.close()

from sys import stdin



lines = []

for line in stdin:

    lines.append(line)

print(lines)


### Убираем лишние переводы строки

In [152]:
with open("stdin.py", encoding="UTF-8") as file_in:
    for line in file_in:
        print(line.rstrip("\n"))

from sys import stdin

lines = []
for line in stdin:
    lines.append(line)
print(lines)


### Как прочитать весь файл

In [153]:
file_in = open("stdin.py", encoding="UTF-8")
lines = file_in.readlines()
file_in.close()
print(lines)

['from sys import stdin\n', '\n', 'lines = []\n', 'for line in stdin:\n', '    lines.append(line)\n', 'print(lines)']


In [154]:
with open("stdin.py", encoding="UTF-8") as file_in:
    lines = file_in.readlines()
print(lines)

['from sys import stdin\n', '\n', 'lines = []\n', 'for line in stdin:\n', '    lines.append(line)\n', 'print(lines)']


### Прочитать конкретную часть

In [155]:
with open("stdin.py", encoding="UTF-8") as file_in:
    symbols = file_in.read(10)
print([symbols])

['from sys i']


### А теперь учимся писать

In [156]:
with open("output_1.txt", "w", encoding="UTF-8") as file_out:
    n = file_out.write("Это первая строка\nА вот и вторая\nИ третья — последняя\n")

In [157]:
n

54

In [159]:
with open("output_1.txt", encoding="UTF-8") as file_in:
    symbols = file_in.readlines()
print(symbols)

['Это первая строка\n', 'А вот и вторая\n', 'И третья — последняя\n']


In [160]:
lines = ["Это первая строка\n", "А вот и вторая\n", "И третья — последняя\n"]
with open("output_2.txt", "w", encoding="UTF-8") as file_out:
    file_out.writelines(lines)

In [161]:
with open("output_2.txt", encoding="UTF-8") as file_in:
    symbols = file_in.readlines()
print(symbols)

['Это первая строка\n', 'А вот и вторая\n', 'И третья — последняя\n']


### Print тоже может писать в файлы...

In [162]:
with open("output_3.txt", "w", encoding="UTF-8") as file_out:
    print("Вывод в файл с помощью функции print()", file=file_out)

In [163]:
with open("output_3.txt", encoding="UTF-8") as file_in:
    symbols = file_in.readlines()
print(symbols)

['Вывод в файл с помощью функции print()\n']


### Разные модификаторы

In [166]:
with open("output_4.txt", "x", encoding="UTF-8") as file_out:
    n = file_out.write("Это первая строка\nА вот и вторая\nИ третья — последняя\n")

FileExistsError: [Errno 17] File exists: 'output_4.txt'

In [167]:
with open("output_4.txt", "a", encoding="UTF-8") as file_out:
    n = file_out.write("Это первая строка\nА вот и вторая\nИ третья — последняя\n")

In [168]:
with open("output_4.txt", encoding="UTF-8") as file_in:
    symbols = file_in.readlines()
print(symbols)

['Это первая строка\n', 'А вот и вторая\n', 'И третья — последняя\n', 'Это первая строка\n', 'А вот и вторая\n', 'И третья — последняя\n']


In [169]:
with open("output_4.txt", "r+", encoding="UTF-8") as file_out:
    data = file_out.readlines()
    print(data)
    n = file_out.write("Это первая строка\n")

['Это первая строка\n', 'А вот и вторая\n', 'И третья — последняя\n', 'Это первая строка\n', 'А вот и вторая\n', 'И третья — последняя\n']


In [170]:
with open("output_4.txt", encoding="UTF-8") as file_in:
    symbols = file_in.readlines()
print(symbols)

['Это первая строка\n', 'А вот и вторая\n', 'И третья — последняя\n', 'Это первая строка\n', 'А вот и вторая\n', 'И третья — последняя\n', 'Это первая строка\n']


In [171]:
with open("output_4.txt", "rb", encoding="UTF-8") as file_out:
    data = file_out.readlines()
    print(data)

ValueError: binary mode doesn't take an encoding argument

In [172]:
with open("output_4.txt", "rt", encoding="UTF-8") as file_out:
    data = file_out.readlines()
    print(data)

['Это первая строка\n', 'А вот и вторая\n', 'И третья — последняя\n', 'Это первая строка\n', 'А вот и вторая\n', 'И третья — последняя\n', 'Это первая строка\n']


# JSON

[

  {
  
    "last_name": "Иванов",
    "first_name": "Иван",
    "patronymic": "Иванович",
    "date_of_birth": "01.01.2001",
    "group_number": 1,
    "phone_numbers": [
      "+7 111 111 1111",
      "+7 111 111 1112"
    ]
  },
  
  {
  
    "last_name": "Петров",
    "first_name": "Пётр",
    "patronymic": "Петрович",
    "date_of_birth": "10.10.2001",
    "group_number": 1,
    "phone_numbers": [
      "+7 111 111 1113",
      "+7 111 111 1114"
    ]
    
  }
  
]

### Прочитаем файл

In [173]:
import json

with open("data.json", encoding="UTF-8") as file_in:
    records = json.load(file_in)
print(records)

[{'last_name': 'Иванов', 'first_name': 'Иван', 'patronymic': 'Иванович', 'date_of_birth': '01.01.2001', 'group_number': 1, 'phone_numbers': ['+7 111 111 1111', '+7 111 111 1112']}, {'last_name': 'Петров', 'first_name': 'Пётр', 'patronymic': 'Петрович', 'date_of_birth': '10.10.2001', 'group_number': 2, 'phone_numbers': ['+7 111 111 1113', '+7 111 111 1114']}]


### Попробуем переписать

In [174]:
import json

with open("data.json", encoding="UTF-8") as file_in:
    records = json.load(file_in)
records[1]["group_number"] = 15

with open("data.json", "w", encoding="UTF-8") as file_out:
    json.dump(records, file_out, ensure_ascii=False, indent=2)

### Что станет, если сделать ensure_ascii=True и поменять indent

In [175]:
with open("data2.json", "w", encoding="UTF-8") as file_out:
    json.dump(records, file_out, ensure_ascii=True, indent=4)

### Пример записи словаря в json файл

In [176]:
import json

records = {1: "First",
           2: "Second",
           3: "Third"}
with open("output.json", "w", encoding="UTF-8") as file_out:
    json.dump(records, file_out, ensure_ascii=False, indent=2)

### Модуль Json не работает с несериализуемыми объектами

In [177]:
import numpy as np

arr = np.array([1, 2, 3, 4])
with open("output2.json", "w", encoding="UTF-8") as file_out:
    json.dump(arr, file_out, ensure_ascii=False, indent=2)

TypeError: Object of type ndarray is not JSON serializable

# YAML

total:

    - BS: 1550
      IT: 791
      id: 11
      name: Liverpool
      to_id: 1
      to_name: LONDON
    
    - BS: 1510
      IT: 793
      id: 12
      name: Bristol
      to_id: 1
      to_name: LONDON
    
    - BS: 1650
      IT: 892
      id: 14
      name: Coventry
      to_id: 2
      to_name:
        new_name: Manchester

In [None]:
# []
# {}

In [178]:
import yaml
from pprint import pprint

with open('info.yaml') as f:
    templates = yaml.safe_load(f)

pprint(templates)

{'total': [{'BS': 1550,
            'IT': 791,
            'id': 11,
            'name': 'Liverpool',
            'to_id': 1,
            'to_name': 'LONDON'},
           {'BS': 1510,
            'IT': 793,
            'id': 12,
            'name': 'Bristol',
            'to_id': 1,
            'to_name': 'LONDON'},
           {'BS': 1650,
            'IT': 892,
            'id': 14,
            'name': 'Coventry',
            'to_id': 2,
            'to_name': {'new_name': 'Manchester'}}]}


In [179]:
import yaml

to_yaml = {
   'access': ['switchport mode access',
              'switchport access vlan',
              'switchport nonegotiate',
              'spanning-tree portfast',
              'spanning-tree bpduguard enable'],
   'trunk': ['switchport trunk encapsulation dot1q',
             'switchport mode trunk',
             'switchport trunk native vlan 999',
             'switchport trunk allowed vlan'],
}

with open('sw_templates.yaml', 'w') as f:
    yaml.dump(to_yaml, f)

with open('sw_templates.yaml') as f:
    print(f.read())

access:
- switchport mode access
- switchport access vlan
- switchport nonegotiate
- spanning-tree portfast
- spanning-tree bpduguard enable
trunk:
- switchport trunk encapsulation dot1q
- switchport mode trunk
- switchport trunk native vlan 999
- switchport trunk allowed vlan



# CSV

hostname, vendor, model, location

sw1, Cisco, 3750, London

sw2, Cisco, 3850, Liverpool

sw3, Cisco, 3650, Liverpool

sw4, Cisco, 3650, London

### Пример чтения

In [180]:
import csv

with open('data.csv') as f:
    reader = csv.reader(f)
    for row in reader:
        print(row)

['hostname', 'vendor', 'model', 'location']
['sw1', 'Cisco', '3750', 'London']
['sw2', 'Cisco', '3850', 'Liverpool']
['sw3', 'Cisco', '3650', 'Liverpool']
['sw4', 'Cisco', '3650', 'London']


### reader - итератор

In [181]:
import csv

with open('data.csv') as f:
    reader = csv.reader(f)
    print(reader)

<_csv.reader object at 0x10b6fa3b0>


In [182]:
import csv

with open('data.csv') as f:
    reader = csv.reader(f)
    print(list(reader))

[['hostname', 'vendor', 'model', 'location'], ['sw1', 'Cisco', '3750', 'London'], ['sw2', 'Cisco', '3850', 'Liverpool'], ['sw3', 'Cisco', '3650', 'Liverpool'], ['sw4', 'Cisco', '3650', 'London']]


### Получение заголовков отдельно

In [183]:
import csv

with open('data.csv') as f:
    reader = csv.reader(f)
    headers = next(reader)
    print('Headers: ', headers)
    for row in reader:
        print(row)

Headers:  ['hostname', 'vendor', 'model', 'location']
['sw1', 'Cisco', '3750', 'London']
['sw2', 'Cisco', '3850', 'Liverpool']
['sw3', 'Cisco', '3650', 'Liverpool']
['sw4', 'Cisco', '3650', 'London']


### Получение в виде словарей

In [184]:
import csv

with open('data.csv') as f:
    reader = csv.DictReader(f)
    for row in reader:
        print(row)
        print(row['hostname'], row['model'])

{'hostname': 'sw1', 'vendor': 'Cisco', 'model': '3750', 'location': 'London'}
sw1 3750
{'hostname': 'sw2', 'vendor': 'Cisco', 'model': '3850', 'location': 'Liverpool'}
sw2 3850
{'hostname': 'sw3', 'vendor': 'Cisco', 'model': '3650', 'location': 'Liverpool'}
sw3 3650
{'hostname': 'sw4', 'vendor': 'Cisco', 'model': '3650', 'location': 'London'}
sw4 3650


### Запись

In [185]:
import csv

data = [['hostname', 'vendor', 'model', 'location'],
        ['sw1', 'Cisco', '3750', 'London, Best str'],
        ['sw2', 'Cisco', '3850', 'Liverpool, Better str'],
        ['sw3', 'Cisco', '3650', 'Liverpool, Better str'],
        ['sw4', 'Cisco', '3650', 'London, Best str']]


with open('sw_data_new.csv', 'w') as f:
    writer = csv.writer(f)
    for row in data:
        writer.writerow(row)

with open('sw_data_new.csv') as f:
    print(f.read())

hostname,vendor,model,location
sw1,Cisco,3750,"London, Best str"
sw2,Cisco,3850,"Liverpool, Better str"
sw3,Cisco,3650,"Liverpool, Better str"
sw4,Cisco,3650,"London, Best str"



### Как добавить кавычки во всех строковых данных

In [186]:
import csv


data = [['hostname', 'vendor', 'model', 'location'],
        ['sw1', 'Cisco', '3750', 'London, Best str'],
        ['sw2', 'Cisco', '3850', 'Liverpool, Better str'],
        ['sw3', 'Cisco', '3650', 'Liverpool, Better str'],
        ['sw4', 'Cisco', '3650', 'London, Best str']]


with open('sw_data_new.csv', 'w') as f:
    writer = csv.writer(f, quoting=csv.QUOTE_NONNUMERIC)
    for row in data:
        writer.writerow(row)

with open('sw_data_new.csv') as f:
    print(f.read())

"hostname","vendor","model","location"
"sw1","Cisco","3750","London, Best str"
"sw2","Cisco","3850","Liverpool, Better str"
"sw3","Cisco","3650","Liverpool, Better str"
"sw4","Cisco","3650","London, Best str"



### Упрощенная запись в файл

In [187]:
import csv

data = [['hostname', 'vendor', 'model', 'location'],
        ['sw1', 'Cisco', '3750', 'London, Best str'],
        ['sw2', 'Cisco', '3850', 'Liverpool, Better str'],
        ['sw3', 'Cisco', '3650', 'Liverpool, Better str'],
        ['sw4', 'Cisco', '3650', 'London, Best str']]


with open('sw_data_new.csv', 'w') as f:
    writer = csv.writer(f, quoting=csv.QUOTE_NONNUMERIC)
    writer.writerows(data)

with open('sw_data_new.csv') as f:
    print(f.read())

"hostname","vendor","model","location"
"sw1","Cisco","3750","London, Best str"
"sw2","Cisco","3850","Liverpool, Better str"
"sw3","Cisco","3650","Liverpool, Better str"
"sw4","Cisco","3650","London, Best str"



### Запись из словаря

In [188]:
import csv

data = [{
    'hostname': 'sw1',
    'location': 'London',
    'model': '3750',
    'vendor': 'Cisco'
}, {
    'hostname': 'sw2',
    'location': 'Liverpool',
    'model': '3850',
    'vendor': 'Cisco'
}, {
    'hostname': 'sw3',
    'location': 'Liverpool',
    'model': '3650',
    'vendor': 'Cisco'
}, {
    'hostname': 'sw4',
    'location': 'London',
    'model': '3650',
    'vendor': 'Cisco'
}]

with open('csv_write_dictwriter.csv', 'w') as f:
    writer = csv.DictWriter(
        f, fieldnames=list(data[0].keys()), quoting=csv.QUOTE_NONNUMERIC)
    writer.writeheader()
    for d in data:
        writer.writerow(d)
        
with open('csv_write_dictwriter.csv') as f:
    print(f.read())

"hostname","location","model","vendor"
"sw1","London","3750","Cisco"
"sw2","Liverpool","3850","Cisco"
"sw3","Liverpool","3650","Cisco"
"sw4","London","3650","Cisco"



hostname;vendor;model;location

sw1;Cisco;3750;London

sw2;Cisco;3850;Liverpool

sw3;Cisco;3650;Liverpool

sw4;Cisco;3650;London

In [189]:
import csv

with open('sw_data2.csv') as f:
    reader = csv.reader(f, delimiter=';')
    for row in reader:
        print(row)

['hostname', 'vendor', 'model', 'location']
['sw1', 'Cisco', '3750', 'London']
['sw2', 'Cisco', '3850', 'Liverpool']
['sw3', 'Cisco', '3650', 'Liverpool']
['sw4', 'Cisco', '3650', 'London']
