<a href="https://colab.research.google.com/github/Quitedeer/doklad/blob/master/DokladTema2.ipynb"><img align="left" src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open in Colab" title="Open and Execute in Google Colaboratory" target="_blank"></a>

# Enum

Модуль **enum** определяет перечислимый тип данных с возможностями итерирования и сравнения элементов. Он позволяет создавать символические имена для значений, чтобы не нужно было использовать строковые литералы или целочисленные значения. Модуль **enum** является частью стандартной библиотеки Python 3, поэтому его не нужно отдельно устанавливать.

In [1]:
from enum import Enum

Перечисления создаются с использованием синтаксиса классов. Это упрощает их чтение и написание.

In [2]:
from enum import Enum 
class Sequences (Enum): 
    list = 1 
    tuple = 2 
    dict = 3 
print(Sequences.list) 
print(Sequences.tuple.name) 
print(Sequences.dict.value)

Sequences.list
tuple
3


Программист может не прописывать значения элементов, вместо этого он может использовать функцию **auto()**, которая автоматически присваивает элементу значение “1”, а каждому последующему — значение на единицу больше:

In [3]:
from enum import Enum, auto 
class Sequences (Enum): 
    list = auto() # 1 
    tuple = auto() # 1 + 1 = 2 
    dict = auto() # 2 + 1 = 3

### Итерирование 

Перечисления — это итерируемые объекты, это значит, что все элементы можно перебрать в цикле.

In [4]:
from enum import Enum 
class Num (Enum): 
    one = 1 
    two = 2 
    three = 3 
for n in Num: print(n)

Num.one
Num.two
Num.three


### Хэшируемость 

Элементы перечисления хэшируемые. То есть программист может использовать их в словарях и множествах. Вспомним, что хэш позволяет создавать высокопроизводительные структуры, используя хэш-функции для сокращения объема данных.

In [5]:
from enum import Enum 
class Color(Enum): 
    BLUE = 1 
    BLACK = 2 
    BROWN = 3 
apples = {} 
apples[Color.BLUE] = 'blue' 
apples[Color.BLACK] = 'black' 
print(apples)

{<Color.BLUE: 1>: 'blue', <Color.BLACK: 2>: 'black'}


Чтобы потребовать уникальность значений перечисления, следует декорировать тип **Enum** декоратором **@unique**.

In [14]:
from enum import Enum, unique
@unique
class BugStatus(Enum): 
    new = 7 
    incomplete = 6 
    invalid = 5 
    wont_fix = 4 
    in_progress = 3 
    fix_committed = 2 
    fix_released = 1 
    # При наличии декоратора unique возбуждается исключение 
    by_design = 4 
    closed = 1

ValueError: duplicate values found in <enum 'BugStatus'>: by_design -> wont_fix, closed -> fix_released

При наличии элементов с одинаковыми значениями интерпретатор возбуждает исключение ValueError.

### Создание методов 

Программист может полностью вывести элемент перечисления, либо вывести его имя, либо вывести его значение. Для того чтобы упростить это, можно самостоятельно создать в перечислении метод.

In [16]:
from enum import Enum 
class Students(Enum): 
    IGOR = 1 
    SERGEY = 2 
    VASYA = 3 
    def info(self): 
        print("Имя - %s, значение - %s"%(self.name, self.value)) 
Students.IGOR.info()

Имя - IGOR, значение - 1


# Collections 

Модуль **collections** содержит специализированные классы контейнеров, альтернативных традиционным **dict, list и tuple**.

Класс **Counter** — это контейнер, предназначенный для подсчета числа сохраненных эквивалентных значений. Создаются они с помощью конструктора **collections.Counter()**. Класс Counter поддерживает три формы инициализации. При вызове конструктора ему можно передать последовательность элементов, словарь, содержащий ключи и значения, или именованные аргументы, сопоставляющие строки имен со значениями счетчиков. Все три формы инициализации дают один и тот же результат.

In [20]:
import collections 
print(collections.Counter(['a', 'b', 'c', 'a', 'b', 'b'])) 
print(collections.Counter({'a': 2, 'b': 3, 'c': 1})) 
print(collections.Counter(a=2, b=3, c=1))

Counter({'b': 3, 'a': 2, 'c': 1})
Counter({'b': 3, 'a': 2, 'c': 1})
Counter({'b': 3, 'a': 2, 'c': 1})


Объект Counter не возбуждает исключения KeyError для неизвестных элементов. Если значение отсутствует во входной строке, то значение его счетчика равно 0.

Метод **elements()** возвращает итератор, обеспечивающий поочередное извлечение всех элементов, известных экземпляру Counter. Итератор возвращает элементы в произвольном порядке, причем элементы, значения счетчиков которых меньше или равны нулю, игнорируются.

In [21]:
import collections 
c = collections.Counter('extremely') 
c['z'] = 0 
print(c)
print(list(c.elements()))

Counter({'e': 3, 'x': 1, 't': 1, 'r': 1, 'm': 1, 'l': 1, 'y': 1, 'z': 0})
['e', 'e', 'e', 'x', 't', 'r', 'm', 'l', 'y']


Для получения последовательности n наиболее часто встречающихся входных значений используется метод **most_common()**.

In [27]:
import collections 
c = collections.Counter() 
with open('C:/Users/User/ttt/hug.txt', 'rt') as f: 
    for line in f: 
        c.update(line.rstrip().lower()) 
    print('Most common:') 
    for letter, count in c.most_common(3): 
        print('{}: {:>7}'.format(letter, count))

Most common:
 :      34
e:      20
o:      16


Экземпляры **Counter** поддерживают арифметические операции и операции над множествами для агрегирования результатов. Следующий пример демонстрирует создание новых экземпляров Counter c помощью стандартных операторов, но поддерживаются также операции, выполняемые на месте c помощью операторов +=, -=, &= и | =. 

При создании новых объектов Counter посредством выполнения одной из этих операций элементы c нулевыми и отрицательными значениями счетчиков отбрасываются.

In [30]:
import collections 
c1 = collections.Counter(['a', 'b', 'c', 'a', 'b', 'b']) 
c2 = collections.Counter('alphabet') 
print('C1:', c1) 
print('C2:', c2) 
print('\nCombined counts:') 
print(c1 + c2) 
print('\nSubtraction:') 
print(c1 - c2) 
print('\nIntersection (taking positive minimums):') 
print(c1 & c2) 
print('\nUnion (taking maximums):') 
print(c1 | c2)

C1: Counter({'b': 3, 'a': 2, 'c': 1})
C2: Counter({'a': 2, 'l': 1, 'p': 1, 'h': 1, 'b': 1, 'e': 1, 't': 1})

Combined counts:
Counter({'a': 4, 'b': 4, 'c': 1, 'l': 1, 'p': 1, 'h': 1, 'e': 1, 't': 1})

Subtraction:
Counter({'b': 2, 'c': 1})

Intersection (taking positive minimums):
Counter({'a': 2, 'b': 1})

Union (taking maximums):
Counter({'b': 3, 'a': 2, 'c': 1, 'l': 1, 'p': 1, 'h': 1, 'e': 1, 't': 1})


### Словарь со значением по умолчанию - defaultdict

Что будет, если обратиться к словарю по ключу, которого в нем ещё нет? Верно, исключение KeyError

In [35]:
d = dict() 
d['name'] = 'James' 
d['surname'] = 'Bond' 
d['patronymic']
d

KeyError: 'patronymic'

В данном случае достаточно использовать альтернативный вариант словаря – collections.defaultdict. Соответствующему конструктору в качестве аргумента передается тип элемента по умолчанию:

In [32]:
d = collections.defaultdict(str) 
d['name'] = 'James' 
d['surname'] = 'Bond' 
d['patronymic'] 
d

defaultdict(str, {'name': 'James', 'surname': 'Bond', 'patronymic': ''})

Обычные словари имеют метод **setdefault()**, который позволяет добиться того же результата, но его использование делает программный код менее наглядным и замедляет исполнение.

Помимо **str** и **int, defaultdict** часто используют в связке с пустым списком, чтобы начинать добавление элементов без лишнего кода:

In [37]:
dict_of_lists = collections.defaultdict(list) 
for i in range(5): 
    dict_of_lists[i].append(i) 
    ... 
dict_of_lists

defaultdict(list, {0: [0], 1: [1], 2: [2], 3: [3], 4: [4]})

### Словарь с памятью порядка добавления элементов OrderedDict

Класс **OrderedDict** — это подкласс словаря, запоминающий порядок добавления содержимого. Так как OrderedDict это упорядоченная последовательность, объекты содержат соответствующие методы, реорганизующие структуру: 
1. popitem(last=True) – удаляет последний элемент если last=True, и первый, если last=False 

In [45]:
d = collections.OrderedDict.fromkeys('abcde') 
d.popitem(last=True) 
''.join(d.keys())

'abcd'

In [48]:
d = collections.OrderedDict.fromkeys('abcde') 
d.popitem(last=False) 
''.join(d.keys())

'bcde'

2. move_to_end(key, last=True) – переносит ключ key в конец, если last=True, и в начало, если last=False

In [50]:
d = collections.OrderedDict.fromkeys('abcde') 
d.move_to_end('b', last=True) 
''.join(d.keys())

'acdeb'

In [47]:
d = collections.OrderedDict.fromkeys('abcde') 
d.move_to_end('b', last=False) 
''.join(d.keys())

'bacde'

### Контейнер словарей ChainMap

После разговора о словарях самое время обсудить класс, умеющий объединять словари в надструктуру – **ChainMap**. При этом получается не один общий словарь, а их совокупность, в которой каждый словарь остаётся независимой составляющей:

In [51]:
letters = {'a':1, 'b':2} 
vowels = {'a':1, 'b':0, 'c':0, 'd': 0, 'e':1} 
chain = collections.ChainMap(letters, vowels) 
chain

ChainMap({'a': 1, 'b': 2}, {'a': 1, 'b': 0, 'c': 0, 'd': 0, 'e': 1})

При обращении к **ChainMap** по ключу одного из словарей, происходит поиск значения среди всех словарей, при этом нет необходимости указывать конкретный словарь:

In [52]:
chain['e']

1

При поиске **ChainMap** выводит первое найденное значение (проходя словари по очереди добавления). В том числе если в словарях несколько одинаковых ключей:

In [53]:
chain['b']

2

Изменение содержания словаря изменяет и ChainMap. Нет необходимости перезаписывать надструктуру:

In [54]:
letters['c'] = 3 
chain

ChainMap({'a': 1, 'b': 2, 'c': 3}, {'a': 1, 'b': 0, 'c': 0, 'd': 0, 'e': 1})

Так как **ChainMap** это комбинация словарей, у неё есть методы **keys()** и **values()**.

In [57]:
list(chain.keys())

['a', 'b', 'c', 'd', 'e']

In [56]:
list(chain.values())

[1, 2, 3, 0, 1]

При необходимости расширить составленный ранее **ChainMap** можно методом **new_child()**. Обратите внимание, что метод не обновляет старую структуру, а создаёт новую.

In [58]:
consons = {'a':0, 'b':1, 'c':1} 
chain.new_child(consons)

ChainMap({'a': 0, 'b': 1, 'c': 1}, {'a': 1, 'b': 2, 'c': 3}, {'a': 1, 'b': 0, 'c': 0, 'd': 0, 'e': 1})

### Двусторонняя очередь deque

Объект типа **deque** является усовершенствованным вариантом списка с оптимизированной вставкой/удалением элементов с обоих концов. Реализация **deque** оптимизирована так, что операции слева и справа имеют примерно одинаковую производительность. Добавление новых элементов в конец происходит не сильно медленнее, чем во встроенных списках, но добавление в начало выполняется существенно быстрее.

In [59]:
seq = list("bcd") 
deq = collections.deque(seq) 
deq

deque(['b', 'c', 'd'])

In [60]:
deq.append('e') # добавление в конец
deq.appendleft('a') # добавление в начало (левый конец) 
deq

deque(['a', 'b', 'c', 'd', 'e'])

Аналогично методу **append()** метод **pop()** для **deque** работает с обоих концов:

In [61]:
deq.pop() 
deq.popleft() 
deq

deque(['b', 'c', 'd'])

Если нужно посчитать число вхождений элемента в последовательность, применяем метод **count()**:

In [62]:
deq.count('b'), deq.count('a')

(1, 0)

Кроме перечисленных, доступны следующие методы:

1. **remove(value)** – удаление первого вхождения value

2. **reverse()** – разворачивает очередь

3. **rotate(n=1)** – последовательно переносит n элементов из начала в конец (если n отрицательно, то с конца в начало). В этом поведение deque напоминает кольцевой связный список.

### Именованный кортеж и функция namedtuple()

**namedtuple()** – функция-фабрика для создания именованных кортежей. Этот тип данных похож на **struct** в других языках программирования:

In [63]:
cols = ['fname', 'pname', 'lname', 'age'] 
User = collections.namedtuple('User', cols) 
user1 = User('Петр', 'Иванович', 'Сидоров', 30) 
user1

User(fname='Петр', pname='Иванович', lname='Сидоров', age=30)

In [64]:
user1.lname

'Сидоров'

In [65]:
Point = collections.namedtuple('Point', ['x', 'y']) 
p = Point(3, 4) 
p.x**2 + p.y**2

25

Именованные кортежи делают код яснее – вместо индексирования составляющие объекта вызываются по явным именам. Остаётся доступной и численная индексация:

In [66]:
p[0]**2 + p[1]**2

25

Структура **namedtuple** похожа на словарь. Посредством метода **_asdict** можно представить те же данные в виде **OrderedDict**:

In [67]:
p._asdict()

{'x': 3, 'y': 4}

Чтобы вызвать значение через строковый ключ, необязательно преобразовывать **namedtuple** – подходит стандартная функция **getattr()**:

In [68]:
getattr(p, 'x')

3

Чтобы преобразовать словарь в именованный кортеж заданного типа, достаточно распаковать его оператором **:

In [69]:
d = {'x': 0, 'y': 1} 
Point(**d)

Point(x=0, y=1)

Имена полей **namedtuple** перечислены в **_fields**:

In [70]:
user1._fields, p._fields

(('fname', 'pname', 'lname', 'age'), ('x', 'y'))

Поскольку именованный кортеж является обычным классом **Python**, в него легко привнести новую функциональность или изменить старую. Например, добавим к **Point** расчёт гипотенузы и формат вывода данных:

In [71]:
class Point(collections.namedtuple('Point', ['x', 'y'])): 
    __slots__ = () # предотвращает создание словарей экземпляров 
    @property 
    def hypot(self): 
        return (self.x**2 + self.y**2) ** 0.5 
    def __str__(self): 
        return 'Point: x=%6.3f y=%6.3f hypot=%6.3f' % (self.x, self.y, self.hypot) 
for p in Point(3, 4), Point(14, 5/7): 
    print(p)

Point: x= 3.000 y= 4.000 hypot= 5.000
Point: x=14.000 y= 0.714 hypot=14.018


# Array

Модуль **array** определяет линейную структуру данных, которая во многом напоминает список, за исключением того, что все члены этого списка должны относиться к одному и тому же элементарному типу. К поддерживаемым типам относятся все числовые и другие элементарные типы, такие как байты.

Некоторые из поддерживаемых типов приведены в таблице. Полный список кодов типов можно найти в документации стандартной библиотеки.

![title](https://sun9-15.userapi.com/impf/9PAqg3f4-s8HXEAWfmY-HOcQzlRnEBHiAVuuYw/xuUQ2qnGcpc.jpg?size=0x0&quality=90&proxy=1&sign=1276c85013f0932dc9655b1ddcd02660)

В этом примере массив сконфигурирован для хранения последовательности байтов и инициализируется простой байтовой строкой.

In [72]:
import array 
import binascii 
s = b'This is the array.' 
a = array.array('b', s) 
print('As byte string:', s) 
print('As array :', a) 
print('As hex :', binascii.hexlify(a))

As byte string: b'This is the array.'
As array : array('b', [84, 104, 105, 115, 32, 105, 115, 32, 116, 104, 101, 32, 97, 114, 114, 97, 121, 46])
As hex : b'54686973206973207468652061727261792e'


### Манипулирование массивами 
К массивам применимы те же способы расширения и выполнения различных манипуляций, которые используются по отношению к другим последовательностям **Python**.

In [114]:
import array
import pprint

a = array.array('i', range(3))

print('Initial: ', a)

a.extend(range(3))
print('Extended: ', a)

print('Slice: ', a[2:5])

print('Iterator: ')
print(list(enumerate(a)))

Initial:  array('i', [0, 1, 2])
Extended:  array('i', [0, 1, 2, 0, 1, 2])
Slice:  array('i', [2, 0, 1])
Iterator: 
[(0, 0), (1, 1), (2, 2), (3, 0), (4, 1), (5, 2)]


К поддерживаемым операциям относятся выделение срезов, итерирование и добавление элементов в конец массива.

Метод **tofile()** использует метод **tobytes()** для форматирования данных, а метод **fromfile()** использует метод **frombytes()** для их обратного преобразования в экземпляр массива.

In [113]:
import array
import binascii
a = array.array('i', range(5))
print('A1:', a)

as_bytes = a.tobytes()
print('Bytes:', binascii.hexlify(as_bytes))

a2 = array.array('i')
a2.frombytes(as_bytes)
print('A2:', a2)

A1: array('i', [0, 1, 2, 3, 4])
Bytes: b'0000000001000000020000000300000004000000'
A2: array('i', [0, 1, 2, 3, 4])


Оба метода, **tobytes()** и frombytes (), работают c байтовыми строками, а не со строками Unicode.

# Задания

### Задание 1

С помощью одного из класса модуля Collections, напишите код, который выводит данную строку: 'g': 3, 'f': 3, 'q': 2, 'h': 1

In [None]:
import collections

### Задание 2

С помощью одного из класса модуля Collections, напишите код, в котором будет удаляться последний элемент: 'dream'

In [None]:
import collections

### Задание 3

С помощью deque добавьте во встроенный список символ 'q'

In [None]:
a = list("zxc")