***-----------------------------------------------------PYTHON-9. Collections. Numpy----------------------------------------------------------------***

**COUNTER**

Как уже было сказано ранее, объект **Counter** (от англ. «счётчик») предназначен для решения часто возникающей задачи по подсчёту различных элементов.

Давайте посмотрим, как используется счётчик. Вначале необходимо импортировать Counter из модуля collections, а затем создать пустой экземпляр этого объекта:

In [1]:
from collections import Counter
# Создаём пустой объект Counter
c = Counter()

cars = ['red', 'blue', 'black', 'black', 'black', 'red', 'blue', 'red', 'white']

for car in cars:
    c[car] += 1
 
print(c)

Counter({'red': 3, 'black': 3, 'blue': 2, 'white': 1})


In [2]:
# Или можно сделать так:
a = Counter(cars)
print (a)

Counter({'red': 3, 'black': 3, 'blue': 2, 'white': 1})


Узнать, сколько раз встретился конкретный элемент, можно, обратившись к счётчику по ключу как к обычному словарю:

Возможности Counter не ограничиваются только подсчётом элементов. Этот объект обладает и дополнительным функционалом — например, счётчики можно складывать и вычитать.

- Чтобы получить список всех элементов, которые содержатся в Counter, используется функция **elements()**. Она возвращает итератор, поэтому, чтобы напечатать все элементы, распакуем их с помощью *:
*counter.elements()
- Чтобы получить список уникальных элементов, достаточно воспользоваться функцией **list()**: list(counter)
- С помощью функции **dict()** можно превратить Counter в обычный словарь: dict(counter)
- В неё также можно передать значение, которое задаёт желаемое число первых наиболее частых элементов, например, 2: counter.most_common(2)

**DEFAULTDICT**

Объект **defaultdict** из модуля **collections** позволяет задавать тот тип данных, который хранится в словаре по умолчанию. Это бывает удобно в том случае, если приходится заполнять одну и ту же структуру данных, экземпляр которой должен храниться по каждому ключу в словаре.

Создадим **defaultdict**, в котором при обращении по несуществующему ключу будет автоматически создаваться новый список. Для этого при создании объекта **defaultdict** в круглых скобках передадим параметр *list*:

In [None]:
from collections import defaultdict
groups = defaultdict(list)

Обратите внимание, что в скобках мы передаём именно указатель на класс объекта (например *list*; также можно было бы применить *set, dict*) без круглых скобок, которые используются для создания нового экземпляра объекта.

Получить элемент из **defaultdict** по ключу можно так же, как и из обычного словаря. Если запрашиваемого ключа нет в словаре, *KeyError* не возникнет. Вместо этого будет напечатан пустой элемент, который создаётся в словаре по умолчанию (и этот пустой элемент появится в словаре, хоть мы его и не создавали).

**ORDEREDDICT**

Сохранение ключей в словаре в порядке добавления не всегда является существенным, но при необходимости словарь с таким функционалом можно получить из модуля **collections**. Специальный словарь, который гарантирует сохранение ключей в порядке их добавления, называется **OrderedDict**:

**DEQUE**

Очередь — это упорядоченный тип данных, который обладает двумя ключевыми функциями: добавление элемента в конец очереди и извлечение самого первого элемента из очереди. То есть очередь подразумевает, что тот элемент, который первым добавлен в очередь, будет первым потом и обработан. Всё как в обычной очереди! Этот принцип сокращённо также называется *FIFO* (от англ. First In — First Out, «первым пришёл — первым ушёл»).

Стек (от англ. stack — стопка) — это упорядоченный тип данных, который обладает двумя основными функциями: добавление элемента в конец стека и извлечение элемента из конца стека. Эта структура данных также называется рюкзаком. Действительно, представьте себе, что вы набили вещами рюкзак. Теперь, когда вы решите достать из него самую верхнюю вещь, что это будет за вещь? Верно — та самая, которую вы убрали в рюкзак последней. Поэтому принцип стека (рюкзака) также сокращённо называется *LIFO* (Last In — First Out, «последним пришёл — первым ушёл»).

Существует структура данных **deque** (читается как «дек», англ. double-ended queue — двухконцевая очередь). Она объединяет в себе возможности и стека, и очереди: содержит функции, которые позволяют добавлять элементы в начало или в конец очереди, а также извлекать первый или последний элемент из неё. 

Можно сказать, что стек и очередь — это принципы обработки данных. deque позволяет обрабатывать данные обоими способами в зависимости от того, что требуется от разработчика. В каком порядке обрабатывать данные (*FIFO* или *LIFO*) вам подскажет собственная логика или более продвинутая теория алгоритмов.

In [None]:
from collections import deque
dq = deque()
print(dq)

У **deque** есть четыре ключевые функции:

- **append** (добавить элемент в конец дека);
- **appendleft** (добавить элемент в начало дека);
- **pop** (удалить и вернуть элемент из конца дека);
- **popleft** (удалить и вернуть элемент из начала дека).

Объект **deque** поддерживает индексацию по элементам.Чтобы удалить конкретный элемент по индексу, необходимо воспользоваться встроенной конструкцией **del**:

In [None]:
clients = deque(['Ivanov', 'Petrov', 'Smirnov', 'Tikhonova'])
del clients[2]
print(clients)
# deque(['Ivanov', 'Petrov', 'Tikhonova'])

Также в очередь возможно добавить сразу несколько элементов из итерируемого объекта. Для этого используют функции **extend** (добавить в конец дека) и **extendleft** (добавить в начало дека).

При создании очереди можно также указать её максимальную длину с помощью параметра **maxlen**. Сделать это можно как при создании пустой очереди, так и при создании очереди от заданного итерируемого объекта:

In [None]:
limited = deque(maxlen=3)
print(limited)
# deque([], maxlen=3)
 
limited_from_list = deque([1,3,4,5,6,7], maxlen=3)
print(limited_from_list)
# deque([5, 6, 7], maxlen=3)

У объекта **deque** есть ещё несколько фишек:
- **reverse** позволяет поменять порядок элементов в очереди на обратный
- **rotate** переносит n заданных элементов из конца очереди в начало
- **index** позволяет найти первый индекс искомого элемента, а **count** позволяет подсчитать, сколько раз элемент встретился в очереди (функции аналогичны одноимённым функциям для списков)
- **clear** позволяет очистить очередь

**МАССИВЫ**

Массив в программировании — это ещё одна структура данных. Она позволяет хранить элементы в заданном порядке точно так же, как это делают списки. Однако массивы обладают особым свойством: элемент по любому номеру из массива можно получить за одно и то же время. Другими словами, неважно, находится элемент в начале, в середине или в конце списка — на времени получения элемента из массива по индексу (номеру) это никак не скажется.

Итак, массив — это структура данных, в которой:
- Элементы хранятся в указанном порядке.
- Каждый элемент можно получить по индексу за одинаковое время.
- Все элементы приведены к одному и тому же типу данных.
- Максимальное число элементов и объём выделенной памяти заданы заранее.

Работа с массивами:
- узнать размерность массива можно с помощью **.ndim**
- узнать общее число элементов в массиве можно с помощью **.size**
- форма или структура массива хранится в атрибуте **.shape**
- узнать, сколько «весит» каждый элемент массива в байтах позволяет **.itemsize**

Массив из нулей создаётся функцией **np.zeros**. Она принимает аргументы **shape** (обязательный) — форма массива (одно число или кортеж) и **dtype** (необязательный) — тип данных, который будет храниться в массиве.

Ещё одной удобной функцией для создания одномерных массивов является **arange**. Она аналогична встроенной функции **range**, но обладает рядом особенностей. Вот её сигнатура: **arange([start,] stop, [step,], dtype=None)**.

Аргументы **start** (по умолчанию 0), **step** (по умолчанию 1) и **dtype** (определяется автоматически) являются необязательными:

На самом деле операции с плавающей точкой не всегда бывают предсказуемыми из-за особенностей хранения таких чисел в памяти компьютера. Поэтому для работы с дробными параметрами start, stop и step лучше использовать функцию **linspace** (англ. linear space — линейное пространство). Она тоже возвращает одномерный массив из чисел, расположенных на равном удалении друг от друга между началом и концом диапазона, но обладает немного другим поведением и сигнатурой:

**np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)**