# Counter

## объект Counter (от англ. «счётчик») предназначен для решения часто возникающей задачи по подсчёту различных элементов.

In [23]:
# Импортируем объект Counter из модуля collections
from collections import Counter
# Создаём пустой объект Counter
c = Counter()

Рассмотрим базовый синтаксис этого инструмента. Например, будем считать цвета проезжающих машин: если встретили красную машину, посчитаем её. Для этого прибавим к ключу 'red' единицу. Синтаксис очень похож на работу со словарём:

In [5]:
c['red'] += 1
print(c)
# Будет напечатано:
# Counter({'red': 1})

Counter({'red': 1})


In [6]:
cars = ['red', 'blue', 'black', 'black', 'black', 'red', 'blue', 'red', 'white']

In [7]:
c = Counter()
for car in cars:
    c[car] += 1
 
print(c)
# Counter({'red': 3, 'black': 3, 'blue': 2, 'white': 1})

Counter({'red': 3, 'black': 3, 'blue': 2, 'white': 1})


Однако гораздо проще при создании Counter сразу передать в круглых скобках итерируемый объект, в котором необходимо посчитать значения:

In [8]:
c = Counter(cars)
print(c)
# Counter({'red': 3, 'black': 3, 'blue': 2, 'white': 1})

Counter({'red': 3, 'black': 3, 'blue': 2, 'white': 1})


Узнать, сколько раз встретился конкретный элемент, можно, обратившись к счётчику по ключу как к обычному словарю:

In [None]:
print(c['black'])
# 3

Если обратиться к счётчику по несуществующему ключу, то, в отличие от словаря, ошибка KeyError не возникнет:

In [None]:
print(c['purple'])
# 0

Данный ответ лишь сообщает нам, что указанный элемент ни разу не встретрился в нашем списке.
Благодаря Counter можно, например, узнать сумму всех значений, используя следующую конструкцию кода:

In [None]:
print(sum(c.values()))
# 9

В этой конструкции мы сначала получаем элементы (число раз, когда встретился ключ) с помощью функции values (такая же функция есть и у словаря):

In [None]:
print(c.values())
# dict_values([3, 2, 3, 1])

Затем суммируем полученные значения итерируемого объекта dict_values, который выглядит почти как список, с помощью встроенной функции sum.

## ОПЕРАЦИИ С COUNTER

СЛОЖЕНИЕ.
Допустим, необходимо посчитать количество цветов встреченных на дороге машин из разных источников. Чтобы узнать, например, сколько машин разных цветов встретилось в двух городах, можно сложить два исходных счётчика и получить новый счётчик:

In [9]:
cars_moscow = ['black', 'black', 'white', 'black', 'black', 'white', 'yellow', 'yellow', 'yellow'] 
# первый исходный счетчик
cars_spb = ['red', 'black', 'black', 'white', 'white', 'yellow', 'yellow', 'red', 'white'] 
# второй исходный счетчик

In [10]:
counter_moscow = Counter(cars_moscow)
counter_spb = Counter(cars_spb)
 
print(counter_moscow)
print(counter_spb)
 
# Counter({'black': 4, 'yellow': 3, 'white': 2})
# Counter({'white': 3, 'red': 2, 'black': 2, 'yellow': 2})

Counter({'black': 4, 'yellow': 3, 'white': 2})
Counter({'white': 3, 'red': 2, 'black': 2, 'yellow': 2})


In [11]:
print(counter_moscow + counter_spb) # получаем третий счетчик
# Counter({'black': 6, 'white': 5, 'yellow': 5, 'red': 2})

Counter({'black': 6, 'white': 5, 'yellow': 5, 'red': 2})


ВЫЧИТАНИЕ. 
Чтобы узнать разницу между объектами Counter, необходимо воспользоваться функцией subtract, которая меняет тот объект, к которому применяется. В примере выше из значений, посчитанных для Москвы, вычитаются значения, посчитанные для Санкт-Петербурга:

In [12]:
print(counter_moscow)
print(counter_spb)
# Counter({'black': 4, 'yellow': 3, 'white': 2})
# Counter({'white': 3, 'red': 2, 'black': 2, 'yellow': 2})
 
counter_moscow.subtract(counter_spb)
print(counter_moscow)
# Counter({'black': 2, 'yellow': 1, 'white': -1, 'red': -2})

Counter({'black': 4, 'yellow': 3, 'white': 2})
Counter({'white': 3, 'red': 2, 'black': 2, 'yellow': 2})
Counter({'black': 2, 'yellow': 1, 'white': -1, 'red': -2})


Заметьте, что белых машин в counter_spb оказалось больше, чем в counter_moscow, поэтому разность отрицательная. Красных машин в moscow вообще не было, а в spb их оказалось сразу две, поэтому разница равна -2. Значения для black и yellow остались положительными, потому что их было больше.

→ Вычитание с учётом отрицательных чисел удобно использовать для сравнения значений в счётчиках: таким образом можно сразу узнать, каких элементов оказалось больше, а каких — меньше.

К сожалению, функцию subtract не всегда бывает удобно использовать для вычитания, так как модифицируется исходный счётчик. Однако аналога у этой функции нет, поскольку вычитание с помощью оператора "-" приводит к другому результату:

In [13]:
# Пересоздаём счётчики, потому что объект counter_moscow поменял свои значения
# после функции subtract.
counter_moscow = Counter(cars_moscow)
counter_spb = Counter(cars_spb)
 
print(counter_moscow - counter_spb)
# Counter({'black': 2, 'yellow': 1})

Counter({'black': 2, 'yellow': 1})


В данном случае нет значений меньше 1, поэтому нет данных о разнице в числе белых и красных машин. Иногда важно получить именно полные данные, а не только положительные значения разности.

Функция subtract может пригодиться, чтобы сравнить активность продаж различных позиций в двух торговых точках: здесь важно узнать не только те позиции, которые продавались активнее, но и те позиции, которые, наоборот, оказались менее популярными в первой точке по сравнению со второй.

## ДОПОЛНИТЕЛЬНЫЕ ФУНКЦИИ

ПРЕОБРАЗОВАНИЕ СЧЕТЧИКА В СПИСОК ВСЕХ ЭЛЕМЕНТОВ.
Чтобы получить список всех элементов, которые содержатся в Counter, используется функция elements(). Она возвращает итератор, поэтому, чтобы напечатать все элементы, распакуем их с помощью *. При этом стоит обратить внимание на порядок элементов списка - располагаются по алфавиту.    

In [14]:
print(*counter_moscow.elements())
# black black black black white white yellow yellow yellow

black black black black white white yellow yellow yellow


ПРЕОБРАЗОВАНИЕ СЧЕТЧИКА В СПИСОК УНИКАЛЬНЫХ ЭЛЕМЕНТОВ.
Чтобы получить список уникальных элементов, достаточно воспользоваться функцией list():

In [15]:
print(list(counter_moscow))
# ['black', 'white', 'yellow']

['black', 'white', 'yellow']


ПРЕОБРАЗОВАНИЕ СЧЕТЧИКА В СЛОВАРЬ.
С помощью функции dict() можно превратить Counter в обычный словарь:

In [16]:
print(dict(counter_moscow))
# {'black': 4, 'white': 2, 'yellow': 3}

{'black': 4, 'white': 2, 'yellow': 3}


ПРЕОБРАЗОВАНИЕ СЧЕТЧИКА В КОРТЕЖ.
Функция most_common() позволяет получить список из кортежей элементов в порядке убывания их встречаемости:

In [17]:
print(counter_moscow.most_common())
# [('black', 4), ('yellow', 3), ('white', 2)]

[('black', 4), ('yellow', 3), ('white', 2)]


В неё также можно передать значение, которое задаёт желаемое число первых наиболее частых элементов, например, 2:

In [18]:
print(counter_moscow.most_common(2))
# [('black', 4), ('yellow', 3)]

[('black', 4), ('yellow', 3)]


ОБНУЛЕНИЕ СЧЕТЧИКА.
Наконец, функция clear() позволяет полностью обнулить счётчик:

In [19]:
counter_moscow.clear()
print(counter_moscow)
# Counter()

Counter()


Примером задания по данной теме может быть следующее: В списке карт clients содержатся номера карт, которыми клиенты оплачивали товары на протяжении некоторого промежутка времени. Выберите номер карты наиболее частого клиента и впишите этот номер в качестве ответа.

In [24]:
# возможный вариант решения
from hidden import clients
from collections import Counter

c = Counter(clients)
print(c.most_common(1))

ModuleNotFoundError: No module named 'hidden'