# Модуль Collections

### Различные варианты получения элемента по ключу в словаре: get, setdefault:
При работе со словарями в Python есть два интересных метода для получения элементов по ключу.


In [9]:
# при обращении к существующиму ключу мы получаем значение
my_dict = {"apple": 5, "banana": 2, "orange": 8}
my_dict['apple']

5

In [10]:
# если обратится к не существующиму ключу мы получаем ошибку
my_dict = {"apple": 5, "banana": 2, "orange": 8}
my_dict['melon']

KeyError: 'melon'

In [None]:
# Чтобы избежать этой ошибки можно использовать метод get()

#### Метод get()

 Метод get(key[, default]): Этот метод позволяет получить значение по ключу key. Если ключ существует в словаре, метод вернет соответствующее значение. В противном случае, если был предоставлен необязательный аргумент default, то он будет возвращен вместо None.

In [11]:
my_dict = {"apple": 5, "banana": 2, "orange": 8}
print(my_dict.get("apple"))     # Выводит 5
print(my_dict.get("grape"))     # Выводит None
print(my_dict.get("grape", 'Нет значения'))  # Выводит 0, так как ключа "grape" нет в словаре


5
None
Нет значения


***Когда использовать:***

* Когда вам нужно безопасно получить значение по ключу, не вызывая исключения KeyError, если ключ отсутствует.

* Когда вам не нужно изменять словарь.

#### Метод setdefault()

Метод setdefault(key[, default]): Этот метод пытается получить значение по ключу key. Если ключ существует, метод вернет соответствующее значение. Если ключа нет в словаре, метод добавит в словарь новую пару ключ-значение с ключом key и значением default, если аргумент default был предоставлен.

In [12]:
my_dict = {"apple": 5, "banana": 2, "orange": 8}
print(my_dict.setdefault("apple", 10))  # Выводит 5 my_dict['apple']=10
print(my_dict.setdefault("grape", 15))  # Выводит 15, добавляет новую пару ключ-значение
print(my_dict.setdefault('tomato',20))
print(my_dict)                         # Выводит {'apple': 5, 'banana': 2, 'orange': 8, 'grape': 15}


5
15
20
{'apple': 5, 'banana': 2, 'orange': 8, 'grape': 15, 'tomato': 20}


***Когда использовать:***

* Когда вам нужно получить значение по ключу, но если ключа нет, вы хотите добавить его в словарь с определённым значением по умолчанию.

* Когда вы хотите избежать повторной проверки наличия ключа и его добавления.

In [None]:
#Пример, где setdefault() удобен:

In [13]:
# Подсчёт частоты элементов в списке
freq = {}
items = ['apple', 'banana', 'apple', 'orange', 'banana', 'apple']

for item in items:
    freq[item] = freq.setdefault(item, 0) + 1

print(freq)  # {'apple': 3, 'banana': 2, 'orange': 1}

{'apple': 3, 'banana': 2, 'orange': 1}


In [None]:
#В этом примере setdefault() позволяет избежать лишних проверок и делает код более компактным.

In [14]:
#Пример 2, без setdefault было бы сложнее работать
# Наличие товаров на складе

my_dict = {"apple": 5, "banana": 2, "orange": 8}

prod = input('введите название товара')

if prod in my_dict.keys():
    print(f'На складе товаров {prod}: {my_dict[prod]} кг.')
else:
    my_dict[prod] = 0
    print(f'На складе товаров {prod}: {my_dict[prod]} кг.')
    



введите название товара melon


На складе товаров melon: 0 кг.


In [15]:
#Пример 2, без setdefault было бы сложнее работать
# Наличие товаров на складе

my_dict = {"apple": 5, "banana": 2, "orange": 8}

prod = input('введите название товара')
my_dict.setdefault(prod,0)
print(f'На складе товаров {prod}: {my_dict[prod]} кг.')

введите название товара melon


На складе товаров melon: 0 кг.


## Класс OrderedDict

Класс OrderedDict представляет словарь, который запоминает порядок вставки элементов. В отличие от обычного словаря, OrderedDict гарантирует, что элементы будут возвращаться в том же порядке, в котором они были добавлены.


#### 1. Создание и добавление элементов

In [16]:
from collections import OrderedDict

# Создание пустого OrderedDict
od = OrderedDict()

# Добавление элементов
od['a'] = 1
od['b'] = 2
od['c'] = 3

print(od)  # OrderedDict({'a': 1, 'b': 2, 'c': 3})

OrderedDict({'a': 1, 'b': 2, 'c': 3})


#### 2. Итерация по элементам

In [17]:
for key, value in od.items():
    print(key, value)


a 1
b 2
c 3


#### 3. Изменение порядка элементов

In [18]:
print(od)

OrderedDict({'a': 1, 'b': 2, 'c': 3})


In [19]:
# Перемещение элемента 'b' в конец
od.move_to_end('b')

print(od)  # OrderedDict({'a': 1, 'c': 3, 'b': 2})

# Перемещение элемента 'c' в начало
od.move_to_end('c', last=False)

print(od)  # OrderedDict({'c': 3, 'a': 1, 'b': 2})

OrderedDict({'a': 1, 'c': 3, 'b': 2})
OrderedDict({'c': 3, 'a': 1, 'b': 2})


#### 4. Удаление элементов

In [21]:
print(od)

OrderedDict({'c': 3, 'a': 1, 'b': 2})


In [22]:
# Удаление последнего элемента
od.popitem()

# Удаление первого элемента
# od.popitem(last=False)

print(od)

# Удаление элемента по ключу
od.pop('a')

print(od)

OrderedDict({'c': 3, 'a': 1})
OrderedDict({'c': 3})


In [25]:
dct = {'apple': 5, 'banana': 2, 'orange': 8, 'grape': 15, 'tomato': 20}


In [26]:
dct.pop('apple')
print(dct)

{'banana': 2, 'orange': 8, 'grape': 15, 'tomato': 20}


In [24]:
del(dct['apple'])
print(dct)

{'banana': 2, 'orange': 8, 'grape': 15, 'tomato': 20}


#### 5. Обновление элементов

In [27]:
# Обновление значения по ключу
od['c'] = 100

print(od)

# Обновление с добавлением новых элементов
od.update({'d': 4, 'e': 5})

print(od)

OrderedDict({'c': 100})
OrderedDict({'c': 100, 'd': 4, 'e': 5})


In [28]:
dct = {'apple': 5, 'banana': 2, 'orange': 8, 'grape': 15, 'tomato': 20}
dct.update({'c': 100, 'd': 4, 'e': 5})
print(dct)

{'apple': 5, 'banana': 2, 'orange': 8, 'grape': 15, 'tomato': 20, 'c': 100, 'd': 4, 'e': 5}


#### 6. Сравнение

In [29]:
od1 = OrderedDict([('a', 1), ('b', 2)])
od2 = OrderedDict([('b', 2), ('a', 1)])

print(od1 == od2)  # False, так как порядок элементов разный

False


#### 7. Преобразование в обычный словарь

In [30]:
regular_dict = dict(od)

print(regular_dict)  # {'c': 100, 'd': 4, 'e': 5}

{'c': 100, 'd': 4, 'e': 5}


#### 8. Создание из списка кортежей

In [31]:
od = OrderedDict([('x', 10), ('y', 20), ('z', 30)])

print(od)  # OrderedDict([('x', 10), ('y', 20), ('z', 30)])

OrderedDict({'x': 10, 'y': 20, 'z': 30})


#### 9. Очистка

In [32]:
od.clear()

print(od)  # OrderedDict()

OrderedDict()


#### 10. Копирование

In [None]:
od = OrderedDict([('a', 1), ('b', 2)])
od_copy = od.copy()

print(od_copy)  # OrderedDict([('a', 1), ('b', 2)])

### Понятие LRU-кэша. Реализация LRU кэша

Кэширование в Python - это процесс временного сохранения результатов вычислений или запросов, чтобы избежать повторных вычислений в будущем. Оно широко используется для оптимизации производительности программы. Когда вы выполняете вычислительно затратные операции или получаете данные из внешнего источника, вы можете сохранить результаты в кэше

Любой проект, который содержит блоки кода, которые в свою очередь могут обрабатываться достаточно продолжительное время - должны использовать технологию кэширования, это позволит оптимизировать программу и ускорить её выполнение.К примеру, вычисление занимает несколько минут, причем, программой пользуется много пользователей, тогда мы делаем вычисления под заданные значения и запоминаем значения и результаты с учетом частоты запросов. 

***Цель кэширования: ускорение работы систем и уменьшения нагрузки на ресурсы.***

Давай разберём, как это работает и почему это круто.

***Как работает кэш?***

1. `Первое обращение:` Когда данные запрашиваются впервые, они извлекаются из основного источника (например, базы данных) и сохраняются в кэше.

2. `Повторное обращение:` При следующем запросе тех же данных система сначала проверяет кэш. Если данные там есть, они возвращаются мгновенно, без обращения к основному источнику.

3. `Обновление кэша:` Если данные в основном источнике изменяются, кэш может быть обновлён или очищен, чтобы избежать устаревания информации.

#### Примеры кэширования
1. Веб-браузер:

Когда ты заходишь на сайт, браузер сохраняет изображения, CSS-файлы и другие ресурсы в кэше. При повторном посещении сайта эти данные загружаются из кэша, что ускоряет загрузку страницы.

*Пример:* Ты зашёл на сайт, и он загрузился за 5 секунд. При следующем посещении он открылся за 1 секунду, потому что часть данных уже была в кэше.

2. Серверные приложения:

Веб-сервер может кэшировать результаты запросов к базе данных. Например, если на сайте часто запрашивается список популярных товаров, этот список сохраняется в кэше, чтобы не обращаться к базе данных каждый раз.

*Пример:* Интернет-магазин показывает топ-10 товаров. Вместо того чтобы каждый раз запрашивать этот список из базы данных, сервер сохраняет его в кэше и обновляет раз в час.

#### Почему кэш — это круто?
1. `Скорость:` Кэш позволяет получать данные в разы быстрее, чем из основного источника.

2. `Снижение нагрузки:` Кэширование уменьшает количество запросов к базам данных или серверам, что снижает нагрузку на них.

3. `Экономия ресурсов:` Меньше запросов к основным источникам означает экономию вычислительных мощностей, энергии и времени.

4. `Улучшение пользовательского опыта:` Быстрая загрузка страниц, приложений и данных делает использование систем более комфортным.

### LRU - кеш (Least Recently Used)

***LRU-кэш*** - это механизм кэширования, который хранит ограниченное количество элементов и автоматически удаляет самый давно неиспользованный элемент при превышении лимита размера.

### Реализация LRU кэша

Для реализации LRU-кэша в Python можно использовать словарь (dict). При каждом обращении к элементу кэша, его ключ и значение обновляются, так что элемент становится самым "свежим". При превышении лимита размера, можно удалить элемент с самым старым использованием, то есть самый первый добавленный элемент.


In [33]:
from collections import OrderedDict

def lru_cache(capacity, cache, key, value): # capacity - объем кеша, cache - кеш 
    if key in cache:
        # Если ключ уже существует, обновляем значение и перемещаем элемент в конец словаря
        cache.pop(key)
    elif len(cache) >= capacity:
        # Если кэш переполнен, удаляем первый элемент (самый старый)
        cache.popitem(last=False)
    cache[key] = value


capacity = 3
cache = OrderedDict()

lru_cache(capacity, cache, "key1", "value1")
lru_cache(capacity, cache, "key2", "value2")
lru_cache(capacity, cache, "key3", "value3")

print(cache)  # Выводит OrderedDict([('key1', 'value1'), ('key2', 'value2'), ('key3', 'value3')])

lru_cache(capacity, cache, "key2", "new_value2")  # Обновляем значение "key2"
print(cache)  # Выводит OrderedDict([('key1', 'value1'), ('key3', 'value3'), ('key2', 'new_value2')])

lru_cache(capacity, cache, "key4", "value4")  # Кэш переполнен, удаляем "key1"
print(cache)  # Выводит OrderedDict([('key3', 'value3'), ('key2', 'new_value2'), ('key4', 'value4')])


OrderedDict({'key1': 'value1', 'key2': 'value2', 'key3': 'value3'})
OrderedDict({'key1': 'value1', 'key3': 'value3', 'key2': 'new_value2'})
OrderedDict({'key3': 'value3', 'key2': 'new_value2', 'key4': 'value4'})


Как это работает:
1. OrderedDict сохраняет порядок добавления элементов.

2. При вызове get, если ключ существует, элемент перемещается в конец словаря, чтобы пометить его как недавно использованный.

3. При вызове put, если ключ уже существует, его значение обновляется, и он перемещается в конец. Если ключ новый, он добавляется в конец. Если размер кеша превышает заданную емкость, удаляется самый старый элемент (первый в OrderedDict).

## Класс defaultdict


Класс defaultdict представляет словарь, который автоматически создает значения для несуществующих ключей при первом обращении.

1. Создание defaultdict с фабричной функцией

In [36]:
from collections import defaultdict

# Создаём defaultdict с фабричной функцией list
dd = defaultdict(list)

# Добавляем элементы
dd['fruits'].append('apple')
dd['fruits'].append('banana')
dd['vegetables'].append('carrot')

print(dd)

defaultdict(<class 'list'>, {'fruits': ['apple', 'banana'], 'vegetables': ['carrot']})


2. Использование int как фабричной функции

In [35]:
from collections import defaultdict

# Создаём defaultdict с фабричной функцией int (по умолчанию 0)
dd = defaultdict(int)

# Подсчитываем количество вхождений элементов в списке
words = ['apple', 'banana', 'apple', 'orange', 'banana', 'apple']
for word in words:
    dd[word] += 1

print(dd)

defaultdict(<class 'int'>, {'apple': 3, 'banana': 2, 'orange': 1})


3. Использование set как фабричной функции

In [37]:
# Создаём defaultdict с фабричной функцией set
dd = defaultdict(set)

# Добавляем элементы
dd['fruits'].add('apple')
dd['fruits'].add('banana')
dd['fruits'].add('apple')  # Дубликаты игнорируются, так как это set

print(dd)

defaultdict(<class 'set'>, {'fruits': {'apple', 'banana'}})


4. Использование lambda для создания пользовательских значений по умолчанию

In [38]:
# Создаём defaultdict с пользовательской фабричной функцией
dd = defaultdict(lambda: 'unknown')

# Присваиваем значения
dd['name'] = 'Alice'
dd['age'] = 25

# Обращаемся к несуществующему ключу
print(dd['city'])  # 'unknown'

print(dd)

unknown
defaultdict(<function <lambda> at 0x00000180CBB640E0>, {'name': 'Alice', 'age': 25, 'city': 'unknown'})


5. Группировка элементов с помощью defaultdict

In [39]:
# Группируем слова по их длине
words = ['apple', 'banana', 'orange', 'kiwi', 'grape', 'melon']
dd = defaultdict(list)

for word in words:
    dd[len(word)].append(word)

print(dd)

defaultdict(<class 'list'>, {5: ['apple', 'grape', 'melon'], 6: ['banana', 'orange'], 4: ['kiwi']})


6. Использование defaultdict для подсчёта вложенных элементов

In [None]:
# Подсчитываем количество вхождений символов в каждом слове
words = ['apple', 'banana', 'orange']
dd = defaultdict(lambda: defaultdict(int))

for word in words:
    for char in word:
        dd[word][char] += 1

print(dd)

Преимущества defaultdict:
* Удобство: Не нужно проверять, существует ли ключ в словаре, перед добавлением значения.

* Гибкость: Можно использовать любую фабричную функцию для создания значений по умолчанию.

* Чистый код: Упрощает код, избавляя от лишних проверок.

* defaultdict особенно полезен при работе с вложенными структурами данных, подсчёте элементов или группировке данных.

### Задание для закрепления

Зная про defaultdict и get, как вы думаете, как реализован defaultdict?


In [None]:
dct = {1:1,2:2,3:3}
key = 4
if key not in dct:
    dct.setdefault(key,0)
else:
    dct[key]='value'
print(dct)


В чем потенциальная проблема в ответе 0 в последней строчке кода?

Потенциальная проблема в ответе 0 в последней строчке кода заключается в том, что defaultdict автоматически создает ключи со значением по умолчанию, даже если вы просто пытаетесь проверить наличие ключа. Это может привести к неожиданному поведению, если вы не ожидаете, что ключ будет добавлен в словарь.

### Задача

В аквариуме три рыбки, и их названия, виды и резервуары указываются в этих трех кортежах.
Нужно организовать инвентарный список по резервуарам и получить список рыб, присутствующих в каждом резервуаре.Используйте defaultdict для группировки рыб по резервуарам.

from collections import defaultdict

fish_inventory = [
    ("Sammy", "shark", "tank-a"),
    ("Jamie", "cuttlefish", "tank-b"),
    ("Mary", "squid", "tank-a"),
]


In [40]:
from collections import defaultdict

fish_inventory = [
    ("Sammy", "shark", "tank-a"),
    ("Jamie", "cuttlefish", "tank-b"),
    ("Mary", "squid", "tank-a"),
]

# Создаем defaultdict, используя list в качестве значения по умолчанию
fish_names_by_tank = defaultdict(list)

# Группируем рыб по резервуарам
for name, species, tank in fish_inventory:
    fish_names_by_tank[tank].append(name)

print(fish_names_by_tank)

# Выводим список рыб в каждом резервуаре
for tank, names in fish_names_by_tank.items():
    print(f"Резервуар {tank}: {', '.join(names)}")


defaultdict(<class 'list'>, {'tank-a': ['Sammy', 'Mary'], 'tank-b': ['Jamie']})
Резервуар tank-a: Sammy, Mary
Резервуар tank-b: Jamie


## Класс counter


Класс Counter предоставляет удобную структуру для подсчета элементов в итерируемом объекте.

In [41]:
from collections import Counter

my_list = [1, 2, 3, 1, 2, 3, 1, 2, 4, 5, 4, 3]
my_counter = Counter(my_list)
print(my_counter)   # Выводит Counter({1: 3, 2: 3, 3: 3, 4: 2, 5: 1})
print(my_counter[1])  # Выводит 3, так как элемент "1" встречается 3 раза в списке


Counter({1: 3, 2: 3, 3: 3, 4: 2, 5: 1})
3


In [42]:
from collections import Counter

my_list = 'hello'
my_counter = Counter(my_list)
print(my_counter)    

Counter({'l': 2, 'h': 1, 'e': 1, 'o': 1})


In [43]:
from collections import Counter

my_list = 'hello world!'
my_counter = Counter(my_list)
print(my_counter)    

Counter({'l': 3, 'o': 2, 'h': 1, 'e': 1, ' ': 1, 'w': 1, 'r': 1, 'd': 1, '!': 1})


## Именованные кортежи

Именованные кортежи представляют удобную структуру для создания простых классов без методов, которые используются только для хранения данных.


Создание nametuple

In [57]:
from collections import namedtuple

# Создаём namedtuple с именем "Point" и полями "x" и "y"
Point = namedtuple('Point', ['x', 'y'])

# Создаём экземпляр Point
p = Point(10, 20)

print(p)  # Point(x=10, y=20)

Point(x=10, y=20)


Доступ к полям по именам

In [58]:
# Доступ к полям по именам
print(p.x)  # 10
print(p.y)  # 20

# Доступ к полям по индексам (как в обычном кортеже)
print(p[0])  # 10
print(p[1])  # 20

10
20
10
20


In [59]:
# Пример 2: Использование именованного кортежа для представления студента

from collections import namedtuple

# Создаем именованный кортеж для студента
Student = namedtuple('Student', ['name', 'age', 'grade'])

# Создаем экземпляры именованного кортежа
student1 = Student(name="Alice", age=20, grade="A")
student2 = Student(name="Bob", age=22, grade="B")
#student3 = Student("Kevin", 22, "C")

# Доступ к элементам по имени
print(student1.name)  # Вывод: Alice
print(student1.age)   # Вывод: 20
print(student1.grade) # Вывод: A

# Сравнение именованных кортежей
print(student1 == student2)  # Вывод: False

Alice
20
A
False


In [60]:
#Пример 3: Использование именованного кортежа для работы с датами

from collections import namedtuple

# Создаем именованный кортеж для даты
Date = namedtuple('Date', ['year', 'month', 'day'])

# Создаем экземпляр именованного кортежа
today = Date(year=2023, month=10, day=15)

# Доступ к элементам по имени
print(today.year)   # Вывод: 2023
print(today.month)  # Вывод: 10
print(today.day)    # Вывод: 15

# Преобразование в строку
print(f"Today is {today.day}/{today.month}/{today.year}")
# Вывод: Today is 15/10/2023

2023
10
15
Today is 15/10/2023


In [51]:
# Пример 4: Использование именованного кортежа для работы с геометрическими фигурами

from collections import namedtuple

# Создаем именованный кортеж для прямоугольника
Rectangle = namedtuple('Rectangle', ['width', 'height'])

# Создаем экземпляр именованного кортежа
rect = Rectangle(width=10, height=5)

# Доступ к элементам по имени
print(rect.width)   # Вывод: 10
print(rect.height)  # Вывод: 5

# Вычисление площади
area = rect.width * rect.height
print(f"Area of the rectangle: {area}")
# Вывод: Area of the rectangle: 50

10
5
Area of the rectangle: 50


Преимущества namedtuple:
* Читаемость: Поля имеют имена, что делает код более понятным.

* Неизменяемость: Данные защищены от случайного изменения.

* Эффективность: namedtuple занимает меньше памяти, чем обычный класс, так как это кортеж.

* Удобство: Поддерживает все методы кортежей, такие как индексация, итерация и распаковка.

namedtuple идеально подходит для работы с данными, где важна читаемость и неизменяемость, например, для хранения конфигураций, возврата нескольких значений из функций или работы с табличными данными.

### Задание для закрепления

Что будет выведено после выполнения этого фрагмента кода:

In [61]:
from collections import namedtuple
 
Person = namedtuple("Person", ["name", "age", "city"])

person1 = Person("Alice", 30, "New York")
person2 = Person("Bob", 25, "San Francisco")

name, age, city = person1
print(name, age, city)


Alice 30 New York


## Модуль json

**Сериализация** — это процесс преобразования объектов Python в формат, который можно сохранить (например, в файл) или передать по сети (например, в виде строки).

**Десериализация** — это обратный процесс, когда данные из файла или строки преобразуются обратно в объекты Python.

В Python для сериализации и десериализации часто используются модули json, pickle и yaml. Рассмотрим простые примеры.

Примеры использования в реальных сценариях:
* Веб-разработка:

 Передача данных между сервером и клиентом в формате JSON.
 Сохранение сессии пользователя в файл или базу данных.
* Машинное обучение:

 Сохранение обученной модели в файл для последующего использования.
 Сериализация данных для обучения и тестирования модели.
* Игры:

 Сохранение состояния игры в файл, чтобы пользователь мог продолжить с того места, где остановился.
* Кэширование:

 Сохранение результатов запросов к базе данных или API, чтобы избежать повторного выполнения.

Модуль json предоставляет функции для сериализации и десериализации данных в формате JSON.

In [62]:
import json

# Сериализация Python-объекта в JSON-строку
data = {"name": "John", "age": 25, "city": "New York"}
json_str = json.dumps(data)
print(json_str)  # Выводит '{"name": "John", "age": 25, "city": "New York"}'

# Десериализация JSON-строки в Python-объект
json_str = '{"name": "John", "age": 25, "city": "New York"}'
data = json.loads(json_str)
print(data["name"])  # Выводит 'John'


{"name": "John", "age": 25, "city": "New York"}
John


Сериализация и десериализация позволяют сохранять объекты в файл или передавать их по сети, а затем восстанавливать их в исходное состояние.


## Практика

1. Дана строка. 
Посчитайте в ней частоту встречаемости всех букв. Считаем, что в строке могут быть пробельные символы.


In [64]:
from collections import Counter

def count_letter_frequency(s):
    return Counter(char.lower() for char in s if char.isalpha())

input_string = input("Введите строку: ")
result = count_letter_frequency(input_string)

for letter, frequency in result.items():
    print(f"{letter}: {frequency}")

Введите строку:  hello world!


h: 1
e: 1
l: 3
o: 2
w: 1
r: 1
d: 1


2. Дан текст. 
Необходимо посчитать сколько раз встретилось каждое слово и вывести в топ слов, упорядоченный сначала по убыванию встречаемости, а при равенстве частот в соответствии с упорядочиванием в лексикографическом порядке. 
Решить задачу с помощью использования изученных классов.


In [72]:
from collections import Counter, namedtuple

# Создаем namedtuple для хранения пары (слово, частота)
WordFrequency = namedtuple('WordFrequency', ['word', 'frequency'])

def count_word_frequency(text):
    words = [word.strip('.!,?()[]').lower() for word in text.split()]
    word_frequency = Counter(words)
    return word_frequency

def top_words(word_frequency, n=10):
    sorted_words = sorted(word_frequency.items(), key=lambda x: (-x[1], x[0]))
    top_words = [WordFrequency(word, freq) for word, freq in sorted_words[:n]]
    return top_words

# Пример текста для анализа
input_text = "Это просто пример текста для подсчета частоты слов. Это просто пример."

word_frequency = count_word_frequency(input_text)
print(word_frequency)
print('--------------------------------------------------------------')
top_word_pairs = top_words(word_frequency)
print(top_word_pairs)
print('--------------------------------------------------------------')

print("Топ слов:")
for pair in top_word_pairs:
    print(f"{pair.word}: {pair.frequency}")


Counter({'это': 2, 'просто': 2, 'пример': 2, 'текста': 1, 'для': 1, 'подсчета': 1, 'частоты': 1, 'слов': 1})
--------------------------------------------------------------
[WordFrequency(word='пример', frequency=2), WordFrequency(word='просто', frequency=2), WordFrequency(word='это', frequency=2), WordFrequency(word='для', frequency=1), WordFrequency(word='подсчета', frequency=1), WordFrequency(word='слов', frequency=1), WordFrequency(word='текста', frequency=1), WordFrequency(word='частоты', frequency=1)]
--------------------------------------------------------------
Топ слов:
пример: 2
просто: 2
это: 2
для: 1
подсчета: 1
слов: 1
текста: 1
частоты: 1


In [68]:
Counter(['это','то','это'])

Counter({'это': 2, 'то': 1})

### Полезные материалы
1. Модуль collections https://pythonworld.ru/moduli/modul-collections.html
2. Модуль json https://pythonworld.ru/moduli/modul-json.html

### Вопросы для закрепления
1. Предположим, что мы хотим реализовать мультимножество – т.е. множество, в котором элементы могут повторяться. Как это можно сделать на питоне?
2. Какие проблемы словаря решают get и setdefault? В чем может быть опасность их применения вместо обращения к элементу в []?
3. В чем преимущество формата json перед табличными представлениями как в Excel?
