In [1]:
import pandas as pd
from collections import Counter, defaultdict, OrderedDict, deque
pd.__version__

'1.5.2'

### Counter

In [3]:
# Создаём пустой объект Counter
c = Counter()

# Список значений
cars = ['red', 'blue', 'black', 'black', 'black', 'red', 'blue', 'red', 'white']

# Считаем количество каждого значения в списке с истользованием Counter
d = Counter(cars)

print(d)

Counter({'red': 3, 'black': 3, 'blue': 2, 'white': 1})


### Defaultdict

In [4]:
# Список студентов и их групп
students = [('Ivanov',1), ('Smirnov',4), ('Petrov',3), ('Kuznetsova',1), ('Nikitina',2), ('Markov',3), ('Pavlov',2)]

# Создаем объект defaultdict с типом данных list в значениях
groups = defaultdict(list)

# Идем по кортежам списка
for student, group in students:
    
    # Записываем в каждую встреченную группу список фамилий студентов
    groups[group].append(student)
 
print(groups)

defaultdict(<class 'list'>, {1: ['Ivanov', 'Kuznetsova'], 4: ['Smirnov'], 3: ['Petrov', 'Markov'], 2: ['Nikitina', 'Pavlov']})


### OrderedDict

In [6]:
# Класс словаря, который сохраняет порядок ключей
data = [('Ivan', 19),('Mark', 25),('Andrey', 23),('Maria', 20)]
ordered_client_ages = OrderedDict(data)
print(ordered_client_ages)

OrderedDict([('Ivan', 19), ('Mark', 25), ('Andrey', 23), ('Maria', 20)])


In [7]:
# Сортируем по второму значению из кортежа, то есть по возрасту
ordered_client_ages = OrderedDict(sorted(data, key=lambda x: x[1]))
print(ordered_client_ages)

OrderedDict([('Ivan', 19), ('Maria', 20), ('Andrey', 23), ('Mark', 25)])


### Deque

Очередь — это упорядоченный тип данных, который обладает двумя ключевыми функциями: добавление элемента в конец очереди и извлечение самого первого элемента из очереди. То есть очередь подразумевает, что тот элемент, который первым добавлен в очередь, будет первым потом и обработан. Всё как в обычной очереди! Этот принцип сокращённо также называется FIFO (от англ. First In — First Out, «первым пришёл — первым ушёл»).

Стек (от англ. stack — стопка) — это упорядоченный тип данных, который обладает двумя основными функциями: добавление элемента в конец стека и извлечение элемента из конца стека. Эта структура данных также называется рюкзаком. Действительно, представьте себе, что вы набили вещами рюкзак. Теперь, когда вы решите достать из него самую верхнюю вещь, что это будет за вещь? Верно — та самая, которую вы убрали в рюкзак последней. Поэтому принцип стека (рюкзака) также сокращённо называется LIFO (Last In — First Out, «последним пришёл — первым ушёл»).

In [2]:
# Двухконцевая кочередь
dq = deque()
print(dq)

deque([])


У deque есть четыре ключевые функции:

* append (добавить элемент в конец дека);
* appendleft (добавить элемент в начало дека);
* pop (удалить и вернуть элемент из конца дека);
* popleft (удалить и вернуть элемент из начала дека).

In [3]:
clients = deque()
clients.append('Ivanov')
clients.append('Petrov')
clients.append('Smirnov')
clients.append('Tikhonova')
print(clients)

deque(['Ivanov', 'Petrov', 'Smirnov', 'Tikhonova'])


In [4]:
# Освободилось два оператора, возьмем двух клиентов из начала очереди
first_client = clients.popleft()
second_client = clients.popleft()
 
print("First client:", first_client)
print("Second client:", second_client)
print(clients)

First client: Ivanov
Second client: Petrov
deque(['Smirnov', 'Tikhonova'])


In [5]:
# Для добавления записей в начало очереди
clients.appendleft('Vip-client')
 
print(clients)

deque(['Vip-client', 'Smirnov', 'Tikhonova'])


Также в очередь возможно добавить сразу несколько элементов из итерируемого объекта в дек. Для этого используют функции **extend** (добавить в конец дека) и **extendleft** (добавить в начало дека).

In [6]:
# В скобках передаём список при создании deque,
# чтобы сразу добавить все его элементы в очередь
shop = deque([1, 2, 3, 4, 5])
print(shop)
# deque([1, 2, 3, 4, 5])
shop.extend([11, 12, 13, 14, 15, 16, 17])
print(shop)

deque([1, 2, 3, 4, 5])
deque([1, 2, 3, 4, 5, 11, 12, 13, 14, 15, 16, 17])


Обратите внимание, что «клиенты из автобуса» оказались в очереди не в том порядке, в каком они «выходили из автобуса». То есть добавленные номера не только приписаны перед записанными в очереди номерами, но также порядок добавленных элементов поменялся на обратный. Это связано с тем, что действие функции extendleft аналогично многократному применению функции appendleft, поэтому самый последний клиент из автобуса оказался в итоге первым в очереди.

In [7]:
shop = deque([1, 2, 3, 4, 5])
print(shop)
# deque([1, 2, 3, 4, 5])
shop.extendleft([11, 12, 13, 14, 15, 16, 17])
print(shop)

deque([1, 2, 3, 4, 5])
deque([17, 16, 15, 14, 13, 12, 11, 1, 2, 3, 4, 5])


При создании очереди можно также указать её максимальную длину с помощью параметра maxlen. Сделать это можно как при создании пустой очереди, так и при создании очереди от заданного итерируемого объекта

In [8]:
limited = deque(maxlen=3)
print(limited)
# deque([], maxlen=3)
 
limited_from_list = deque([1,3,4,5,6,7], maxlen=3)
print(limited_from_list)

deque([], maxlen=3)
deque([5, 6, 7], maxlen=3)


Обратите внимание, что теперь дополнительно печатается максимальная длина очереди.

Также заметьте, что в очереди с ограниченной длиной сохраняются только последние элементы, а первые исчезают из памяти:

In [9]:
limited.extend([1,2,3])
print(limited)
# deque([1, 2, 3], maxlen=3)
 
print(limited.append(8))
# None
print(limited)

deque([1, 2, 3], maxlen=3)
None
deque([2, 3, 8], maxlen=3)


# JSON

In [30]:
d = '[{"1": "1", "2": "2", "3": "3"},{"1": "a", "2": "b", "3": "c"}]'

s = '{"row 1":{"col 1":"a","col 2":"b"},"row 2":{"col 1":"c","col 2":"d"}}'
s1 = '[{"col 1":"a","col 2":"b"},{"col 1":"c","col 2":"d"}]'
# type(s)

pd.read_json(d, orient='records')

Unnamed: 0,1,2,3
0,1,2,3
1,a,b,c


In [31]:
# import os

# os.chdir(r'C:\Users\gromf\Desktop')
# os.listdir(path=".")
with open(r'C:\Users\gromf\Desktop\test.txt', encoding='UTF-8') as file:
    a = file.read()
    
pd.read_json(a, orient='records')

Unnamed: 0,1,2,3
0,1,2,3
